版本 1.1.0

我们很高兴宣布 AutoGluon 1.1 版本发布。

AutoGluon 1.1 版本包含时间序列模块的重大改进,通过添加 Chronos(一个用于时间序列预测的预训练模型)以及众多其他增强功能,相对于 AutoGluon 1.0 实现了 60% 的胜率。其他模块也通过新功能得到了增强,例如支持 Conv-LORA,并提高了大小在 5 - 30 GB 之间的大型表格数据集的性能。有关 AutoGluon 1.1 功能的完整细分,请参阅以下的功能亮点和详细增强功能。

加入社区:
获取最新更新:Twitter

此版本支持 Python 3.8、3.9、3.10 和 3.11 版本。不支持加载在旧版 AutoGluon 上训练的模型。请使用 AutoGluon 1.1 重新训练模型。

此版本包含来自 20 位贡献者的 121 次提交

完整贡献者列表(按提交次数排序)

@shchur @prateekdesai04 @Innixma @canerturkmen @zhiqiangdon @tonyhoo @AnirudhDagar @Harry-zzh @suzhoum @FANGAreNotGnu @nimasteryang @lostella @dassaswat @afmkt @npepin-hub @mglowacki100 @ddelange @LennartPurucker @taoyang1122 @gradientsky

特别感谢 @ddelange 在 Python 3.11 支持和 Ray 版本升级方面的持续协助!

焦点

AutoGluon 在 ML 竞赛中取得靠前排名!

自 AutoGluon 1.0 发布以来,AutoGluon 在 Kaggle 上得到了广泛采用。在过去 90 天里,AutoGluon 已被用于超过 130 个 Kaggle notebook 中,并在超过 100 个讨论帖中被提及!最令人兴奋的是,自 2024 年初以来,AutoGluon 已被用于在数千名竞争对手参与的多个竞赛中取得靠前排名。

排名

竞赛

作者

日期

AutoGluon 详情

备注

:3rd_place_medal: 排名 3/2303 (前 0.1%)

钢板缺陷预测

Samvel Kocharyan

2024/03/31

v1.0, 表格数据

Kaggle Playground 系列 S4E3

:2nd_place_medal: 排名 2/93 (前 2%)

预测区间竞赛 I:出生体重

Oleksandr Shchur

2024/03/21

v1.0, 表格数据

:2nd_place_medal: 排名 2/1542 (前 0.1%)

WiDS 数据马拉松 2024 挑战赛 #1

lazy_panda

2024/03/01

v1.0, 表格数据

:2nd_place_medal: 排名 2/3746 (前 0.1%)

肥胖风险多类别预测

Kirderf

2024/02/29

v1.0, 表格数据

Kaggle Playground 系列 S4E2

:2nd_place_medal: 排名 2/3777 (前 0.1%)

使用银行客户流失数据集进行二元分类

lukaszl

2024/01/31

v1.0, 表格数据

Kaggle Playground 系列 S4E1

排名 4/1718 (前 0.2%)

肝硬化结果多类别预测

Kirderf

2024/01/01

v1.0, 表格数据

Kaggle Playground 系列 S3E26

我们很高兴数据科学社区正在将 AutoGluon 作为他们快速有效地实现靠前排名机器学习解决方案的首选方法!有关使用 AutoGluon 的竞赛解决方案的最新列表,请参阅我们的 AWESOME.md,如果您在竞赛中使用了 AutoGluon,请随时告诉我们!

Chronos,一个用于时间序列预测的预训练模型

AutoGluon-TimeSeries 现在推出了 Chronos,这是一个在大型开源时间序列数据集集合上预训练的预测模型系列,可以为新的未见数据生成准确的零样本预测。请查阅新教程,了解如何通过熟悉的 TimeSeriesPredictor API 使用 Chronos。

通用

时间序列

亮点

AutoGluon 1.1 版本为时间序列模块带来了许多新功能和改进。这些功能包括高度请求的功能,例如特征重要性、支持分类协变量、可视化预测能力以及日志记录增强。新版本还显著提高了预测准确性,与之前的 AutoGluon 版本相比,胜率达到 60%,平均错误率降低 3%。这些改进主要归因于 Chronos 的添加、改进的预处理逻辑以及缺失值的原生处理。

新功能

修复和改进

AutoMM

亮点

AutoMM 1.1 引入了创新的 Conv-LoRA,这是一种参数高效微调 (PEFT) 方法,源自我们在 ICLR 2024 上发表的最新论文,题为“卷积遇上 LoRA:用于 Segment Anything Model 的参数高效微调”。Conv-LoRA 专为微调 Segment Anything Model 而设计,在自然图像、农业、遥感和医疗保健等不同领域的各种语义分割任务中,与之前的 PEFT 方法(如 LoRA 和视觉提示微调)相比,表现出卓越的性能。请查阅我们的 Conv-LoRA 示例

新功能

修复和改进

表格数据

亮点

AutoGluon-Tabular 1.1 主要侧重于错误修复和稳定性改进。特别是,我们通过使用二次抽样进行决策阈值校准和将加权集成拟合到 100 万行,极大地提高了大小在 5 - 30 GB 之间的大型数据集的运行时性能,在保持相同质量的同时执行速度大大加快。我们还将默认的加权集成迭代次数从 100 次调整为 25 次,这将使所有加权集成拟合时间加快 4 倍。我们对 fit_pseudolabel 逻辑进行了大量重构,现在应该能取得显著更好的结果。

修复和改进

文档和 CI