AutoGluon 被模块化为专门用于表格数据、多模态或时间序列数据的子模块。您可以通过单独安装特定子模块来减少所需的依赖项数量,方法是:pip install <submodule>,其中 <submodule> 可以是以下选项之一

  • autogluon.tabular - 表格数据功能 (TabularPredictor)

    • autogluon.tabular 独立版的默认安装是骨架安装。

    • 通过 pip install autogluon.tabular[all] 进行安装,可获得与通过 pip install autogluon 相同的表格数据安装。

    • 可用的可选依赖项:lightgbm,catboost,xgboost,fastai,ray。这些都包含在 all 中。

    • 未包含在 all 中的可选依赖项:imodels,skex,skl2onnx

    • 例如,要仅使用可选的 LightGBM 和 CatBoost 模型运行 autogluon.tabular,您可以执行:pip install autogluon.tabular[lightgbm,catboost]

    • 可选依赖项:skex。这将使 CPU 上的 KNN 模型在训练和推理中提速 25 倍。使用 pip install autogluon.tabular[all,skex] 启用。注意:不兼容 ARM 处理器。

    • 实验性可选依赖项:imodels。这将安装 imodels 包,并允许您在 TabularPredictor 中拟合可解释模型。

    • 可选依赖项:skl2onnx。这将通过 predictor.compile() 在支持的模型上启用 ONNX 模型编译。

  • autogluon.multimodal - 用于图像、文本和多模态问题的功能。专注于深度学习模型。

    • 要尝试使用 MultiModalPredictor 的目标检测功能,请通过 mim install "mmcv==2.1.0"pip install "mmdet==3.2.0"pip install pycocotools 安装额外的依赖项。注意:Windows 用户还应通过 pip install pycocotools-windows 安装 pycocotools,但这仅支持 python 3.6/3.7/3.8。

  • autogluon.timeseries - 仅用于时间序列数据的功能 (TimeSeriesPredictor)。

  • autogluon.common - 辅助功能。不适用于单独使用。

  • autogluon.core - 仅核心功能 (Searcher/Scheduler),用于任意代码/模型的超参数调整。

  • autogluon.features - 仅用于特征生成/特征预处理管道的功能(主要与表格数据相关)。

  • autogluon.eda - (已弃用)仅用于探索性数据分析的功能。

要从源代码安装子模块,请按照从源代码安装整个软件包的说明进行操作,但将行 cd autogluon && ./full_install.sh 替换为 cd autogluon && pip install -e {SUBMODULE_NAME}/{OPTIONAL_DEPENDENCIES}

  • 例如,要从源代码安装 autogluon.tabular[lightgbm,catboost],命令为:cd autogluon && pip install -e tabular/[lightgbm,catboost]

安装所有 AutoGluon 可选依赖项

pip install autogluon && pip install autogluon.tabular[imodels,skex,skl2onnx]