AutoGluon 被模块化为专门用于表格数据、多模态或时间序列数据的子模块。您可以通过单独安装特定子模块来减少所需的依赖项数量,方法是:pip install <submodule>
,其中 <submodule>
可以是以下选项之一
autogluon.tabular
- 表格数据功能 (TabularPredictor)autogluon.tabular
独立版的默认安装是骨架安装。通过
pip install autogluon.tabular[all]
进行安装,可获得与通过pip install autogluon
相同的表格数据安装。可用的可选依赖项:
lightgbm,catboost,xgboost,fastai,ray
。这些都包含在all
中。未包含在
all
中的可选依赖项:imodels,skex,skl2onnx
。例如,要仅使用可选的 LightGBM 和 CatBoost 模型运行
autogluon.tabular
,您可以执行:pip install autogluon.tabular[lightgbm,catboost]
可选依赖项:
skex
。这将使 CPU 上的 KNN 模型在训练和推理中提速 25 倍。使用pip install autogluon.tabular[all,skex]
启用。注意:不兼容 ARM 处理器。实验性可选依赖项:
imodels
。这将安装 imodels 包,并允许您在 TabularPredictor 中拟合可解释模型。可选依赖项:
skl2onnx
。这将通过predictor.compile()
在支持的模型上启用 ONNX 模型编译。
autogluon.multimodal
- 用于图像、文本和多模态问题的功能。专注于深度学习模型。要尝试使用
MultiModalPredictor
的目标检测功能,请通过mim install "mmcv==2.1.0"
、pip install "mmdet==3.2.0"
和pip install pycocotools
安装额外的依赖项。注意:Windows 用户还应通过pip install pycocotools-windows
安装pycocotools
,但这仅支持 python 3.6/3.7/3.8。
autogluon.timeseries
- 仅用于时间序列数据的功能 (TimeSeriesPredictor)。autogluon.common
- 辅助功能。不适用于单独使用。autogluon.core
- 仅核心功能 (Searcher/Scheduler),用于任意代码/模型的超参数调整。autogluon.features
- 仅用于特征生成/特征预处理管道的功能(主要与表格数据相关)。autogluon.eda
- (已弃用)仅用于探索性数据分析的功能。
要从源代码安装子模块,请按照从源代码安装整个软件包的说明进行操作,但将行 cd autogluon && ./full_install.sh
替换为 cd autogluon && pip install -e {SUBMODULE_NAME}/{OPTIONAL_DEPENDENCIES}
例如,要从源代码安装
autogluon.tabular[lightgbm,catboost]
,命令为:cd autogluon && pip install -e tabular/[lightgbm,catboost]
安装所有 AutoGluon 可选依赖项
pip install autogluon && pip install autogluon.tabular[imodels,skex,skl2onnx]