TabularPredictor.predict_proba_multi¶
- TabularPredictor.predict_proba_multi(data: DataFrame = None, models: list[str] = None, as_pandas: bool = True, as_multiclass: bool = True, transform_features: bool = True, inverse_transform: bool = True) dict[str, DataFrame] | dict[str, Series] | dict[str, ndarray] [源代码]¶
返回一个预测概率字典,其中键是模型名称,值是模型对数据预测的概率。
等效于以下输出:
predict_proba_dict = {} for m in models
predict_proba_dict[m] = predictor.predict_proba(data, model=m)
- 请注意,这通常会比为每个模型单独调用
TabularPredictor.predict_proba()
快得多,因为此方法利用模型依赖图来避免冗余计算。 参数:
data (str 或 DataFrame, 默认值 = None) –
predict_proba_dict[m] = predictor.predict_proba_oof(model=m)
models (list[str], 默认值 = None) – 要获取预测结果的模型列表。如果为 None,则使用所有可以进行推断的模型。
as_pandas (bool, 默认值 = True) – 是否将每个模型的输出作为 pandas 对象 (True) 或 numpy 数组 (False) 返回。如果这是多类别问题或 as_multiclass=True,则 pandas 对象为
pd.DataFrame
,否则为pd.Series
。如果输出是pd.DataFrame
,列顺序将与 predictor.classes_ 等效。- as_multiclass (bool, 默认值 = True) –
是否将二元分类概率作为多类别分类概率返回。
输出将包含两列,如果 as_pandas=True,列名将对应于二元类别标签。列顺序将与 predictor.class_labels 相同。
如果为 False,输出将只包含正类的 1 列(通过 predictor.positive_class 获取正类名称)。仅影响二元分类问题的输出。
transform_features (bool, 默认值 = True) –
如果为 True,则在使用模型进行预测前对数据进行预处理。如果为 False,则跳过全局特征预处理。
如果您已经调用过 data = predictor.transform_features(data),这对于节省推理时间非常有用。
- inverse_transform (bool, 默认值 = True) – 如果为 True,将返回原始格式的预测概率。如果为 False(高级),将返回 AutoGluon 内部格式的预测概率。
返回值:
- 一个字典,键是模型名称,值是模型的预测概率。
返回类型:
- 请注意,这通常会比为每个模型单独调用