TabularPredictor.predict_from_proba

TabularPredictor.predict_from_proba(y_pred_proba: pd.DataFrame | np.ndarray, decision_threshold: float | None = None) pd.Series | np.array[source]

给定预测概率,将其转换为预测结果。

参数:
  • y_pred_proba (pd.DataFramenp.ndarray) – 要转换为预测结果的预测概率。可通过 predictor.predict_proba 的输出获得。

  • decision_threshold (float, 默认为 None) – 用于将预测概率转换为预测结果的决策阈值。仅与二元分类相关,否则将被忽略。如果为 None,则默认为 predictor.decision_threshold。有效值范围为 [0.0, 1.0]。可以通过先调用 predictor.calibrate_decision_threshold() 来获取最优的 decision_threshold。对于 balanced_accuracyf1 等指标,设置此值很有用,因为 0.5 通常不是最优阈值。预测结果通过以下逻辑基于正类别计算:1 if pred > decision_threshold else 0

返回类型:

预测结果数组,与给定数据集中的每一行对应。根据 y_pred_proba 的数据类型,可以是 np.ndarraypd.Series

示例

>>> from autogluon.tabular import TabularPredictor
>>> predictor = TabularPredictor(label='class').fit('train.csv', label='class')
>>> y_pred_proba = predictor.predict_proba('test.csv')
>>>
>>> # y_pred and y_pred_from_proba are identical
>>> y_pred = predictor.predict('test.csv')
>>> y_pred_from_proba = predictor.predict_from_proba(y_pred_proba=y_pred_proba)