TabularPredictor.predict_from_proba¶
- TabularPredictor.predict_from_proba(y_pred_proba: pd.DataFrame | np.ndarray, decision_threshold: float | None = None) pd.Series | np.array [source]¶
给定预测概率,将其转换为预测结果。
- 参数:
y_pred_proba (
pd.DataFrame
或np.ndarray
) – 要转换为预测结果的预测概率。可通过 predictor.predict_proba 的输出获得。decision_threshold (float, 默认为 None) – 用于将预测概率转换为预测结果的决策阈值。仅与二元分类相关,否则将被忽略。如果为 None,则默认为 predictor.decision_threshold。有效值范围为 [0.0, 1.0]。可以通过先调用 predictor.calibrate_decision_threshold() 来获取最优的 decision_threshold。对于 balanced_accuracy 和 f1 等指标,设置此值很有用,因为 0.5 通常不是最优阈值。预测结果通过以下逻辑基于正类别计算:1 if pred > decision_threshold else 0。
- 返回类型:
预测结果数组,与给定数据集中的每一行对应。根据 y_pred_proba 的数据类型,可以是
np.ndarray
或pd.Series
。
示例
>>> from autogluon.tabular import TabularPredictor >>> predictor = TabularPredictor(label='class').fit('train.csv', label='class') >>> y_pred_proba = predictor.predict_proba('test.csv') >>> >>> # y_pred and y_pred_from_proba are identical >>> y_pred = predictor.predict('test.csv') >>> y_pred_from_proba = predictor.predict_from_proba(y_pred_proba=y_pred_proba)