TabularPredictor.predict_from_proba¶

TabularPredictor.predict_from_proba(y_pred_proba: pd.DataFrame | np.ndarray, decision_threshold: float | None = None) → pd.Series | np.array[source]¶

给定预测概率，将其转换为预测结果。

参数：

y_pred_proba (pd.DataFrame 或 np.ndarray) – 要转换为预测结果的预测概率。可通过 predictor.predict_proba 的输出获得。
decision_threshold (float, 默认为 None) – 用于将预测概率转换为预测结果的决策阈值。仅与二元分类相关，否则将被忽略。如果为 None，则默认为 predictor.decision_threshold。有效值范围为 [0.0, 1.0]。可以通过先调用 predictor.calibrate_decision_threshold() 来获取最优的 decision_threshold。对于 balanced_accuracy 和 f1 等指标，设置此值很有用，因为 0.5 通常不是最优阈值。预测结果通过以下逻辑基于正类别计算：1 if pred > decision_threshold else 0。

返回类型：

预测结果数组，与给定数据集中的每一行对应。根据 y_pred_proba 的数据类型，可以是 np.ndarray 或 pd.Series。

示例

>>> from autogluon.tabular import TabularPredictor
>>> predictor = TabularPredictor(label='class').fit('train.csv', label='class')
>>> y_pred_proba = predictor.predict_proba('test.csv')
>>>
>>> # y_pred and y_pred_from_proba are identical
>>> y_pred = predictor.predict('test.csv')
>>> y_pred_from_proba = predictor.predict_from_proba(y_pred_proba=y_pred_proba)