TabularPredictor.evaluate¶

TabularPredictor.evaluate(data: DataFrame | str, model: str = None, decision_threshold: float = None, display: bool = False, auxiliary_metrics: bool = True, detailed_report: bool = False, **kwargs) → dict[source]¶

报告在给定数据集上评估的预测性能。这基本上是以下操作的快捷方式：pred_proba = predict_proba(data); evaluate_predictions(data[label], pred_proba)。

参数:

data (str 或 pd.DataFrame) – 此数据集还必须包含具有与之前指定的相同列名的 label。如果传入 str，则 data 将使用 str 值作为文件路径加载。如果设置了 self.sample_weight 且 self.weight_evaluation==True，则会检查是否存在具有样本权重名称的列，如果存在，则用于加权指标评估。
model (str (可选)) – 用于获取预测概率的模型名称。默认为 None，此时使用验证集上得分最高的模型。通过调用 predictor.model_names() 可以列出此 predictor 中的有效模型。
decision_threshold (float, 默认为 None) – 将预测概率转换为预测时使用的决策阈值。这将影响 f1 和 accuracy 等指标的得分。如果为 None，则默认为 predictor.decision_threshold。除非 problem_type=’binary’，否则忽略此参数。有关更多信息，请参阅 predictor.decision_threshold 的 docstring。
display (bool, 默认为 False) – 如果为 True，则打印性能结果。
auxiliary_metrics (bool, 默认为 True) – 除了默认指标外，是否应计算其他（problem_type 特定）指标？
detailed_report (bool, 默认为 False) – 是否应计算更详细版本的 auxiliary_metrics？(需要 auxiliary_metrics = True)

返回:

返回 dict，其中键 = 指标，值 = 每个指标的性能。要获取 eval_metric 分数，请执行 output[predictor.eval_metric.name]
注意 (指标得分始终以越高越好的形式显示。)
这意味着像 log_loss 和 root_mean_squared_error 这样的指标的符号将被翻转，值将为负。