TabularPredictor.evaluate¶
- TabularPredictor.evaluate(data: DataFrame | str, model: str = None, decision_threshold: float = None, display: bool = False, auxiliary_metrics: bool = True, detailed_report: bool = False, **kwargs) dict [source]¶
报告在给定数据集上评估的预测性能。这基本上是以下操作的快捷方式:pred_proba = predict_proba(data); evaluate_predictions(data[label], pred_proba)。
- 参数:
data (str 或
pd.DataFrame
) – 此数据集还必须包含具有与之前指定的相同列名的 label。如果传入 str,则 data 将使用 str 值作为文件路径加载。如果设置了 self.sample_weight 且 self.weight_evaluation==True,则会检查是否存在具有样本权重名称的列,如果存在,则用于加权指标评估。model (str (可选)) – 用于获取预测概率的模型名称。默认为 None,此时使用验证集上得分最高的模型。通过调用 predictor.model_names() 可以列出此 predictor 中的有效模型。
decision_threshold (float, 默认为 None) – 将预测概率转换为预测时使用的决策阈值。这将影响 f1 和 accuracy 等指标的得分。如果为 None,则默认为 predictor.decision_threshold。除非 problem_type=’binary’,否则忽略此参数。有关更多信息,请参阅 predictor.decision_threshold 的 docstring。
display (bool, 默认为 False) – 如果为 True,则打印性能结果。
auxiliary_metrics (bool, 默认为 True) – 除了默认指标外,是否应计算其他(problem_type 特定)指标?
detailed_report (bool, 默认为 False) – 是否应计算更详细版本的 auxiliary_metrics?(需要 auxiliary_metrics = True)
- 返回:
返回 dict,其中键 = 指标,值 = 每个指标的性能。要获取 eval_metric 分数,请执行 output[predictor.eval_metric.name]
注意 (指标得分始终以越高越好的形式显示。)
这意味着像 log_loss 和 root_mean_squared_error 这样的指标的符号将被翻转,值将为负。