TabularPredictor.fit_weighted_ensemble

TabularPredictor.fit_weighted_ensemble(base_models: list = None, name_suffix: str = 'Best', expand_pareto_frontier: bool = False, time_limit: float = None, refit_full: bool = False, num_cpus: int | str = 'auto', num_gpus: int | str = 'auto')[源代码]

拟合新的加权集成模型以组合先前训练好的模型的预测结果。在原始训练期间必须将 cache_data 设置为 True 才能启用此功能。

参数:
  • base_models (list, default = None) – 加权集成模型可以考虑作为候选的模型名称列表。如果为 None,则考虑所有先前训练的模型,除了加权集成模型。例如,要训练一个只能将权重分配给模型 'model_a' 和 'model_b' 的加权集成模型,请设置 base_models=['model_a', 'model_b']

  • name_suffix (str, default = 'Best') – 要添加到新拟合的集成模型名称的后缀。

  • expand_pareto_frontier (bool, default = False) – 如果为 True,将训练 N-1 个加权集成模型而不是 1 个,其中 N=len(base_models)。当为 True 时训练的最终模型与当为 False 时训练的模型相同。这些加权集成模型将尝试扩展帕累托前沿。这将创建许多具有不同准确性/内存/推理速度权衡的加权集成模型。当推理速度是重要考虑因素时,这特别有用。

  • time_limit (float, default = None) – 每个加权集成模型允许训练的秒数。如果 expand_pareto_frontier=True,则 time_limit 值适用于每个模型。如果为 None,则集成模型训练时不受时间限制。

  • refit_full (bool, default = False) – 如果为 True,将对在此调用期间创建的所有加权集成模型应用 refit_full。与调用 predictor.refit_full(model=predictor.fit_weighted_ensemble(…)) 相同。

  • num_cpus (int | str, default = "auto") – AutoGluon predictor 希望使用的 CPU 总数量。Auto 表示 AutoGluon 将根据可用的 CPU 总数和模型对最佳性能的要求做出决定。用户通常不需要设置此值。

  • num_gpus (int | str, default = "auto") – AutoGluon predictor 希望使用的 GPU 总数量。Auto 表示 AutoGluon 将根据可用的 GPU 总数和模型对最佳性能的要求做出决定。用户通常不需要设置此值。

返回:

  • 新训练的加权集成模型的名称列表。

  • 如果在训练集成模型时遇到异常,该模型的名称将不会出现在列表中。