TabularPredictor.load_data_internal

TabularPredictor.load_data_internal(data='train', return_X=True, return_y=True)[source]

加载模型训练期间使用的内部数据表示。像神经网络这样的单个 AutoGluon 模型可能会应用额外的特征转换,这些转换在此方法中未反映。此方法仅应用所有 AutoGluon 模型通用的转换。警告,内部表示可能

与原始数据相比具有不同的特征。与原始数据相比具有不同的行数。索引与原始数据不一致。标签值与原始数据中的值不同。

内部数据表示不应与原始数据结合使用,在大多数情况下这是不可能的。

参数:
  • data (str, default = 'train') –

    要加载的数据。有效值为

    ’train’

    加载模型训练期间使用的训练数据。这是传递给 fit()train_data 的转换和增强版本。

    ’val’

    加载模型训练期间使用的验证数据。这是传递给 fit()tuning_data 的转换和增强版本。如果在 fit() 中设置了 tuning_data=None,则 tuning_data 是通过分割 train_data 自动生成的验证集。警告:如果由 bagging 预测器调用,将引发异常,因为 bagging 预测器没有验证数据。

  • return_X (bool, default = True) – 是否返回内部数据特征。如果设置为 False,则返回元组中的第一个元素将为 None。

  • return_y (bool, default = True) – 是否返回内部数据标签。如果设置为 False,则返回元组中的第二个元素将为 None。

返回类型:

对应于内部数据特征和内部数据标签的元组,类型分别为 (pd.DataFrame, pd.Series)。