TabularPredictor.load_data_internal¶

TabularPredictor.load_data_internal(data='train', return_X=True, return_y=True)[source]¶

加载模型训练期间使用的内部数据表示。像神经网络这样的单个 AutoGluon 模型可能会应用额外的特征转换，这些转换在此方法中未反映。此方法仅应用所有 AutoGluon 模型通用的转换。警告，内部表示可能

与原始数据相比具有不同的特征。与原始数据相比具有不同的行数。索引与原始数据不一致。标签值与原始数据中的值不同。

内部数据表示不应与原始数据结合使用，在大多数情况下这是不可能的。

参数:

data (str, default = 'train') –
要加载的数据。有效值为

’train’
加载模型训练期间使用的训练数据。这是传递给 fit() 的 train_data 的转换和增强版本。

’val’
加载模型训练期间使用的验证数据。这是传递给 fit() 的 tuning_data 的转换和增强版本。如果在 fit() 中设置了 tuning_data=None，则 tuning_data 是通过分割 train_data 自动生成的验证集。警告：如果由 bagging 预测器调用，将引发异常，因为 bagging 预测器没有验证数据。
return_X (bool, default = True) – 是否返回内部数据特征。如果设置为 False，则返回元组中的第一个元素将为 None。
return_y (bool, default = True) – 是否返回内部数据标签。如果设置为 False，则返回元组中的第二个元素将为 None。

返回类型:

对应于内部数据特征和内部数据标签的元组，类型分别为 (pd.DataFrame, pd.Series)。