TabularPredictor.load_data_internal¶
- TabularPredictor.load_data_internal(data='train', return_X=True, return_y=True)[source]¶
加载模型训练期间使用的内部数据表示。像神经网络这样的单个 AutoGluon 模型可能会应用额外的特征转换,这些转换在此方法中未反映。此方法仅应用所有 AutoGluon 模型通用的转换。警告,内部表示可能
与原始数据相比具有不同的特征。与原始数据相比具有不同的行数。索引与原始数据不一致。标签值与原始数据中的值不同。
内部数据表示不应与原始数据结合使用,在大多数情况下这是不可能的。
- 参数:
data (str, default = 'train') –
要加载的数据。有效值为
- ’train’
加载模型训练期间使用的训练数据。这是传递给 fit() 的 train_data 的转换和增强版本。
- ’val’
加载模型训练期间使用的验证数据。这是传递给 fit() 的 tuning_data 的转换和增强版本。如果在 fit() 中设置了 tuning_data=None,则 tuning_data 是通过分割 train_data 自动生成的验证集。警告:如果由 bagging 预测器调用,将引发异常,因为 bagging 预测器没有验证数据。
return_X (bool, default = True) – 是否返回内部数据特征。如果设置为 False,则返回元组中的第一个元素将为 None。
return_y (bool, default = True) – 是否返回内部数据标签。如果设置为 False,则返回元组中的第二个元素将为 None。
- 返回类型:
对应于内部数据特征和内部数据标签的元组,类型分别为 (
pd.DataFrame
,pd.Series
)。