autogluon.core.TabularDataset¶
- class autogluon.core.TabularDataset(data, **kwargs)[source]¶
表格格式的数据集(行 = 样本,列 = 特征/变量)。此类在初始化时返回
pd.DataFrame
,并且所有现有的 pandas 方法都可应用于它。有关方法/属性的完整列表,请参阅 pandas Dataframe 文档:https://pandas.ac.cn/pandas-docs/stable/reference/api/pandas.DataFrame.html此类旨在提供一种易于使用的简写方式,用于加载 pandas DataFrame 以在 AutoGluon 中使用。
- 参数:
data (str,
pd.DataFrame
,np.ndarray
, Iterable, or dict) – 如果是 str,则为数据文件(CSV 或 Parquet 格式)的路径。如果您已有pd.DataFrame
格式的数据,可以在此处指定。在这种情况下,将返回相同的 DataFrame,没有任何更改。
示例
>>> import pandas as pd >>> from autogluon.common import TabularDataset >>> train_data = TabularDataset("https://autogluon.s3.amazonaws.com/datasets/Inc/train.csv") >>> train_data_pd = pd.read_csv("https://autogluon.s3.amazonaws.com/datasets/Inc/train.csv") >>> assert isinstance(train_data, pd.DataFrame) # True >>> assert train_data.equals(train_data_pd) # True >>> assert type(train_data) == type(train_data_pd) # True
- __init__()¶
方法