TimeSeriesDataFrame.train_test_split¶
- TimeSeriesDataFrame.train_test_split(prediction_length: int, end_index: int | None = None, suffix: str | None = None) Tuple[TimeSeriesDataFrame, TimeSeriesDataFrame] [来源]¶
从给定数据集中生成训练/测试集分割。此方法可用于生成多窗口回测的分割。
- 参数:
prediction_length (int) – 单个评估窗口中的时间步长数量。
end_index (int, optional) – 如果给定,在进行训练/测试分割之前,所有时间序列都将缩短至
end_idx
。换句话说,测试数据将包含每个时间序列的切片[:end_index]
,而训练数据将包含切片[:end_index - prediction_length]
。suffix (str, optional) – 追加到
item_id
索引级别中所有条目的后缀。
- 返回:
train_data (TimeSeriesDataFrame) – 数据的训练部分。包含
test_data
中每个时间序列的切片[:-prediction_length]
。test_data (TimeSeriesDataFrame) – 数据的测试部分。包含原始数据集中每个时间序列的切片
[:end_idx]
。