TimeSeriesDataFrame.train_test_split

TimeSeriesDataFrame.train_test_split(prediction_length: int, end_index: int | None = None, suffix: str | None = None) Tuple[TimeSeriesDataFrame, TimeSeriesDataFrame][来源]

从给定数据集中生成训练/测试集分割。此方法可用于生成多窗口回测的分割。

参数:
  • prediction_length (int) – 单个评估窗口中的时间步长数量。

  • end_index (int, optional) – 如果给定,在进行训练/测试分割之前,所有时间序列都将缩短至 end_idx。换句话说,测试数据将包含每个时间序列的切片 [:end_index],而训练数据将包含切片 [:end_index - prediction_length]

  • suffix (str, optional) – 追加到 item_id 索引级别中所有条目的后缀。

返回:

  • train_data (TimeSeriesDataFrame) – 数据的训练部分。包含 test_data 中每个时间序列的切片 [:-prediction_length]

  • test_data (TimeSeriesDataFrame) – 数据的测试部分。包含原始数据集中每个时间序列的切片 [:end_idx]