TimeSeriesDataFrame.fill_missing_values

TimeSeriesDataFrame.fill_missing_values(method: str = 'auto', value: float = 0.0) TimeSeriesDataFrame[source]

填充由 NaN 表示的缺失值。

参数:
  • method (str, 默认值 = "auto") –

    用于填充缺失值的方法。

    • "auto" - 首先向前填充(填充中间和尾部的 NaN),然后向后填充(填充开头的 NaN)

    • "ffill" 或 "pad" - 将最后一个有效观测值向前传播。注意:时间序列开头的缺失值不会被填充。

    • "bfill" 或 "backfill" - 使用下一个有效观测值填充空缺。注意:这可能导致信息泄露;时间序列末尾的缺失值不会被填充。

    • "constant" - 用给定的常量 value 替换 NaN。

    • "interpolate" - 使用线性插值填充 NaN 值。注意:这可能导致信息泄露。

  • value (float, 默认值 = 0.0) – "constant" 填充方法使用的值。

示例

>>> ts_df
                    target
item_id timestamp
0       2019-01-01     NaN
        2019-01-02     NaN
        2019-01-03     1.0
        2019-01-04     NaN
        2019-01-05     NaN
        2019-01-06     2.0
        2019-01-07     NaN
1       2019-02-04     NaN
        2019-02-05     3.0
        2019-02-06     NaN
        2019-02-07     4.0
>>> ts_df.fill_missing_values(method="auto")
                    target
item_id timestamp
0       2019-01-01     1.0
        2019-01-02     1.0
        2019-01-03     1.0
        2019-01-04     1.0
        2019-01-05     1.0
        2019-01-06     2.0
        2019-01-07     2.0
1       2019-02-04     3.0
        2019-02-05     3.0
        2019-02-06     3.0
        2019-02-07     4.0