TabularPredictor.disk_usage_per_file¶

TabularPredictor.disk_usage_per_file(*, sort_by: str = 'size', include_path_in_name: bool = False) → Series[source]¶

返回 `predictor.path` 目录下每个文件的大小（字节）。

参数：

sort_by (str, default = "size") – 如果为 None，输出文件将按照在 os.walk(path) 中的搜索顺序排列。如果为 "size"，输出文件将按照文件大小降序排列。如果为 "name"，输出文件将按照名称升序排列。
include_path_in_name (bool, default = False) –
如果为 True，输出 pd.Series 的索引中将包含文件的完整路径，包括输入的 `path`。如果为 False，将移除输出 pd.Series 索引中文件路径的 `path` 前缀。

例如，对于位于 `foo/bar/model.pkl` 的文件，path='foo/'
如果为 True，索引将是 `foo/bar/model.pkl`；如果为 False，索引将是 `bar/model.pkl`

返回类型：

pd.Series，索引是文件路径，值是文件大小（字节）。