TabularPredictor.disk_usage_per_file¶
- TabularPredictor.disk_usage_per_file(*, sort_by: str = 'size', include_path_in_name: bool = False) Series [source]¶
返回 `predictor.path` 目录下每个文件的大小(字节)。
- 参数:
sort_by (str, default = "size") – 如果为 None,输出文件将按照在 os.walk(path) 中的搜索顺序排列。如果为 "size",输出文件将按照文件大小降序排列。如果为 "name",输出文件将按照名称升序排列。
include_path_in_name (bool, default = False) –
如果为 True,输出 pd.Series 的索引中将包含文件的完整路径,包括输入的 `path`。如果为 False,将移除输出 pd.Series 索引中文件路径的 `path` 前缀。
- 例如,对于位于 `foo/bar/model.pkl` 的文件,path='foo/'
如果为 True,索引将是 `foo/bar/model.pkl`;如果为 False,索引将是 `bar/model.pkl`
- 返回类型:
pd.Series,索引是文件路径,值是文件大小(字节)。