autogluon.common.features.feature_metadata.FeatureMetadata¶
- class autogluon.common.features.feature_metadata.FeatureMetadata(type_map_raw: Dict[str, str], type_group_map_special: Dict[str, List[str]] = None, type_map_special: Dict[str, List[str]] = None)[source]¶
特征元数据包含关于特征的信息,这些信息在原始数据本身中并不直接显现。这使得特征生成器能够正确地处理特征,并允许下游模型在训练和推理过程中正确地处理特征。
- 参数:
type_map_raw (Dict[str, str]) –
特征名称到原始类型的字典。值可以是任何类型,但通常建议使用以下类型之一:
[‘int’, ‘float’, ‘object’, ‘category’, ‘datetime’]
type_group_map_special (Dict[str, List[str]], optional) –
特殊类型到特征名称列表的字典。键可以是任何类型,但通常建议使用以下类型之一:
[‘binned’, ‘datetime_as_int’, ‘datetime_as_object’, ‘text’, ‘text_as_category’, ‘text_special’, ‘text_ngram’, ‘image_path’, ‘stack’]
有关每种特殊特征类型的描述,请参阅:autogluon.common.features.types 出现在值列表中的特征名称也必须是 type_map_raw 中的键。特征名称不要求具有特殊类型。type_group_map_special 和 type_map_special 中只能指定一个。
type_map_special (Dict[str, List[str]], optional) – 特征名称到特殊类型列表的字典。这是特殊类型的另一种表示形式。type_group_map_special 和 type_map_special 中只能指定一个。
- __init__(type_map_raw: Dict[str, str], type_group_map_special: Dict[str, List[str]] = None, type_map_special: Dict[str, List[str]] = None)[source]¶
方法
为特征添加特殊类型。
根据输入
pd.DataFrame
推断的特征类型构建 FeatureMetadata。返回经过可用参数修剪后保留在特征元数据对象中的特征列表。
将两个 FeatureMetadata 对象连接在一起,返回一个新的 FeatureMetadata 对象
从元数据中删除所有特征,除了 features 中指定的特征
从元数据中删除 features 中指定的所有特征
将元数据中作为 rename_map 键的所有特征重命名为其对应的值。
如果 DataFrame 的原始类型与 FeatureMetadata 匹配,则返回 True,否则返回 False
如果 DataFrame 的特征是 FeatureMetadata 的子集且其原始类型与 FeatureMetadata 匹配,则返回 True,否则返回 False
如果 DataFrame 的特征是 FeatureMetadata 的超集且其原始类型与 FeatureMetadata 匹配,则返回 True,否则返回 False