autogluon.common.features.feature_metadata.FeatureMetadata

class autogluon.common.features.feature_metadata.FeatureMetadata(type_map_raw: Dict[str, str], type_group_map_special: Dict[str, List[str]] = None, type_map_special: Dict[str, List[str]] = None)[source]

特征元数据包含关于特征的信息,这些信息在原始数据本身中并不直接显现。这使得特征生成器能够正确地处理特征,并允许下游模型在训练和推理过程中正确地处理特征。

参数:
  • type_map_raw (Dict[str, str]) –

    特征名称到原始类型的字典。值可以是任何类型,但通常建议使用以下类型之一:

    [‘int’, ‘float’, ‘object’, ‘category’, ‘datetime’]

  • type_group_map_special (Dict[str, List[str]], optional) –

    特殊类型到特征名称列表的字典。键可以是任何类型,但通常建议使用以下类型之一:

    [‘binned’, ‘datetime_as_int’, ‘datetime_as_object’, ‘text’, ‘text_as_category’, ‘text_special’, ‘text_ngram’, ‘image_path’, ‘stack’]

    有关每种特殊特征类型的描述,请参阅:autogluon.common.features.types 出现在值列表中的特征名称也必须是 type_map_raw 中的键。特征名称不要求具有特殊类型。type_group_map_special 和 type_map_special 中只能指定一个。

  • type_map_special (Dict[str, List[str]], optional) – 特征名称到特殊类型列表的字典。这是特殊类型的另一种表示形式。type_group_map_special 和 type_map_special 中只能指定一个。

__init__(type_map_raw: Dict[str, str], type_group_map_special: Dict[str, List[str]] = None, type_map_special: Dict[str, List[str]] = None)[source]

方法

add_special_types

为特征添加特殊类型。

from_df

根据输入 pd.DataFrame 推断的特征类型构建 FeatureMetadata。

get_feature_type_raw

get_feature_types_special

get_features

返回经过可用参数修剪后保留在特征元数据对象中的特征列表。

get_type_group_map_raw

get_type_group_map_special_from_type_map_special

get_type_map_special

join_metadata

将两个 FeatureMetadata 对象连接在一起,返回一个新的 FeatureMetadata 对象

join_metadatas

keep_features

从元数据中删除所有特征,除了 features 中指定的特征

print_feature_metadata_full

remove_features

从元数据中删除 features 中指定的所有特征

rename_features

将元数据中作为 rename_map 键的所有特征重命名为其对应的值。

to_dict

verify_data

如果 DataFrame 的原始类型与 FeatureMetadata 匹配,则返回 True,否则返回 False

verify_data_subset

如果 DataFrame 的特征是 FeatureMetadata 的子集且其原始类型与 FeatureMetadata 匹配,则返回 True,否则返回 False

verify_data_superset

如果 DataFrame 的特征是 FeatureMetadata 的超集且其原始类型与 FeatureMetadata 匹配,则返回 True,否则返回 False