MultiModalCloudPredictor.fit#

MultiModalCloudPredictor.fit(*, predictor_init_args: Dict[str, Any], predictor_fit_args: Dict[str, Any], image_column: Optional[str] = None, leaderboard: bool = True, framework_version: str = 'latest', job_name: Optional[str] = None, instance_type: str = 'ml.m5.2xlarge', instance_count: Union[int, str] = 'auto', volume_size: int = 256, custom_image_uri: Optional[str] = None, timeout: int = 86400, wait: bool = True, backend_kwargs: Optional[Dict] = None) CloudPredictor#

使用后端拟合预测器。

参数
  • predictor_init_args (dict) – 预测器的初始化参数

  • predictor_fit_args (dict) – 预测器的拟合参数

  • image_column (str, default = None) – 训练/调优数据中包含图像路径的列名。图像路径必须是您本地系统的绝对路径。

  • leaderboard (bool, default = True) – 是否在输出 Artifact 中包含排行榜

  • framework_version (str, default = latest) – autogluon 的训练容器版本。如果为 latest,将使用最新可用的容器版本。如果提供特定版本,将使用此版本。如果设置了 custom_image_uri,此参数将被忽略。

  • job_name (str, default = None) – 启动的训练作业名称。如果为 None,CloudPredictor 将创建一个带有前缀 ag-cloudpredictor 的名称。

  • instance_type (str, default = 'ml.m5.2xlarge') – 预测器将在 SageMaker 上训练的实例类型。

  • instance_count (int, default = 1) – 用于拟合预测器的实例数量。如果未指定,将由后端决定。

  • volumes_size (int, default = 256) – 训练期间用于存储输入数据的 EBS 卷的大小(GB)(默认为 256)。如果使用文件模式(这是默认模式),必须足够大以存储训练数据。

  • timeout (int, default = 24*60*60) – 训练的超时时间(秒)。此超时不包括预处理或启动训练作业的时间。

  • wait (bool, default = True) – 调用是否应等待作业完成。请注意,函数不会立即返回,因为在拟合之前需要进行一些准备工作。使用 get_fit_job_status 获取作业状态。

  • backend_kwargs (dict, default = None) –

    传递给底层后端所需的任何额外参数。对于 SageMaker 后端,有效键为

    1. autogluon_sagemaker_estimator_kwargs

      初始化 AutoGluonSagemakerEstimator 所需的任何额外参数。请参考 https://sagemaker.readthedocs.io/en/stable/api/training/estimators.html#sagemaker.estimator.Estimator 查看所有选项。

    2. fit_kwargs

      传递给 fit 所需的任何额外参数。请参考 https://sagemaker.readthedocs.io/en/stable/api/training/estimators.html#sagemaker.estimator.Estimator.fit 查看所有选项。

    对于 RayAWS 后端,有效键为
    1. custom_config: Optional[Union[str, Dict[str, Any]]] = None,

      自定义集群配置。请参考 https://docs.rayai.org.cn/en/latest/cluster/vms/references/ray-cluster-configuration.html#cluster-yaml-configuration-options 了解详情。

    2. cluster_name: Optional[str] = None,

      正在创建的临时集群的名称。如果未指定,将自动生成,格式为 f”ag_ray_aws_default_{timestamp}”。

    3. initialization_commands: Optional[List[str]], default = None

      Ray 集群的初始化命令。如果未指定,将包含一个默认的 ECR 登录命令,以便能够拉取 AG DLC 镜像,例如:

      • aws ecr get-login-password –region us-east-1 | docker login –username AWS –password-stdin 763104351884.dkr.ecr.us-east-1.amazonaws.com

      要了解有关 initialization_commands 的更多信息,请参阅:

      https://docs.rayai.org.cn/en/latest/cluster/vms/references/ray-cluster-configuration.html#initialization-commands

返回类型

CloudPredictor 对象。返回自身。