更新时间:2024-09-10 GMT+08:00
分享

创建训练任务

针对专属池场景,应注意挂载的目录设置和调试时一致。

  1. 登录ModelArts管理控制台,检查当前帐号是否已完成访问授权的配置。如果未完成,请参考使用委托授权针对之前使用访问密钥授权的用户,建议清空授权,然后使用委托进行授权。
  2. 在左侧导航栏中选择“模型训练 > 训练作业”,默认进入“训练作业”列表。单击“创建训练作业”进入创建训练作业页面。
  3. “创建训练作业”页面,填写相关参数信息,然后单击“提交”
    • 创建方式:选择“自定义算法”。
    • 启动方式:选择“自定义”。
    • 镜像:选择上传的自定义镜像。
    • 启动命令:
      cd ${MA_JOB_DIR}/demo && python main.py -a resnet50 -b 128 --epochs 5 dog_cat_1w/

      此处的“demo”为用户自定义的OBS存放代码路径的最后一级目录,可以根据实际修改。

    • 资源池:在“专属资源池”页签选择GPU规格的专属资源池。
    • 规格:选择单GPU规格。
  4. 单击“提交”,在“信息确认”页面,确认训练作业的参数信息,确认无误后单击“确定”
  5. 训练作业创建完成后,后台将自动完成容器镜像下载、代码目录下载、执行启动命令等动作。

    训练作业一般需要运行一段时间,根据您的训练业务逻辑和选择的资源不同,训练时长将持续几十分钟到几小时不等。

相关文档