文档首页 > > AI工程师用户指南> 使用自定义镜像> 用于训练模型> 训练作业自定义镜像规范

训练作业自定义镜像规范

分享
更新时间: 2019/12/26 GMT+08:00

针对您本地开发的模型及训练脚本,在制作镜像时,需满足ModelArts定义的规范。

规范要求

  • 自定义镜像必须基于ModelArts官方提供的基础镜像,支持的基础镜像请参考基础镜像包
  • 自定义镜像中不能包含恶意代码。
  • 基础镜像中的部分内容不能改变,包括“/bin”“/sbin”“/usr”“/lib(64)”下的所有文件,“/etc”下的部分重要配置文件,以及“$HOME”下的ModelArts小工具。
  • 不可以新增属主为“root”且权限包含“setuid”“setgid”位的文件。
  • 自定义镜像大小不能超过9.5GB。
  • 日志文件输出,为保证日志内容可以正常显示,日志信息需要打印到标准输出。

基础镜像包

  • 基础镜像中有一些必要的工具,用户需要基于ModelArts官方提供的基础镜像来制作自定义镜像。
  • ModelArts将持续更新基础镜像版本,基础镜像更新后,对于兼容性更新,用户还可以继续使用旧的镜像;对于不兼容性更新,基于旧版本制作的自定义镜像将不能在ModelArts上运行,但已经审核过的自定义镜像可以继续使用。
  • 当用户发现自定义镜像审核不通过,并且审核日志中出现基础镜像不匹配的错误信息时,需要使用新的基础镜像重新制作镜像。
  • 基础镜像包含的组件、工具如表1表2所示,完整的基础镜像内容可参考Dockerfile
表1 组件列表

名称

说明

run_train.sh

训练启动引导脚本。实现了代码目录下载,执行训练命令、重定向训练日志输出、以及训练命令结束后上传日志文件至OBS的功能。

表2 工具列表

工具名称

说明

utils.sh

工具脚本。“run_train.sh”脚本依赖此脚本。

提供了SK解密,代码目录下载,日志文件上传等方法。

ip_mapper.py

网卡地址获取脚本。

默认获取ib0网卡地址IP,训练代码可以使用ib0网卡的IP加速网络通信。

dls-downloader.py

OBS下载脚本。“utils.sh”脚本依赖此脚本。

ModelArts提供的基础镜像名称格式如下,名称中的具体参数说明请参见表3

swr.<region>.myhuaweicloud.com/<image org>/custom-<processor type>-[<cuda version>]-[<python version>]-base:<image tag>
表3 参数说明

参数

支持的值

说明

<region>

  • cn-north-1
  • cn-north-2
  • cn-north-4
  • cn-south-1
  • ap-southeast-1
  • cn-north-5

镜像所在的区域。支持的值中,分别表示:

  • 北京一
  • 北京二
  • 北京四
  • 华南广州
  • 亚太香港
  • 乌兰察布一

<image org>

  • eiwizard
  • modelarts-job-dev-image

镜像所属组织。建议使用“modelarts-job-dev-image”“eiwizard”不再新增镜像。

<processor type>

  • cpu
  • gpu

处理器类型。

<cuda version>

  • cuda92
  • cuda9
  • cuda8

镜像中已安装的CUDA版本。

当<processor type>为gpu时,<cuda version>才会生效。

<python version>

  • cp27
  • cp36

镜像中已安装的Python版本。

<image tag>

  • 1.0
  • 1.1
  • 1.2
  • 1.3

镜像版本。建议使用最新镜像版本“1.3”

例如,在“华北-北京一”区域,ModelArts支持的基础镜像列表如下,您可根据个人需求选择相应的镜像。

  • swr.cn-north-1.myhuaweicloud.com/eiwizard/custom-cpu-base:1.2
  • swr.cn-north-1.myhuaweicloud.com/modelarts-job-dev-image/custom-cpu-base:1.3
  • swr.cn-north-1.myhuaweicloud.com/eiwizard/custom-gpu-cuda92-base:1.2
  • swr.cn-north-1.myhuaweicloud.com/modelarts-job-dev-image/custom-gpu-cuda92-base:1.3
  • swr.cn-north-1.myhuaweicloud.com/eiwizard/custom-gpu-cuda9-base:1.2
  • swr.cn-north-1.myhuaweicloud.com/modelarts-job-dev-image/custom-gpu-cuda9-base:1.3
  • swr.cn-north-1.myhuaweicloud.com/eiwizard/custom-gpu-cuda8-base:1.2
  • swr.cn-north-1.myhuaweicloud.com/modelarts-job-dev-image/custom-gpu-cuda8-base:1.3
  • ...
分享:

    相关文档

    相关产品

文档是否有解决您的问题?

提交成功!

非常感谢您的反馈,我们会继续努力做到更好!

反馈提交失败,请稍后再试!

*必选

请至少选择或填写一项反馈信息

字符长度不能超过200

提交反馈 取消

如您有其它疑问,您也可以通过华为云社区问答频道来与我们联系探讨

跳转到云社区