训练作业的自定义镜像制作流程

如果您已经在本地完成模型开发或训练脚本的开发，且您使用的AI引擎是ModelArts不支持的框架。您可以制作自定义镜像，并上传至SWR服务。您可以在ModelArts使用此自定义镜像创建训练作业，使用ModelArts提供的资源训练模型。

制作流程

图1 训练作业的自定义镜像制作流程

场景一：预置镜像满足ModelArts训练平台约束，但不满足代码依赖的要求，需要额外安装软件包。

具体案例参考使用预置镜像制作自定义镜像用于训练模型。

场景二：已有本地镜像满足代码依赖的要求，但是不满足ModelArts训练平台约束，需要适配。

具体案例参考已有镜像迁移至ModelArts用于训练模型。

场景三： 当前无可使用的镜像，需要从0制作镜像（既需要安装代码依赖，又需要制作出的镜像满足MAModelArts平台约束）。具体案例参考：

从0制作自定义镜像用于创建训练作业（PyTorch+CPU/GPU）

从0制作自定义镜像用于创建训练作业（MPI+CPU/GPU）

从0制作自定义镜像用于创建训练作业（Tensorflow+GPU）

从0制作自定义镜像用于创建训练作业（MindSpore+Ascend）

训练框架的自定义镜像约束

推荐自定义镜像使用ubuntu-18.04的操作系统，避免出现版本不兼容的问题。
自定义镜像的大小推荐15GB以内，最大不要超过资源池的容器引擎空间大小的一半。镜像过大会直接影响训练作业的启动时间。
ModelArts公共资源池的容器引擎空间为50G，专属资源池的容器引擎空间的默认为50G，支持在创建专属资源池时自定义容器引擎空间。
自定义镜像的默认用户必须为“uid”为“1000”的用户。
自定义镜像中不能安装GPU或Ascend驱动程序。当用户选择GPU资源运行训练作业时，ModelArts后台自动将GPU驱动程序放置在训练环境中的 /usr/local/nvidia目录；当用户选择Ascend资源运行训练作业时，ModelArts后台自动将Ascend驱动程序放置在/usr/local/Ascend/driver目录。
X86 CPU架构和ARM CPU架构的自定义镜像分别只能运行于对应CPU架构的规格中。
执行如下命令，查看自定义镜像的CPU架构。
```
docker inspect {自定义镜像地址} | grep Architecture
```
ARM CPU架构的自定义镜像，上述命令回显如下。
```
"Architecture": "arm64"
```
- 规格中带有ARM字样的显示，为ARM CPU架构。
- 规格中未带有ARM字样的显示，为X86 CPU架构。
ModelArts后台暂不支持下载开源安装包，建议用户在自定义镜像中安装训练所需的依赖包。
自定义镜像需上传至容器镜像服务（SWR）才能在ModelArts上用于训练。

父主题： 制作自定义镜像用于训练模型

上一篇：制作自定义镜像用于训练模型

下一篇：使用预置镜像制作自定义镜像用于训练模型

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！您可在我的云声建议查看反馈及问题处理状态。

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

直接提交取消

如您有其它疑问，您也可以通过华为云社区问答频道来与我们联系探讨

智能客服提问云社区提问

训练作业的自定义镜像制作流程

制作流程

训练框架的自定义镜像约束

相关文档

意见反馈

文档内容是否对您有帮助？

7*24

备案

专业服务

退订

建议反馈

售前咨询热线