文档首页/ AI开发平台ModelArts/ 最佳实践/ 历史待下线案例/ 示例:从 0 到 1 制作自定义镜像并用于训练(MindSpore+Ascend)
更新时间:2024-08-17 GMT+08:00
分享

示例:从 0 到 1 制作自定义镜像并用于训练(MindSpore+Ascend)

本案例介绍如何从0到1制作Ascend容器镜像,并使用该镜像在ModelArts平台上进行训练。镜像中使用的AI引擎是MindSpore,训练使用的资源是专属资源池的Ascend芯片。

约束限制

  • 由于案例中需要下载商用版CANN,因此本案例仅面向有下载权限的渠道用户,非渠道用户建议参考其他自定义镜像制作教程。
  • Mindspore版本与CANN版本,CANN版本与Ascend驱动/固件版本均有严格的匹配关系,版本不匹配会导致训练失败。

场景描述

目标:构建安装如下软件的容器镜像,并在ModelArts平台上使用Ascend规格资源运行训练任务。

  • ubuntu-18.04
  • cann-6.3.RC2 (商用版本)
  • python-3.7.13
  • mindspore-2.1.1
  • 本教程以cann-6.3.RC2.、mindspore-2.1.1为例介绍。
  • 本示例仅用于示意Ascend容器镜像制作流程,且在匹配正确的Ascend驱动/固件版本的专属资源池上运行通过。

操作流程

使用自定义镜像创建训练作业时,需要您熟悉docker软件的使用,并具备一定的开发经验。详细步骤如下所示:

  1. Step1 创建OBS桶和文件夹
  2. Step2 准备脚本文件并上传至OBS中
  3. Step3 制作自定义镜像
  4. Step4 上传镜像至SWR
  5. Step5 在ModelArts上创建Notebook并调试
  6. Step6 在ModelArts上创建训练作业

相关文档