更新时间:2024-06-15 GMT+08:00
训练作业自定义镜像规范
针对您本地开发的模型及训练脚本,在制作镜像时,需满足ModelArts定义的规范。
规范要求
- 推荐自定义镜像使用ubuntu-18.04的操作系统,避免出现版本不兼容的问题。
- 自定义镜像的大小推荐15GB以内,最大不要超过资源池的容器引擎空间大小的一半。镜像过大会直接影响训练作业的启动时间。
ModelArts公共资源池的容器引擎空间为50G,专属资源池的容器引擎空间的默认为50G,支持在创建专属资源池时自定义容器引擎空间。
- 自定义镜像的默认用户必须为“uid”为“1000”的用户。
- 自定义镜像中不能安装GPU或Ascend驱动程序。当用户选择GPU资源运行训练作业时,ModelArts后台自动将GPU驱动程序放置在训练环境中的 /usr/local/nvidia目录;当用户选择Ascend资源运行训练作业时,ModelArts后台自动将Ascend驱动程序放置在/usr/local/Ascend/driver目录。
- X86 CPU架构,ARM CPU架构的自定义镜像分别只能运行于对应CPU架构的规格中。
- ModelArts后台暂不支持下载开源安装包,建议用户在自定义镜像中安装训练所需的依赖包。
父主题: 准备训练镜像