更新时间:2024-11-21 GMT+08:00
分享

准备环境

本文档中的模型运行环境是ModelArts Lite的DevServer。请参考本文档要求准备资源环境。

资源规格要求

计算规格:不同模型训练推荐的NPU卡数请参见表1

硬盘空间:至少200GB。

Ascend资源规格:

  • Ascend: 1*ascend-snt9b表示Ascend单卡。
  • Ascend: 8*ascend-snt9b表示Ascend 8卡。

购买并开通资源

如果使用DevServer资源,请参考DevServer资源开通,购买DevServer资源,并确保机器已开通,密码已获取,能通过SSH登录,不同机器之间网络互通。

当容器需要提供服务给多个用户,或者多个用户共享使用该容器时,应限制容器访问Openstack的管理地址(169.254.169.254),以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据

购买共享存储硬盘资源(多机训练场景)

用户若购买开通多个节点机器资源,并使用多机进行分布式训练时,则需要用户购买可挂载的存储硬盘资源,以实现多机共同访问同一存储硬盘资源。ModelArts Lite DevServer 支持配置的存储方案请参考配置Lite Server存储。其中访问方式中,可支持在裸金属服务器中挂载的有弹性文件服务SFS和云硬盘EVS。

相关文档