Lite Server管理CloudPond的NPU资源
场景描述
客户已经购买的CloudPond的昇腾算力资源需要通过Lite Server发放。本方案主要介绍如何通过Lite Server发放资源。
CloudPond可以理解为华为云的一个边缘可用区,边缘可用区将云基础设施和云服务部署到企业现场,适合对应用访问时延、数据本地化留存及本地系统交互等有高要求的场景,可便捷地将云端丰富应用部署到本地,CloudPond介绍可参考产品介绍。
Lite Server仅是对CloudPond上的昇腾算力资源进行了发放、启动、停止、删除等生命周期管理。
约束限制
Lite Server仅支持对CloudPond的Ascend Snt9b资源进行纳管,不支持GPU、CPU资源纳管。
仅新版的Lite Server购买界面支持发放CloudPond类型的资源。
前提条件
- 已购买CloudPond云服务,具体请参见CloudPond快速入门。
- 请联系客户经理确认Server资源方案、申请要开通资源的规格,如果无客户经理可提交工单。
- 提升资源配额,具体请参见步骤2:提升资源配额。
- 开通基础权限,具体请参见步骤3:开通基础权限。
- 配置ModelArts委托授权,具体请参见步骤4 在ModelArts上创建委托授权。
计费影响
在Lite Server上发放并纳管CloudPond资源的操作是免费的,CloudPond资源费用实际在购买CloudPond资源时收取。
发放CloudPond资源操作
创建Lite Server资源过程即发放CloudPond类型的资源过程。
- 登录ModelArts管理控制台。
- 在左侧导航栏中,选择 ,进入资源列表。
- 单击右上角的“购买轻量算力节点”,进入“购买轻量算力节点”页面,在该页面填写相关参数信息。
Lite Server购买界面存在新旧两个版本,仅新版的Lite Server购买界面支持发放CloudPond类型的资源。
图1 购买轻量算力节点时的基础配置表1 基础配置参数说明 参数名称
说明
节点类型
必须选择“单节点”。
资源类型
必须选择“弹性云服务器”。
计费模式
必须选择“按需计费”。目前策略是免费创建。
区域
选择已购买的边缘小站类型的资源所在区域。
可用区
选择“边缘小站”,在下拉框中勾选已有的CloudPond资源。如果没有可用的CloudPond资源,请参考CloudPond快速入门创建。
表2 资源配置参数说明 参数名称
说明
CPU架构
资源类型的CPU架构,请选择ARM。由于Lite Server仅支持对CloudPond的Ascend Snt9b资源进行纳管,所以选择ARM。
请先选择CPU架构,再根据具体需求选择实例规格。具体规格有区域差异,以最终显示为准。
说明:如果界面无可选规格,请联系华为云技术支持申请开通。
系统盘
系统盘和规格有关,选择支持挂载的规格才会显示此参数。可以在创建完成后在云服务器侧实现数据盘挂载或系统盘的扩容,建议取值至少100GB。
表3 操作系统参数说明 参数名称
说明
镜像
- 公共镜像
公共镜像对所有用户可见。所有用户可以根据镜像ID进行只读使用。
ModelArts服务提供了多个公共镜像,支持多种操作系统,并且内置了AI场景相关驱动和软件,为用户提供了一个完整的AI开发环境,方便用户直接进行开发和训练,而无需额外配置。
当前支持的公共镜像请参考Lite Server算力资源和镜像版本配套关系。
- 私有镜像
表4 存储配置参数说明 参数名称
说明
节点系统盘类型
系统盘和规格有关,选择支持挂载的实例规格才会显示此参数。
节点系统盘用于存储服务器的操作系统,创建Lite Server时自带系统盘,且系统盘自动初始化。
此处支持选择“节点系统盘类型”,并设置“大小”。系统盘大小取值范围在100GiB和1024GiB之间。
也可以在Server创建完成后再进行系统盘的扩容。
系统盘会自动挂载到每个计算节点上。
节点数据盘类型(可选)
单击“增加数据盘”,可以在创建Lite Server时挂载云上EVS数据盘。暂不支持挂载本地磁盘。
此处支持选择“节点数据盘类型”,并设置“大小”和数据盘“数量”。
数据盘大小取值范围在100GiB和32768GiB之间。
ECS类型的机器,数据盘个数上限是59块。也可以在Server创建完成后再进行数据盘的扩容。
数据盘会自动挂载到每个计算节点上。
表5 网络配置参数说明 参数名称
说明
虚拟私有云
虚拟私有云(Virtual Private Cloud,简称VPC)用以确保Server资源的安全性、隔离性和网络的灵活性。
在下拉框中选择Server对应的VPC,建议选择VPC时与其它云服务保持一致,便于网络互通。
下拉框中无可用VPC时,单击右侧的“新建虚拟私有云”创建一个VPC。创建虚拟私有云需要登录管理员账号,IP地址段请根据现网情况合理规划。
子网
选择该VPC下对应CloudPond边缘区域子网。
下拉框中无子网可选时,单击右侧的“新建子网”创建一个子网。
安全组
安全组是一个逻辑上的分组,为同一个VPC内具有相同安全保护需求并相互信任的Server提供访问策略。
下拉框中无安全组可用时,单击右侧的“新建安全组”创建一个安全组。
IPv6网络
如果当前网络配置的子网、规格、镜像都支持IPv6,则会显示该参数,打开后可启用IPv6功能。
请确保您的子网已开启IPv6功能,如果未开启请参考为虚拟私有云创建新的子网。
不同规格、镜像对IPv6支持的情况不同,如果不支持则不会显示IPv6网络参数,请以控制台实际显示为准。
RoCE网络
当使用A系列GPU或昇腾Snt9b、Snt9b23资源进行分布式训练时,为了将硬件上的RoCE网卡使用起来,需要配置RoCE网络。
该参数与所选规格有关,如果未选中规格或规格不支持RoCE网络,则不显示。
如果规格支持RoCE网络但未创建过,单击“新建RoCE网络”即可完成创建。
如果规格支持RoCE网络且已创建过RoCE网络,直接选择已有RoCE网络即可(不支持重复创建)。
表6 节点管理参数说明 参数名称
说明
服务器名称
Server的机器名称。只能包含数字、大小写字母、下划线和中划线,长度不能超过64位且不能为空。
登录凭证
“密钥对”方式创建的Server节点安全性更高,建议选择“密钥对”方式。如果您习惯使用“密码”方式,请增强密码的复杂度,保证密码符合要求,防止被恶意攻击。
- 密钥对
指使用密钥对作为登录Server节点的鉴权方式。您可以选择使用已有的密钥对,或者单击“新建密钥对”创建新的密钥。
说明:如果选择使用已有的密钥,请确保您已在本地获取该文件,否则,将影响您正常登录Server节点。
- 密码
指使用设置初始密码方式作为Server节点的鉴权方式,此时,您可以通过用户名密码方式登录Server节点。
Linux操作系统时为root用户的初始密码,Windows操作系统时为Administrator用户的初始密码。密码复杂度需满足以下要求:
- 长度为8至26个。
- 至少包含大写字母、小写字母、数字及特殊符号(!@$%^-_=+[{}]:,./?)中的3种
- 不能与用户名或倒序的用户名相同。
- 不能包含root或administrator及其逆序。
CES主机监控委托
勾选“开启”。
勾选后,将一键配置CES主机监控委托。委托CES对Server的CPU、内存、网络、磁盘、进程等指标进行监控,监控指标间隔是1分钟。详细监控指标信息请参见使用CES监控Lite Server单节点NPU资源章节。
企业项目
该参数针对企业用户使用,只有开通了企业项目的客户,或者权限为企业主账号的客户才可见。如需使用该功能,请联系您的客户经理申请开通。
企业项目是一种云资源管理方式,企业项目管理服务提供统一的云资源按项目管理,以及项目内的资源管理、成员管理,默认项目为default。
请从下拉列表中选择所在的企业项目。更多关于企业项目的信息,请参见《企业管理用户指南》。
注意:已经完成购买的Server,不支持再修改企业项目,订单中暂不支持同步企业项目信息。
表7 高级配置参数说明 参数名称
说明
CES主机监控委托
勾选“开启”。
勾选后,将一键配置CES主机监控委托。委托CES对Server的CPU、内存、网络、磁盘、进程等指标进行监控,监控指标间隔是1分钟。详细监控指标信息请参见使用CES监控Lite Server单节点NPU资源章节。
表8 购买配置参数说明 参数名称
说明
购买数量
支持同时购买多台机器,输入值必须在1到10之间。
- 公共镜像
- 单击“立即购买”,完成实例的创建。目前策略是免费发放。
- 由于Server资源创建约20~60分钟,请耐心等待。如果资源创建失败,请参考资源购买失败处理。
图2 资源创建成功