Lite Server资源开通
阶段 |
任务 |
---|---|
准备工作 |
1、申请开通资源规格。 |
2、资源配额提升。 |
|
3、基础权限开通。 |
|
4、配置ModelArts委托授权。 |
|
5、创建虚拟私有云。 |
|
6、创建密钥对。(可选,若为密码登录方式则不需要) |
|
购买Server资源 |
7、在ModelArts控制台上购买资源池。 |
步骤1:申请开通资源规格
请联系华为云客户经理确认Server资源方案、申请要开通资源的规格(若无客户经理可提交工单)。
步骤2:资源配额提升
由于Server所需资源可能会超出华为云默认提供的资源(如ECS、EIP、SFS、内存大小、CPU核数),因此需要提升资源配额。
- 登录华为云管理控制台。
- 在顶部导航栏单击“资源 > 我的配额”,进入服务配额页面。
- 单击右上角“申请扩大配额”,填写申请材料后提交工单。
配额需大于需要开通的资源,且在购买开通前完成提升,否则会导致资源开通失败。
步骤3:基础权限开通
基础权限开通需要登录管理员账号,为子用户账号开通Server功能所需的基础权限(ModelArts FullAccess/BMS FullAccess/ECS FullAccess/VPC FullAccess/VPC Administrator/VPCEndpoint Administrator)。
- 登录统一身份认证服务管理控制台。
- 单击目录左侧“用户组”,然后在页面右上角单击“创建用户组”。
- 填写“用户组名称”并单击“确定”。
- 在操作列单击“用户组管理”,将需要配置权限的用户加入用户组中。
- 单击用户组名称,进入用户组详情页。
- 在权限管理页签下,单击“授权”。
图2 “配置权限”
- 在搜索栏输入“ModelArts FullAccess”,并勾选“ModelArts FullAccess”。
图3 ModelArts FullAccess
以相同的方式,依次添加:BMS FullAccess、ECS FullAccess、VPC FullAccess、VPC Administrator、VPCEndpoint Administrator。(Server Administrator、DNS Administrator为依赖策略,会自动被勾选)。
- 单击“下一步”,授权范围方案选择“所有资源”。
- 单击“确认”,完成基础权限开通。
步骤4 在ModelArts上创建委托授权
步骤5:创建虚拟私有云
创建虚拟私有云需要登录管理员账号,IP地址段请根据现网情况合理规划。
- 登录管理控制台。
- 在左侧服务列表中,单击“网络 > 虚拟私有云 VPC”,进入虚拟私有云页面。
- 单击右上角“创建虚拟私有云”后,根据界面提示配置虚拟私有云参数(参数介绍可参考此处),然后单击“立即创建”。
图6 新建虚拟私有云
步骤6:创建密钥对
若使用密码方式登录裸金属服务器,则不需要创建密钥对。
- 登录ModelArts管理控制台。
- 在左侧导航栏中,选择“AI专属资源池 > 弹性节点 Server”,进入“节点”列表。
- 单击“购买AI专属节点”,进入“创建Server”页面。
- 单击“新建密钥对”。
- 在新页面中单击右上角“创建密钥对”后,单击“确定”,并将密钥对保存至本地。
图7 创建密钥对
步骤7:购买资源
当前支持的裸金属镜像请见Lite Server算力资源和镜像版本配套关系,在创建Server实例时,根据所需镜像选择对应的规格。
- 登录ModelArts管理控制台。
- 在左侧导航栏中,选择“AI专属资源池 > 弹性节点 Server”,进入“节点”列表。
- 单击“购买AI专属节点”,进入“购买AI专属节点”页面,在该页面填写相关参数信息。
表2 基础配置参数说明 参数名称
说明
资源类型
- 裸金属服务器是一款兼具弹性云服务器和物理机性能的计算类服务器,为您和您的企业提供专属的云上物理服务器。
- 弹性云服务器是一种可随时自助获取、可弹性伸缩的云服务器,可帮助您打造可靠、安全、灵活、高效的应用环境,确保服务持久稳定运行,提升运维效率。
计费模式
选择“按需计费”或“包年/包月”模式。
区域
不同区域的云服务产品之间内网互不相通;请就近选择靠近您业务的区域,可减少网络时延,提高访问速度。资源购买完成后,您可在控制台左上角切换区域,查看对应的资源。
可用区
可用区是同一服务区内,电力和网络互相独立的地理区域,一般是一个独立的物理机房,这样可以保证可用区的独立性。是否将资源放在同一可用区内,主要取决于您对容灾能力和网络时延的要求。
- 如果您的应用需要较高的容灾能力,建议您将资源部署在同一区域的不同可用区内。
- 如果您的应用要求实例之间的网络延时较低,则建议您将资源创建在同一可用区内。
若您使用了CloudPond云服务,您可以在此处看到对应的边缘可用区。边缘可用区将云基础设施和云服务部署到企业现场,适合对应用访问时延、数据本地化留存及本地系统交互等有高要求的场景,可便捷地将云端丰富应用部署到本地,CloudPond介绍可参考产品介绍。
表3 集群配置参数说明 参数名称
说明
服务器名称
Server的机器名称。只能包含数字、大小写字母、下划线和中划线,长度不能超过64位且不能为空。
注意:订单中的服务器名称会一直保持此处下单购买时设置的名称。后期修改服务器名称后,不会在订单中同步更新。
CPU架构
资源类型的CPU架构,支持X86和ARM。请根据所需规格选择CPU架构,若使用GPU选择X86,若使用NPU则选择ARM。具体规格有区域差异,以最终显示为准。
说明:如果界面无可选规格,请联系华为云技术支持申请开通。
系统盘
系统盘和规格有关,选择支持挂载的规格才会显示此参数。可以在创建完成后在云服务器侧实现数据盘挂载或系统盘的扩容,建议取值至少100GB。
表4 镜像配置参数说明 参数名称
说明
镜像
- 公共镜像
常见的标准操作系统镜像,所有用户可见,包括操作系统以及预装的公共应用(SDI卡驱动、bms-network-config网络配置程序、Cloud-init初始化工具等)。请根据您的实际需要自助配置应用环境或相关软件。ModelArts服务提供镜像支持多种操作系统,内置AI场景相关驱动和软件,预置ModelArts自定义OS优化组件,当前支持的镜像请参考Lite Server算力资源和镜像版本配套关系。
- 私有镜像
用户基于外部镜像文件或裸金属服务器创建的个人镜像,仅用户自己可见。包含操作系统、预装的公共应用以及用户的私有应用。选择私有镜像创建,可以节省您重复配置服务器的时间。
表5 选择网络参数说明 参数名称
说明
虚拟私有云
配置Server的虚拟私有云(Virtual Private Cloud,简称VPC),建议选择VPC时与其它云服务(如MRS、CCE等云服务) 保持一致,便于网络互通。
子网
选择该VPC下的一个子网。
IPv6网络
若当前网络配置的子网、规格、镜像都支持IPv6,则会显示该参数,打开后可启用IPv6功能。
请确保您的子网已开启IPv6功能,若未开启请参考为虚拟私有云创建新的子网。
不同规格、镜像对IPv6支持的情况不同,若不支持则不会显示IPv6网络参数,请以控制台实际显示为准。
RoCE网络
当前使用A系列GPU时,进行分布式训练为了将硬件上的RoCE网卡使用起来,需要配置RoCE网络。
该参数与所选规格有关,若未选中规格或规格不支持RoCE网络,则不显示。
若规格支持RoCE网络但未创建过,单击“新建RoCE网络”即可完成创建。
若规格支持RoCE网络且已创建过RoCE网络,直接选择已有RoCE网络即可(不支持重复创建)。
安全组
安全组是一个逻辑上的分组,为同一个VPC内具有相同安全保护需求并相互信任的Server提供访问策略。
表7 高级配置参数说明 参数名称
说明
企业项目
该参数针对企业用户使用,只有开通了企业项目的客户,或者权限为企业主账号的客户才可见。如需使用该功能,请联系您的客户经理申请开通。
企业项目是一种云资源管理方式,企业项目管理服务提供统一的云资源按项目管理,以及项目内的资源管理、成员管理,默认项目为default。
请从下拉列表中选择所在的企业项目。更多关于企业项目的信息,请参见《企业管理用户指南》。
注意:已经完成购买的Server,不支持再修改企业项目,订单中暂不支持同步企业项目信息。
表8 购买配置参数说明 参数名称
说明
购买数量
支持同时购买多台机器,输入值必须在1到10之间。
若有多台机器资源,会生成对应多笔订单,需逐一支付每笔订单,不可合并支付。
- 单击“立即创建”,完成实例的创建,随后进入付款界面。
- 支付对应资源的订单。
图8 支付订单
若有多台机器资源,会生成对应多笔订单,需逐一支付每笔订单,不可合并支付。
- 支付完成后,由于Server资源创建约20~60分钟,请耐心等待,创建成功如下所示。
图9 资源创建成功
- 若ModelArts弹性节点Server创建失败,可能由多种原因导致,以下给出了几种类型的可能原因进行快速排查和定位解决。
- 资源不足:跳转到BMS页面,查看要购买的规格是否售罄,如果该规格售罄,说明无该规格资源,需要联系客户经理获取到资源后再进行购买。
- 配额不足:查看账户的资源配额是否满足,若该账号下资源配额,包括核心数、RAM等,如果未满足也会导致创建失败,需要申请配额后再进行购买。
- BMS机器内部错误:查看BMS界面,创建失败出现内部错误,该问题需要提工单给BMS进行进一步定位失败原因并解决。
- 当容器需要提供服务给多个用户,或者多个用户共享使用该容器时,应限制容器访问Openstack的管理地址(169.254.169.254),以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。
- 若ModelArts弹性节点Server创建失败,可能由多种原因导致,以下给出了几种类型的可能原因进行快速排查和定位解决。