文档首页/ AI开发平台ModelArts/ ModelArts Lite Server用户指南/ Lite Server资源开通(旧版页面)
更新时间:2025-08-20 GMT+08:00
分享

Lite Server资源开通(旧版页面)

场景描述

本章节主要介绍如何在ModelArts控制台上购买Lite Server算力资源,及购买前的准备工作。

用户先完成资源配额提升、配置基础权限、设置ModelArts委托授权等准备工作。在购买资源时,用户创建实例并支付订单,支付完成后等待约20~60分钟,资源创建成功后即可配置弹性公网IP进行访问,开展相关AI开发工作。

约束限制

ModelArts Lite Server算力资源当前仅支持“包年/包月”计费模式。

资源开通流程

图1 Server资源开通流程图

表1 Server资源开通流程

阶段

任务

准备工作

1、申请开通资源规格。

2、资源配额提升。

3、基础权限开通。

4、配置ModelArts委托授权。

购买Server资源

5、在ModelArts控制台上购买轻量算力节点 (Lite Server)资源。

步骤1:申请开通资源规格

请联系客户经理确认Server资源方案、申请要开通资源的规格,如果无客户经理可提交工单。

步骤2:提升资源配额

由于Server所需资源可能会超出云服务默认提供的资源(如ECS、EIP、SFS、内存大小、CPU核数),因此需要提升资源配额。

  1. 登录华为云管理控制台
  2. 在顶部导航栏单击“资源 > 我的配额”,进入服务配额页面。
  3. 单击右上角“申请扩大配额”,填写申请材料后提交工单。

    配额需大于需要开通的资源,且在购买开通前完成提升,否则会导致资源开通失败。

步骤3:开通基础权限

开通基础权限需要登录管理员账号,为子用户账号开通Server功能所需的基础权限,包括ModelArts FullAccess、BMS FullAccess、ECS FullAccess、VPC FullAccess、VPC Administrator、VPCEndpoint Administrator,即允许子用户账号同时可以使用这些云服务。

  1. 登录统一身份认证服务管理控制台
  2. 单击目录左侧“用户组”,然后在页面右上角单击“创建用户组”
  3. 填写“用户组名称”并单击“确定”
  4. 在操作列单击“用户组管理”,将需要配置权限的用户加入用户组中。
  5. 单击用户组名称,进入用户组详情页。
  6. 在权限管理页签下,单击“授权”
    图2 “配置权限”

  7. 在搜索栏输入“ModelArts FullAccess”,并勾选“ModelArts FullAccess”
    图3 ModelArts FullAccess

    以相同的方式,依次添加:BMS FullAccess、ECS FullAccess、VPC FullAccess、VPC Administrator、VPCEndpoint Administrator。(Server Administrator、DNS Administrator为依赖策略,会自动被勾选)。

  8. 单击“下一步”,授权范围方案选择“所有资源”
  9. 单击“确认”,完成基础权限开通。

步骤4 在ModelArts上创建委托授权

ModelArts Lite Server在任务执行过程中需要访问用户的其他服务,典型的就是容器使用过程中需要到SWR服务拉取镜像。在这个过程中,就出现了ModelArts“代表”用户去访问其他云服务的情形。从安全角度出发,ModelArts代表用户访问任何云服务之前,均需要先获得用户的授权,而这个动作就是一个“委托”的过程。用户授权ModelArts代表自己访问特定的云服务,以完成其在ModelArts平台上执行的AI计算任务。

  • 新建委托

    第一次使用ModelArts时需要创建委托授权,授权允许ModelArts代表用户去访问其他云服务。进入到ModelArts控制台的系统管理 > 权限管理页面,单击“添加授权”,根据提示进行操作。

  • 更新委托

    如果之前给ModelArts创过委托授权,此处可以更新授权。

    1. 进入到ModelArts控制台“资源管理 > 轻量算力节点 (Lite Server)”页面,查看是否存在授权缺失的提示。
      图4 Lite Server权限缺失提示
    2. 如果有授权缺失,根据提示,单击“此处”更新委托。根据提示选择“追加至已有授权”,单击“确定”,系统会提示权限更新成功。
      图5 追加授权

步骤5:购买轻量算力节点 (Lite Server)资源

购买轻量算力节点 (Lite Server)资源的过程即创建资源过程。

  1. 登录ModelArts管理控制台
  2. 在左侧导航栏中,选择资源管理 > 轻量算力节点 (Lite Server),进入资源列表。
  3. 单击右上角的“购买轻量算力节点”,进入“购买轻量算力节点”页面,在该页面填写相关参数信息。
    图6 购买轻量算力节点时的基础配置
    表2 基础配置参数说明

    参数名称

    说明

    资源类型

    • 裸金属服务器:是一款兼具弹性云服务器和物理机性能的计算类服务器,为您和您的企业提供专属的云上物理服务器。
    • 弹性云服务器:是一种可随时自助获取、可弹性伸缩的云服务器,可帮助您打造可靠、安全、灵活、高效的应用环境,确保服务持久稳定运行,提升运维效率。
    • 超节点服务器:是一种高性能服务器配置,专门用于支持大规模的模型推理任务。这些服务器通常配备有多个计算卡(如昇腾NPU),能够提供强大的计算能力,以满足高负载的推理需求。超节点资源仅支持西南-贵阳一和华东二区域。

    计费模式

    选择“包年/包月”

    包年/包月是预付费模式,按订单的购买周期计费,适用于可预估资源使用周期的场景,价格比按需计费模式更优惠。

    暂不支持按需计费。

    区域

    不同区域的云服务产品之间内网互不相通;请就近选择靠近您业务的区域,可减少网络时延,提高访问速度。资源购买完成后,您可在控制台左上角切换区域,查看对应的资源。

    可用区

    可用区是同一服务区内,电力和网络互相独立的地理区域,一般是一个独立的物理机房,这样可以保证可用区的独立性。是否将资源放在同一可用区内,主要取决于您对容灾能力和网络时延的要求。

    • 如果您的应用需要较高的容灾能力,建议您将资源部署在同一区域的不同可用区内。
    • 如果您的应用要求实例之间的网络延时较低,则建议您将资源创建在同一可用区内。

    边缘小站资源发放的详细内容请参见Lite Server管理CloudPond的NPU资源

    表3 资源配置参数说明

    参数名称

    说明

    服务器名称

    Server的机器名称。只能包含数字、大小写字母、下划线和中划线,长度不能超过64位且不能为空。

    注意:

    订单中的服务器名称会一直保持此处下单购买时设置的名称。后期修改服务器名称后,不会在订单中同步更新。

    CPU架构

    资源类型的CPU架构,支持X86和ARM。

    • X86:如果使用GPU资源选择X86。
    • ARM:如果使用NPU资源则选择ARM。

    请先选择CPU架构,再根据具体需求选择实例规格。具体规格有区域差异,以最终显示为准。已售罄的资源会呈灰色显示,不支持购买。

    如果您购买48台超节点,请结合您的业务场景,自行预留部分机器作为备机,确保机器出现故障时,及时切换到备机。

    说明:

    如果界面无可选规格,请联系华为云技术支持申请开通。

    系统盘

    系统盘和规格有关,选择支持挂载的实例规格才会显示此参数。

    系统盘用于存储服务器的操作系统,创建Lite Server时自带系统盘,且系统盘自动初始化。

    此处支持选择系统盘的类型,并设置大小。系统盘大小取值范围在100GiB和1024GiB之间。

    也可以在Server创建完成后在云服务器侧实现系统盘的扩容。

    系统盘会自动挂载到每个计算节点上。

    数据盘类型(可选)

    单击“添加数据盘”,可以在创建Lite Server时挂载云上EVS数据盘。暂不支持挂载本地磁盘。

    此处支持选择数据盘的类型,并设置大小和数据盘个数。数据盘大小取值范围在100GiB和32768之间。BMS或ECS类型的机器,数据盘个数上限是59块。超节点类型的机器,数据盘个数上限是8块。

    也可以在Server创建完成后在云服务器侧实现数据盘的扩容。

    数据盘会自动挂载到每个计算节点上。

    表4 镜像配置参数说明

    参数名称

    说明

    镜像

    • 公共镜像

      公共镜像对所有用户可见。所有用户可以根据镜像ID进行只读使用。

      ModelArts服务提供了多个公共镜像,支持多种操作系统,并且内置了AI场景相关驱动和软件,为用户提供了一个完整的AI开发环境,方便用户直接进行开发和训练,而无需额外配置。

      当前支持的公共镜像请参考Lite Server算力资源和镜像版本配套关系

    • 私有镜像

      仅镜像创建者可以使用,其他用户无法访问。选择私有镜像创建,可以节省您重复配置服务器的时间。

    表5 网络配置参数说明

    参数名称

    说明

    虚拟私有云

    虚拟私有云(Virtual Private Cloud,简称VPC)用以确保Server资源的安全性、隔离性和网络的灵活性。

    在下拉框中选择Server对应的VPC,建议选择VPC时与其它云服务保持一致,便于网络互通。

    下拉框中无可用VPC时,单击右侧的“新建虚拟私有云”创建一个VPC。创建虚拟私有云需要登录管理员账号,IP地址段请根据现网情况合理规划。

    子网

    选择该VPC下的一个子网。

    下拉框中无子网可选时,单击右侧的“新建子网”创建一个子网。

    安全组

    安全组是一个逻辑上的分组,为同一个VPC内具有相同安全保护需求并相互信任的Server提供访问策略。

    下拉框中无安全组可用时,单击右侧的“新建安全组”创建一个安全组。

    IPv6网络

    如果当前网络配置的子网、规格、镜像都支持IPv6,则会显示该参数,打开后可启用IPv6功能。

    请确保您的子网已开启IPv6功能,如果未开启请参考为虚拟私有云创建新的子网

    不同规格、镜像对IPv6支持的情况不同,如果不支持则不会显示IPv6网络参数,请以控制台实际显示为准。

    RoCE网络

    当使用A系列GPU或昇腾Snt9b、Snt9b23资源进行分布式训练时,为了将硬件上的RoCE网卡使用起来,需要配置RoCE网络。

    该参数与所选规格有关,如果未选中规格或规格不支持RoCE网络,则不显示。

    如果规格支持RoCE网络但未创建过,单击“新建RoCE网络”即可完成创建。

    如果规格支持RoCE网络且已创建过RoCE网络,直接选择已有RoCE网络即可(不支持重复创建)。

    表6 管理参数说明

    参数名称

    说明

    登录凭证

    “密钥对”方式创建的Server节点安全性更高,建议选择“密钥对”方式。如果您习惯使用“密码”方式,请增强密码的复杂度,保证密码符合要求,防止被恶意攻击。

    • 密钥对

      指使用密钥对作为登录Server节点的鉴权方式。您可以选择使用已有的密钥对,或者单击“新建密钥对”创建新的密钥。

      说明:

      如果选择使用已有的密钥,请确保您已在本地获取该文件,否则,将影响您正常登录Server节点。

    • 密码

      指使用设置初始密码方式作为Server节点的鉴权方式,此时,您可以通过用户名密码方式登录Server节点。

      Linux操作系统时为root用户的初始密码,Windows操作系统时为Administrator用户的初始密码。密码复杂度需满足以下要求:

      • 长度为8至26个。
      • 至少包含大写字母、小写字母、数字及特殊符号(!@$%^-_=+[{}]:,./?)中的3种
      • 不能与用户名或倒序的用户名相同。
      • 不能包含root或administrator及其逆序。

    CES主机监控委托

    勾选“开启”

    勾选后,将一键配置CES主机监控委托。委托CES对Server的CPU、内存、网络、磁盘、进程等指标进行监控,监控指标间隔是1分钟。详细监控指标信息请参见使用CES监控Lite Server单节点NPU资源章节。

    表7 高级配置参数说明

    参数名称

    说明

    企业项目

    该参数针对企业用户使用,只有开通了企业项目的客户,或者权限为企业主账号的客户才可见。如需使用该功能,请联系您的客户经理申请开通。

    企业项目是一种云资源管理方式,企业项目管理服务提供统一的云资源按项目管理,以及项目内的资源管理、成员管理,默认项目为default。

    请从下拉列表中选择所在的企业项目。更多关于企业项目的信息,请参见《企业管理用户指南》

    注意:

    已经完成购买的Server,不支持再修改企业项目,订单中暂不支持同步企业项目信息。

    表8 购买配置参数说明

    参数名称

    说明

    购买时长

    选择资源购买时长,并根据需要勾选“自动续费”

    购买数量

    支持同时购买多台机器,输入值必须在1到10之间。

    如果有多台机器资源,会生成对应多笔订单,需逐一支付每笔订单,不可合并支付。

  4. 在当前购买页面的左下角查看配置费用,并单击“立即创建”,完成实例的创建,随后进入付款界面,支付对应资源的订单。
    配置费用中会显示当前资源的费用构成。如果有优惠,可以通过“优惠详情”查看详细内容,配置费用显示的是最终优惠后的费用。实际扣费请在账单中查看。

    如果有多台机器资源,会生成对应多笔订单,需逐一支付每笔订单,不可合并支付。

  5. 支付完成后,由于Server资源创建约20~60分钟,请耐心等待。如果资源创建失败,请参考资源购买失败处理
    图7 资源创建成功

    当容器需要提供服务给多个用户,或者多个用户共享使用该容器时,应限制容器访问Openstack的管理地址(169.254.169.254),以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据

资源购买失败处理

ModelArts的轻量算力节点 (Lite Server)创建失败,可能由多种原因导致,以下给出了几类可能原因,方便快速排查和定位解决。
  • 资源不足:跳转到BMS或ECS页面,查看要购买的规格是否售罄,如果该规格售罄,说明无该规格资源,需要联系客户经理获取到资源后再进行购买。
  • 配额不足:查看账户的资源配额是否满足,如果该账号下资源配额,包括核心数、RAM等,如果未满足也会导致创建失败,需要申请配额后再进行购买。
  • BMS或ECS机器内部错误:查看BMS或ECS界面,创建失败出现内部错误,该问题需要提工单给BMS或ECS进行进一步定位失败原因并解决。

相关文档