管理Standard专属资源池的逻辑子池
用户可以在ModelArts Standard专属资源池上拆分出逻辑子池,并设置每个子池的资源配额,包括保障配额和配额上限。拆分出逻辑子池后,训练、推理和开发环境的任务投递,需要投递在逻辑子池上,并受逻辑子池的配额约束,满足配额约束的任务才能被投递运行。
在资源池详情页,切换到“逻辑子池”页签。在逻辑子池列表中,您可以单击左上角“创建逻辑子池”创建逻辑子池,也可对已创建的逻辑子池做扩缩容、设置作业类型和删除操作。
如果需要将一个逻辑子池的资源迁移给另外一个逻辑子池子池,可以把其中一个逻辑子池子池删掉,然后对另外一个子池进行扩容操作。
创建逻辑子池
- 登录ModelArts管理控制台,在左侧菜单栏中选择“资源管理 > 标准算力集群 (Standard Cluster)”。
- 在资源池列表中,单击某一资源池名称,进入资源池详情页。
- 在资源池详情页,切换到“逻辑子池”页签。在逻辑子池列表中,您可以单击左上角“创建逻辑子池”。
图1 逻辑子池
- 单击“创建逻辑子池”,在弹窗中填写信息,然后单击“确定”创建逻辑子池。
创建逻辑子池后,如果逻辑子池需要绑定物理池节点,请开启Standard专属资源池节点绑定。
表1 创建逻辑子池参数说明 参数
说明
名称
逻辑子池名称。
描述
逻辑子池的简单描述。
作业类型
逻辑子池支持运行的作业类型,必须是物理专属资源池中支持的作业类型。
实例规格管理
针对逻辑子池的实例规格设置如下参数,ModelArts平台会根据所配置的参数进行逻辑子池的任务调度。
- 步长:每次调整保障配额时的最小单位。在节点绑定场景下每个步长内的节点将作为一个整体,且属于同一批次。仅超节点和整柜节点才有步长。在超节点场景下,允许创建的逻辑子池步长比物理池步长小。
- 保障配额:逻辑子池拥有的最小资源量,可以设置为0。
- 配额上限:逻辑子池拥有的最大资源量,必须大于等于保障配额。
当保障配额<配额上限时,即使物理专属资源池支持“开发环境”,“作业类型”也不支持选择“开发环境”。
任务调度规则:- 所需资源量 ≤ 保障配额的作业可以保障资源占用。
- 所需资源量 > 保障配额且 ≤ 配额上限的作业,在资源充足时可以调度,资源不足时会被抢占。
图2 创建逻辑子池
扩缩容逻辑子池
针对已创建的逻辑子池,单击操作列“扩缩容”,在弹窗中重新设置实例规格管理,单击“确定”。

如果是开启节点绑定的逻辑子池,扩缩容时需要确认是否进行节点排水。节点排水通常指的是清空节点资源以便释放或移除不再需要的节点。
启用节点排水后将会对扩缩容的节点进行排水,仅本次扩缩容操作生效。可前往节点页签查看排水状态,如果排水失败,可将鼠标移至节点状态查看排水失败原因。

排水过程中节点会被设置为不可调度,节点上的作业负载会被驱逐,可能导致作业失败。
设置逻辑子池作业类型
针对已创建的逻辑子池,单击操作列的“设置作业类型”,在弹窗中设置当前逻辑子池的作业类型,单击“确定”。

更改已设置的作业类型可能会导致: 开发环境实例被删除、正在运行的训练作业失败、正在运行的推理服务失败。
删除逻辑子池
针对已创建的逻辑子池,单击操作列的“删除”,在弹窗的输入框中输入DELETE,单击“确定”。

开启/关闭Standard专属资源池节点绑定
当资源池下已创建逻辑子池,支持开启节点绑定,为逻辑子池绑定专属的节点。
开启节点绑定后,系统会自动绑定相应数量的专属节点,任务只能在这些绑定的节点上运行,确保资源专有性和稳定性。主要适用于需要高资源保障和稳定性的任务场景。
节点绑定作用如下:
- 提高任务稳定性:通过绑定特定节点,任务不会因节点动态分配而中断,确保任务的连续性和稳定性。
- 资源保障:绑定节点后,任务可以独占绑定的节点资源,避免与其他任务竞争资源。
- 优化资源利用率:通过合理分配节点资源,可以提高整体资源利用率,避免资源浪费。
开启节点绑定
开启节点绑定后,服务后台会为逻辑子池自动绑定节点。
在资源池列表中,选择某个资源池右侧操作列的“ > 开启节点绑定”。
在“开启节点绑定”弹窗中,单击“确定”。
- 登录ModelArts管理控制台,在左侧菜单栏中选择“资源管理 > 标准算力集群 (Standard Cluster)”。
- 在资源池列表中,选择某个资源池右侧操作列的“
> 开启节点绑定”。
- 在“开启节点绑定”弹窗中,单击“确定”。
Standard专属资源池开启节点绑定后,资源池内的节点支持换绑逻辑子池。

关闭节点绑定功能可能会导致原逻辑子池上的作业被抢占,请谨慎操作。
在资源池列表中,选择某个资源池右侧操作列的“ > 关闭节点绑定”。
- 在“关闭节点绑定”弹窗中,确认信息,并在文本框中输入“YES”,单击“确定”。
- 登录ModelArts管理控制台,在左侧菜单栏中选择“资源管理 > 标准算力集群 (Standard Cluster)”。
- 在资源池列表中,选择某个资源池右侧操作列的“
> 关闭节点绑定”。
- 在“关闭节点绑定”弹窗中,确认信息,并在文本框中输入“YES”,单击“确定”。
换绑逻辑子池
Standard专属资源池开启节点绑定后,资源池内的节点可换绑指定的逻辑子池。
- 登录ModelArts管理控制台,在左侧菜单栏中选择“资源管理 > 标准算力集群 (Standard Cluster)”。
- 在资源池列表中,单击已开启节点绑定的资源池名称,进入资源池详情页。
- 切换至“节点”页签,勾选待换绑逻辑子池的节点,单击上方的“更多>换绑资源池”。
图5 换绑逻辑子池
- 在“换绑逻辑子池”弹窗中,设置换绑节点参数,符合参数配置的节点换绑逻辑子池。
- 当节点状态处于非稳态(除可用和异常状态以外的状态)时,不可对节点进行换绑操作。
- 逻辑子池的驱动版本和节点驱动不匹配时,节点驱动会自动升级导致节点运行中的业务中断,请谨慎操作。
表2 选择换绑节点参数说明 参数
说明
节点来源
选择换绑前节点所属资源池类型。可选择“物理资源池”和“逻辑子池”的节点换绑。
节点类型
选择换绑节点的节点类型,支持“单节点”和“超节点”类型。
- 单节点:单一物理主机或虚拟主机,提供基础的独立计算、存储和网络资源。
- 超节点:融合架构节点,提供大规模计算资源池,支持灵活调配和高密度部署。超节点专门用于支持大规模的模型推理任务。这些服务器通常配备有多个计算卡(如昇腾NPU),能够提供强大的计算能力,以满足高负载的推理需求。超节点资源仅支持西南-贵阳一和华东二区域。
实例规格
选择换绑节点的实例规格。仅支持选择同一规格的节点进行换绑操作。
节点批次
“节点类型”选择“超节点”时,需要选择换绑节点的节点批次。仅支持选择同一批次的节点进行换绑操作。
节点列表
在节点列表中勾选换绑的节点。
节点排水
节点排水通常指的是清空节点资源以便释放或移除不再需要的节点。
启用节点排水后将会对换绑逻辑子池的节点进行排水,仅本次换绑逻辑子池操作生效。可前往节点页签查看排水信息,如果排水失败,可将鼠标移至节点状态查看排水失败原因。
警告:排水过程中节点会被设置为不可调度,节点上的作业负载会被驱逐,可能导致作业失败。
- 单击“下一步”,选择目标资源池类型,并勾选目标资源池,单击“确定”。
“节点来源”是“物理资源池”,目标资源池必须是逻辑子池,“节点来源”是“逻辑子池”,目标资源池支持选择物理资源池和逻辑子池。
如果选择的节点类型是超节点,仅支持换绑至与实例规格匹配,且已选节点可被资源池规格步长整除的逻辑子池。图6 选择目标逻辑子池