更新时间:2025-08-14 GMT+08:00

扩缩容Lite Cluster资源池

场景介绍

当Lite Cluster资源池创建完成,使用一段时间后,由于用户业务的变化,对于资源池资源量的需求可能会产生变化,面对这种场景,ModelArts Lite Cluster资源池提供了扩缩容功能,用户可以根据需求动态调整资源。

对已有规格实例数扩缩容,即增加或减少资源池已有规格的实例数量,增加实例数即扩容,减少实例数即缩容。扩缩容规格实例数适用于调整资源池的整体规模,减少资源池中的节点数量来优化资源使用;如果因为资源池节点异常或空闲需要移除特定的节点,请前往资源池详情页面删除节点

  • 缩容操作可能影响到正在运行的业务,建议用户在业务空窗期进行缩容,或进入资源池详情页面,在指定空闲的节点上进行删除来实现缩容。
  • 缩容规格实例数时,资源池中如果包含已开启删除锁的节点,可能会导致开启删除锁的节点被删除,从而中断正在运行的业务,且该动作不可回退,因此建议不要对这些节点进行缩容。如果仍需缩容,请前往资源池详情页删除节点

计费影响

在增加实例数量时,会产生计算资源的计费。具体费用可参见ModelArts价格详情

可以在扩缩容时通过指定节点计费模式,为资源池新创建的节点设置不同于资源池的计费模式。例如用户可以在包周期的资源池中创建按需的节点,如果用户不指定该参数,创建的节点计费模式和资源池保持一致。具体内容如表1所示。

表1 计费项

计费项

计费项说明

适用的计费模式

计费公式

计算资源

专属资源池

使用计算资源的用量。

具体费用可参见ModelArts价格详情

包年/包月

规格单价 * 计算节点个数 * 购买时长

前提条件

已经开通Lite Cluster资源池

约束限制

  • 只支持对状态为“运行中”的Lite Cluster资源池进行扩缩容。
  • 缩容规格实例数时,当Lite Cluster资源池中只剩一个实例节点时,无法进行缩容操作。因此,缩容操作必须确保至少保留一个节点。
  • 包年/包月的资源池仅支持扩容操作。

扩缩容Lite Cluster资源池

  1. 登录ModelArts管理控制台,在左侧菜单栏中选择“资源管理 > 轻量算力集群(Lite Cluster)”。
  2. 单击某个资源池操作列的“扩缩容”对资源池进行扩缩容。对于为包周期资源池,此按钮为“扩容”,如果需要缩容,请进入到包周期资源池详情页对节点进行退订节点操作。
  3. 在“专属资源池扩缩容”页面,按表2设置扩缩容参数。
    表2 专属资源池扩缩容参数说明

    参数

    说明

    实例规格类型

    当前待扩缩容的Lite Cluster资源池实例规格类型。不可编辑。

    规格内容

    当前待扩缩容的Lite Cluster资源池规格内容。不可编辑。

    当前实例数

    当前待扩缩容的Lite Cluster资源池实例数。不可编辑。

    可用区

    指定扩缩容完成后节点的可用区分布。可选择“随机分配”“指定可用区”

    • 选择随机分配时,扩缩容完成后,节点的可用区分布由系统后台随机选择。
    • 选择指定可用区时,可指定扩缩容完成后节点的可用区分布。可用区ID对应的实例数总和默认为“目标总实例数”

      比如:

      • 当前实例数为3,可用区ID对应的实例数总和为5,“目标总实例数”默认为5,表示扩容实例数至5。
      • 当前实例数为3,可用区ID对应的实例数总和为2,“目标总实例数”默认为2,表示缩容实例数至2。

    容器引擎空间限制

    扩容资源池时,即“目标总实例数”大于“当前总实例数”时,可以设置新建节点的容器引擎空间大小,可指定“容器引擎空间”大小。

    此操作会导致资源池内该规格下节点的dockerBaseSize不一致,可能会使得部分任务在不同节点的运行情况不一致,请谨慎操作。存量节点不支持修改容器引擎空间大小

    容器引擎空间大小

    “容器引擎空间限制”选择“指定大小”时,设置新建节点的容器引擎空间大小。

    目标总实例数

    通过设置目标总实例数实现扩缩容。请用户根据本身业务诉求进行调整。

    • 扩容:设置“目标总实例数”大于“当前总实例数”
    • 缩容:设置“目标总实例数”小于“当前总实例数”

    如果“可用区”选择“指定可用区”,不用另外设置“目标总实例数”“目标总实例数”默认为可用区ID对应的实例数总和。

    如果购买资源池时,节点数量采用整柜方式购买(部分规格支持),则在扩缩容时为整柜方式扩缩容,目标实例总数等于“数量*整柜”。“整柜”参数为创建资源池时选择,扩缩容时不可修改。用户通过增减“数量”来改变“目标总实例数”。

    节点池名称

    当前待扩缩容的Lite Cluster资源池名称。不可编辑。

    容器引擎

    容器引擎是Kubernetes最重要的组件之一,负责管理镜像和容器的生命周期。Kubelet通过Container Runtime Interface (CRI) 与容器引擎交互,以管理镜像和容器。其中Containerd调用链更短,组件更少,更稳定,占用节点资源更少,Containerd和Docker差异对比请见容器引擎

    如果CCE集群版本低于1.23,仅支持选择Docker作为容器引擎。如果CCE集群版本大于等于1.27,仅支持选择Containerd作为容器引擎。其余CCE集群版本,支持选择Containerd或Docker作为容器引擎。

    操作系统

    在下拉列表中指定操作系统版本。

  4. 指定节点计费模式。用户增加节点数量时,可以打开“节点计费模式”开关,为资源池新扩容的节点设置不同于资源池的计费模式、购买时长和开启自动续费功能。例如用户可以在包周期的资源池中创建按需的节点。若用户不指定该参数,则新扩容的节点计费模式和资源池保持一致。
  5. 设置完成后,单击“提交”,在弹出的确认框中单击“确定”完成扩缩容。

    在轻量算力集群(Lite Cluster)页面查看资源池的节点总数是否与设置的“目标总实例数”一致。

相关操作

  • 管理Lite Cluster节点:因为资源池节点异常或空闲需要移除特定的节点,可前往资源池详情页面删除指定节点或批量删除节点。同时对资源池节点可进行替换、重置、续费等操作。
  • 升级Lite Cluster资源池驱动:当专属资源池中的节点含有GPU/Ascend资源时,可基于自己的业务升级专属资源池GPU/Ascend驱动的能力。