更新时间:2025-08-07 GMT+08:00

扩缩容Standard专属资源池

当专属资源池创建完成,使用一段时间后,由于用户AI开发业务的变化,对于资源池资源量的需求可能会产生变化,面对这种场景,ModelArts Standard专属资源池提供了扩缩容功能,用户可以根据自己的需求动态调整资源池规模。

对已有规格实例数扩缩容,即增加或减少资源池已有规格的实例数量,增加实例数即扩容,减少实例数即缩容。扩缩容规格实例数适用于调整资源池的整体规模,减少资源池中的实例数量来优化资源使用;如果因为资源池节点异常或空闲需要移除特定的节点,请前往资源池详情页面查看资源池节点删除节点。

  • 缩容规格实例数时,资源池中如果包含已开启删除锁的节点,可能会导致开启删除锁的节点被删除,从而中断正在运行的业务,且该动作不可回退,因此建议不要对这些节点进行缩容。如果仍需缩容,请前往资源池详情页查看资源池节点进行单节点删除。
  • 缩容操作有可能影响正在运行中的任务,且该动作不可回退,该机型若存在本地盘,则本地盘上的数据会被清除,不可恢复,请谨慎操作。由于资源池启用了开发环境,缩容后可能导致已经创建的使用EVS存储的Notebook不可用。
  • 缩容操作可能影响到正在运行的业务,建议用户在业务空窗期进行缩容,或进入资源池详情页面查看资源池节点,在指定空闲的节点上进行删除来实现缩容。

计费影响

在增加实例数量时,会产生计算资源的计费。具体费用可参见ModelArts价格详情

可以在扩缩容时通过指定节点计费模式,为资源池新创建的节点设置不同于资源池的计费模式。例如用户可以在包周期的资源池中创建按需的节点,如果用户不指定该参数,创建的节点计费模式和资源池保持一致。具体内容如表1所示。

表1 计费项

计费项

计费项说明

适用的计费模式

计费公式

计算资源

专属资源池

使用计算资源的用量。

具体费用可参见ModelArts价格详情

按需计费

规格单价 * 计算节点个数 * 使用时长

包年/包月

规格单价 * 计算节点个数 * 购买时长

前提条件

已经创建Standard专属资源池

约束限制

  • 只支持对状态为“运行中”的专属资源池进行扩缩容。在旧版资源池迁移到新版资源池的过程中,资源池状态显示为“受限”。此时,资源池无法进行扩缩容和退订。
  • 缩容规格实例数时,当资源池中只剩一个实例节点时,无法进行缩容操作。因此,缩容操作必须确保至少保留一个节点。
  • 缩容操作有可能影响正在运行中的任务,且该动作不可回退,该机型若存在本地盘,则本地盘上的数据会被清除,不可恢复,请谨慎操作。由于资源池启用了开发环境,缩容后可能导致已经创建的使用EVS存储的Notebook不可用。

规格实例数扩缩容

  1. 登录ModelArts管理控制台,在左侧菜单栏中选择“资源管理 > 标准算力集群 (Standard Cluster)”。
  2. 单击某个资源池操作列右侧的扩缩容,进入“专属资源池扩缩容”页面,对资源池进行扩缩容操作。对于包周期资源池,此按钮为“扩容”,如果需要缩容,请进入到包周期资源池详情页对节点进行退订操作。

  3. 在“专属资源池扩缩容”页面,按表2设置资源配置。
    表2 资源配置参数说明

    参数

    说明

    实例规格类型

    当前待扩缩容的Standard资源池实例规格类型。不可编辑。

    规格内容

    当前待扩缩容的Standard资源池规格内容。不可编辑。

    当前实例数

    当前待扩缩容的Standard资源池实例数。不可编辑。

    可用区

    指定扩缩容完成后节点的可用区分布。可选择随机分配和指定可用区。

    • 选择随机分配时,扩缩容完成后,节点的可用区分布由系统后台随机选择。
    • 选择指定可用区时,可指定扩缩容完成后节点的可用区分布。可用区ID对应的实例数总和默认为“目标总实例数”

      比如:

      • 当前实例数为3,可用区ID对应的实例数总和为5,“目标总实例数”默认为5,表示扩容实例数至5。
      • 当前实例数为3,可用区ID对应的实例数总和为2,“目标总实例数”默认为2,表示缩容实例数至2。

    容器引擎空间限制

    扩容资源池时,即“目标总实例数”大于“当前总实例数”时,可以设置新建节点的容器引擎空间大小,可指定“容器引擎空间”大小。

    此操作会导致资源池内该规格下节点的dockerBaseSize不一致,可能会使得部分任务在不同节点的运行情况不一致,请谨慎操作。存量节点不支持修改容器引擎空间大小

    容器引擎空间大小

    “容器引擎空间限制”选择“指定大小”时,设置新建节点的容器引擎空间大小。

    目标总实例数

    通过设置目标总实例数实现扩缩容。请用户根据本身业务诉求进行调整。

    • 扩容:设置“目标总实例数”大于“当前总实例数”
    • 缩容:设置“目标总实例数”小于“当前总实例数”

    如果“可用区”选择“指定可用区”,不用另外设置“目标总实例数”“目标总实例数”默认为可用区ID对应的实例数总和。

    如果购买资源池时,实例数量采用整柜方式购买(部分规格支持),则在扩缩容时为整柜方式扩缩容,目标实例总数等于“数量*整柜”。“整柜”参数为创建资源池时选择,扩缩容时不可修改。用户通过增减“数量”来改变“目标总实例数”。

    操作系统

    “操作系统”下拉列表中指定实例的操作系统版本。

    图1 资源配置(单节点方式)

  4. 指定节点计费模式。用户增加实例数量时,可以打开“节点计费模式”开关,为资源池新扩容的节点设置不同于资源池的计费模式、购买时长和开启自动续费功能。例如用户可以在包周期的资源池中创建按需的节点。若用户不指定该参数,则新扩容的节点计费模式和资源池保持一致。
  5. 设置完成后,单击“提交”,在弹出的确认框中单击“确定”完成扩缩容。

    在标准算力集群(Standard Cluster)页面查看资源池的节点总数是否与设置的“目标总实例数”一致。

相关操作

  • 查看资源池节点:因为资源池节点异常或空闲需要移除特定的节点,可前往资源池详情页面删除指定节点或批量删除节点。
  • 升级Standard专属资源池驱动:当专属资源池中的节点含有GPU/Ascend资源时,可基于自己的业务升级专属资源池GPU/Ascend驱动的能力。
  • 修复Standard专属资源池故障节点:Standard专属资源池支持对故障节点进行修复操作,目前提供了高可用冗余节点、重置节点和重启节点等方式。
  • 修改Standard专属资源池支持的作业类型:专属资源池提供的动态设置作业类型功能,可以在创建资源池时、创建完成后,对资源池支持的作业类型进行编辑(新增或减少),避免不必要的资源浪费。