扩缩容Standard专属资源池
当专属资源池创建完成,使用一段时间后,由于用户AI开发业务的变化,对于资源池资源量的需求可能会产生变化,面对这种场景,ModelArts Standard专属资源池提供了扩缩容功能,用户可以根据自己的需求动态调整资源池规模。
对已有规格实例数扩缩容,即增加或减少资源池已有规格的实例数量,增加实例数即扩容,减少实例数即缩容。扩缩容规格实例数适用于调整资源池的整体规模,减少资源池中的实例数量来优化资源使用;如果因为资源池节点异常或空闲需要移除特定的节点,请前往资源池详情页面查看资源池节点删除节点。

计费影响
在增加实例数量时,会产生计算资源的计费。具体费用可参见ModelArts价格详情。
可以在扩缩容时通过指定节点计费模式,为资源池新创建的节点设置不同于资源池的计费模式。例如用户可以在包周期的资源池中创建按需的节点,如果用户不指定该参数,创建的节点计费模式和资源池保持一致。具体内容如表1所示。
计费项 |
计费项说明 |
适用的计费模式 |
计费公式 |
|
---|---|---|---|---|
计算资源 |
专属资源池 |
使用计算资源的用量。 具体费用可参见ModelArts价格详情。 |
按需计费 |
规格单价 * 计算节点个数 * 使用时长 |
包年/包月 |
规格单价 * 计算节点个数 * 购买时长 |
前提条件
约束限制
- 只支持对状态为“运行中”的专属资源池进行扩缩容。在旧版资源池迁移到新版资源池的过程中,资源池状态显示为“受限”。此时,资源池无法进行扩缩容和退订。
- 缩容规格实例数时,当资源池中只剩一个实例节点时,无法进行缩容操作。因此,缩容操作必须确保至少保留一个节点。
- 缩容操作有可能影响正在运行中的任务,且该动作不可回退,该机型若存在本地盘,则本地盘上的数据会被清除,不可恢复,请谨慎操作。由于资源池启用了开发环境,缩容后可能导致已经创建的使用EVS存储的Notebook不可用。
规格实例数扩缩容
- 登录ModelArts管理控制台,在左侧菜单栏中选择“资源管理 > 标准算力集群 (Standard Cluster)”。
- 单击某个资源池操作列右侧的“专属资源池扩缩容”页面,对资源池进行扩缩容操作。对于包周期资源池,此按钮为“扩容”,如果需要缩容,请进入到包周期资源池详情页对节点进行退订操作。 ,进入
- 在“专属资源池扩缩容”页面,按表2设置资源配置。
表2 资源配置参数说明 参数
说明
实例规格类型
当前待扩缩容的Standard资源池实例规格类型。不可编辑。
规格内容
当前待扩缩容的Standard资源池规格内容。不可编辑。
当前实例数
当前待扩缩容的Standard资源池实例数。不可编辑。
可用区
指定扩缩容完成后节点的可用区分布。可选择随机分配和指定可用区。
- 选择随机分配时,扩缩容完成后,节点的可用区分布由系统后台随机选择。
- 选择指定可用区时,可指定扩缩容完成后节点的可用区分布。可用区ID对应的实例数总和默认为“目标总实例数”。
比如:
- 当前实例数为3,可用区ID对应的实例数总和为5,“目标总实例数”默认为5,表示扩容实例数至5。
- 当前实例数为3,可用区ID对应的实例数总和为2,“目标总实例数”默认为2,表示缩容实例数至2。
容器引擎空间限制
扩容资源池时,即“目标总实例数”大于“当前总实例数”时,可以设置新建节点的容器引擎空间大小,可指定“容器引擎空间”大小。
此操作会导致资源池内该规格下节点的dockerBaseSize不一致,可能会使得部分任务在不同节点的运行情况不一致,请谨慎操作。存量节点不支持修改容器引擎空间大小。
容器引擎空间大小
当“容器引擎空间限制”选择“指定大小”时,设置新建节点的容器引擎空间大小。
目标总实例数
通过设置目标总实例数实现扩缩容。请用户根据本身业务诉求进行调整。
- 扩容:设置“目标总实例数”大于“当前总实例数”。
- 缩容:设置“目标总实例数”小于“当前总实例数”。
如果“可用区”选择“指定可用区”,不用另外设置“目标总实例数”。“目标总实例数”默认为可用区ID对应的实例数总和。
如果购买资源池时,实例数量采用整柜方式购买(部分规格支持),则在扩缩容时为整柜方式扩缩容,目标实例总数等于“数量*整柜”。“整柜”参数为创建资源池时选择,扩缩容时不可修改。用户通过增减“数量”来改变“目标总实例数”。
操作系统
在“操作系统”下拉列表中指定实例的操作系统版本。
图1 资源配置(单节点方式) - 指定节点计费模式。用户增加实例数量时,可以打开“节点计费模式”开关,为资源池新扩容的节点设置不同于资源池的计费模式、购买时长和开启自动续费功能。例如用户可以在包周期的资源池中创建按需的节点。若用户不指定该参数,则新扩容的节点计费模式和资源池保持一致。
- 设置完成后,单击“提交”,在弹出的确认框中单击“确定”完成扩缩容。
在标准算力集群(Standard Cluster)页面查看资源池的节点总数是否与设置的“目标总实例数”一致。
相关操作
- 查看资源池节点:因为资源池节点异常或空闲需要移除特定的节点,可前往资源池详情页面删除指定节点或批量删除节点。
- 升级Standard专属资源池驱动:当专属资源池中的节点含有GPU/Ascend资源时,可基于自己的业务升级专属资源池GPU/Ascend驱动的能力。
- 修复Standard专属资源池故障节点:Standard专属资源池支持对故障节点进行修复操作,目前提供了高可用冗余节点、重置节点和重启节点等方式。
- 修改Standard专属资源池支持的作业类型:专属资源池提供的动态设置作业类型功能,可以在创建资源池时、创建完成后,对资源池支持的作业类型进行编辑(新增或减少),避免不必要的资源浪费。