扩缩容专属资源池
当专属资源池创建完成,使用一段时间后,由于用户AI开发业务的变化,对于资源池资源量的需求可能会产生变化,面对这种场景,ModelArts专属资源池提供了扩缩容功能,用户可以根据自己的需求动态调整资源池规模。
对已有规格实例数扩缩容,即增加或减少资源池已有规格的实例数量,增加实例数即扩容,减少实例数即缩容。扩缩容规格实例数适用于调整资源池的整体规模,减少资源池中的实例数量来优化资源使用;如果因为资源池节点异常或空闲需要移除特定的节点,请前往资源池详情页面查看资源池节点删除节点。
专属资源池扩缩容类型如下:
- 规格实例数扩缩容:增加或减少资源池已有规格的实例数量,增加实例数即扩容,减少实例数即缩容。扩缩容规格实例数适用于调整资源池的整体规模,减少资源池中的实例数量来优化资源使用;如果因为资源池节点异常或空闲需要移除特定的节点,请前往资源池详情页面查看资源池节点删除节点。
计费影响
在增加实例数量时,会产生计算资源的计费。具体费用可参见ModelArts价格详情。
可以在扩缩容时通过指定节点计费模式,为资源池新创建的节点设置不同于资源池的计费模式。例如用户可以在包周期的资源池中创建按需的节点,如果用户不指定该参数,创建的节点计费模式和资源池保持一致。具体内容如表1所示。
| 计费项 | 计费项说明 | 适用的计费模式 | 计费公式 | |
|---|---|---|---|---|
| 计算资源 | 专属资源池 | 使用计算资源的用量。 具体费用可参见ModelArts价格详情。 | 按需计费 | 规格单价 * 计算节点个数 * 使用时长 |
| 包年/包月 | 规格单价 * 计算节点个数 * 购买时长 | |||
前提条件
已经创建专属资源池。
约束限制
- 只支持对状态为“运行中”的专属资源池进行扩缩容。在旧版资源池迁移到新版资源池的过程中,资源池状态显示为“受限”。此时,资源池无法进行扩缩容和退订。
- 缩容规格实例数时,当资源池中只剩一个实例节点时,无法进行缩容操作。因此,缩容操作必须确保至少保留一个节点。
- 缩容操作有可能影响正在运行中的任务,且该动作不可回退,该机型若存在本地盘,则本地盘上的数据会被清除,不可恢复,请谨慎操作。由于资源池启用了开发环境,缩容后可能导致已经创建的使用EVS存储的Notebook不可用。
- 对于包周期的专属资源池,只能增加规格,不能减少规格。
专属资源池扩缩容
- 登录ModelArts管理控制台,在左侧菜单栏中选择“资源管理 > 专属算力资源 > 资源池”(旧版控制台:“资源管理 > 专属资源池”)。
- 在资源池列表页面,单击某个资源池操作列右侧的“
> 扩缩容”,选择节点池,单击“确定”进入“节点池扩缩容”页面。对于包周期资源池,此按钮为“扩缩容”,如果需要缩容,请进入到包周期资源池详情页对节点进行退订操作。 - 在“节点池扩缩容”页面,按表2设置资源配置。
表2 节点池扩缩容参数说明 参数
说明
节点池名称
填写节点池名称。也可以在创建成功后在详情页对节点池名称行修改。
小写字母开头, 支持小写字母. 数字. 中划线(-), 不能以中划线(-)结尾,不能以-default结尾,长度范围2-50个字符。
当前总实例数
当前待扩缩容的专属资源池实例数。不可编辑。
目标总实例数
通过设置目标总实例数实现扩缩容。请用户根据本身业务诉求进行调整。
- 扩容:设置“目标总实例数”大于“当前总实例数”。
- 缩容:设置“目标总实例数”小于“当前总实例数”。
如果“可用区”选择“指定可用区”,不用另外设置“目标总实例数”。“目标总实例数”默认为可用区ID对应的实例数总和。
如果购买资源池时,实例数量采用整柜方式购买(部分规格支持),则在扩缩容时为整柜方式扩缩容,目标总实例数等于“数量*整柜”。“整柜”参数为创建资源池时选择,扩缩容时不可修改。用户通过增减“数量”来改变“目标总实例数”。
如果购买资源池时,实例规格为Snt9b23类型,即超节点规格,实例数量采用步长方式购买,则在扩缩容时为步长方式扩缩容,目标总实例数等于“数量*步长”。“步长”参数为创建资源池时选择,扩缩容时不可修改。用户通过增减“数量”来改变“目标总实例数”。
可用区
指定扩缩容完成后节点的可用区分布。可选择随机分配和指定可用区。
- 选择随机分配时,扩缩容完成后,节点的可用区分布由系统后台随机选择。
- 选择指定可用区时,可指定扩缩容完成后节点的可用区分布。可用区ID对应的实例数总和默认为“目标总实例数”。
比如:
- 当前实例数为3,可用区ID对应的实例数总和为5,“目标总实例数”默认为5,表示扩容实例数至5。
- 当前实例数为3,可用区ID对应的实例数总和为2,“目标总实例数”默认为2,表示缩容实例数至2。
指定计费模式
指定节点计费模式。
用户增加实例数量时,可以打开“节点计费模式”开关,为资源池新扩容的节点设置不同于资源池的计费模式、购买时长和开启自动续费功能。例如用户可以在包周期的资源池中创建按需的节点。
如果用户不指定该参数,创建的节点计费模式和资源池保持一致。
只有包年/包月可以设置自动续费。
计费详情请参见计费影响。
- 设置完成后,单击“下一步”,进入节点池扩缩容变更确认页,界面分别展示预览变更、扩容节点配置具体信息。如果是缩容场景,则界面会列出因缩容而将要删除的节点池名称和变更前后的实例数,以及缩容风险提示和缩容二次确认。
- 单击“确定”完成扩缩容。
相关操作
- 查看资源池节点:因为资源池节点异常或空闲需要移除特定的节点,可前往资源池详情页面删除指定节点或批量删除节点。
- 升级专属资源池驱动:当专属资源池中的节点含有GPU/NPU资源时,可基于自己的业务升级专属资源池GPU/NPU驱动的能力。
- 管理专属资源池节点:专属资源池支持对故障节点进行修复操作,目前提供了热备节点(旧版:高可用冗余)、重置节点和重启节点等方式。
- 修改专属资源池支持的作业类型:专属资源池提供的动态设置作业类型功能,可以在创建资源池时、创建完成后,对资源池支持的作业类型进行编辑(新增或减少),避免不必要的资源浪费。