调整计算资源池容量
随着业务负载的不断增长,现有的计算资源池容量可能无法满足日益增长的算力需求。为了保障业务的稳定运行,管理员需要通过弹性扩容的方式动态调整计算资源池的规模,以适应业务峰谷变化。
约束与限制
- 计算资源池包含多种资源类型(CPU、GPU、NPU)时,同一扩缩容任务只支持调整一种资源类型。如需同时调整多种资源,需分多次执行扩缩容任务。
- 仅在资源池状态为“运行中”时可操作扩容与缩容。
- 扩容与缩容的生效时间与规格、实例数量相关,不可预估。
- 缩容前请先确认作业是否已经完成,系统优先确保作业运行完成。若30分钟内作业未结束,系统将执行强制缩容,请注意长作业的失败风险。
扩缩容计算资源池
- 登录AI DataLake管理控制台。
- 在左侧导航栏单击“资源管理”。
- 在计算资源池页面中待操作的计算资源池的“操作”列下,单击“更多 > 扩缩容”。
- 选择待扩容的资源类型、资源规格以及资源目标数量,单击“下一步”。
图1 资源池扩缩容
- 确认资源规格及变更数量无误后,单击“确定”。
任务提交后,资源池将进入“扩容中”或者“缩容中”状态,等待资源池扩容完成。
缩容前请先确认作业是否已经完成,系统优先确保作业运行完成。若30分钟内作业未结束,系统将执行强制缩容,请注意长作业的失败风险。
待资源扩容完成后,资源池状态将自动变更为 “可用”,表示扩容成功完成,新的计算资源已就绪可供使用。