文档首页/
AI开发平台ModelArts/
ModelArts Studio(MaaS)用户指南/
ModelArts Studio(MaaS)在线推理服务/
在ModelArts Studio(MaaS)管理我的服务/
在ModelArts Studio(MaaS)扩缩容模型服务实例数
更新时间:2025-07-31 GMT+08:00
在ModelArts Studio(MaaS)扩缩容模型服务实例数
在使用大型模型进行推理时,其业务需求会呈现出明显的峰谷波动。因此,模型服务必须具备灵活的扩缩容能力,以适应不同时间段内的用户负载变化,确保服务的高可用性和资源的高效利用。
ModelArts Studio大模型即服务平台支持手动扩缩容模型服务的实例数,该操作不会影响部署服务的正常运行。
前提条件
已经在ModelArts Studio(MaaS)部署模型。
约束限制
仅当模型服务处于这几个状态下才能扩缩容实例数:运行中、告警。
计费说明
- 扩容模型服务实例数后,在调用MaaS预置服务时,将根据实际使用的Tokens数量进行计费,详情请见计费说明。
- 扩容模型服务实例数后,在MaaS进行模型推理时,会产生计算资源和存储资源的累计值计费。计算资源为运行模型服务的费用。存储资源包括数据存储到OBS的计费。具体内容如请参见ModelArts Studio(MaaS)模型推理计费项。
扩缩容实例数
- 登录ModelArts Studio(MaaS)控制台,在顶部导航栏选择目标区域。
- 在左侧导航栏,选择“在线推理”。
- 在“在线推理”页面的“我的服务”页签,在目标模型服务右侧,单击操作列的“更多 > 扩缩容”,进入扩缩容页面。
- 在“扩缩容”页面,根据业务需要增删模型服务的实例数,配置完成后,单击“确认”提交扩缩容任务。
- 在“扩缩容服务”对话框,单击“确定”。
在“我的服务”页签,单击服务名称,进入服务详情页,可以查看修改后的实例数是否生效。