扩缩容在线服务部署
当在线服务部署完成,使用一段时间后,由于实际业务的变化,对于在线服务资源量的需求可能会产生变化。面对这种场景,ModelArts支持在线服务部署扩缩容,根据实际负载需求,调整在线服务部署的资源规格或实例数量。
ModelArts在线服务当前提供两种方式的扩缩容方式,手动扩缩容和自动扩缩容,应对用户多样化的需求。目前只支持对单个部署实例数进行修改。
- 手动扩缩容:用户可以手动触发在线服务部署扩缩容,支持对单个部署的实例数量进行修改,减少修改实例数的耗时。
- 自动扩缩容:用户可以设置扩缩容规则,根据设置的规则对实例数进行修改,提高资源利用率。自动扩缩容,用户可以设置合理的扩缩容规则,在高、低峰时间段自动对实例进行扩容或缩容的操作,进而提高资源的利用率。
表1 手动扩缩容和自动扩缩容差异对比 伸缩类型
手动扩缩容
自动扩缩容
配置方式
手动
自动
配置内容
修改实例数
设置扩缩容规则
执行方式
手动配置后执行
定期触发或指标触发
扩缩容失败后的表现
回滚到扩缩容之前的实例个数
按实际扩缩的实例个数为准
约束限制
- 服务处于停止、运行中、告警状态可以设置扩缩容规则。
- 每个在线服务最多支持10个周期触发扩缩容规则,添加指标触发扩缩容规则时每个指标最多添加一条。
手动扩缩容
- 登录ModelArts管理控制台,在左侧菜单栏中选择“模型推理 > 在线推理”,进入在线服务管理页面。
- 单击目标服务名称,进入服务详情页面,切换到“部署”页签。
- 选择要扩缩容的部署卡片,单击“…>扩缩容”,进入服务部署“扩缩容”页面。
- 单击“手动扩缩容”,在弹框中设置扩缩容后的部署副本数。最小值为1。单击“确定”。
可在实例列表查看手动扩缩容后的实例状态。
如果要缩容指定实例,可在实例列表单击操作列的“删除”,在弹框中一键输入DELETE,单击“确定”,删除指定实例。
删除实例后,实例数量将相应减少,该操作无法恢复,请谨慎操作。
自动扩缩容
- 登录ModelArts管理控制台,在左侧菜单栏中选择“模型推理>在线推理”,进入在线服务管理页面。
- 单击目标服务名称,进入服务详情页面,切换到“部署”页签。
- 选择要扩缩容的部署卡片,单击“…>扩缩容”,进入服务部署“扩缩容”页面。
- 在“自动扩缩容规则”区域单击“配置扩缩容规则”,在弹框中设置自动扩缩容规则。
每个在线服务最多支持10个周期触发扩缩容规则,添加指标触发扩缩容规则时每个指标最多添加一条。
不能添加相同的周期触发类扩容规则。扩缩容规则参数说明请见表2。
- 设置完成后,单击“确定”。
规则添加后,周期触发的自动扩缩容可以在扩缩容规则区域设置各个扩缩容规则的启用状态,在启用状态开关打开的情况下,当前服务部署会在设置的触发时间下会自动进行扩缩容,可以在下方区域看到扩缩容执行记录。
单击操作列的“删除”可以删除创建的扩缩容规则。