文档首页/
AI开发平台ModelArts/
ModelArts用户指南(Standard)/
使用ModelArts Standard部署模型并推理预测/
管理同步在线服务/
设置在线服务故障自动重启
更新时间:2024-11-21 GMT+08:00
设置在线服务故障自动重启
场景描述
当系统检测到Snt9b硬件故障时,自动复位Snt9B芯片并重启推理在线服务,提升了推理在线服务的恢复速度。
约束限制
仅支持使用Snt9b资源的同步在线服务。
只支持针对整节点资源复位,请确保部署的在线服务为8*N卡规格,请谨慎评估对部署在该节点的其他服务的影响。
开启故障自动重启
用户可以在部署在线服务任务时,勾选“高级选项”的“现在配置”,可以看到“故障自动重启”参数,打开开关即可。
父主题: 管理同步在线服务