更新时间:2024-04-30 GMT+08:00

设置告警规则

操作场景

通过设置ModelArts在线服务和模型负载告警规则,用户可自定义监控目标与通知策略,及时了解ModelArts在线服务和模型负载状况,从而起到预警作用。

设置ModelArts服务和模型的告警规则包括设置告警规则名称、监控对象、监控指标、告警阈值、监控周期和是否发送通知等参数。本节介绍了设置ModelArts服务和模型告警规则的具体方法。

只有“运行中”的在线服务,支持对接CES监控。

前提条件

  • 已创建ModelArts在线服务。
  • 已在云监控服务创建ModelArts监控服务。登录云监控服务控制台,在自定义监控页面,根据界面提示创建ModelArts监控服务。

操作步骤

设置告警规则有多种方式。您可以根据实际应用场景,选择设置告警规则的方式。

  • 对ModelArts服务设置告警规则
  • 对单个服务设置告警规则
  • 对模型版本设置告警规则
  • 对服务或模型版本的单个指标设置告警规则

方式一:对整个ModelArts服务设置告警规则

  1. 登录管理控制台。
  2. “服务列表”中选择管理与监管 > 云监控服务,进入“云监控服务”管理控制台。
  3. 在左侧导航栏,选择告警 > 告警规则页面,单击“创建告警规则”。
  4. 在“创建告警规则”页面,“资源类型”选择“ModelArts”,“维度”选择“服务”,“触发规则”选择“自定义创建”,设置告警策略,完成其他信息填写后,单击“立即创建”。

方式二:对单个服务设置告警规则

  1. 登录管理控制台。
  2. “服务列表”中选择管理与监管 > 云监控服务,进入“云监控服务”管理控制台。
  3. 在左侧导航栏,选择云服务监控 > ModelArts
  4. 选择需要添加告警规则的在线服务名称,单击操作列的“创建告警规则”
  5. “创建告警规则”界面,根据界面提示设置ModelArts在线服务和模型负载的告警规则。

方式三:对单个版本设置告警规则

  1. 登录管理控制台。
  2. “服务列表”中选择管理与监管 > 云监控服务,进入“云监控服务”管理控制台。
  3. 在左侧导航栏,选择云服务监控 > ModelArts
  4. 单击在线服务名称前面的小三角,展示模型版本列表,选择需要设置告警规则的模型版本,单击操作列的“创建告警规则”
  5. “创建告警规则”界面,根据界面提示设置模型负载的告警规则。

方式四:对服务或模型版本的单个指标设置告警规则

  1. 登录管理控制台。
  2. “服务列表”中选择管理与监管 > 云监控服务,进入“云监控服务”管理控制台。
  3. 在左侧导航栏,选择云服务监控 > ModelArts
  4. 单击在线服务名称或单击在线服务名称前面的小三角,展示模型版本列表,单击模型版本名称,查看告警规则详情。
  5. 在告警规则详情页,单击单个指标右上角的加号按钮,对服务或模型版本的单个指标设置告警规则。