更新时间:2024-09-14 GMT+08:00
分享

为微服务配置告警策略

支持对某个服务下的单个微服务或者多个微服务配置告警策略,告警信息会进行上报,业务可在监控服务(ServiceInsight)管理台上查看告警信息。

前提条件

需要具备AppStage服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限

新增告警配置

  1. 进入AppStage运维中心
  2. 在顶部导航栏选择服务。
  3. 单击,选择微服务开发 > 服务发现
  4. 选择左侧导航栏的服务目录 > 一方服务
  5. 选择“服务列表”页签,单击操作列的“告警配置”
  6. 单击“新增告警配置”,配置相关参数,参数说明如表1所示。

    表1 告警配置参数说明

    参数

    说明

    配置名称

    可自定义,对同一个服务配置多条告警时,配置名称不可重复。

    微服务

    可以选择对应服务下单个或多个微服务。

    告警指标

    • 长时间拨测状态
    • 大量实例下线

    指标配置

    • 当告警指标为长时间拨测状态时,配置存在实例持续X分钟拨测状态未更新,X范围:1~30,表示微服务实例注册到CloudMap后,如果某个实例或多个实例的状态变成了拨测状态,且状态持续时间超过了X分钟就会触发告警。
    • 当告警指标为大量实例下线时,配置微服务集群在一段时间内有超过X%的实例下线,X范围:1~100,表示微服务实例注册到CloudMap后,如果有多个实例在一段时间内下线就会触发告警,这里的下线不是实例的状态是下线状态,而是实例从CloudMap上删除,这里的一段时间是管理台的定时扫描任务时间(默认5分钟)。例:某个微服务下有10个实例,一段时间内,实例变成了8个,下线实例百分比为(10-8)/10=0.2*100%=20%,如果配置的X是1~20,则会触发告警。

    告警等级

    告警分为提示、一般、严重三个等级。

    如果相同的告警指标,指标配置不同,告警等级不同,如果都触发告警,则最终会按照配置了最高等级的指标配置进行告警提示。

  7. 单击“提交”

    告警配置完成后,在告警配置列表中开启“是否开启”列的开关,才能生效。

更多操作

告警配置完成后,您可以执行如表2所示的操作。

执行修改/删除操作前,请先关闭告警,否则无法进行操作。

表2 相关操作

操作

说明

修改告警配置

单击告警配置列表操作列的“修改”,修改告警配置相关参数。

删除告警配置

单击告警配置列表操作列的“删除”,删除告警配置。

相关文档