为微服务配置告警策略
支持对某个服务下的单个微服务或者多个微服务配置告警策略,告警信息会进行上报,业务可在监控服务(ServiceInsight)管理台上查看告警信息。
前提条件
需要具备AppStage服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。
新增告警配置
- 进入AppStage运维中心。
- 在顶部导航栏选择服务。
- 单击,选择 。
- 选择左侧导航栏的 。
- 选择“服务列表”页签,单击操作列的“告警配置”。
- 单击“新增告警配置”,配置相关参数,参数说明如表1所示。
表1 告警配置参数说明 参数
说明
配置名称
可自定义,对同一个服务配置多条告警时,配置名称不可重复。
微服务
可以选择对应服务下单个或多个微服务。
告警指标
- 长时间拨测状态
- 大量实例下线
指标配置
- 当告警指标为长时间拨测状态时,配置存在实例持续X分钟拨测状态未更新,X范围:1~30,表示微服务实例注册到CloudMap后,如果某个实例或多个实例的状态变成了拨测状态,且状态持续时间超过了X分钟就会触发告警。
- 当告警指标为大量实例下线时,配置微服务集群在一段时间内有超过X%的实例下线,X范围:1~100,表示微服务实例注册到CloudMap后,如果有多个实例在一段时间内下线就会触发告警,这里的下线不是实例的状态是下线状态,而是实例从CloudMap上删除,这里的一段时间是管理台的定时扫描任务时间(默认5分钟)。例:某个微服务下有10个实例,一段时间内,实例变成了8个,下线实例百分比为(10-8)/10=0.2*100%=20%,如果配置的X是1~20,则会触发告警。
告警等级
告警分为提示、一般、严重三个等级。
如果相同的告警指标,指标配置不同,告警等级不同,如果都触发告警,则最终会按照配置了最高等级的指标配置进行告警提示。
- 单击“提交”。
告警配置完成后,在告警配置列表中开启“是否开启”列的开关,才能生效。