告警概述
告警服务是ServiceInsight组成部分,ServiceInsight为用户提供了一个对于虚机,容器,数据库等资源的立体化监控平台与链路式的处理定位平台。
告警服务的目的就是在当用户云上业务出现异常时,能够快速接收到异常并作出反应,为后续的定位、定界提供依据,保证业务顺畅运行。
功能架构
告警服务架构图如下:
功能特性
功能 |
功能描述 |
---|---|
告警列表 |
告警的控制台,提供对于告警的一系列处理操作和生命周期查询。 |
告警通知 |
告警的通知在所有的告警处理的链路结束以后才会发生。告警处理模块会根据上报告警的上下文获取告警的值班配置,值班配置由业务预置。 |
告警屏蔽 |
为您提供短时间的屏蔽功能,可以通过设置告警屏蔽的规则,告警将在屏蔽的时间内不再触发任何通知,规则结束后,将会被再次唤醒,屏蔽期间告警被清除后,将不再触发任何通知,减少您的处理频度。 |
告警过滤 |
告警过滤是直接在接入的阶段就将告警屏蔽,告警仍然会进入Bypass的数据库但不会再向下发送给告警处理模块。 |
告警收敛 |
多个维度的告警,通过特定的条件将它们变为一条告警,只需要配置自定义的收敛规则,就可以将重复告警收敛到一起,当然还有默认的规则帮助你维护告警。 |
告警标记 |
告警标记的作用是为一段时间内的告警打上标签,例如现网变更或者现网演练时,由于要模拟大量异常请求和其他操作会造成大量无用告警上报,标记的作用就是为这一段时间的告警打上标签与正常告警进行区分。 |
告警定义 |
如果您对于繁琐复杂的告警上报字段感到困惑,可以使用统一告警定义,该功能会自动下发到业务对应的agent,使用更加人性化的界面设计,让告警上报更加统一、准确。 |
告警修复 |
设置特定的命中条件,告警在发送通知之前将会进行预置的修复脚本,修复操作,自动帮助您修复简单的告警。 |
语音值班配置 |
配置对应的责任人,当告警生成时,通过短信、电话等形式,快速通知责任人。 |