更新时间:2024-05-07 GMT+08:00
分享

告警概述

告警服务是ServiceInsight组成部分,ServiceInsight为用户提供了一个对于虚机,容器,数据库等资源的立体化监控平台与链路式的处理定位平台。

告警服务的目的就是在当用户云上业务出现异常时,能够快速接收到异常并作出反应,为后续的定位、定界提供依据,保证业务顺畅运行。

功能架构

告警服务架构图如下:

图1 告警服务架构图

功能特性

功能

功能描述

告警列表

告警的控制台,提供对于告警的一系列处理操作和生命周期查询。

告警通知

告警的通知在所有的告警处理的链路结束以后才会发生。告警处理模块会根据上报告警的上下文获取告警的值班配置,值班配置由业务预置。

告警屏蔽

为您提供短时间的屏蔽功能,可以通过设置告警屏蔽的规则,告警将在屏蔽的时间内不再触发任何通知,规则结束后,将会被再次唤醒,屏蔽期间告警被清除后,将不再触发任何通知,减少您的处理频度。

告警过滤

告警过滤是直接在接入的阶段就将告警屏蔽,告警仍然会进入Bypass的数据库但不会再向下发送给告警处理模块。

告警收敛

多个维度的告警,通过特定的条件将它们变为一条告警,只需要配置自定义的收敛规则,就可以将重复告警收敛到一起,当然还有默认的规则帮助你维护告警。

告警标记

告警标记的作用是为一段时间内的告警打上标签,例如现网变更或者现网演练时,由于要模拟大量异常请求和其他操作会造成大量无用告警上报,标记的作用就是为这一段时间的告警打上标签与正常告警进行区分。

告警定义

如果您对于繁琐复杂的告警上报字段感到困惑,可以使用统一告警定义,该功能会自动下发到业务对应的agent,使用更加人性化的界面设计,让告警上报更加统一、准确。

告警修复

设置特定的命中条件,告警在发送通知之前将会进行预置的修复脚本,修复操作,自动帮助您修复简单的告警。

语音值班配置

配置对应的责任人,当告警生成时,通过短信、电话等形式,快速通知责任人。

分享:

    相关文档

    相关产品