更新时间:2024-05-23 GMT+08:00
分享

查看告警

监控服务提供对告警的一系列处理操作和生命周期查询。

前提条件

  • 已配置模板告警,将虚拟机监控异常进行告警上报。
  • 已配置异常检测,将采集的业务日志做异常告警上报。

操作步骤

  1. 进入运维中心工作台。
  2. 在顶部导航栏选择自有服务。
  1. 单击,选择“运维 > 监控服务(ServiceInsight)”。
  1. 选择左侧导航栏的告警 > 告警列表,进入告警列表页面查看告警,告警参数说明如表1所示。

    表1 告警列表参数说明

    告警参数

    参数说明

    状态

    只存在于当前告警和归档告警中,是处理告警的标志。有未确认、已确认、已通知三种状态,告警产生时默认是未确认状态,单击上方的“确认告警”、“批量通知”,可以让它进入已确认状态和已通知状态,该字段不会影响告警的处理流程属于是打标记的字段。

    级别

    告警上报时level字段代表级别,有提示、一般、严重和紧急四个等级,分别对应了上报时的notice、minor、major和critical。

    操作

    • 处理:为这条告警添加一条处理记录,可选的动作有三个,包括人工通知、处理过程和处理结果,对告警添加记录不会影响告警的流程。

      单击告警操作列的“处理”,即可处理该告警,也可勾选多个告警,单击告警列表左上方的“批量处理”,处理多条告警。

    • 屏蔽:屏蔽告警后该告警就不会展示在告警列表,可以在“屏蔽告警”页签查看。

      单击告警操作列的“屏蔽”,即可屏蔽该告警,也可勾选多个告警,单击告警列表右上方的“屏蔽”,屏蔽多条告警。

    • 清除:勾选告警,然后单击告警列表右上方的“清除告警”,即可清除已勾选告警。

      告警上报的数据会根据产品ID、服务ID、level等信息生成一个唯一标识,该标识为告警的指纹信息,监控服务会依据指纹信息进行告警的判重。

      当监控主机的指标数据满足统一告警定义中设置的阈值且数据的持续时间满足设置的持续时间时会上报告警,当指标数据恢复正常且持续一段时间后告警会自动消除。如果监控数据始终满足统一告警定义中设置的阈值时会认为第一次产生的告警问题始终存在,手动清除告警后不会再产生新的同类告警。

    入库时间

    告警经过处理后进入数据库表的时间。

    发生时间

    告警上报时start_timestamp字段所表示的时间。

    持续时间

    告警发生时间到当前时区时间为告警持续时间。

    应用/服务

    告警归属的产品与服务。

    主机名

    告警上报时的source_tag字段,表示告警来自哪台机器或者集群。

    自动恢复状态

    如果告警和自动恢复的规则相匹配,会异步调用EAP、JOB执行一次告警的恢复。

    IP

    发生告警的IP。

    正文

    告警正文。

    [告警类型(上报时带着的category字段),当前语音呼叫的状态告警上报的msg + detail + name,系统分配的告警id,告警的原始ID]

告警类型说明

告警在列表中总共有五种状态,实际上告警本身只有告警中和已解决两种状态,根据这两种状态在系统中不同的标记又细分为五种状态,具体告警类型如表2所示。

表2 告警类型说明

告警类型

告警说明

当前告警

告警进入系统后如果没有被屏蔽规则屏蔽就会进入该页签,表示当前仍然是告警中状态且未被清除和屏蔽的告警。

屏蔽告警

告警进入系统后被设置的屏蔽规则自动屏蔽或者人为在界面上手动单击屏蔽的告警。屏蔽的告警分为两种,一种是有具体屏蔽时间的,到了屏蔽时间结束后会作为一条新的告警再次出现在当前告警的列表中,一种是没有屏蔽时间的,将会被永久屏蔽。

历史告警

历史告警都是已解决的告警,让告警进入已解决的状态的方式有两种,一种是上报的告警已解决,这条告警就会被清除进入历史告警,或者是在界面上直接清除告警也会进入历史告警。

未确认已恢复告警

系统接收到已解决或自动清除的告警,非界面操作影响的告警。

归档告警

历史告警中,告警级别在严重和紧急的告警且是已解决状态的,每个小时会被定时任务扫描到转移至归档告警。

查询告警参数说明

可以用不同参数对告警进行查询,参数说明如表3所示。

表3 查询告警参数说明

告警参数

参数说明

应用/服务

告警所属的自有服务,不选则默认展示用户拥有权限下的所有告警。

告警级别

告警上报时所带的level字段。

显示模式

显示模式分为三种,告警收敛,原始告警和仅收敛告警。

  • 告警收敛:展示未参与收敛的告警与收敛的告警是默认的显示模式,当告警被收敛后,收敛告警的正文中会统计当前收敛的子告警的状态。单击告警收敛后可以操作和查看具体子告警。
  • 原始告警:原始告警展示除了收敛告警外的所有告警,包括已经被收敛了的原始告警也会展示。
  • 仅收敛告警:仅展示已经被收敛了的告警。

状态

支持对未确认、已确认、已通知、处理中和处理完成的告警进行查询。

语音呼叫状态

告警当前的语音呼叫的状态。

告警类型

告警上报时的category字段。

入库时间

告警进入系统的时间。

区域

告警涉及的区域。

告警单发

选择是否查看属于告警单发的告警。

分享:

    相关文档

    相关产品