更新时间:2024-09-13 GMT+08:00
分享

查看并处理告警

ServiceInsight为用户提供了一个对于虚机、容器、数据库等资源的立体化监控平台与链路式的处理定位平台。在用户云上业务出现异常时,能够快速接收到异常并作出反应,为后续的定位、定界提供依据,保证业务顺畅运行。

前提条件

操作步骤

  1. 进入AppStage运维中心
  2. 在顶部导航栏选择服务。
  1. 单击,选择“运维 > 监控服务(ServiceInsight)”。
  1. 选择左侧导航栏的告警 > 告警列表,进入告警列表页面查看告警,告警参数说明如表1所示。

    如需确认告警、批量通知、处理告警、清除告警、屏蔽告警和创建事件单,需要获取服务运维岗位权限,权限申请操作请参见申请权限

    表1 告警列表参数说明

    告警参数

    参数说明

    状态

    只存在于当前告警和归档告警中,是处理告警的标志。有未确认、已确认、已通知三种状态,告警产生时默认是未确认状态,单击上方的“确认告警”、“批量通知”,可以让它进入已确认状态和已通知状态,该字段不会影响告警的处理流程属于是打标记的字段。

    级别

    告警上报时level字段代表级别,有提示、一般、严重和紧急四个等级,分别对应了上报时的notice、minor、major和critical。

    操作

    • 处理:为这条告警添加一条处理记录,可选的动作有三个,包括人工通知、处理过程和处理结果,对告警添加记录不会影响告警的流程。

      单击告警操作列的“处理”,即可处理该告警,也可勾选多个告警,单击告警列表左上方的“批量处理”,处理多条告警。

    • 屏蔽:屏蔽告警后该告警就不会展示在告警列表,可以在“屏蔽告警”页签查看。

      单击告警操作列的“屏蔽”,即可屏蔽该告警,也可勾选多个告警,单击告警列表右上方的“屏蔽”,屏蔽多条告警。

    • 创建事件单:可以通过告警直接生成事件单,创建后会在“事件单管理”页面生成一条待处理事件,需要设置处理人后才能提交。
    • 清除:勾选告警,然后单击告警列表右上方的“清除告警”,即可清除已勾选告警。

      告警上报的数据会根据产品ID、服务ID、level等信息生成一个唯一标识,该标识为告警的指纹信息,监控服务会依据指纹信息进行告警的判重。

      当监控主机的指标数据满足统一告警定义中设置的阈值且数据的持续时间满足设置的持续时间时会上报告警,当指标数据恢复正常且持续一段时间后告警会自动消除。如果监控数据始终满足统一告警定义中设置的阈值时会认为第一次产生的告警问题始终存在,手动清除告警后不会再产生新的同类告警。

    入库时间

    告警经过处理后进入数据库表的时间。

    发生时间

    告警上报时start_timestamp字段所表示的时间。

    持续时间

    告警发生时间到当前时区时间为告警持续时间。

    自动恢复状态

    如果告警和自动恢复的规则相匹配,会异步调用EAP执行告警的恢复。

    IP

    发生告警的IP。

    告警定义ID

    创建告警定义规则时系统自动生成的ID。

告警类型说明

告警在列表中总共有五种状态,实际上告警本身只有告警中和已解决两种状态,根据这两种状态在系统中不同的标记又细分为五种状态,具体告警类型如表2所示。

表2 告警类型说明

告警类型

告警说明

当前告警

告警进入系统后如果没有被屏蔽规则屏蔽就会进入该页签,表示当前仍然是告警中状态且未被清除和屏蔽的告警。

屏蔽告警

告警进入系统后被设置的屏蔽规则自动屏蔽或者人为在界面上手动单击屏蔽的告警。屏蔽的告警分为两种,一种是有具体屏蔽时间的,到了屏蔽时间结束后会作为一条新的告警再次出现在当前告警的列表中,一种是没有屏蔽时间的,将会被永久屏蔽。

历史告警

历史告警都是已解决的告警,让告警进入已解决的状态的方式有两种,一种是上报的告警已解决,这条告警就会被清除进入历史告警,或者是在界面上直接清除告警也会进入历史告警。

未确认已恢复告警

系统接收到已解决或自动清除的告警,非界面操作影响的告警。

归档告警

历史告警中,告警级别在严重和紧急的告警且是已解决状态的,每个小时会被定时任务扫描到转移至归档告警。

查询告警参数说明

可以用不同参数对告警进行查询,参数说明如表3所示。

表3 查询告警参数说明

告警参数

参数说明

应用/服务

告警所属的服务,不选则默认展示用户拥有权限下的所有告警。

告警级别

告警上报时所带的level字段。

显示模式

显示模式分为三种,告警收敛、原始告警和仅收敛告警。默认显示告警收敛。

  • 告警收敛:展示已收敛的告警和未收敛的告警。当告警被收敛后,可以单击收敛告警“操作”列的“详情”,查看并处理收敛的子告警。
  • 原始告警:原始告警展示除了收敛告警外的所有告警,包括已经被收敛了的原始告警也会展示。
  • 仅收敛告警:仅展示已经被收敛了的告警。

状态

支持对未确认、已确认、已通知、处理中和处理完成的告警进行查询。

语音呼叫状态

告警当前的语音呼叫的状态。

告警类型

上报的告警会显示类型信息,可根据类型筛选查看告警。

入库时间

告警进入系统的时间。

区域

告警涉及的区域。

告警单发

选择是否查看属于告警单发的告警。

无处理人

选择无处理人的告警。

相关文档