更新时间:2022-03-25 GMT+08:00
分享

根因事件识别

  • 分类

    诊断

  • 适用领域

    IT应用

  • 使用场景

    网络设备经常发生电力、链接等故障,故障时链路上的设备不断上报大量的告警数据,这些告警通常派发成工单,让运维人员应接不暇。跨域的告警分析、根因定位难度大,对运维人员技术要求高,另外隶属同一故障的多个告警,让运维效率进一步下降。使用根因事件识别,可基于实时的告警流、拓扑数据,聚合故障相关事件、快速地识别故障并准确定位故障根因。

  • 功能说明
    1. 震荡告警过滤

    对于现网实时产生的告警进行震荡识别和过滤,不影响正常故障的识别和处理。

    2. 告警聚合

    基于智能地故障时长预测以及拓扑关系聚合故障相关的告警。

    3. 故障识别

    基于故障传播图等算法以及聚合后的告警数据,识别并定位故障。

    4. 故障清除

    基于上报的清除告警,实时判断识别的故障是否已经清除。已清除故障无需再派单处理。

    5. 故障关联

    识别同一个网元不同时段发生的继发故障,用户只需关注处理原发故障;相近时间和拓扑的网元故障,会进行关联推荐,方便客户合并派单处理

    6. 增量规则推荐

    服务可以基于新增的告警数据定期训练推荐故障传播图规则,用户可以判断并选择接受、应用于后续故障识别。

  • 输入数据
    1. 告警、网络拓扑
      • 接入方式:kafka
      • 告警数据字段描述如表 告警数据表所示
        表1 告警数据字段表

        名称

        类型

        长度

        是否必须

        描述

        serialId

        String

        255

        Y

        告警实例ID

        alarmSource

        String

        2555

        Y

        告警资源

        reportTime

        timestamp

        29

        Y

        上报时间

        severity

        String

        255

        Y

        告警级别

        clearFlag

        String

        255

        Y

        清除记录

        raiseTime

        timestamp

        29

        Y

        异常上报时间

        clearTime

        timestamp

        29

        Y

        异常清除时间

        location

        String

        255

        Y

        location

        neId

        String

        255

        Y

        网元ID

        normId

        String

        255

        Y

        日志ID

        title

        String

        255

        Y

        告警标识

        alarmType

        String

        255

        Y

        告警类型

  • 输出数据
    1. 故障(事件)
      • 接入方式:kafka
      • 故障输出数据字段描述如表 故障输出数据表所示。
        表2 故障输出数据字段表

        名称

        类型

        长度

        是否必须

        描述

        ackTime

        long

        255

        Y

        ack时间

        ackUser

        String

        255

        Y

        ack用户名

        category

        String

        255

        Y

        种类

        clearTime

        String

        255

        Y

        清除时间

        collectTime

        String

        255

        Y

        采集时间

        clearUser

        String

        255

        Y

        清除用户名

        csn

        String

        255

        Y

        事件标识

        detail

        String

        255

        Y

        描述

        domain

        String

        255

        Y

        领域

        duration

        long

        255

        Y

        持续时间

        endTime

        long

        255

        Y

        结束时间

        eventSize

        long

        255

        Y

        事件大小

        incidentId

        String

        255

        Y

        事件标识

        linkList

        String

        2048

        Y

        关联topo

        maskType

        String

        255

        Y

        预留,暂未使用

        memo

        String

        255

        Y

        预留,暂未使用

        mergeKey

        String

        255

        Y

        合入键

        name

        String

        255

        Y

        名称

        occurTime

        long

        255

        Y

        发生时间

        priority

        long

        255

        Y

        优先权

        rankType

        long

        255

        Y

        rank类型

        relatedIncident

        String

        2048

        Y

        相关事件

        repairAdvice

        String

        255

        Y

        修复建议

        rootCause

        String

        255

        Y

        根因

        rootEventCsn

        String

        255

        Y

        根因事件标识

        rootNodes

        String

        2048

        Y

        根因节点

        sourceObjName

        String

        255

        Y

        资源名称

        sourceObjType

        String

        255

        Y

        资源类型

        sourceObjects

        String

        255

        Y

        资源对象

        status

        String

        255

        Y

        状态

        tenant

        String

        255

        Y

        租户

        updateTime

        long

        255

        Y

        更新时间

        events

        String

        2048

        Y

        事件

        affects

        String

        2048

        Y

        影响

        rootCauses

        String

        2048

        Y

        根因

        relatedIncidents

        String

        2048

        Y

        相关事件

        rootEvents

        String

        2048

        Y

        根因事件

        dealTag

        String

        255

        Y

        处理分支

        createTime

        long

        255

        Y

        创建时间

  • 使用约束

    暂无

  • 流程样例

数据对接 -> 根因事件识别 -> 记录集

分享:

    相关文档

    相关产品

close