更新时间:2025-09-10 GMT+08:00
分享

流转规则概述

企业IT架构日趋复杂,服务器、网络设备、云服务等多种来源的告警信息格式不一、标准杂乱。这些原始告警直接进入运维流程,容易造成信息冗余、关键问题被掩盖,还会导致处理标准不统一,影响故障响应和团队协作效率。

而在云运维中心(COC)的标准化运维体系里,需要把各类告警转化为能按统一流程处理的对象,实现精准通知、快速响应,同时支持配置响应预案以实现故障自愈。为此,流转规则连接不同来源的告警和标准化处理流程,助力提升运维效率与自动化水平。

流转规则的具体配置项功能说明请参考 表1

表1 触发规则参数说明

参数

说明

触发类型

可选项“事件”、“告警”。

  • 事件:生成事件单,需要值班人员尽快处理,持续跟进直至闭环。
  • 告警:生成告警管理,支持基于响应预案手动或自动化快速闭环。

数据源

请选择数据源。

数据源是原始告警产生的来源。

配置规则前请确保数据已接入并启用,当满足所有条件时,运行流转规则。数据源设置请参考集成管理

触发条件

选择触发条件的key、比较方式、value。

支持添加触发条件,最多支持5个触发条件。key的详细说明请参考表3 触发条件key参数说明表

触发规则

请选择触发规则。

事件级别

仅触发类型选择事件时需要选择。可选项“P1”、“P2”、“P3”、“P4”、“P5”。

默认严重程度“P1”最严重,“P5”最轻微。

沉默规则

仅触发类型选择事件时需要选择。选择“启用”、“禁用”沉默规则。

此流转规则生成事件后,在事件未走到“已完成”或“客户已关闭”状态前,若又满足触发规则不再生成新的事件。

告警级别

仅触发类型选择告警时需要选择。可选项“紧急”、“重要”、“次要”、“提示”。

核心原理:从异构告警到标准化处理的转化枢纽

流转规则的核心逻辑是建立一套 “过滤 - 清洗 - 转化 - 分发 - 联动” 的标准化处理机制,实现对原始告警的系统化管控:

  • 异构告警接入:通过适配不同告警源的接口协议(如 SNMP、HTTP、Syslog 等),将分散的原始告警信息统一接入规则引擎。
  • 清洗与规整:根据预设规则对原始告警进行去重(剔除重复告警)、降噪(过滤无效或低优先级告警)、字段补全(补充设备信息、归属业务线等元数据),确保信息准确性。
  • 标准化转化:将清洗后的告警按照COC统一的数据模型(如告警级别、影响范围、故障类型等字段)转化为 “汇聚告警”,或进一步升级为需要人工处理的 “事件单”,实现格式与语义的标准化。
  • 精准分发与联动:基于规则配置的责任分配机制(如排班表、责任人列表),将标准化告警/事件单推送至对应处理人员;同时,若配置了响应预案,可自动触发预设的自愈动作(如重启服务、切换备用节点等)。

功能特性:驱动告警处理全流程的智能化与规范化

  • 灵活的规则配置能力支持用户自定义告警处理逻辑,可通过可视化界面配置触发条件(如 “CPU 使用率> 90% 且持续 5 分钟”)、处理动作(如清洗规则、转化方式)、分发策略等,适配不同业务场景的个性化需求。
  • 多维度责任分配机制
    • 支持按排班体系分配:绑定运维排班表,自动将告警分配给当前值班人员,确保 7×24 小时无间断响应。
    • 支持多责任人协同:可指定多个关联责任人(如业务负责人、技术支持人员),实现告警信息的同步通知与协同处理,避免责任真空。
    • 支持优先级路由:高优先级告警可绕过常规流程,直接推送至核心负责人,缩短响应时效。
  • 自动化响应与故障自愈内置响应预案配置功能,可针对特定类型的告警关联自动化处理流程:例如,当 “数据库连接数超限” 告警触发时,自动执行扩容脚本;当 “服务节点宕机” 告警产生时,自动切换至备用节点。通过 “告警 - 规则 - 预案” 的联动,实现部分故障的无人干预自愈,降低人工介入成本。
  • 全流程可追溯与审计记录告警从接入、规则匹配、转化、分发到处理完成的全生命周期轨迹,包括规则触发时间、责任人接收状态、预案执行结果等信息,形成完整审计日志,为运维优化与责任追溯提供依据。
  • 适配多样化告警场景兼容各类告警源(物理设备、虚拟资源、云服务、应用系统等)和告警类型(性能告警、安全告警、业务告警等),通过灵活的规则配置满足不同场景下的告警处理需求,支撑COC的集中化、标准化运营。

价值:提升运维效率与故障响应能力的关键支撑

流转规则通过对告警信息的 “提纯”“标准化” 和 “智能调度”,为用户带来多重价值:

  • 降低信息噪音:过滤无效告警,确保运维人员聚焦关键问题;
  • 统一处理标准:将异构告警转化为标准化对象,保障COC流程的规范化执行;
  • 加速故障响应:精准通知责任人并联动自愈预案,缩短故障发现与解决时间;
  • 强化协同效率:明确责任分配与处理轨迹,提升跨团队协作的透明度。

相关文档