更新时间:2025-08-08 GMT+08:00

基本概念

IDC

互联网数据中心(Internet Data Center):为集中存储、处理和传输数据提供基础设施服务的专业化物理设施。

补丁基线

一系列预设的补丁管理规则合集,包含操作系统类型、补丁分类、合规性级别等,一般基于补丁基线对实例进行补丁扫描和安装。

流转规则

将集成至COC的原始告警信息,通过一系列的触发类型、触发条件等,转化成事件或汇聚告警的功能,主要实现了告警的汇聚和降噪。

事件

IT运维概念之一,COC中的“事件”,来自于手动创建、告警转事件或流转规则生成,主要指应用中发生的异常状态或服务中断,需通过标准化流程快速响应与处置,COC默认的事件级别可分为P1/P2/P3/P4/P5。

汇聚告警

满足COC流转规则触发条件后自动生成的内容,可通过COC将汇聚告警进行清除/转事件/执行响应预案等操作。

问题

IT运维概念之一,一般指事件发生的深层诱因,需经系统性调查明确原因。

WarRoom

在COC中,WarRoom是指在发生群体性故障或重大故障时,为快速恢复业务正常运行,支撑运维、研发、运营联合作战,保障业务快速恢复而组建的会议。在WarRoom中,可以通过应用诊断、响应预案等方式辅助应用快速恢复,且支持拉起钉钉/企业微信/飞书WarRoom群组。

改进

IT运维概念之一,基于事件分析、告警处理等输入,对架构、配置、流程等进行系统性优化,持续提升应用质量和效率。

变更

IT运维概念之一,指对应用、资源、架构、配置等进行增删改查一系列操作的统称。

PRR

运维领域的PRR(生产就绪程度评估),指服务或应用上线前,通过系统性评估验证其是否满足高可用性、可运维性及容灾能力等生产环境要求的标准化流程。

SLI

Service Level Indicator,服务等级指标,是SLA和SLO的基础指标,直接反映服务的关键质量维度(如延迟、错误率)。

SLO

Service Level Objective,服务等级目标,通常基于SLI衡量系统稳定性与可靠性达标程度,是SLA的核心依据,核心价值在于将模糊的“系统稳定性”转化为可量化承诺(如“月度可用率≥99.999%”)。

SLA

Service Level Agreement,服务等级协议,本质是一种服务质量承诺,明确定义服务提供方需满足的性能指标、可用性标准及违约追责条款等,核心是通过量化目标(如可用性≥99.999%)平衡用户需求与服务能力。