设置SLI指标
在云运维管理场景中,企业核心业务多基于云原生架构部署,多服务实例协同运行、多维度请求交叉交互,易出现运维指标零散无统一量化标准、服务质量无明确底线的问题,既导致监控预警缺乏准确依据,故障发生后无量化判定标准,也让技术与业务团队对服务稳定性的认知存在偏差,跨团队协同效率低。基于请求型、实例型SLI量化数据,为各业务域、各服务层级针对性设置SLO指标,明确可用性、故障恢复时长、资源负载阈值等核心质量目标,划定服务质量红线,让运维监控有清晰的预警基准,故障处置有量化的判定依据,跨团队协同有统一的服务质量共识,同时为资源调配、服务迭代优化提供数据化决策支撑,让服务质量管控从被动响应转向主动预判。
指标分为请求型SLI指标和实例型SLI指标,配置完成可以在后续设置SLO中断记录中调用。
用户可以通过此页面进行SLO指标的添加、修改、删除、查看操作。
SLI指标与SLO指标的区别与关联性
SLI(服务水平指标,Service Level Indicator):是对服务质量核心维度进行客观、量化测量的具体指标,是服务质量的 “量化数据载体”。聚焦云运维中服务运行的关键维度,涵盖请求型(如请求成功率、响应耗时)、实例型(如实例在线率、CPU利用率)等类别,通过具体数值 / 比率反映服务实际运行状态,是设置SLO的数据基础,无目标性,仅客观呈现服务实际表现。
SLO(服务水平目标,Service Level Objective):是基于SLI指标设定的服务质量量化期望与阈值,是服务质量的 “红线标准”。结合业务需求、运维能力,为核心SLI指标划定明确的目标范围(如核心服务请求成功率≥99.95%、实例在线率≥99.9%),是技术与业务团队对齐的服务质量共识,也是运维监控、故障处置、资源优化的核心判定依据。
|
对比维度 |
SLI指标 |
SLO指标 |
|---|---|---|
|
核心定位 |
服务质量的量化测量依据 |
服务质量的量化目标标准 |
|
核心属性 |
客观性、数据性(无目标导向) |
主观性、目标性(基于业务 / 运维需求设定) |
|
表现形式 |
具体数值/比率(如请求成功率 99.98%、CPU利用率 60%) |
数值阈值/区间(如请求成功率≥99.95%、CPU利用率≤80%) |
|
核心作用 |
客观反映服务实际运行状态 |
划定服务质量红线,指导运维动作、对齐跨团队共识 |
|
关联关系 |
是SLO设定的基础和前提,无SLI则无量化的SLO |
是对SLI的目标约束,SLO的达成需通过监控SLI来验证 |
SLI和SLO是云运维中服务质量管控的核心层级,SLO基于SLI落地,而后续的SLA(服务水平协议),则是将SLO转化为面向客户/业务方的正式约定,三者形成 “测量 - 目标 - 协议” 的服务质量管控体系。
前提条件
已开通“故障管理”套餐,具体计费情况请参考计费说明。
添加SLI指标
- 登录云运维中心。
- 在左侧导航栏选择“基础配置 > SLO管理”。
- 选择需要配置的SLO指标,单击操作列“指标配置”。
- 单击“添加SLI指标”,进入添加SLI指标页面。
- 在添加SLI指标页面,设置SLI指标信息。
表2 配置SLI指标参数说明 参数
说明
指标类型
可选项“请求型SLI指标”、“实例型SLI指标”。
- 请求型SLI指标:反映服务对外部请求的处理能力和服务质量,是面向业务/用户侧的SLI指标。例如,请求成功率、响应耗时、吞吐量、错误率等。
- 实例型SLI指标:反映服务运行载体的健康度、资源利用率与运行稳定性,是面向基础设施/服务部署侧的SLI指标。例如,实例在线率、CPU利用率、内存使用率、磁盘IO负载、端口存活状态等。
SLI指标名称
填写自定义SLI指标的名称。
名称由中文、字母、数字、中划线、下划线组成,长度在3~100个字符之间。
SLI指标描述
填写SLI指标的详细说明。长度不超过256个字符。
不可用定义
请选择参数的比较方式、参数值、参数单位。
参数满足条件时即为不可用。
- 单击下方“确定”,完成单个SLI指标添加。
- 设置完成后,单击右下方“确定”,完成SLI指标添加。
添加完成后,可在对应的SLO指标下查看。
图1 查看SLI指标
更多操作
创建SLI指标后,还可以进行以下操作:
|
功能 |
场景 |
操作 |
|---|---|---|
|
修改SLI指标 |
SLI指标创建后,您根据业务需求进行修改。 |
|
|
删除SLI指标 |
SLI指标创建后,如不再适用,支持删除。 |
|