更新时间:2024-04-07 GMT+08:00
必须配置的监控告警
本章节主要介绍部分监控指标的告警策略,以及配置操作。在实际业务中,建议按照以下告警策略,配置监控指标的告警规则。
是否接近性能上限,表示当前资源支撑的性能为告警策略中设置的告警阈值,如果继续上升,业务可能出现问题。
指标名称 |
正常范围 |
告警策略 |
是否接近性能上限 |
指标说明和告警处理建议 |
---|---|---|---|---|
磁盘容量使用率 |
0~100 |
告警阈值:原始值>85 连续触发次数:3 告警级别:紧急 |
是 |
指标说明:该指标为从RocketMQ节点虚拟机层面采集的磁盘容量使用率。单位:%。 处理建议:出现该告警时,说明当前实例规格已不足以承载业务,需要扩容存储空间。具体操作,请参考变更实例规格。 |
CPU核均负载 |
0~2 |
告警阈值:原始值>1.5 连续触发次数:3 告警级别:重要 |
是 |
指标说明:该指标为从RocketMQ节点虚拟机层面采集的CPU每个核的平均负载。 处理建议:出现该告警时,参考如下操作: |
内存使用率 |
0~100 |
告警阈值:原始值>85 连续触发次数:3 告警级别:紧急 |
是 |
指标说明:该指标为RocketMQ节点虚拟机层面采集的内存使用率。单位:%。 处理建议:出现该告警时,参考如下操作: |
操作步骤
- 登录管理控制台。
- 在管理控制台左上角单击,选择区域。
请选择RocketMQ实例所在的区域。
- 在管理控制台左上角单击,选择“应用服务 > 分布式消息服务RocketMQ版”,进入分布式消息服务RocketMQ专享版页面。
- 在RocketMQ实例名称后,单击。
进入云监控该实例的监控指标页面。
- 在实例监控指标页面中,找到需要创建告警的指标项,鼠标移动到指标区域,然后单击指标右上角的,创建告警规则。
跳转到创建告警规则页面。
- 在告警规则页面,设置告警信息。
创建告警规则操作,请查看创建告警规则。
父主题: 监控