文档首页/ 分布式消息服务RocketMQ版/ 用户指南/ 查看监控指标与配置告警/ 配置RocketMQ监控告警

更新时间：2026-06-11 GMT+08:00

配置RocketMQ监控告警

本章节主要介绍部分监控指标的告警策略，以及配置操作。在实际业务中，建议按照以下告警策略，配置监控指标的告警规则。

是否接近性能上限，表示当前资源支撑的性能为告警策略中设置的告警阈值，如果继续上升，业务可能出现问题。

表1 RocketMQ实例配置告警的指标
指标ID	指标名称	测量对象	告警策略	指标说明	告警处理建议
instance_accumulation	消息堆积数	实例	告警阈值：原始值>积压上限的90%，积压上限由您根据业务实际情况设定连续触发次数：1 告警级别：重要	该指标用于统计RocketMQ实例中所有消费组的总堆积消息数。	出现该告警时，首先排查是否有闲置消费组，如果有，则删除。其次，可以考虑加快消费速度，例如增加组内消费者数量。
broker_disk_usage	磁盘容量使用率	节点	告警阈值：原始值>85 连续触发次数：3 告警级别：紧急	该指标为从RocketMQ节点虚拟机层面采集的磁盘容量使用率。单位：%。	出现该告警时，说明当前实例规格已不足以承载业务，需要扩容存储空间。具体操作，请参考变更实例规格。
broker_cpu_usage	CPU使用率	节点	告警阈值：原始值>80 连续触发次数：3 告警级别：重要	该指标为从RocketMQ节点虚拟机层面采集的CPU使用率。	出现该告警时，先检查该监控是否长期处于接近或超过告警阈值状态，如果是，需要扩容实例代理个数。具体操作，请参考变更实例规格。
broker_disk_read_await	磁盘平均读操作耗时（RocketMQ 4.8.0版本才显示此监控项）	节点	告警阈值：原始值>20 连续触发次数：3 告警级别：重要	该指标为从RocketMQ节点磁盘读时延，当磁盘性能到达上限时，磁盘读、写时延会上升，导致RocketMQ生产、消费时延增大。	出现该告警时，先检查该监控是否长期处于接近或超过告警阈值状态，如果是，需要扩容实例代理个数。具体操作，请参考变更实例规格。
broker_disk_write_await	磁盘平均写操作耗时（RocketMQ 4.8.0版本才显示此监控项）	节点	告警阈值：原始值>20 连续触发次数：3 告警级别：重要	该指标为从RocketMQ节点磁盘写时延，当磁盘性能到达上限时，磁盘读、写时延会上升，导致RocketMQ生产、消费时延增大。	出现该告警时，先检查该监控是否长期处于接近或超过告警阈值状态，如果是，需要扩容实例代理个数。具体操作，请参考变更实例规格。

操作视频

本视频演示配置RocketMQ监控告警通知的操作。

因产品功能演进，操作界面可能存在差异，相关视频仅供参考，具体以实际环境为准。

配置RocketMQ监控告警

登录RocketMQ实例控制台。
在RocketMQ实例名称后，单击“查看监控数据”。

进入云监控该实例的监控指标页面。
在实例监控指标页面中，找到需要创建告警的指标项，鼠标移动到指标区域，然后单击指标右上角的，创建告警规则。

跳转到创建告警规则页面。
在告警规则页面，设置告警信息。

创建告警规则操作，请查看创建告警规则。
1. 设置告警名称和告警的描述。
2. 设置告警策略和告警级别。
  如下图所示，在进行指标监控时，如果连续3次周期，磁盘容量使用率原始值超过85%，则产生告警，如果未及时处理，则产生告警通知。
  
  图1 设置告警策略和告警级别
3. 设置“发送通知”开关。当开启时，设置告警生效时间、产生告警时通知的对象以及触发的条件。
4. 单击“立即创建”，等待创建告警规则成功。

相关文档

Topic监控数据无法正常展示的处理方法请参见云监控无法展示Topic监控数据？。

父主题：查看监控指标与配置告警

上一篇：RocketMQ支持的监控指标

下一篇：查看RocketMQ审计日志

相关文档

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提交成功！非常感谢您的反馈，我们会继续努力做到更好！您可在我的云声建议查看反馈及问题处理状态。

系统繁忙，请稍后重试

如您有其它疑问，您也可以通过华为云社区问答频道来与我们联系探讨

云宝助手提问云社区提问