RocketMQ支持的监控指标
功能说明
本章节定义了分布式消息服务RocketMQ版上报云监控服务的监控指标的命名空间,监控指标列表和维度定义,您可以通过分布式消息服务RocketMQ版控制台来检索分布式消息服务RocketMQ版产生的监控指标和告警信息。
命名空间
SYS.DMS
实例监控指标
| 指标ID | 指标名称 | 指标含义 | 取值范围 | 单位 | 进制 | 维度 | 监控周期(原始指标) |
|---|---|---|---|---|---|---|---|
| instance_produce_msg | 消息生产数 | 实例一分钟收到的消息数 | >0 | Count | 不涉及 | reliablemq_instance_id | 1分钟 |
| instance_consume_msg | 消息消费数 | 实例一分钟被消费的消息数 | >0 | Count | 不涉及 | reliablemq_instance_id | 1分钟 |
| current_topics | 主题数 | 实例的主题数量 说明: 2022年5月16号及以后购买的实例,支持此监控项。 | >=0 | Count | 不涉及 | reliablemq_instance_id | 1分钟 |
| current_queues | 队列数 | 实例的队列数量 说明: 2022年5月16号及以后购买的实例,支持此监控项。 | >=0 | Count | 不涉及 | reliablemq_instance_id | 1分钟 |
| instance_accumulation | 消息堆积数 | 实例所有消费组堆积消息数量之和 说明: 2022年5月16号及以后购买的实例,支持此监控项。 | >=0 | Count | 不涉及 | reliablemq_instance_id | 1分钟 |
| instance_produce_scheduled_msg | 生产定时消息数 | 实例一分钟收到的定时消息数 说明: 2023年7月8号及以后购买的实例,支持此监控项。 | >=0 | Count | 不涉及 | reliablemq_instance_id | 1分钟 |
| instance_retention_period | 实例消息保留时间 | 实例消息保留时间 说明: 2023年7月8号及以后购买的实例,支持此监控项。 | >=0 | Hour | 不涉及 | reliablemq_instance_id | 1分钟 |
| instance_disk_usage | 实例磁盘容量使用率 | 实例磁盘容量使用率 说明: 2023年7月8号及以后购买的实例,支持此监控项。 | >=0 | % | 不涉及 | reliablemq_instance_id | 1分钟 |
| instance_produce_rate | 实例生产速率 | 实例生产速率 说明: 2023年7月8号及以后购买的实例,支持此监控项。 | >=0 | Count/s | 不涉及 | reliablemq_instance_id | 1分钟 |
| instance_consume_rate | 实例消费速率 | 实例消费速率 说明: 2023年7月8号及以后购买的实例,支持此监控项。 | >=0 | Count/s | 不涉及 | reliablemq_instance_id | 1分钟 |
| instance_produce_rate_for_ratelimit | 折算后的生产TPS | 按消息大小、类型折算后的生产TPS,用于计算流控。 说明: RocketMQ 5.x版本才显示此参数。
| >=0 | Count/s | 不涉及 | reliablemq_instance_id | 1分钟 |
| instance_consume_rate_for_ratelimit | 折算后的消费TPS | 按消息大小、类型折算后的消费TPS,用于计算流控。 说明: RocketMQ 5.x版本才显示此参数。
| >=0 | Count/s | 不涉及 | reliablemq_instance_id | 1分钟 |
| instance_produce_ratelimit_percentage | 生产TPS百分比 | 折算后的生产TPS占生产流控上限百分比。 说明: RocketMQ 5.x版本才显示此参数。
| >=0 | % | 不涉及 | reliablemq_instance_id | 1分钟 |
| instance_consume_ratelimit_percentage | 消费TPS百分比 | 折算后的消费TPS占消费流控上限百分比。 说明: RocketMQ 5.x版本才显示此参数。
| >=0 | % | 不涉及 | reliablemq_instance_id | 1分钟 |
| instance_produce_ratelimit_times | 生产被流控次数 | 一分钟内生产被流控次数。 说明: RocketMQ 5.x版本才显示此参数。 | >=0 | Count | 不涉及 | reliablemq_instance_id | 1分钟 |
| instance_consume_ratelimit_times | 消费被流控次数 | 一分钟内消费被流控次数。 说明: RocketMQ 5.x版本才显示此参数。 | >=0 | Count | 不涉及 | reliablemq_instance_id | 1分钟 |
节点指标监控
RocketMQ 4.8.0版本显示节点指标监控,RocketMQ 5.x版本没有节点指标监控。
| 指标ID | 指标名称 | 指标含义 | 取值范围 | 单位 | 进制 | 维度 | 监控周期(原始指标) |
|---|---|---|---|---|---|---|---|
| broker_produce_msg | 消息生产数 | 节点一分钟收到的消息数 | >0 | Count | 不涉及 | reliablemq_instance_id,reliablemq_broker | 1分钟 |
| broker_consume_msg | 消息消费数 | 节点一分钟被消费的消息数 | >0 | Count | 不涉及 | reliablemq_instance_id,reliablemq_broker | 1分钟 |
| broker_produce_rate | 消息生产速率 | 节点每秒收到的消息数 | >0 | Count/s | 不涉及 | reliablemq_instance_id,reliablemq_broker | 1分钟 |
| broker_consume_rate | 消息消费速率 | 节点每秒被消费的消息数 | >0 | Count/s | 不涉及 | reliablemq_instance_id,reliablemq_broker | 1分钟 |
| broker_total_bytes_in_rate | 网络入流量 | 节点每秒网络访问流入流量 | >0 | Byte/s | 1024(IEC) | reliablemq_instance_id,reliablemq_broker | 1分钟 |
| broker_total_bytes_out_rate | 网络出流量 | 节点每秒网络访问流出流量 | >0 | Byte/s | 1024(IEC) | reliablemq_instance_id,reliablemq_broker | 1分钟 |
| broker_cpu_core_load | CPU核均负载 | 该指标用于统计节点虚拟机CPU每个核的平均负载 | >0 | 不涉及 | 不涉及 | reliablemq_instance_id,reliablemq_broker | 1分钟 |
| broker_disk_usage | 磁盘容量使用率 | 该指标用于统计节点虚拟机的磁盘容量使用率 | 0~100 | % | 不涉及 | reliablemq_instance_id,reliablemq_broker | 1分钟 |
| broker_memory_usage | 内存使用率 | 该指标用于统计节点虚拟机的内存使用率 | 0~100 | % | 不涉及 | reliablemq_instance_id,reliablemq_broker | 1分钟 |
| broker_alive | 节点存活状态 | 节点存活状态 说明: 2022年5月16号及以后购买的实例,支持此监控项。 | 1:存活 0:离线 | 不涉及 | 不涉及 | reliablemq_instance_id,reliablemq_broker | 1分钟 |
| broker_connections | 连接数 | 虚拟机使用的连接数 说明: 2022年5月16号及以后购买的实例,支持此监控项。 | >=0 | Count | 不涉及 | reliablemq_instance_id,reliablemq_broker | 1分钟 |
| broker_cpu_usage | CPU使用率 | 虚拟机的CPU使用率 说明: 2022年5月16号及以后购买的实例,支持此监控项。 | >=0 | % | 不涉及 | reliablemq_instance_id,reliablemq_broker | 1分钟 |
| broker_disk_read_await | 磁盘平均读操作耗时 | 磁盘平均读操作耗时 说明: 2022年5月16号及以后购买的实例,支持此监控项。 | >=0 | ms | 不涉及 | reliablemq_instance_id,reliablemq_broker | 1分钟 |
| broker_disk_write_await | 磁盘平均写操作耗时 | 磁盘平均写操作耗时 说明: 2022年5月16号及以后购买的实例,支持此监控项。 | >=0 | ms | 不涉及 | reliablemq_instance_id,reliablemq_broker | 1分钟 |
| broker_produce_p99 | 节点生产请求P99处理时长 | 节点所有生产请求处理时长从小到大排列,顺序处于99%位置的时长 说明: 2022年5月16号及以后购买的实例,支持此监控项。 | >=0 | ms | 不涉及 | reliablemq_instance_id,reliablemq_broker | 1分钟 |
| broker_produce_p999 | 节点生产请求P99.9处理时长 | 节点所有生产请求处理时长从小到大排列,顺序处于99.9%位置的时长 说明: 2022年5月16号及以后购买的实例,支持此监控项。 | >=0 | ms | 不涉及 | reliablemq_instance_id,reliablemq_broker | 1分钟 |
| broker_retention_period | 消息保留时间 | 当前时间与节点保存的最早一条消息的时间的差值 说明: 2022年5月16号及以后购买的实例,支持此监控项。 | >=0 | Hours | 不涉及 | reliablemq_instance_id,reliablemq_broker | 1分钟 |
| broker_produce_success_rate | 生产成功率 | 节点所有生产请求的成功率 说明: 2022年5月16号及以后购买的实例,支持此监控项。 | >=0 | % | 不涉及 | reliablemq_instance_id,reliablemq_broker | 1分钟 |
| broker_produce_scheduled_msg | 一分钟生产定时消息数 | 节点一分钟生产的定时消息数量 说明: 2022年5月16号及以后购买的实例,支持此监控项。 | >=0 | Count | 不涉及 | reliablemq_instance_id,reliablemq_broker | 1分钟 |
| broker_disk_read_rate | 磁盘读流量 | 磁盘读操作流量 说明: 2022年5月16号及以后购买的实例,支持此监控项。 | >=0 | Byte/s | 1024(IEC) | reliablemq_instance_id,reliablemq_broker | 1分钟 |
| broker_disk_write_rate | 磁盘写流量 | 磁盘写操作流量 说明: 2022年5月16号及以后购买的实例,支持此监控项。 | >=0 | Byte/s | 1024(IEC) | reliablemq_instance_id,reliablemq_broker | 1分钟 |
主题监控指标
| 指标ID | 指标名称 | 指标含义 | 取值范围 | 单位 | 进制 | 维度 | 监控周期(原始指标) |
|---|---|---|---|---|---|---|---|
| topic_produce_msg | 消息生产数 | Topic一分钟收到的消息数 | >0 | Count | 不涉及 | reliablemq_instance_id,reliablemq_topics | 1分钟 |
| topic_consume_msg | 消息消费数 | Topic一分钟被消费的消息数 | >0 | Count | 不涉及 | reliablemq_instance_id,reliablemq_topics | 1分钟 |
| topic_produce_rate | 消息生产速率 | Topic每秒收到的消息数 | >0 | Count/s | 不涉及 | reliablemq_instance_id,reliablemq_topics | 1分钟 |
| topic_consume_rate | 消息消费速率 | Topic每秒被消费的消息数 | >0 | Count/s | 不涉及 | reliablemq_instance_id,reliablemq_topics | 1分钟 |
| topic_bytes_in_rate | 生产流量 | 当前主题的生产流量 说明: 2022年5月16号及以后购买的实例,支持此监控项。 | >=0 | Byte/s | 1024(IEC) | reliablemq_instance_id,reliablemq_topics | 1分钟 |
| topic_bytes_out_rate | 消费流量 | 当前主题的消费流量 说明: 2022年5月16号及以后购买的实例,支持此监控项。 | >=0 | Byte/s | 1024(IEC) | reliablemq_instance_id,reliablemq_topics | 1分钟 |
消费组监控指标
| 指标ID | 指标名称 | 指标含义 | 取值范围 | 单位 | 进制 | 维度 | 监控周期(原始指标) |
|---|---|---|---|---|---|---|---|
| group_consume_msg | 消息消费数 | 消费组一分钟消费的消息数 说明: 在“消费组”页签,当“主题”为“所有主题”时,才包含该指标。 | >0 | Count | 不涉及 | reliablemq_instance_id,reliablemq_groups | 1分钟 |
| group_accumulation | 消息堆积数(消费组可消费消息数) | 消费组的消息堆积量 单位:Count 说明: 在“消费组”页签,当“主题”为“所有主题”时,才包含该指标。 | >0 | Count | 不涉及 | reliablemq_instance_id,reliablemq_groups | 1分钟 |
| group_topic_consume_msg | 消息消费数 | 消费组对指定Topic一分钟消费的消息数 说明: 在“消费组”页签,当“主题”为指定的Topic名称时,才包含该指标。 | >0 | Count | 不涉及 | reliablemq_instance_id,reliablemq_groups,reliablemq_groups_topics | 1分钟 |
| group_topic_consume_rate | 消费速率 | 消费组对指定Topic每秒消费的消息数 说明: 在“消费组”页签,当“主题”为指定的Topic名称时,才包含该指标。 | >0 | Count/s | 不涉及 | reliablemq_instance_id,reliablemq_groups,reliablemq_groups_topics | 1分钟 |
| group_topic_accumulation | 可消费消息数 | 消费组对指定Topic的消息堆积数 说明: 在“消费组”页签,当“主题”为指定的Topic名称时,才包含该指标。 | >0 | Count | 不涉及 | reliablemq_instance_id,reliablemq_groups,reliablemq_groups_topics | 1分钟 |
| consumer_subscription_consistency | 消费组内订阅关系一致性 | 一分钟内消费组内消费者订阅关系是否一致 说明:
|
| 不涉及 | 不涉及 | reliablemq_instance_id,reliablemq_groups | 1分钟 |
死信队列监控指标
| 指标ID | 指标名称 | 指标含义 | 取值范围 | 单位 | 进制 | 测量对象(维度) | 监控周期(原始指标) |
|---|---|---|---|---|---|---|---|
| dlq_accumulation | 死信主题消息量 | 死信主题的消息量总数 | >=0 | Count | 不涉及 | reliablemq_instance_id,reliablemq_dlq_topics | 1分钟 |
| dlq_increase | 死信消息增长量 | 死信主题一分钟内增加的消息数量 | >=0 | Count | 不涉及 | reliablemq_instance_id,reliablemq_dlq_topics | 1分钟 |
对于有多层测量维度的测量对象,使用接口查询监控指标时,需要代入具体指标的维度层级关系。
例如,需要查询消费组的消息堆积数(group_accumulation),该指标的维度信息为“reliablemq_instance_id,reliablemq_groups”,表示reliablemq_instance_id为0层,reliablemq_groups为1层。
- 通过API查询单个监控指标时,reliablemq_groups的维度信息代入样例如下:
dim.0=reliablemq_instance_id,6a0df74a-fxxx-497bfdda6c8e&dim.1=reliablemq_groups,10
其中,6a0df74a-fxxx-497bfdda6c8e和10分别为reliablemq_instance_id和reliablemq_groups的维度值,具体获取方法请参见维度表格中的获取指导。
- 通过API批量查询监控指标时,reliablemq_groups的维度信息代入样例如下:
"dimensions": [ { "name": "reliablemq_instance_id", "value": "6a0df74a-fxxx-497bfdda6c8e" }, { "name": "reliablemq_groups", "value": "10" } ]其中,6a0df74a-fxxx-497bfdda6c8e和10分别为reliablemq_instance_id和reliablemq_groups的维度值,具体获取方法请参见维度表格中的获取指导。
维度
| Key | Value |
|---|---|
| reliablemq_instance_id | RocketMQ实例ID,例如:6a0df74a-fxxx-497bfdda6c8e。 该取值的获取方式为:调用查询所有实例列表,从接口返回的响应参数中提取。 |
| reliablemq_broker | RocketMQ实例节点,节点编号从0开始递增。例如3个节点的实例,节点为:broker-0,broker-1,broker-2。 该取值的获取方式为:调用查询实例在CES的监控层级关系API,从接口返回的响应参数中提取。 |
| reliablemq_topics | Topic名称,例如:topic-01。 该取值的获取方式为:调用查询实例在CES的监控层级关系API,从接口返回的响应参数中提取。 |
| reliablemq_groups | RocketMQ实例的消费组名称,例如:group-01。 该取值的获取方式为:调用查询实例在CES的监控层级关系API,从接口返回的响应参数中提取。 |
| reliablemq_groups_topics | 消费组消费的Topic名称,例如:topic-01。 该取值的获取方式为:调用查询实例在CES的监控层级关系API,从接口返回的响应参数中提取。 |
| reliablemq_dlq_topics | RocketMQ实例的死信队列名称,例如:DLQ_group-1。 该取值的获取方式为:调用查询实例在CES的监控层级关系API,从接口返回的响应参数中提取。 |