设置RabbitMQ告警规则
本章节主要介绍部分监控指标的告警策略,以及配置操作。在实际业务中,建议按照以下告警策略,配置监控指标的告警规则。
指标名称 |
告警策略 |
指标说明 |
解决方案 |
---|---|---|---|
内存高水位状态 |
告警阈值:原始值>=1 连续触发次数:1 告警级别:致命 |
告警阈值为1表示触发内存高水位,会阻塞消息生产 |
|
磁盘高水位状态 |
告警阈值:原始值>=1 连续触发次数:1 告警级别:致命 |
告警阈值为1表示触发磁盘高水位,会阻塞消息生产 |
|
内存使用率 |
告警阈值:原始值>业务预期使用率(推荐30%) 连续触发次数:连续3~5个周期 告警级别:重要 |
该指标需要分别为每个节点设置内存使用率告警,避免触发内存高水位阻塞生产 |
|
CPU使用率 |
告警阈值:原始值>业务预期使用率(推荐70%) 连续触发次数:连续3~5个周期 告警级别:重要 |
该指标需要分别为每个节点设置CPU使用率告警,CPU使用率过高可能会影响生产速度 |
|
可消费消息数 |
告警阈值:原始值>业务预期可消费消息数 连续触发次数:1 告警级别:重要 |
可消费消息数过多表示消息堆积 |
请参考消息堆积的解决办法 |
未确认消息数 |
告警阈值:原始值>业务预期未确认消息数 连续触发次数:1 告警级别:重要 |
未确认消息数过多可能会导致消息堆积 |
|
连接数 |
告警阈值:原始值>业务预期连接数 连续触发次数:1 告警级别:重要 |
连接数突增可能是流量变大的预警 |
需检查业务是否正常,可参考其他告警 |
通道数 |
告警阈值:原始值>业务预期通道数 连续触发次数:1 告警级别:重要 |
通道数突增可能是流量变大的预警 |
需检查业务是否正常,可参考其他告警 |
Erlang进程数 |
告警阈值:原始值>业务预期进程数 连续触发次数:1 告警级别:重要 |
进程数突增可能是流量变大的预警 |
需检查业务是否正常,可参考其他告警 |
- 告警阈值请根据业务预期数设置。例如,业务预期使用率35%,则告警阈值设置35%。
- 连续触发次数和告警级别可根据业务逻辑自行调整。
操作步骤
- 登录管理控制台。
- 在管理控制台左上角单击,选择区域。
此处请选择与您的应用服务相同的区域。
- 在管理控制台左上角单击,选择“应用服务 > 分布式消息服务 RabbitMQ”,进入分布式消息服务RabbitMQ专享版页面。
- 在RabbitMQ实例名称后,单击“查看监控数据”,进入“云监控”页面。
- 在实例监控指标页面中,找到需要创建告警的指标项,鼠标移动到指标区域,然后单击指标右上角的,进入“创建告警规则”页面。
- 在告警规则页面,设置告警信息。
创建告警规则操作,请查看《云监控服务 用户指南》。