配置事件规则
事件规则分为自定义规则和系统内置规则。系统内置规则是开箱即用的规则,由系统统一配置,业务可以禁用某一系统内置规则。如果系统内置规则不满足要求,业务还可以在微服务粒度下自行配置自定义规则,支持业务配置规则来检测JVM指标、线程池指标等出现的异常事件,并可产生告警通知领域SRE。
系统内置规则如表1所示。
规则名称 |
指标类型 |
触发条件 |
---|---|---|
redis异常查询检测 |
redis监控 |
连续1个5分钟周期,redis错误次数,求和>=1个 |
kafka异常检测 |
kafka监控 |
连续1个5分钟周期,kafka异常,求和>=1个 |
sql异常监控 |
数据库监控 |
连续1个5分钟周期,sql异常,求和>=5个 |
CPU使用率检测 |
JVM监控 |
连续3个5分钟周期,CPU使用率,最大值>=80% |
死锁线程检测 |
JVM监控 |
连续1个1440分钟周期,JVM死锁线程数,最大值>=1个 |
慢sql监控 |
数据库监控 |
连续1个5分钟周期,慢sql,求和>=1个 |
redis响应平均值检测 |
redis监控 |
连续1个5分钟周期,平均响应时间,平均值>=10ms |
接口异常监控 |
接口监控 |
连续3个5分钟周期,接口异常,求和>=5个 |
httpclient调用时延检测 |
httpclient监控 |
连续3个5分钟周期,httpclient平均时延,平均值>=3000ms |
kafka消息堆积数检测 |
kafka监控 |
连续1个5分钟周期,kafka消息堆积,最大值>=50个 |
接口最大响应时间监控 |
接口监控 |
连续3个5分钟周期,接口最大响应时间,最大值>=3000ms |
rainbow连接池活跃率检测 |
数据库连接池监控 |
连续3个5分钟周期,rainbow连接池活跃率,平均值>=80% |
httpclient调用异常检测 |
httpclient监控 |
连续3个5分钟周期,httpclient错误次数,求和>=1个 |
线程数过多检测 |
JVM监控 |
连续1个60分钟周期,JVM线程总数,平均值>=5000个 |
线程数持续增长检测 |
JVM监控 |
连续2个1440分钟周期,JVM线程总数,平均值增量>=500个,且最大值增量>= 500个 |
元空间内存持续增长检测 |
JVM监控 |
连续2个1440分钟周期,JVM元空间占最大堆内存比值,平均值增量>=10%,且最小值>= 20% |
堆内存持续增长检测 |
JVM监控 |
连续2个1440分钟周期,JVM GC后老年代占最大堆内存比值,平均值增量>=10%,且最小值>= 40% |
频繁FullGc检测 |
JVM监控 |
连续1个60分钟周期,JVM FullGC次数,求和>=50次 |
前提条件
已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。
新增自定义规则
- 进入AppStage运维中心。
- 在顶部导航栏选择服务。
- 单击
,选择 。
- 在左侧导航栏选择 。
- 选择“自定义规则”页签,单击“新增自定义规则”。
- 配置自定义规则,参数说明如表2所示,配置完成后,单击“确定”。
- 选择需要关联的电子流,单击“提交”。列表显示该新增的规则信息。
- 可以通过规则所在行“是否开启”、“监控服务告警通知”列下的按钮开启或关闭对应规则,或开启告警通知。
- 可以单击规则“操作”列的“修改”或“删除”,修改自定义规则或删除自定义规则。
配置系统内置规则
可对系统内置规则进行禁用/启用。
- 进入AppStage运维中心。
- 在顶部导航栏选择服务。
- 单击
,选择 。
- 在左侧导航栏选择 。
- 选择“系统内置规则”页签。
- 单击规则“操作”列的“禁用”或“启用”,在弹出的提示框中单击“确定”,关联电子流后单击“提交”。