更新时间:2024-09-04 GMT+08:00
ALM-12190 Knox连接数超过阈值
告警解释
系统周期性检测Knox所有拓扑的连接数情况,当存在拓扑的当前连接数超过最大连接数的阈值(默认为90%)时上报此告警,当连接数低于阈值后,告警自动清除。
该告警适用于MRS 3.1.0及之后版本集群。
告警属性
告警ID |
告警级别 |
是否自动清除 |
---|---|---|
12190 |
重要 |
是 |
告警参数
参数名称 |
参数含义 |
---|---|
来源 |
产生告警的集群或系统名称 |
服务名 |
产生告警的服务名称 |
角色名 |
产生告警的角色名称 |
主机名 |
产生告警的主机名称 |
拓扑名 |
产生告警的Knox拓扑名称 |
对系统的影响
Knox高出阈值的拓扑存在连接满的可能,连接满后无法正常提供请求转发功能,影响整个MRS使用。
可能原因
用户大量使用Hue或者Manager,默认设置的Knox最大连接数较少。
处理步骤
- 以root用户分别登录OMS主节点和备节点。
- 在主备OMS节点的gateway-site.xml文件中增加以下配置,适当增加线程池。
vi /opt/knox/conf/gateway-site.xml
<property> <name>gateway.httpclient.maxConnections</name> <value>64</value> </property>
- 以omm用户登录主OMS节点,执行以下命令重启knox进程。
sh /opt/knox/bin/restart-knox.sh
- 等待五分钟,查看该告警是否恢复。
- 是,处理完毕。
- 否,执行5。
- 请联系运维人员,进行处理。
告警清除
此告警修复后,系统会自动清除此告警,无需手工清除。
参考信息
无
父主题: MRS集群告警处理参考