更新时间:2024-09-04 GMT+08:00

ALM-12190 Knox连接数超过阈值

告警解释

系统周期性检测Knox所有拓扑的连接数情况,当存在拓扑的当前连接数超过最大连接数的阈值(默认为90%)时上报此告警,当连接数低于阈值后,告警自动清除。

该告警适用于MRS 3.1.0及之后版本集群。

告警属性

告警ID

告警级别

是否自动清除

12190

重要

告警参数

参数名称

参数含义

来源

产生告警的集群或系统名称

服务名

产生告警的服务名称

角色名

产生告警的角色名称

主机名

产生告警的主机名称

拓扑名

产生告警的Knox拓扑名称

对系统的影响

Knox高出阈值的拓扑存在连接满的可能,连接满后无法正常提供请求转发功能,影响整个MRS使用。

可能原因

用户大量使用Hue或者Manager,默认设置的Knox最大连接数较少。

处理步骤

  1. root用户分别登录OMS主节点和备节点。
  2. 在主备OMS节点的gateway-site.xml文件中增加以下配置,适当增加线程池。

    vi /opt/knox/conf/gateway-site.xml

    <property>
    <name>gateway.httpclient.maxConnections</name>
    <value>64</value>
    </property>

  3. omm用户登录主OMS节点,执行以下命令重启knox进程。

    sh /opt/knox/bin/restart-knox.sh

  4. 等待五分钟,查看该告警是否恢复。

    • 是,处理完毕。
    • 否,执行5

  5. 请联系运维人员,进行处理。

告警清除

此告警修复后,系统会自动清除此告警,无需手工清除。

参考信息