更新时间:2024-11-29 GMT+08:00

ALM-12190 Knox连接数超过阈值

告警解释

系统周期性检测Knox所有拓扑的连接数情况,当存在拓扑的当前连接数超过最大连接数的阈值(默认为90%)时上报此告警,当连接数低于阈值后,告警自动清除。

告警属性

告警ID

告警级别

告警类型

业务类型

是否可自动清除

12190

重要

业务质量告警

FusionInsight Manager

告警参数

类别

参数名称

参数含义

定位信息

来源

产生告警的集群或系统名称

服务名

产生告警的服务名称

角色名

产生告警的角色名称

主机名

产生告警的主机名称

拓扑名

产生告警的Knox拓扑名称

对系统的影响

Knox高出阈值的拓扑存在连接满的可能,连接满后无法正常提供请求转发功能,影响整个MRS使用。

可能原因

用户大量使用Hue或者Manager,默认设置的Knox最大连接数较少。

处理步骤

  1. root用户分别登录OMS主节点和备节点。
  2. 在主备OMS节点的gateway-site.xml文件中增加以下配置,适当增加线程池。

    vi /opt/knox/conf/gateway-site.xml

    <property>
    <name>gateway.httpclient.maxConnections</name>
    <value>64</value>
    </property>

  3. omm用户登录主OMS节点,执行以下命令重启knox进程。

    sh /opt/knox/bin/restart-knox.sh

  4. 等待五分钟,查看该告警是否恢复。

    • 是,处理完毕。
    • 否,执行5

  5. 请联系运维人员,进行处理。

告警清除

此告警修复后,系统会自动清除此告警,无需手工清除。

参考信息

不涉及。