更新时间:2024-11-22 GMT+08:00
分享

ALM-43028 JDBCServer Session过载

本章节仅适用于MRS 3.3.1及之后版本。

告警解释

JDBCServer进程进行请求转发的时候,当触发Session资源不足流控后,会产生该告警。此时说明发送到JDBCServer进程的请求过多,超出JDBCServer进程目前的承受范围。

告警属性

告警ID

告警级别

是否可自动清除

43028

重要(默认连续3次检测超过9次)

紧急(默认连续3次检测超过12次)

告警参数

类别

参数名称

参数含义

定位信息

来源

产生告警的集群名称。

服务名

产生告警的服务名称。

角色名

产生告警的角色名称。

主机名

产生告警的主机名。

附加信息

Trigger Condition

系统当前指标取值满足自定义的告警设置条件。

对系统的影响

JDBCServer进程目前接收的请求已超出能够处理的能力范围,对于无法处理的请求会直接返回失败。

可能原因

该节点JDBCServer进程负载较大。

处理步骤

检查上报告警的JDBCServer实例的请求来源

  1. 在FusionInsight Manager首页,选择“运维 > 告警 > 告警”,选中“ID”为“43028”的告警,查看“定位信息”中的角色名以及确认主机名所在的IP地址。
  2. 在FusionInsight Manager首页,选择“集群 > 服务 > Spark > 实例”,单击告警上报的JDBCServer,单击左侧Log栏目中的jdbcserver-audit。
  3. 单击左下角的下载按钮,将日志下载回本地。
  4. 搜索日志中 UserIP关键字,统计提交较多的客户端IP,针对该客户端进行流控限制,避免提交过多请求导致其他客户端抢占不到资源。

收集故障信息

  1. 在FusionInsight Manager界面,选择“运维 > 日志 > 下载”。
  2. 在“服务”中勾选待操作集群的“Spark”。
  3. 单击右上角的设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后10分钟,单击“下载”。
  4. 请联系运维人员,并发送已收集的故障日志信息。

告警清除

需手工清除。

参考信息

不涉及。

相关文档