文档首页/ MapReduce服务 MRS/ 用户指南/ MRS集群运维/ MRS集群告警处理参考/ ALM-26054 Storm Nimbus堆内存使用率超过阈值(2.x及以前版本)
更新时间:2024-09-04 GMT+08:00

ALM-26054 Storm Nimbus堆内存使用率超过阈值(2.x及以前版本)

告警解释

系统每30秒周期性检测Storm Nimbus堆内存使用率,并把实际的Storm Nimbus堆内存使用率和阈值相比较。当Storm Nimbus堆内存使用率超出阈值(默认值为80%)时产生该告警。

用户可通过系统设置 > 阈值配置 > 服务 > Storm修改阈值。

当Storm Nimbus堆内存使用率小于或等于阈值时,告警恢复。

告警属性

告警ID

告警级别

可自动清除

26054

严重

告警参数

参数名称

参数含义

ServiceName

产生告警的服务名称。

RoleName

产生告警的角色名称。

HostName

产生告警的主机名。

Trigger Condition

系统当前指标取值满足自定义的告警设置条件。

对系统的影响

Storm Nimbus堆内存使用率过高时,可能造成频繁的内存垃圾回收,甚至造成内存溢出,进而影响Storm任务提交。

可能原因

该节点Storm Nimbus实例堆内存使用量过大,或分配的堆内存不合理,导致使用量超过阈值。

处理步骤

  1. 检查堆内存使用量。

    1. 登录MRS集群详情页面,选择“告警管理”。
    2. 单击ALM-26054 Storm Nimbus堆内存使用率超过阈值 > 定位信息,查看告警上报的实例的HostName。
    3. 单击组件管理 > Storm > 实例 > Nimbus(对应上报告警实例HostName) > 定制 > Nimbus堆内存使用率,查看堆内存使用情况。
    4. 查看Nimbus使用的堆内存是否已达到Nimbus设定的最大堆内存的80%。
      • 是,执行1.e
      • 否,执行2
    5. 调整堆内存。

      单击组件管理 > Storm > 服务配置,将“基础配置”切换为“全部配置”并选择“Nimbus > 系统”。将“NIMBUS_GC_OPTS”参数中“-Xmx”的值根据实际情况调大,然后单击“保存配置”,勾选“重新启动角色实例。”,单击“确定”进行重启。

    6. 观察告警是否清除。
      • 是,处理完毕。
      • 否,执行2

  2. 收集故障信息。

    1. 在MRS Manager界面,单击“系统设置 > 日志导出”。
    2. 请联系运维人员,并发送已收集的故障日志信息。

参考信息

无。