文档首页/ MapReduce服务 MRS/ 用户指南/ MRS集群运维/ MRS集群告警处理参考/ ALM-29004 Impalad进程内存占用率超过阈值
更新时间:2024-09-04 GMT+08:00

ALM-29004 Impalad进程内存占用率超过阈值

告警解释

以30s为周期检测Impalad进程系统内存占用率,当检测到的超过默认阈值(80%)时,系统产生此告警。

当系统检测到进程内存占用率下降到阈值以下时,告警将自动解除。

告警属性

告警ID

告警级别

是否可自动清除

29004

次要

告警参数

类别

参数名称

参数含义

定位信息

来源

产生告警的集群名称。

服务名

产生告警的服务名称。

角色名

产生告警的角色名称。

主机名

产生告警的主机名。

附加信息

Trigger Condition

系统当前指标取值满足自定义的告警设置条件。

对系统的影响

内存使用过高,部分查询任务可能因为内存不足而失败。

可能原因

Impalad进程正在执行较大量查询任务。

处理步骤

  1. 在FusionInsight Manager首页,选择“运维 > 告警 > 阈值设置 > Impala > CPU和内存 > Impalad进程的内存占用率(Impalad)”,检查阈值大小。

  2. 如阈值较小(小于80%),可根据实际需要适当增大告警阈值,检查告警是否消除。

    • 是,操作结束。
    • 否,执行3

  3. 如阈值已超过80%,请检查告警出现时刻是否有突发的大量并发查询任务,突发大量任务将会导致内存占用飙升,待任务执行完成后检查告警是否消失,期间可能有因内存不足而执行失败或取消的任务,请重试。

    如内存占用超过阈值为常态化状态,需要考虑集群扩容。

    • 是,操作结束。
    • 否,执行4

收集故障信息。

  1. 在FusionInsight Manager界面,选择“运维 > 日志 > 下载”。
  2. 在“服务”中勾选待操作集群的“Impala”。
  3. 单击右上角的编辑按钮设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后1小时,单击“下载”。
  4. 请联系运维人员,并发送已收集的故障日志信息。

告警清除

突发并发任务执行结束后告警自动清除。

参考信息

不涉及。