文档首页/ MapReduce服务 MRS/ 用户指南/ MRS集群运维/ MRS集群告警处理参考/ ALM-29015 Catalog进程内存占用率超过阈值
更新时间:2024-09-04 GMT+08:00

ALM-29015 Catalog进程内存占用率超过阈值

告警解释

以30s为周期检测Catalog进程系统内存占用率,当检测到的超过默认阈值(80%)时,系统产生此告警。

当系统检测到进程内存占用率下降到阈值以下时,告警将自动解除。

告警属性

告警ID

告警级别

是否自动清除

29015

重要

告警参数

类别

参数名称

参数含义

定位信息

来源

产生告警的集群名称。

服务名

产生告警的服务名称。

角色名

产生告警的角色名称。

主机名

产生告警的主机名。

附加信息

Trigger condition

系统当前指标取值满足自定义的告警设置条件。

对系统的影响

内存使用过高,部分查询任务可能因为内存不足而失败。

可能原因

该节点实例内存使用率过大,或配置的内存不合理。

处理步骤

  1. 在FusionInsight Manager首页,选择“运维 > 告警 > 阈值设置 > Impala > CPU和内存 > Catalog进程的内存占用率”,检查阈值大小。
  2. 如阈值较小(小于80%),可根据实际需要适当增大告警阈值,检查告警是否消除。

    • 是,操作结束。
    • 否,执行3

  3. 如阈值已超过80%,请检查告警出现时刻是否有突发的大量并发查询任务,突发大量任务将会导致内存占用飙升,待任务执行完成后检查告警将是否消失,期间可能有因内存不足而执行失败或取消的任务,请重试。

    如内存占用超过阈值为常态化状态,需要考虑集群扩容。

    • 是,操作结束。
    • 否,执行4

收集故障信

  1. 在主备集群的FusionInsight Manager首页,选择“运维 > 日志 > 下载”。
  2. 在“服务”中勾选待操作集群的“Impala”。
  3. 单击右上角的编辑按钮设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后10分钟,单击“下载”。
  4. 请联系运维人员,并发送已收集的故障日志信息。

告警清除

此告警修复后,系统会自动清除此告警,无需手工清除。

参考信息