文档首页/ MapReduce服务 MRS/ 故障排除/ 使用Spark/ MRS集群反复上报43006告警
更新时间:2023-11-10 GMT+08:00

MRS集群反复上报43006告警

用户问题

集群反复出现“ALM-43006 JobHistory进程堆内存使用超出阈值”告警,且按照告警参考处理无效。

问题现象

集群出现告警“ALM-43006 JobHistory进程堆内存使用超出阈值”并且按照指导处理以后,运行一段时间又会出现同样的告警。

原因分析

可能存在JobHistory内存泄露问题,需要安装相应的补丁修复。

处理步骤

  • 适当调大JobHistory进程堆内存。
  • 如果已经调大堆内存,可以通过重启JobHistory实例规避。