更新时间:2023-11-10 GMT+08:00
MRS集群反复上报43006告警
用户问题
集群反复出现“ALM-43006 JobHistory进程堆内存使用超出阈值”告警,且按照告警参考处理无效。
问题现象
集群出现告警“ALM-43006 JobHistory进程堆内存使用超出阈值”并且按照指导处理以后,运行一段时间又会出现同样的告警。
原因分析
可能存在JobHistory内存泄露问题,需要安装相应的补丁修复。
处理步骤
- 适当调大JobHistory进程堆内存。
- 如果已经调大堆内存,可以通过重启JobHistory实例规避。
父主题: 使用Spark