更新时间:2024-11-29 GMT+08:00
集群反复出现43006告警
用户问题
集群反复出现“ALM-43006 JobHistory进程堆内存使用超出阈值”告警,且按照告警参考设置无效。
问题现象
集群出现告警并且按照指导设置以后,运行一段时间又会出现同样的告警。
原因分析
可能存在JobHistory内存泄露问题,需要安装相应的补丁修复。
处理步骤
- 适当调大JobHistory进程堆内存。
- 如果已经调大堆内存,可以通过重启JobHistory实例规避。
父主题: 使用Spark