更新时间:2024-09-04 GMT+08:00
ALM-29015 Catalog进程内存占用率超过阈值
告警解释
以30s为周期检测Catalog进程系统内存占用率,当检测到的超过默认阈值(80%)时,系统产生此告警。
当系统检测到进程内存占用率下降到阈值以下时,告警将自动解除。
告警属性
告警ID |
告警级别 |
是否自动清除 |
---|---|---|
29015 |
重要 |
是 |
告警参数
类别 |
参数名称 |
参数含义 |
---|---|---|
定位信息 |
来源 |
产生告警的集群名称。 |
服务名 |
产生告警的服务名称。 |
|
角色名 |
产生告警的角色名称。 |
|
主机名 |
产生告警的主机名。 |
|
附加信息 |
Trigger condition |
系统当前指标取值满足自定义的告警设置条件。 |
对系统的影响
内存使用过高,部分查询任务可能因为内存不足而失败。
可能原因
该节点实例内存使用率过大,或配置的内存不合理。
处理步骤
- 在FusionInsight Manager首页,选择“运维 > 告警 > 阈值设置 > Impala > CPU和内存 > Catalog进程的内存占用率”,检查阈值大小。
- 如阈值较小(小于80%),可根据实际需要适当增大告警阈值,检查告警是否消除。
- 是,操作结束。
- 否,执行3。
- 如阈值已超过80%,请检查告警出现时刻是否有突发的大量并发查询任务,突发大量任务将会导致内存占用飙升,待任务执行完成后检查告警将是否消失,期间可能有因内存不足而执行失败或取消的任务,请重试。
如内存占用超过阈值为常态化状态,需要考虑集群扩容。
- 是,操作结束。
- 否,执行4。
收集故障信息
告警清除
此告警修复后,系统会自动清除此告警,无需手工清除。
参考信息
无
父主题: MRS集群告警处理参考