更新时间:2024-09-04 GMT+08:00

ALM-29014 Catalog FGCT超过阈值

告警解释

系统每60秒周期性检测Catalog服务的FGC时间,当检测到的FGC时间超出阈值(连续5次检测超过12秒)时产生该告警,当FGC时间小于或等于阈值时,告警恢复。

告警属性

告警ID

告警级别

是否自动清除

29014

重要

告警参数

类别

参数名称

参数含义

定位信息

来源

产生告警的集群名称。

服务名

产生告警的服务名称。

角色名

产生告警的角色名称。

主机名

产生告警的主机名。

附加信息

Trigger condition

系统当前指标取值满足自定义的告警设置条件。

对系统的影响

FGC时间超出阈值,会影响到数据的读写。

可能原因

该节点实例内存使用率过大,或配置的堆内存不合理,导致进程GC频繁。

处理步骤

检查GC时间

  1. 用户可通过“运维> 告警 > 阈值设置 > 待操作集群的名称 > Impala > 进程FGCT >Catalog进程FGCT(Catalog)”查看阈值大小(默认值12s)。

  2. 在FusionInsightManager首页,选择“运维 > 告警 > 告警”查看是否存在告警ID为“29014”的告警。

    • 是,执行3
    • 否,操作结束。

  3. 在FusionInsightManager首页,选择“集群 > Impala > 实例 > 告警上报的Catalog实例 > 图表 > 进程FGCT ”,查看FGC时间是否大于步骤1中的阈值。

    • 是,执行4
    • 否,执行5

  4. 通过“运维> 告警 > 阈值设置 > 待操作集群的名称 > Impala>进程FGCT->Catalog进程FGCT(Catalog)”修改阈值大小,使其小于3中的时间,查看告警是否清除。

    • 是,操作结束。
    • 否,执行5

收集故障信

  1. 在主备集群的FusionInsight Manager首页,选择“运维 > 日志 > 下载”。
  2. 在“服务”中勾选待操作集群的“Impala”。
  3. 单击右上角的编辑按钮设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后10分钟,单击“下载”。
  4. 请联系运维人员,并发送已收集的故障日志信息。

告警清除

此告警修复后,系统会自动清除此告警,无需手工清除。

参考信息