文档首页/ MapReduce服务 MRS/ 用户指南(安卡拉区域)/ 告警参考/ ALM-19022 HBase热点检测功能不可用
更新时间:2024-11-29 GMT+08:00

ALM-19022 HBase热点检测功能不可用

告警解释

HBase服务安装MetricController实例时,告警模块按120秒周期检测HBase MetricController主实例健康状态。当HBase MetricController主实例不存在或不可用时,热点检测功能不可用,上报该告警。

HBase MetricController主实例功能恢复时,告警清除。

告警属性

告警ID

告警级别

告警类型

业务类型

是否可自动清除

19022

重要

处理错误告警

HBase

告警参数

类别

参数名称

参数含义

定位信息

来源

产生告警的集群名称。

服务名

产生告警的服务名称。

角色名

产生告警的角色名称。

主机名

产生告警的主机名。

对系统的影响

HBase热点检测功能不可用。对于正常业务无影响,但是如果业务存在请求或者数据倾斜问题,无法提供主动感知上报告警以及自愈的能力,该业务的请求可能会导致该节点过载,出现请求响应慢,甚至超时问题。

可能原因

  • ZooKeeper服务异常。
  • HBase服务异常。
  • 当前HBase服务中,与主HMaster实例共节点的MetricController实例未启动。
  • 网络异常。

处理步骤

检查ZooKeeper服务状态。

  1. 在FusionInsight Manager的服务列表中,查看ZooKeeper运行状态是否为“良好”。

    • 是,执行5
    • 否,执行2

  2. 在告警列表中,查看是否有“ALM-13000 ZooKeeper服务不可用”告警产生。

    • 是,执行3
    • 否,执行5

  3. 参考“ALM-13000 ZooKeeper服务不可用”的处理步骤处理该故障。
  4. 等待几分钟后,在告警列表中查看“HBase热点检测功能不可用”告警是否清除。

    • 是,处理完毕。
    • 否,执行5

检查HBase服务状态。

  1. 在FusionInsight Manager的服务列表中,查看HBase运行状态是否为“良好”。

    • 是,执行9
    • 否,执行6

  2. 在告警列表中,查看是否有“ALM-19000 HBase服务不可用”告警产生。

    • 是,执行7
    • 否,执行9

  3. 参考“ALM-19000 HBase服务不可用”的处理步骤处理该故障。
  4. 等待几分钟后,在告警列表中查看“HBase热点检测功能不可用”告警是否清除。

    • 是,处理完毕。
    • 否,执行9

检查与主HMaster实例共节点的MetricController实例是否启动。

  1. 在FusionInsight Manager首页,选择“集群 > 服务 > HBase > 实例”,查看“MetricController(主)”实例是否存在。

    • 是,执行12
    • 否,执行10

  2. 勾选与主HMaster实例管理IP地址相同的MetricController实例,单击“启动实例”,启动MetricController实例。
  3. MetricController实例重启成功后,在告警列表中查看“HBase热点检测功能不可用”告警是否清除。

    • 是,处理完毕。
    • 否,执行12

检查启动的MetricController两个实例与主HMaster节点的网络连接。

  1. 登录到主HMaser实例所在节点执行ping 备MetricController实例所在节点IP地址命令,查看启动的MetricController实例与主HMaster实例所在主机的网络连接是否正常。

    • 是,执行15
    • 否,执行13

  2. 联系网络管理员恢复网络。
  3. 网络恢复后,在告警列表中,查看“HBase热点检测功能不可用”告警是否清除。

    • 是,处理完毕。
    • 否,执行15

收集故障信息

  1. 在FusionInsight Manager界面,选择“运维 > 日志 > 下载”。
  2. 在“服务”中勾选待操作集群的“HBase”。
  3. 在“主机”中勾选HMaster实例所在的主机。
  4. 单击右上角的时间编辑按钮,设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后10分钟,单击“下载”。
  5. 请联系运维人员,并发送已收集的故障日志信息。

告警清除

此告警修复后,系统会自动清除此告警,无需手工清除。

参考信息

不涉及。