更新时间:2023-03-17 GMT+08:00
HBase健康检查指标项说明
运行良好的RegionServer数
指标项名称:运行良好的RegionServer数
指标项含义:检查HBase集群中运行良好的RegionServer数。
恢复指导:如果该指标项异常,请检查RegionServer的状态是否正常并处理,然后建议检查网络是否正常。
服务健康状态
指标项名称:服务状态
指标项含义:检查HBase服务状态是否正常。如果状态不正常,则认为不健康。
恢复指导:如果该指标项异常,请检查HMaster和RegionServer的状态是否正常并先处理,然后检查ZooKeeper服务的状态是否为故障并处理。使用客户端,确认是否可以正确读取HBase表中的数据,排查读数据失败的原因。最后参见告警进行处理。
检查告警
指标项名称: 告警信息
指标项含义:检查服务是否存在未清除的告警。如果存在,则认为不健康。
恢复指导:如果该指标项异常,建议参见告警进行处理。
父主题: 健康检查管理