更新时间:2024-11-29 GMT+08:00
Hive中的告警有哪些以及触发的场景
Hive中的告警
告警ID |
告警级别 |
可自动清除 |
告警名称 |
告警类型 |
---|---|---|---|---|
16000 |
Minor |
TRUE |
Percentage of Sessions Connected to the HiveServer to Maximum Number Allowed Exceeds the Threshold |
故障告警 |
16001 |
Minor |
TRUE |
Hive Warehouse Space Usage Exceeds the Threshold |
故障告警 |
16002 |
Minor |
TRUE |
The Successful Hive SQL Operations Lower than The Threshold |
故障告警 |
16004 |
Critical |
TRUE |
Hive Service Unavailable |
故障告警 |
告警触发场景
- 16000:当连接HiveServer的session数占允许连接总数的比率超过设定的阈值的时候触发告警。如连接的session数为9,总连接数为12,设定的阈值为70%,9/12 > 70%便触发告警。
- 16001:当Hive使用的HDFS容量占分配给Hive的HDFS总容量的比率超过设定的阈值时触发告警。如分配给Hive的是500G,Hive已经使用400G,设定的阈值时75%,400/500 > 75%便触发告警。
- 16002:当执行SQL的成功率低于设定的阈值时变触发告警。如你执行了4条失败了2条,设定的阈值为60%,成功率2/4 < 60%便触发告警。
- 16004:Hive服务的健康状态变为Bad时触发告警。
- FusionInsight Manager界面操作:告警的阈值和告警的级别以及触发告警的时间段可以在FusionInsight Manager界面的“运维 > 告警 > 阈值设置”中设定。
- Hive运行相关的指标可以在Hive监控界面查看。
父主题: 使用Hive