文档首页/ MapReduce服务 MRS/ 用户指南(安卡拉区域)/ 故障排除/ 使用Hive/ Hive中的告警有哪些以及触发的场景
更新时间:2024-11-29 GMT+08:00

Hive中的告警有哪些以及触发的场景

Hive中的告警

告警ID

告警级别

可自动清除

告警名称

告警类型

16000

Minor

TRUE

Percentage of Sessions Connected to the HiveServer to Maximum Number Allowed Exceeds the Threshold

故障告警

16001

Minor

TRUE

Hive Warehouse Space Usage Exceeds the Threshold

故障告警

16002

Minor

TRUE

The Successful Hive SQL Operations Lower than The Threshold

故障告警

16004

Critical

TRUE

Hive Service Unavailable

故障告警

告警触发场景

  • 16000:当连接HiveServer的session数占允许连接总数的比率超过设定的阈值的时候触发告警。如连接的session数为9,总连接数为12,设定的阈值为70%,9/12 > 70%便触发告警。
  • 16001:当Hive使用的HDFS容量占分配给Hive的HDFS总容量的比率超过设定的阈值时触发告警。如分配给Hive的是500G,Hive已经使用400G,设定的阈值时75%,400/500 > 75%便触发告警。
  • 16002:当执行SQL的成功率低于设定的阈值时变触发告警。如你执行了4条失败了2条,设定的阈值为60%,成功率2/4 < 60%便触发告警。
  • 16004:Hive服务的健康状态变为Bad时触发告警。
  • FusionInsight Manager界面操作:告警的阈值和告警的级别以及触发告警的时间段可以在FusionInsight Manager界面的“运维 > 告警 > 阈值设置”中设定。
  • Hive运行相关的指标可以在Hive监控界面查看。