文档首页 > > 用户指南> 管理现有集群> 健康检查管理> Storm健康检查指标项说明

Storm健康检查指标项说明

分享
更新时间:2020/04/28 GMT+08:00

工作节点数

指标项名称:Supervisor数

指标项含义:检查集群中可用的Supervisor数,若集群中可用的Supervisor数小于1,则认为不健康。

恢复指导:如果该指标项异常,进入Streaming服务实例页面,单击不可用Supervisor实例的“主机名”,在“概要信息”中查看主机的健康状态,若为“良好”,则参见“ALM-12007 进程故障”告警进行处理;若不为“良好”,则参见“ALM-12006 节点故障”告警进行处理。

空闲Slot数

指标项名称:空闲Slot数

指标项含义:检查集群中空闲的Slot数,若集群中空闲slot数目小于1,则认为不健康。

恢复指导:如果该指标项异常,进入Storm服务实例页面,查看Supervisor实例的“健康状态”,若均为“良好”,则需要扩容集群Core节点;若不为良好,则参见“ALM-12007 进程故障”告警进行处理。

服务健康状态

指标项名称:服务状态

指标项含义:检查Storm服务状态是否正常。如果状态不正常,则认为不健康。

恢复指导:如果该指标项异常,建议参见“ALM-26051 Storm服务不可用”告警进行处理。

检查告警

指标项名称:告警信息

指标项含义:检查服务是否存在未清除的告警。如果存在,则认为不健康。

恢复指导:如果该指标项异常,建议参见告警进行处理。

分享:

    相关文档

    相关产品

文档是否有解决您的问题?

提交成功!

非常感谢您的反馈,我们会继续努力做到更好!

反馈提交失败,请稍后再试!

*必选

请至少选择或填写一项反馈信息

字符长度不能超过200

提交反馈 取消

如您有其它疑问,您也可以通过华为云社区问答频道来与我们联系探讨

智能客服提问云社区提问