提交Storm拓扑失败排查思路
问题背景与现象
使用MRS流式集群,主要安装ZooKeeper、Storm、Kafka。
使用客户端命令,提交Topology失败。
可能原因
- Storm服务异常。
- 客户端用户没有进行安全认证或者认证过期。
- 提交拓扑中包含storm.yaml文件和服务端冲突。
原因分析
用户提交拓扑失败,可能原因客户端侧问题或者Storm侧问题。
- 查看Storm状态。
对于MRS 3.x之前的版本集群:登录MRS Manager,在MRS Manager页面,选择“服务管理 > Storm”,查看Storm服务当前状态,发现状态为“良好”,且监控指标内容显示正确。
对于MRS 3.x及后续版本集群:登录FusionInsight Manager。选择“集群 > 服务 > Storm”,查看Storm服务当前状态,发现状态为“良好”,且监控指标内容显示正确。
- 查看客户端提交日志,发现打印KeeperExceptionSessionExpireException异常信息,如下所示:
上述错误是由于在提交拓扑之前没有进行安全认证或者认证后TGT过期导致。
解决方法参考1。
- 查看客户端提交日志,发现打印ExceptionInIntializerError异常信息,提示Found multiple storm.yaml resources。如下所示:
该错误是由于业务jar包中存在storm.yaml文件,和服务端的storm.yaml文件冲突导致的。
解决方法参考2。
- 如果不是上述原因,则请参考提交Storm拓扑失败,提示Failed to check principle for keytab。