更新时间:2023-10-14 GMT+08:00
节点互信异常如何处理?
当Manager报“ALM-12066 节点间互信失效”告警,或者发现节点间无ssh互信时,可参考如下步骤操作。
- 分别在互信集群的两端节点执行ssh-add -l 确认是否有identities信息。
- 如果没有identities信息,执行ps -ef|grep ssh-agent找到ssh-agent进程,并kill该进程等待该进程自动重启。
- 执行ssh-add -l 查看是否已经添加identities信息,如果已经添加,请手动ssh确认互信是否正常。
- 如果有identities信息,需要确认/home/omm/.ssh/authorized_keys中是否有对端节点/home/omm/.ssh/id_rsa.pub文件中的信息,如果没有手动添加对端节点信息。
- 检查/home/omm/.ssh目录下的文件权限是否正确。
- 排查日志文件 “/var/log/Bigdata/nodeagent/scriptlog/ssh-agent-monitor.log”,
- 如果用户把omm的家目录删除了,需要联系MRS支撑人员修复。
父主题: 集群管理类
集群管理类 所有常见问题
- 如何查看所有集群?
- 如何查看MRS服务的操作日志信息?
- 如何查看MRS集群配置信息?
- 如何在MRS集群中手动添加组件?
- 升级Master节点规格需要关机吗?
- MRS集群中安装的组件能否删除?
- MRS是否支持变更MRS集群节点?
- 如何取消集群风险告警的消息通知?
- 为什么MRS集群显示的资源池内存小于实际集群内存?
- 如何配置knox内存?
- MRS集群安装的Python版本是多少?
- 如何查看各组件配置文件路径?
- 如何上传本地文件到集群内节点?
- MRS集群节点时间信息不正确如何处理?
- 如何查询MRS节点的启动时间?
- 节点互信异常如何处理?
- 如何调整manager-executor进程内存?
- MRS集群是否支持调整Master节点规格?
- Hive服务运行状态为亚健康是否会影响上层业务?
more