更新时间:2024-08-27 GMT+08:00
集群不可用排查指导
问题现象
云搜索服务的集群列表中,“集群状态”出现“不可用”。
图1 集群不可用
原因分析及处理方法
- 如果集群列表的任务状态显示“冻结”,可能是集群冻结状态导致集群不可用。
- 如果集群列表的任务状态显示“配置错误,重启失败”,可能是X-pack参数配置导致集群不可用。
- 如果集群节点的日志内容存在警告“master not discovered or elected yet, an election requires at least 2 nodes with ids [xxx, xxx, xxx, ...], have discovered [xxx...] which is not a quorum”,可能是安全组策略设置不合理导致集群不可用。
- 如果集群节点的日志内容存在明显的关于插件的报错“fatal error in thread [main], exitingjava.lang. NoClassDefFoundError: xxx/xxx/.../xxxPlugin at ...”,可能是插件不兼容导致集群不可用。
- 如果集群的健康状态为红色和且“unassigned shards”不为0,表示集群存在无法分配的索引分片,是分片未正常分配导致集群不可用。
- 如果集群进行备份恢复或集群迁移操作后,出现的不可用现象,可能是数据类型不兼容导致集群不可用。
- 如果集群节点的日志内容存在报错“OutOfMemoryError”和警告“[gc][xxxxx] overhead spent [x.xs] collecting in the last [x.xs]”,可能是集群负载过高导致集群不可用。
父主题: 集群不可用