更新时间:2025-05-09 GMT+08:00
当集群状态为“不可用”时,如何排查解决?
当集群状态显示为“不可用”时,请参照如下方式来排查解决。
排查思路
以下排查思路根据原因的出现概率进行排序,建议从高频率原因向低频率原因排查,从而快速定位原因。
如果解决完某个可能原因仍未解决问题,请继续排查其他可能原因。
如果以上排查思路仍无法解决您的问题,请提交工单寻找客服人员协助您进行定位。
排查项一:安全组是否被修改
- 登录网络控制台,单击左侧导航栏的“访问控制 > 安全组”,找到集群控制节点的安全组。
控制节点安全组名称为:{集群名}-cce-control-{随机ID}。
- 单击安全组名称,进入详情页面,请确保集群控制节点的安全组规则的正确性。
安全组的详细说明请参见4.1-Master节点安全组。
排查项二:集群证书是否生效
问题现象
当集群所在地区需要夏令时与冬令时转换时,在夏令时与冬令时的重叠时间,例如在凌晨2点申请创建集群,转变为冬令时后,时间变为凌晨1点,可能导致集群不可用。
问题根因
集群内证书的生效时间在未来,而不是当前时间,在证书未生效时,会导致集群受到影响。k8s的各个组件使用证书访问kube-apiserver,kube-apiserver会对请求的证书验证,如果验证不通过会拒绝请求。
解决方案
- 等待证书生效时间到达,集群会自动变成可用状态。
- 提交工单寻找客服人员协助您进行定位。