文档首页/ 云容器引擎 CCE_Autopilot集群/ 常见问题/ 集群管理/ 当集群状态为“不可用”时,如何排查解决?
更新时间:2025-05-09 GMT+08:00

当集群状态为“不可用”时,如何排查解决?

当集群状态显示为“不可用”时,请参照如下方式来排查解决。

排查思路

以下排查思路根据原因的出现概率进行排序,建议从高频率原因向低频率原因排查,从而快速定位原因。

如果解决完某个可能原因仍未解决问题,请继续排查其他可能原因。

如果以上排查思路仍无法解决您的问题,请提交工单寻找客服人员协助您进行定位。

排查项一:安全组是否被修改

  1. 登录网络控制台,单击左侧导航栏的“访问控制 > 安全组”,找到集群控制节点的安全组。

    控制节点安全组名称为:{集群名}-cce-control-{随机ID}

  2. 单击安全组名称,进入详情页面,请确保集群控制节点的安全组规则的正确性。

    安全组的详细说明请参见4.1-Master节点安全组

排查项二:集群证书是否生效

问题现象

当集群所在地区需要夏令时与冬令时转换时,在夏令时与冬令时的重叠时间,例如在凌晨2点申请创建集群,转变为冬令时后,时间变为凌晨1点,可能导致集群不可用。

问题根因

集群内证书的生效时间在未来,而不是当前时间,在证书未生效时,会导致集群受到影响。k8s的各个组件使用证书访问kube-apiserver,kube-apiserver会对请求的证书验证,如果验证不通过会拒绝请求。

解决方案

  • 等待证书生效时间到达,集群会自动变成可用状态。
  • 提交工单寻找客服人员协助您进行定位。