更新时间:2025-08-07 GMT+08:00
分享

常见问题

问题一:弹性CCI功能不可用

问题原因:用户CCE集群所在子网与10.247.0.0/16重叠,与CCI命名空间下的Service网段冲突。

解决方案:重新规划CCE集群子网网段。

问题二:插件由1.5.18及以上版本回退至低于1.5.18后,Pod通过Service访问出现异常

问题原因:插件升级到1.5.18及以上版本之后,新弹性到CCI的Pod中的sidecar无法兼容1.5.18以下版本的插件,因此插件回退版本后会导致这些Pod中的Service访问异常。插件在低于1.5.18版本时弹性到CCI的Pod不受影响。

解决方案:

  • 方案一:将插件再升级到1.5.18及以上版本。
  • 方案二:将Service访问异常的Pod删除重建,重建后弹性到CCI的Pod Service访问将恢复正常。

问题三:插件无法删除

问题场景:因为误修改swr_addr、swr_user导致的插件卸载失败。

问题原因:插件卸载依赖gc-job执行,镜像拉取失败场景gc-job无法运行成功,导致卸载失败。

解决方案:再次进行卸载操作,依次删除gc-job。
  1. 插件处于删除失败状态时,先登录至CCE集群配置有kubectl的节点后,再次单击“卸载”。
  2. 在210秒内执行以下命令:
    1. 删除resource-gc-jobs。
      kubectl get job -nkube-system | grep "virtual-kubelet-.*-resource-gc-jobs"
      kubectl delete job -nkube-system xxx

    2. 删除namespace-gc-jobs。
      kubectl get job -nkube-system | grep "virtual-kubelet-.*-namespace-gc-jobs"
      kubectl delete job -nkube-system yyy

  3. 其余异常场景请提交工单协助处理。

问题四:依赖Service访问的业务容器启动失败

问题场景:业务容器启动过程或postStart配置依赖访问Service,出现第一次启动失败,待Sidecar容器启动后,重新启动又成功的现象。

问题原因:CCI侧pod访问Service依赖Sidecar容器,未完成Service同步时,业务容器访问Service会失败,同步完成后业务容器正常启动。

解决方案:请将插件升级至1.5.28及以上版本。

相关文档