更新时间:2024-11-06 GMT+08:00
分享

插件异常问题排查

在插件安装、升级、更改配置等过程中出现异常问题时,控制台通常会提示相应的错误码。您可以根据错误码查找对应的问题,查看问题原因和解决方案。本文介绍常见错误码及其问题原因和解决方案。

资源冲突

问题现象

安装插件时,出现“内部错误”,错误码为CCE.03500001。

问题原因

出现“内部错误”时,错误信息内会提示具体的错误原因,如 ClusterRole \"gatekeeper-manager-role\" in namespace \"\" exists and cannot be imported into the current release 表示集群内已经创建了对应的ClusterRole资源,但是该资源不是由插件管理的。

解决方案

手动使用kubectl删除非插件管理的冲突的资源后,重试插件的安装。

安装超时

问题现象

安装/升级插件时,提示安装失败,错误信息显示 timed out。

Release	"*****" failed: failed pre-install: timed out waiting for the condition

问题原因

插件的Pod没有到达就绪状态,导致插件无法完成安装/升级。

解决方案

在“总览”页面查看“K8S事件”,确认Pod没有就绪的原因。

常见原因

解决方案

原因一:Pod无法调度

对应事件内容:FailedScheduling

原因详述:集群中的节点无法满足Pod的调度要求,可能由以下一种或多种原因导致。可以通过事件的详细描述确定具体原因。

  • 集群节点可用的CPU、内存资源不足,无法满足组件Pod的资源需求,对应事件描述中存在Insufficient memory或Insufficient cpu等字样。
  • 节点存在组件Pod未容忍的污点,对应事件描述中存在the pod didn't tolerate等字样。
  • 节点数量过少,无法满足组件Pod的反亲和性要求,对应事件描述中存在didn't match pod anti-affinity rules等字样。

解决方案:可以参考以下方法满足组件Pod的调度要求,处理完成之后再次尝试组件变更操作。

原因二:Pod创建失败

参考工作负载状态异常定位方法解决创建失败的问题。

插件资源不存在

问题现象

更新或升级插件时,提示更新失败,报 404 错误。

问题原因

插件相关资源查询异常,无法直接更新或升级,可能由于相关资源被手工修改或删除导致。

解决方案

请先卸载该组件,然后重新安装最新版本。

相关文档