更新时间:2024-01-04 GMT+08:00

工作负载状态异常定位方法

工作负载状态异常时,建议先查看Pod的事件以便于确定导致异常的初步原因,再参照表1中的内容针对性解决问题。

表1 排查思路列表

事件信息

实例状态

处理措施

实例调度失败

Pending

请参考工作负载异常:实例调度失败

拉取镜像失败

重新拉取镜像失败

FailedPullImage

ImagePullBackOff

请参考工作负载异常:实例拉取镜像失败

启动容器失败

重新启动容器失败

CreateContainerError

CrashLoopBackOff

请参考工作负载异常:启动容器失败

实例状态为“Evicted”,pod不断被驱逐

Evicted

请参考工作负载异常:实例驱逐异常(Evicted)

实例挂卷失败

Pending

请参考工作负载异常:存储卷无法挂载或挂载超时

实例状态一直为“创建中”

Creating

请参考工作负载异常:一直处于创建中

实例状态一直为“结束中”

Terminating

请参考工作负载异常:结束中,解决Terminating状态的Pod删不掉的问题

实例状态为“已停止”

Stopped

请参考工作负载异常:已停止

Pod事件查看方法

Pod的事件可以使用kubectl describe pod {pod-name}命令查看,或在CCE控制台,工作负载详情页面中查看。

$ kubectl describe pod prepare-58bd7bdf9-fthrp
...
Events:
  Type     Reason            Age   From               Message
  ----     ------            ----  ----               -------
  Warning  FailedScheduling  49s   default-scheduler  0/2 nodes are available: 2 Insufficient cpu.
  Warning  FailedScheduling  49s   default-scheduler  0/2 nodes are available: 2 Insufficient cpu.