工作负载状态异常定位方法

工作负载状态异常时，建议先查看Pod的事件以便于确定导致异常的初步原因，再针对性解决问题。

定位流程

查看工作负载Pod是否处于异常状态步骤如下：

登录CCE控制台。
单击集群名称进入集群，在左侧选择“工作负载”。
在页面左上角选择命名空间，找到对应的工作负载，查看其状态。
- 如果工作负载状态为“未就绪”，可通过查看Pod的事件等信息确定异常原因，详情请参见Pod事件查看方法。
- 如果工作负载状态为“处理中”，一般为过程中的状态，请耐心等待。
- 如果工作负载状态为“运行中”，一般无需处理。如果出现状态正常但无法访问的情况，则需要进一步排查集群内访问是否正常。
  您可以在CCE控制台界面或者使用kubectl命令查找pod的IP，然后登录到集群内的节点或容器中，使用curl命令等方法手动调用接口，查看结果是否符合预期。
  
  如果容器IP+端口不能访问，建议登录到业务容器内使用“127.0.0.1+端口”进行排查。

Pod事件查看方法

方式一

在CCE控制台中单击工作负载名称，前往“工作负载详情”页面，找到处于异常状态的实例，单击操作栏中的“事件”进行查看。

方式二

Pod的事件可以使用kubectl describe pod {pod-name}命令查看，

$ kubectl describe pod prepare-58bd7bdf9-fthrp
...
Events:
  Type     Reason            Age   From               Message
  ----     ------            ----  ----               -------
  Warning  FailedScheduling  49s   default-scheduler  0/2 nodes are available: 2 Insufficient cpu.
  Warning  FailedScheduling  49s   default-scheduler  0/2 nodes are available: 2 Insufficient cpu.

表1 排查思路列表
事件信息	实例状态	处理措施
实例调度失败	Pending	请参考工作负载异常：实例调度失败
拉取镜像失败重新拉取镜像失败	FailedPullImage ImagePullBackOff	请参考工作负载异常：实例拉取镜像失败
启动容器失败重新启动容器失败	CreateContainerError CrashLoopBackOff	请参考工作负载异常：启动容器失败
实例状态为“Evicted”，pod不断被驱逐	Evicted	请参考工作负载异常：实例驱逐异常（Evicted）
实例挂卷失败	Pending	请参考工作负载异常：存储卷无法挂载或挂载超时
实例状态一直为“创建中”	Creating	请参考工作负载异常：一直处于创建中
实例状态一直为“结束中”	Terminating	请参考工作负载异常：结束中，解决Terminating状态的Pod删不掉的问题
实例状态为“已停止”	Stopped	请参考工作负载异常：已停止

父主题： 工作负载异常

上一篇：工作负载异常

下一篇：工作负载异常：实例调度失败

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

直接提交取消