文档首页/ 云容器引擎 CCE/ 常见问题/ 工作负载/ 工作负载异常问题排查/ 工作负载状态异常定位方法

更新时间：2024-11-06 GMT+08:00

查看PDF

工作负载状态异常定位方法

工作负载状态异常时，建议先查看Pod的事件以便于确定导致异常的初步原因，再针对性解决问题。

定位流程

点击放大

工作负载状态异常定位步骤如下：

查看Pod状态是否正常
1. 登录CCE控制台。
2. 单击集群名称进入集群，在左侧选择“工作负载”。
3. 在页面左上角选择命名空间，找到对应的工作负载，查看其状态。
  - 如果工作负载状态为“未就绪”，可通过查看Pod的事件等信息确定异常原因，详情请参见Pod事件查看方法。根据事件，参考Pod常见异常问题查找异常的解决方案。
  - 如果工作负载状态为“处理中”，一般为过程中的状态，请耐心等待。
  - 如果工作负载状态为“运行中”，一般无需处理。如果出现状态正常但无法访问的情况，则需要进一步排查集群内访问是否正常。
集群内部是否可以正常访问

您可以在CCE控制台界面或者使用kubectl命令查找Pod的IP，然后登录到集群内的节点或容器中，使用curl命令等方法手动调用接口，查看结果是否符合预期。

如果容器IP+端口不能访问，建议登录到业务容器内使用“127.0.0.1+端口”进行排查。

登录容器的操作步骤请参见登录容器的方法。
访问结果是否符合预期

如果集群内可以正常访问工作负载，但访问结果不符合预期，则需要进一步排查工作负载配置问题，例如镜像版本、环境变量是否正确。详情请参见工作负载状态正常但未正常工作。

Pod常见异常问题

实例状态	问题描述	处理措施
Pending	实例调度失败	请参考工作负载异常：实例调度失败
Pending	实例挂卷失败	请参考工作负载异常：存储卷无法挂载或挂载超时
Pending	添加存储失败	请参考工作负载异常：添加存储失败
FailedPullImage ImagePullBackOff	拉取镜像失败重新拉取镜像失败	请参考工作负载异常：实例拉取镜像失败
CreateContainerError CrashLoopBackOff	启动容器失败重新启动容器失败	请参考工作负载异常：启动容器失败
Evicted	实例状态为“Evicted”，pod不断被驱逐	请参考工作负载异常：实例驱逐异常（Evicted）
Creating	实例状态一直为“创建中”	请参考工作负载异常：一直处于创建中
Terminating	实例状态一直为“结束中”	请参考工作负载异常：Pod一直处于Terminating状态
Stopped	实例状态为“已停止”	请参考工作负载异常：已停止
Running	实例状态为“运行中”	Pod运行正常则无需处理。如果未正常工作，请参考工作负载状态正常但未正常工作
Init:N/M	Init容器启动失败	请参考工作负载异常：Init容器启动失败
Init:Error	Init容器启动失败	请参考工作负载异常：Init容器启动失败
Init:CrashLoopBackOff	Init容器不断重启失败	请参考工作负载异常：Init容器启动失败

Pod状态检查方法

登录CCE控制台。
单击集群名称进入集群，在左侧选择“工作负载”。
单击指定工作负载名称，查看工作负载中实例（Pod）的运行状态。

Pod配置查看方法

登录CCE控制台。
单击集群名称进入集群，在左侧选择“工作负载”。
单击指定工作负载名称，在工作负载实例列表中，单击操作列的“更多 > 查看YAML”。

Pod事件查看方法

方式一

在CCE控制台中单击工作负载名称，前往“工作负载详情”页面，找到处于异常状态的实例，单击操作栏中的“事件”进行查看。

图1 查看Pod事件
点击放大

方式二

Pod的事件可以使用kubectl describe pod {pod-name}命令查看，

$ kubectl describe pod prepare-58bd7bdf9-fthrp
...
Events:
  Type     Reason            Age   From               Message
  ----     ------            ----  ----               -------
  Warning  FailedScheduling  49s   default-scheduler  0/2 nodes are available: 2 Insufficient cpu.
  Warning  FailedScheduling  49s   default-scheduler  0/2 nodes are available: 2 Insufficient cpu.

容器日志查看方法

登录CCE控制台。
单击集群名称进入集群，在左侧选择“工作负载”。
单击工作负载操作列的“日志”。
您可以在日志上方切换实例和容器。

Pod监控检查方法

登录CCE控制台。
单击集群名称进入集群，在左侧选择“工作负载”。
单击工作负载操作列的“监控”，即可查看Pod的CPU、内存、网络I/O等监控大盘。

登录容器的方法

登录CCE控制台。
单击集群名称进入集群，在左侧选择“工作负载”。
单击指定工作负载名称，在工作负载实例列表中，单击操作列的“更多 > 远程登录”。

父主题：工作负载异常问题排查

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！您可在我的云声建议查看反馈及问题处理状态。

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

直接提交取消

如您有其它疑问，您也可以通过华为云社区问答频道来与我们联系探讨

智能客服提问云社区提问

工作负载状态异常定位方法

定位流程

Pod常见异常问题

Pod状态检查方法

Pod配置查看方法

Pod事件查看方法

容器日志查看方法

Pod监控检查方法

登录容器的方法

相关文档

意见反馈

文档内容是否对您有帮助？

7*24

备案

专业服务

退订

建议反馈

售前咨询热线