诊断CCE Pod
CCE智能诊断是一款面向 Kubernetes 的智能化运维工具,旨在自动检测并诊断K8s相关的问题,帮助运维人员快速发现并解决集群问题。当前版本已支持 Pod 的异常状态诊断。
前提条件
使用盘古Doer提问之前,必须先完成登录、实名认证和服务声明签署。
场景1: 工作负载诊断
分析Pod调度异常、Pod拉取镜像异常、Pod init容器异常、Pod长时间处于ContainerCreating、od中容器处于CrashLoopBackOff状态、Pod长期处于Terminating状态、Pod被驱逐(Evicted)等问题
示例问题
- 诊断CCE Pod
- 诊断pod调度异常
- Pod拉取镜像异常,诊断一下
举例
在工作负载列表详情页触发:
- 登录CCE控制台,单击集群名称进入集群。
- 选择左侧导航栏的“工作负载”,在右侧选择对应的工作负载页签,例如“无状态负载”
- 点击需要诊断的工作负载实例名称,进入工作负载详情页面。
- 在实例列表中,找到状态异常的 Pod,点击其“状态”栏中的 “智能诊断” 按钮,即可启动诊断流程。
在“容器组”列表页触发:
- 登录CCE控制台,单击集群名称进入集群。
- 选择左侧导航栏的“工作负载”,在右侧选择“容器组”页签。
- 在容器组列表中,找到状态异常的 Pod,点击其“状态”栏中的 “智能诊断” 按钮,即可启动诊断流程。
在“盘古Doer”按钮触发:
- 登录CCE控制台,单击右侧侧边栏的按钮,选择“盘古Doer”
2.打开盘古Doer,输入问题“cce pod诊断”
3.选择“集群”、“命名空间”、“pod”,点击“发起诊断”
约束与限制
关于AI建议的高风险操作执行规范
- 对于AI建议的删除资源(如delete deployment)、强制更新(如kubectl replace --force)等操作,请确认修改影响。
- 保留操作回滚信息,用于修改异常后的快速恢复。
- 确认修改时段,避免业务高峰期操作。