文档首页/ 云容器引擎 CCE/ 用户指南/ 工作负载/ CCE工作负载智能诊断
更新时间:2025-09-19 GMT+08:00
分享

CCE工作负载智能诊断

CCE智能诊断是一款面向Kubernetes的智能化运维工具,旨在自动检测并诊断Kubernetes相关的问题,帮助运维人员快速发现并解决集群问题。当前版本已支持工作负载的异常状态诊断。

前提条件

使用CC工作负载智能诊断会通过盘古Doer进行交互,您必须先完成登录、实名认证和服务声明签署。

约束与限制

关于AI建议的高风险操作执行规范

  • 对于AI建议的删除资源(如delete deployment)、强制更新(如kubectl replace --force)等操作,可能会引起业务不连续,请您在执行前务必审慎判断并确认修改影响。
  • 建议您保留操作回滚信息,可用于修改异常后的快速恢复。
  • 请您确认修改时段,避免在业务高峰期操作。

使用工作负载智能诊断

您可以通过工作负载智能诊断分析Pod调度异常、Pod拉取镜像异常、Pod init容器异常、Pod长时间处于ContainerCreating、Pod中容器处于CrashLoopBackOff状态、Pod长期处于Terminating状态、Pod被驱逐(Evicted)等问题。

您可以通过自然语言对盘古Doer发起提问,例如:

  • 诊断CCE Pod
  • 诊断Pod调度异常
  • Pod拉取镜像异常,诊断一下
  1. 登录CCE控制台,单击集群名称进入集群。
  2. 在左侧导航栏中选择“工作负载”,切换至对应的工作负载页签,例如“无状态负载”页签。
  3. 找到异常节点,单击需要诊断的工作负载实例名称,进入工作负载详情页面。
  4. 在实例列表中,找到状态异常的Pod,并将鼠标悬浮至“状态”栏中。

  5. 单击“智能诊断”可启动诊断流程,盘古Doer将会基于您的Pod异常情况给出智能判断,帮助您定位并排查问题。
  1. 登录CCE控制台
  2. 在页面右侧单击盘古Doer的悬浮图标,在对话框中输入问题,如“诊断CCE Pod”。

  3. 在弹出的卡片中选择需要诊断的集群、命名空间和Pod,单击“发起诊断”。

    盘古Doer将会基于您的Pod异常情况给出智能判断,帮助您定位并排查问题。

相关文档