CCE工作负载智能诊断
CCE智能诊断是一款面向Kubernetes的智能化运维工具,旨在自动检测并诊断Kubernetes相关的问题,帮助运维人员快速发现并解决集群问题。当前版本已支持工作负载的异常状态诊断。
前提条件
使用CC工作负载智能诊断会通过盘古Doer进行交互,您必须先完成登录、实名认证和服务声明签署。
约束与限制
关于AI建议的高风险操作执行规范
- 对于AI建议的删除资源(如delete deployment)、强制更新(如kubectl replace --force)等操作,可能会引起业务不连续,请您在执行前务必审慎判断并确认修改影响。
- 建议您保留操作回滚信息,可用于修改异常后的快速恢复。
- 请您确认修改时段,避免在业务高峰期操作。
使用工作负载智能诊断
您可以通过工作负载智能诊断分析Pod调度异常、Pod拉取镜像异常、Pod init容器异常、Pod长时间处于ContainerCreating、Pod中容器处于CrashLoopBackOff状态、Pod长期处于Terminating状态、Pod被驱逐(Evicted)等问题。
您可以通过自然语言对盘古Doer发起提问,例如:
- 诊断CCE Pod
- 诊断Pod调度异常
- Pod拉取镜像异常,诊断一下
- 登录CCE控制台,单击集群名称进入集群。
- 在左侧导航栏中选择“工作负载”,切换至对应的工作负载页签,例如“无状态负载”页签。
- 找到异常节点,单击需要诊断的工作负载实例名称,进入工作负载详情页面。
- 在实例列表中,找到状态异常的Pod,并将鼠标悬浮至“状态”栏中。
- 单击“智能诊断”可启动诊断流程,盘古Doer将会基于您的Pod异常情况给出智能判断,帮助您定位并排查问题。
- 登录CCE控制台。
- 在页面右侧单击盘古Doer的悬浮图标,在对话框中输入问题,如“诊断CCE Pod”。
- 在弹出的卡片中选择需要诊断的集群、命名空间和Pod,单击“发起诊断”。
盘古Doer将会基于您的Pod异常情况给出智能判断,帮助您定位并排查问题。