CCE集群智能诊断
CCE智能诊断是一款面向Kubernetes的智能化运维工具,旨在自动检测并诊断Kubernetes相关的问题,帮助运维人员快速发现并解决集群问题。当前版本已支持K8s事件、集群告警及工作负载日志的智能分析与诊断。
前提条件
使用CCE集群智能诊断会通过盘古Doer进行交互,您必须先完成登录、实名认证和服务声明签署。
约束与限制
关于AI建议的高风险操作执行规范
- 对于AI建议的删除资源(如强制重置节点配置)、强制更新(如修改核心系统文件)等操作,可能会引起业务不连续,请您在执行前务必审慎判断并确认修改影响。
- 建议您保留操作回滚信息,可用于修改异常后的快速恢复。
- 请您确认修改时段,避免在业务高峰期操作。
集群智能诊断介绍
集群智能诊断覆盖集群运维过程中的核心场景,包括:
- 事件分析:针对 K8s 核心事件(Events)进行深度解读,定位异常根因。
- 告警分析:对告警中心产生的告警信息进行智能分析,提供处置建议。
- 日志分析:支持对工作负载日志选中片段分析,快速识别报错堆栈。
场景一:事件分析(在集群概览页触发)
- 登录CCE控制台,单击集群名称进入集群。
- 在左侧导航栏中选择“概览”,向下滚动至“告警”、“运维事件”和“K8S事件”区域,找到需要分析的异常事件。
- 单击“智能分析”按钮,即可唤起盘古Doer进行诊断。

场景二:告警分析(在告警中心触发)
- 登录CCE控制台,单击集群名称进入集群。
- 在左侧导航栏中选择“告警中心”,在告警列表中找到目标告警。
- 单击“智能分析”按钮,即可唤起盘古Doer进行诊断。

场景三:日志分析(在工作负载日志页触发)
- 登录CCE控制台,单击集群名称进入集群。
- 在左侧导航栏中选择“工作负载”,找到目标工作负载,单击操作列的“日志”按钮。
- 查看工作负载的某个容器日志,单击日志工具栏上方的“智能日志解读”按钮,系统将自动分析当前展示的前10行日志内容。

- 登录CCE控制台。
- 在左侧导航栏中选择“工作负载”,找到目标工作负载,单击操作列的“日志”按钮。
- 查看工作负载的某个容器日志,在输出区域中,使用鼠标选中一段具体的报错或异常日志文本。
- 单击悬浮的盘古Doer标志,将针对选中的日志片段进行定向解释。
