更新时间:2025-12-11 GMT+08:00
分享

CCE集群智能诊断

CCE智能诊断是一款面向Kubernetes的智能化运维工具,旨在自动检测并诊断Kubernetes相关的问题,帮助运维人员快速发现并解决集群问题。当前版本已支持K8s事件、集群告警及工作负载日志的智能分析与诊断。

前提条件

使用CCE集群智能诊断会通过盘古Doer进行交互,您必须先完成登录、实名认证和服务声明签署。

约束与限制

关于AI建议的高风险操作执行规范

  • 对于AI建议的删除资源(如强制重置节点配置)、强制更新(如修改核心系统文件)等操作,可能会引起业务不连续,请您在执行前务必审慎判断并确认修改影响。
  • 建议您保留操作回滚信息,可用于修改异常后的快速恢复。
  • 请您确认修改时段,避免在业务高峰期操作。

集群智能诊断介绍

集群智能诊断覆盖集群运维过程中的核心场景,包括:

  • 事件分析:针对 K8s 核心事件(Events)进行深度解读,定位异常根因。
  • 告警分析:对告警中心产生的告警信息进行智能分析,提供处置建议。
  • 日志分析:支持对工作负载日志选中片段分析,快速识别报错堆栈。

场景一:事件分析(在集群概览页触发)

  1. 登录CCE控制台,单击集群名称进入集群。
  2. 在左侧导航栏中选择“概览”,向下滚动至“告警”、“运维事件”和“K8S事件”区域,找到需要分析的异常事件。
  3. 单击“智能分析”按钮,即可唤起盘古Doer进行诊断。

场景二:告警分析(在告警中心触发)

  1. 登录CCE控制台,单击集群名称进入集群。
  2. 在左侧导航栏中选择“告警中心”,在告警列表中找到目标告警。
  3. 单击“智能分析”按钮,即可唤起盘古Doer进行诊断。

场景三:日志分析(在工作负载日志页触发)

  1. 登录CCE控制台,单击集群名称进入集群。
  2. 在左侧导航栏中选择“工作负载”,找到目标工作负载,单击操作列的“日志”按钮。
  3. 查看工作负载的某个容器日志,单击日志工具栏上方的“智能日志解读”按钮,系统将自动分析当前展示的前10行日志内容。

  1. 登录CCE控制台
  2. 在左侧导航栏中选择“工作负载”,找到目标工作负载,单击操作列的“日志”按钮。
  3. 查看工作负载的某个容器日志,在输出区域中,使用鼠标选中一段具体的报错或异常日志文本。
  4. 单击悬浮的盘古Doer标志,将针对选中的日志片段进行定向解释。

相关文档