工作负载诊断
基于以往的运维经验,负载类型故障通常发生比较频繁,处理这些问题往往耗费运维人员大量精力。为了提升运维效率,CCE引入了单Pod级别的资源诊断能力,帮助运维团队更高效地定位和解决问题。
该诊断工具通过综合使用Kubernetes原生API、Kubernetes事件、日志以及监控指标,对问题进行全面的分析和判定,并提供具体的修复建议。这种综合诊断方法不仅提高了故障定位的准确性,还显著减少了运维人员的工作负担,从而提升了整体运维效率。
前提条件
- 已获取资源权限
- 集群版本高于v1.17。
- 集群处于“运行中”状态。
选择Pod进行诊断
- 登录CCE控制台,单击集群名称进入集群详情页。
- 在左侧导航栏中选择“健康中心”, 单击“Pod”页签 。
- 在“Pod”页签界面,单击“开始诊断”,选择要进行诊断的Pod,单击“确定”开启诊断。
图1 开始诊断
- 诊断完成后,单击“查看详情”,查看诊断结果。
图2 诊断结束
图3 诊断结果查看