更新时间:2024-10-17 GMT+08:00
分享

集群监控

当您想观测整个集群的资源使用情况和健康度时,可以在“集群”页面查看,该页面提供了单个集群的监控情况,包含资源健康概况资源消耗Top统计数据面监控多维度的信息概况。

功能入口

  1. 登录CCE控制台,单击集群名称进入集群详情页。
  2. 在左侧导航栏中选择“监控中心”,单击“集群”。

资源健康概况

资源概况涵盖了工作负载和Pod资源中异常资源所占比例,以及命名空间的总数。

图1 资源概况

资源消耗Top统计

在资源消耗Top统计中,CCE服务会将CPU使用率和内存使用率排名前五的无状态负载、有状态负载和Pod纳入统计范围,以帮助您识别资源消耗“大户”。如果您需要查看全部数据,可前往工作负载Pod页面。

图2 资源消耗Top统计

监控名词解释:

  • CPU使用率

    工作负载CPU使用率 = 工作负载各个Pod中CPU使用率的平均值

    Pod CPU使用率 = Pod实际使用的CPU核数 / 业务容器CPU核数限制值之和

  • 内存使用率

    工作负载内存使用率 = 工作负载各个Pod中内存使用率的平均值

    Pod内存使用率 = Pod实际使用的物理内存 / 业务容器物理内存限制值之和

数据面监控

此处默认统计近1小时、近8小时和近24小时的各维度资源用量。如需查看更多监控信息,请单击“查看全部监控”,跳转至“仪表盘”页面,相应指导请参见使用仪表盘

您可以将鼠标悬停在图表上,以便查看每分钟的监控数据。

  • Pod数量状态趋势:实时监控集群Pod的状态。
  • Pod总重启次数趋势:近5分钟的集群的Pod重启次数总和。

相关文档