更新时间:2024-10-17 GMT+08:00
分享

Pod监控

如果您需要监控Pod的资源使用情况,可以前往“Pod”页面查看。该页面提供了指定集群下所有Pod的综合信息,以及单个Pod的详细监控数据,包括CPU/内存使用率、网络流入/流出速率等。

功能入口

  1. 登录CCE控制台,单击集群名称进入集群详情页。
  2. 在左侧导航栏中选择“监控中心”,单击“Pod”。

    页面呈现了所有Pod的综合信息,如需深入了解单个Pod的监控情况,可单击Pod名称,进入该Pod的“概览”页面,通过切换“容器列表”、“监控”页签查看相应内容。

Pod列表

Pod列表中包含Pod名称、状态、命名空间、Pod IP、所在节点、重启次数、CPU申请/限制、内存申请/限制、CPU使用率,以及内存使用率等信息。

图1 Pod列表

您可以利用列表上方的命名空间,以及搜索栏中的Pod名称、状态、Pod IP和所在节点进行筛选,快速定位所需的Pod。

您也可以单击“导出”按钮来导出全部Pod数据,或者选择部分Pod进行导出,此时仅导出所选中的数据。导出的文件为“.xlsx”格式,文件命名中包含时间戳。

概览

单击Pod名称,您可以方便地查看资源概况,包括Pod状态、容器数量(异常/总数)以及异常事件。此外,还可以浏览Pod近一小时的监控概览,其中包括CPU使用率、内存使用率和网络流入/流出速率这些常见的监控指标。

图2 资源概况和监控概览

同时,概览页面还提供了容器使用趋势功能,您可以从中了解Pod中各容器的CPU使用率、CPU使用量、内存使用率和内存使用量(在图表右上角切换对应指标),并且支持查看降序Top5和升序Top5数据(在图表左上角进行切换)。

如需了解更多指标,请前往监控页面查看。

容器列表

容器列表中包含了容器名称、状态、命名空间、重启次数,以及镜像等详细信息。

图3 容器列表

您可以通过在列表上方按照容器名称、状态和命名空间进行筛选,快速找到需要的容器。您也可以单击“导出”按钮来导出全部容器数据,或者选择部分容器进行导出,此时仅导出所选中的数据。导出的文件为“.xlsx”格式,文件命名中包含时间戳。

监控

在此处,您可以方便地查看实例在近1小时、近8小时、近24小时以及自定义时间段内各维度资源的使用情况。如需查看更多监控信息,请单击“查看全部仪表盘”,跳转至“仪表盘”页面,相应指导请参见使用仪表盘

图4 Pod监控
  • CPU相关指标
    • CPU:Pod 的所有容器在不同的时间段 CPU 使用总量占 Pod 的所有容器 CPU Limit 总量的比例。
    • CPU 使用量:Pod 已经使用的 CPU 核数。
    • CPU 申请量:Pod CPU Request 值。
    • CPU 限制量:Pod CPU Limit 值,使用量接近该值时容器的 CPU 资源会被限流,影响容器性能。
  • 内存相关指标
    • 内存使用率:Pod 的所有容器在不同的时间段内存使用总量占 Pod 的所有容器内存 Limit 总量。
    • 内存使用量:Pod 已经使用的内存量。
    • 内存申请量:Pod 内存 Request 值。
    • 内存限制量:Pod 内存 Limit 值, 使用量到达该值时会导致容器 OOM。
  • 网络相关指标
    • 网络总流出速率:Pod 的所有容器每秒钟发送的总字节数。
    • 网络总流入速率:Pod 的所有容器每秒钟接收的总字节数。
  • 容器相关指标
    • 容器CPU使用率:Pod 的每个容器在不同的时间段的 CPU 使用量占它们的 CPU Limit 量的比例。
    • 容器内存使用率:Pod 的每个容器在不同的时间段的内存使用量占它们的内存 Limit 量的比例。
    • 容器CPU受限:Pod 的每个容器在不同的时间段的 CPU 受限时间所占的比例。
    • 容器网络丢包率:Pod 的每个的容器在不同的时间段接收丢失的数据包总量占接收的数据包总量的比例。
  • 其他指标
    • Pod 历史状态:Pod 在不同时间段所处的状态。
    • 容器历史状态:Pod 的每个容器在不同的时间段所处的状态。

相关文档