更新时间:2024-04-25 GMT+08:00

节点

如果您需要监控节点的资源使用情况,可以前往“容器洞察 > 节点”页面查看。该页面提供了指定集群下所有节点的综合信息,以及单个节点的详细监控数据,包括CPU/内存使用率、网络流入/流出速率、磁盘读/写IO等。

功能入口

  1. 登录CCE控制台,单击集群名称进入集群详情页。
  2. 在左侧导航栏中选择“监控中心”,单击“容器洞察 > 节点”。

    页面呈现了所有节点的综合信息,如需深入了解单个节点的监控情况,可单击节点名称,进入该节点的“概览”页面,通过切换“Pod列表”、“监控”页签查看相应内容。

节点列表

节点列表中包含节点名称、状态、IP地址、Pod(已分配/总额度)、CPU申请率/限制率/使用率,以及内存申请率/限制率/使用率等信息。

图1 节点列表

您可以通过在列表上方按照节点名称、状态、私有地址和公网地址进行筛选,快速找到需要的节点。您也可以单击“导出”按钮导出全部节点数据,或者选择部分节点进行导出,此时仅导出所选中的数据。导出的文件为“.xlsx”格式,文件命名中包含时间戳。

当节点的CPU限制率或内存限制率超过100%时,意味着节点资源超分,节点上的负载限制值(可使用的最大值)之和已经超过了节点规格。如果负载占用资源过高,可能会导致业务负载互相抢占资源,引发业务异常乃至节点异常。

概览

单击节点名称,您可以方便地查看资源健康概况,包括节点状态、Pod数量以及异常事件。此外,还可以浏览近一小时的监控概览,其中包括CPU使用率、内存使用率和网络流入/流出速率这些常见的监控指标。

图2 资源概况和监控概览

同时,概览页面还提供了Pod使用趋势功能,您可以从中了解节点中各Pod的CPU使用率、CPU使用量、内存使用率和内存使用量(在图表右上角切换对应指标),并且支持查看降序Top5和升序Top5数据(在图表左上角进行切换)。

图3 Pod使用趋势

如需了解更多指标,请前往监控页面查看。

Pod列表

Pod列表中包含了Pod名称、状态、命名空间、Pod IP、所在节点、重启次数、CPU申请/限制、内存申请/限制,以及CPU和内存使用量、使用率等详细信息。

图4 Pod列表

您可以通过在列表上方按照Pod名称、状态、命名空间、Pod IP和所在节点进行筛选,快速找到需要的Pod。您也可以单击“导出”按钮来导出全部Pod数据,或者选择部分Pod进行导出,此时仅导出所选中的数据。导出的文件为“.xlsx”格式,文件命名中包含时间戳。

单击Pod名称可以查看Pod的详细监控数据。更多相关内容,请参见Pod

监控

在此处,您可以方便地查看节点在近1小时、近8小时、近24小时以及自定义时间段内各维度资源的使用情况。如需查看更多监控信息,请单击“查看全部仪表盘”,跳转至“仪表盘”页面,相应指导请参见使用仪表盘

图5 节点监控
  • CPU相关指标
    • CPU使用率:节点的CPU非空闲时间所占的平均比例。
    • CPU分配率:节点上所有容器对CPU的Request之和除以节点的CPU总核数。
    • 节点CPU单核使用率:节点上每个CPU核非空闲时间各自所占的比例。
  • 内存相关指标
    • 内存使用率:节点的内存使用量除以节点的内存总量。
    • 内存分配率:节点上所有容器对内存的 Request 之和占节点的内存总量的比例。
  • 网络相关指标
    • 网络流出速率:节点上的物理网卡在不同的时间段的每秒钟发送的字节数。
    • 网络流入速率:节点上的物理网卡在不同的时间段的每秒钟接收的字节数。
    • 网络发送丢包率:节点的物理网卡网络发送丢包速率。
    • 网络接收丢包率:节点的物理网卡网络接收丢包率。
  • 磁盘相关指标
    • 磁盘读取速率:节点上的每个文件系统在不同的时间段的每秒钟读取的字节数。
    • 磁盘写入速率:节点上的每个文件系统在不同的时间段的每秒钟写入的字节数。
    • 磁盘使用率:节点上的每个文件系统在不同的时间段已使用的空间所占各自总空间的比例
  • Pod相关指标
    • Pod CPU使用率:节点上每个Pod在不同的时间段的CPU使用量占它们的CPU Limit量的比例。
    • Pod内存使用率:节点上每个Pod在不同的时间段的内存使用量占它们的内存Limit量的比例。
    • Pod状态数量趋势:节点上在不同的时间段分别处于不可用、未就绪、运行中、已完成或其他的状态 Pod 数量之和。
    • Pod数量变化趋势:节点上所有的 Pod 在不同的时间段的数量。
  • 其他指标
    • 节点平均负载:节点的平均负载是指在一定时间内,节点上正在运行的进程数量的平均值。即节点上正在运行的进程数量是否过多,是否超出了节点的处理能力。通常情况下,节点平均负载应该保持在一个合理的范围内,以确保节点的稳定性和可靠性。
    • Iptables 连接数:连接跟踪表的最大条目数和当前已分配的条目数。