更新时间:2024-08-17 GMT+08:00

主机视图

从主机视角出发,监控主机的资源占用与健康状态,查看主机的磁盘、文件系统等常用系统设备指标,帮助您掌控节点运行状况。

指标说明

主机视图暴露的指标具体说明如下:

图1 主机资源指标
表1 视图说明

图表名称

单位

说明

CPU使用率

百分比

每个CPU核的使用率

平均负载

/

平均负载反映了CPU资源的竞争情况

  • 值小于1时,说明部分CPU资源在处理请求。
  • 值等于1时,说明所有的CPU资源都在处理请求。
  • 值大于1时,说明有部分线程在等待处理。

内存使用量

字节

不同模式的内存使用情况

内存使用率

百分比

主机内存使用率

磁盘写入速率

字节/秒

不同的磁盘的写入速率

磁盘读取速率

字节/秒

不同的磁盘的读取速率

磁盘空间使用

字节

磁盘可用量和已使用量

磁盘空间使用率

百分比

不同设备的磁盘使用率

磁盘IO延迟(秒)

磁盘IO延迟

TCP连接

TCP连接数

  • alloc:已分配(已建立、已申请到sk_buff)的TCP套接字数量。
  • inuse:正在使用(侦听)的TCP套接字数量。
  • orphan:已分配(已建立、已申请到sk_buff)的TCP套接字数量。
  • tw:等待关闭的TCP连接数。

UDP使用情况

UDP使用情况

  • liteInuse:正在使用的UDP-Lite套接字数量。
  • inuse:正在使用的UDP套接字数量。
  • useMemory:UPD缓冲区使用量。

最大文件描述符

EB:10的18次方

最大文件描述符数

已使用文件描述符

当前已分配使用的文件描述符数量

Socket使用情况

Socket使用情况

  • socketsUsed:使用的所有协议套接字总量。
  • fragInuse:正在使用的Frag套接字数量。
  • fragMemroy:Frag缓冲区使用量。
  • rawInuse:正在使用的Raw套接字数量。

文件系统异常

/

文件系统状态

  • readonly:文件系统只读
  • deviceError:文件系统错误

磁盘读写速率

次/秒

磁盘每秒进行的读写次数

磁盘读和写延迟(秒)

磁盘读写时延

IO队列数

/

磁盘设备平均IO队列长度,节点磁盘IO时间加权值。该值越大,表示节点的磁盘性能越好。

进程状态

处于不同状态的进程数量

连接跟踪表条目数

  • 已分配:连接跟踪表当前已分配的条目数
  • 总容量:连接跟踪表的最大条目数

指标清单

主机视图使用的指标清单如下:
表2 指标说明

指标名称

类型

说明

node_cpu_seconds_total

Counter

节点不同模式下花费的CPU秒

node_load1

Gauge

1分钟内CPU平均负载,反映了CPU资源的竞争情况。

  • 值小于1时,说明部分CPU资源在处理请求。
  • 值等于1时,说明所有的CPU资源都在处理请求。
  • 值大于1时,说明有部分线程在等待处理。

node_load15

Gauge

15分钟内CPU平均负载

node_memory_MemTotal_bytes

Gauge

节点内存总量

node_memory_MemAvailable_bytes

Gauge

节点可用内存量

node_disk_written_bytes_total

Gauge

节点磁盘写入量

node_disk_read_bytes_total

Gauge

节点磁盘读取量

node_filesystem_size_bytes

Gauge

节点文件系统大小

node_filesystem_avail_bytes

Gauge

节点可用文件系统大小

node_disk_io_time_seconds_total

Counter

I/O操作所花费的总秒数

node_sockstat_TCP_alloc

Gauge

已分配的TCP套接字数

node_sockstat_UDPLITE_inuse

Gauge

已使用的UDPLITE套接字

node_filefd_maximum

Gauge

文件描述符统计信息:最大值。

node_filefd_allocated

Gauge

文件描述符统计信息:已分配。

node_sockstat_sockets_used

Gauge

已使用的IPv4套接字数

node_filesystem_readonly

Gauge

文件系统只读状态

node_disk_reads_completed_total

Counter

磁盘读取完成的次数

node_disk_read_time_seconds_total

Counter

磁盘读取完成的次数的总耗时

node_disk_io_time_weighted_seconds_total

Counter

节点磁盘IO时间加权值。该值越大,表示节点的磁盘性能越好。

node_procs_blocked

Gauge

等待I/O完成的阻塞进程数

node_nf_conntrack_entries

Gauge

连接跟踪表的最大大小