基础指标:CAE指标
介绍CAE服务上报到AOM的监控指标,包括指标的类别、名称、含义等信息。
指标分类 |
指标名称 |
指标含义 |
---|---|---|
job:kubernetes-cadvisor |
cadvisor_version_info |
Docker容器监控工具Prometheus中cAdvisor模块的版本信息指标。 |
container_cpu_cfs_periods_total |
容器已经执行的CPU时间周期数。 |
|
container_cpu_cfs_throttled_periods_total |
容器被限流的CPU时间周期数。 |
|
container_cpu_cfs_throttled_seconds_total |
容器被限流的CPU时间。 |
|
container_cpu_load_average_10s |
容器过去10秒内的CPU负载的平均值。 |
|
machine_cpu_physical_cores |
物理CPU核心的数量。 |
|
machine_cpu_sockets |
主机(机器)上的CPU插槽数。 |
|
machine_nvm_avg_power_budget_watts |
NVM(Non-Volatile Memory,非易失性内存)平均功率预算的Prometheus指标。 |
|
machine_nvm_capacity |
机器(通常是服务器或节点)的NVM(Non-Volatile Memory,非易失性内存)容量。 |
|
machine_scrape_error |
从目标机器(通常是服务器或容器)收集指标时遇到的错误情况。 |
|
container_cpu_system_seconds_total |
容器系统CPU总时长。 |
|
container_cpu_usage_seconds_total |
容器在所有CPU内核上的累积占用时间。 |
|
container_cpu_user_seconds_total |
容器用户CPU总时长。 |
|
container_file_descriptors |
容器当前打开文件描述符的个数。 |
|
container_fs_inodes_free |
文件系统的可用inode数量。 |
|
container_fs_inodes_total |
文件系统的总计inode数量 |
|
container_fs_io_current |
磁盘/文件系统当前正在进行的 I/O 数量。 |
|
container_fs_io_time_seconds_total |
磁盘/文件系统花费在 I/O 上的累计秒数。 |
|
container_fs_io_time_weighted_seconds_total |
磁盘/文件系统累积加权 I/O 时间。 |
|
container_fs_limit_bytes |
容器可以使用的磁盘/文件系统总量。 |
|
container_fs_read_seconds_total |
容器累积读取磁盘/文件系统数据的秒数。 |
|
container_fs_reads_bytes_total |
容器累积读取磁盘/文件系统数据的总量。 |
|
container_fs_reads_merged_total |
容器合并读取磁盘/文件系统的累积计数。 |
|
container_fs_reads_total |
容器已完成读取磁盘/文件系统的累积计数。 |
|
container_fs_sector_reads_total |
容器已完成扇区读取磁盘/文件系统的累积计数。 |
|
container_fs_sector_writes_total |
容器已完成扇区写入磁盘/文件系统的累积计数。 |
|
container_fs_usage_bytes |
文件系统的使用量。 |
|
container_fs_write_seconds_total |
容器累计写入磁盘/文件系统的秒数。 |
|
container_fs_writes_bytes_total |
容器累积写入磁盘/文件系统数据的总量。 |
|
container_fs_writes_merged_total |
容器合并写入磁盘/文件系统的累积计数。 |
|
container_fs_writes_total |
容器已完成写入磁盘/文件系统的累积计数。 |
|
container_last_seen |
最近一次监控采集器感知到容器的时间。 |
|
container_memory_cache |
容器总页缓存内存。 |
|
container_memory_failcnt |
容器内存使用达到限制的次数。 |
|
container_memory_mapped_file |
容器内存映射文件的大小。 |
|
container_memory_max_usage_bytes |
容器历史最大内存使用量。 |
|
container_memory_rss |
容器常驻内存集的大小。 |
|
container_memory_swap |
容器虚拟内存使用量。 |
|
container_memory_usage_bytes |
容器当前的内存使用量。 |
|
container_memory_working_set_bytes |
容器工作集内存使用量。 |
|
container_network_receive_bytes_total |
容器网络累积接收数据总量。 |
|
container_network_receive_errors_total |
接收时遇到的错误累积计数。 |
|
container_network_receive_packets_dropped_total |
接收时丢弃的数据包的累积计数。 |
|
container_network_receive_packets_total |
接收数据包的累积计数。 |
|
container_network_transmit_bytes_total |
容器网络累积传输数据总量。 |
|
container_network_transmit_errors_total |
传输时遇到的错误累积计数。 |
|
container_network_transmit_packets_dropped_total |
传输时丢弃的数据包的累积计数。 |
|
container_network_transmit_packets_total |
传输数据包的累积计数。 |
|
container_processes |
容器当前运行的进程数。 |
|
container_scrape_error |
记录在从容器收集指标时遇到的错误次数。 |
|
container_sockets |
容器当前打开套接字的个数。 |
|
container_spec_cpu_period |
容器分配的CPU周期。 |
|
container_spec_cpu_quota |
容器分配的CPU配额。 |
|
container_spec_cpu_shares |
容器分配的CPU份额。 |
|
container_spec_memory_limit_bytes |
容器可以使用的总内存量限制。 |
|
container_spec_memory_reservation_limit_bytes |
容器可以使用的预留内存限制。 |
|
container_spec_memory_swap_limit_bytes |
容器可以使用的虚拟内存限制。 |
|
container_start_time_seconds |
容器已经运行的时间。 |
|
container_tasks_state |
处于给定状态的任务数(sleeping, running, stopped, uninterruptible, or ioawaiting)。 |
|
container_threads |
容器内当前运行的线程数。 |
|
container_threads_max |
容器内允许运行的最大线程数。 |
|
container_ulimits_soft |
容器内1号进程的软 ulimit 值。如果为-1,则无限制,优先级和nice除外。 |
|
machine_cpu_cores |
物理机或虚拟机中的CPU核心数量。 |
|
machine_memory_bytes |
当前物理机或虚拟机的内存总数。 |
|
scrape_duration_seconds |
衡量从目标资源获取监控数据(即“抓取”数据)所花费的时间。 |
|
scrape_samples_post_metric_relabeling |
衡量在指标重标记(relabeling)之后,收集器(scrape)过程中采样的数量。 |
|
scrape_samples_scraped |
记录在特定时间段内被scrape(抓取)操作收集的样本数量。 |
|
scrape_series_added |
监控数据收集系统(如Prometheus)的性能。 |
|
up |
up指标通常用于描述一个系统组件或服务的运行时间。例如,在容器化环境中,如Docker容器,up可以表示容器的启动时间。 |
|
job:kubernetes-node-exporter |
node_filesystem_size_bytes |
挂载的文件系统占用空间。 |
node_memory_Buffers_bytes |
节点缓冲区的内存。 |
|
node_cpu_seconds_total |
节点CPU时间。 |
|
node_filesystem_avail_bytes |
挂载的文件系统可用空间。 |
|
node_memory_Cached_bytes |
节点页面缓存中的内存。 |
|
node_memory_MemFree_bytes |
节点空闲内存。 |
|
node_memory_MemTotal_bytes |
节点内存总量。 |
|
node_network_receive_bytes_total |
累积接收数据总量。 |
|
node_network_transmit_bytes_total |
累积传输数据总量。 |
|
node_disk_reads_completed_total |
磁盘读取完成的次数。 |
|
node_disk_writes_completed_total |
磁盘写入完成的次数。 |
|
汇聚指标 |
cae_container_cpu_usage |
容器的CPU使用情况。 |
cae_container_downlink_bps |
容器的网络下行带宽(即从容器到外部网络的数据传输速率)。 |
|
cae_container_fs_reads_bytes_total |
容器在文件系统中进行的读操作的总字节数。 |
|
cae_container_fs_writes_bytes_total |
容器中文件系统的写操作字节数。 |
|
cae_container_memory_usage |
容器的内存使用情况。 |
|
cae_container_uplink_bps |
容器的上行网络带宽的比特率(bps)。 |
|
cae_node_cup_usage |
度量节点(通常是Kubernetes节点或物理/虚拟服务器)的CPU使用情况。 |
|
cae_node_disk_reads_bytes |
度量节点(通常是主机或服务器)的磁盘读取操作的字节数。 |
|
cae_node_disk_usage |
节点(通常是Kubernetes节点或服务器)的磁盘使用情况。 |
|
cae_node_disk_writes_bytes |
节点(通常是主机或服务器)的磁盘写入操作的字节数。 |
|
cae_node_downlink_bps |
节点(通常是服务器或虚拟机)的下行带宽的比特率(bps)。 |
|
cae_node_memory_usage |
节点(通常是Kubernetes节点或物理/虚拟服务器)的内存使用情况。 |
|
cae_node_uplink_bps |
Kubernetes集群中节点(Node)的网络上行带宽的比特率(bps)。 |