更新时间:2024-09-29 GMT+08:00

Prometheus Server视图

Prometheus本地数据存储模式可以收集有关主机和应用程序的指标数据并存储在集群中,监控数据可以选择上报并存储到AOM或三方监控平台。Prometheus Server视图展示了Prometheus提供的一些内置指标,可用于监控和度量系统的性能和状态。

指标说明

Prometheus Server视图暴露的指标如下:

图1 Prometheus Server资源指标
表1 Prometheus Server图表说明

视图指标

单位

描述

Target同步

target指标采集时延

Target数量

target采集的指标总数

平均抓取间隔

每一次指标采集的时间间隔

抓取失败

采集失败的次数

Samples添加速率

head 添加Samples的速率

Head中Series数量

head中Series数量

Head块数量

head块数量

查询速率

次/秒

每秒执行普罗query的次数

P90查询耗时

不同分片的90%的操作的查询耗时

远端样本滞后比率

存储在WAL中的样本的最高时间戳与远程写入成功的最高时间戳的比率

远程写流量

字节/秒

远程写入的速率

当前队列数

当前用于并行发送到远程存储的分片数

最大队列数

可用于并行发送到远程存储的分片数的最大值

最小队列数

可用于并行发送到远程存储的分片数的最小值

期望队列数

分片队列期望基于输入样本和输出样本的比率运行的分片数

队列容量

用于并行发送到远程存储的队列每个分片的容量

挂起中的样本数

用于并行发送到远程存储的队列中每个分片的容量

TSDB当前段

TSDB当前正在写入的WAL段索引

远程写入当前段

WAL watcher正在从中读取记录的当前段

样本丢弃率

次/秒

在通过远程写入发送之前,从WAL读取后丢弃的样本速率。

样本失败率

次/秒

发送到远程存储时失败的样本失败速率,不可恢复错误。

样本重试率

次/秒

在发送到远程存储时失败但由于发送错误可恢复而重试的样本速率

入队失败重试率

次/秒

由于分片队列已满而入队失败重试速率

指标清单

Prometheus Server视图使用的指标清单如下:

表2 Prometheus Server指标说明

指标

类型

描述

prometheus_target_sync_length_seconds_sum

Summary

不同的target的采集时延

prometheus_sd_discovered_targets

Gauge

不同的target采集的指标数

prometheus_target_interval_length_seconds_sum

Summary

指标采集间隔

prometheus_target_scrapes_exceeded_body_size_limit_total

Counter

采集失败的次数

prometheus_tsdb_head_samples_appended_total

Counter

head中添加的samples的总数

prometheus_tsdb_head_series

Gauge

head中保存的series数量

prometheus_tsdb_head_chunks

Gauge

head中存放的chunk数量

prometheus_engine_query_duration_seconds_count

Counter

查询普罗query的次数

prometheus_engine_query_duration_seconds

Counter

不同分片的响应时间耗时

prometheus_remote_storage_highest_timestamp_in_seconds

Gauge

远程存储里最新的时间戳

prometheus_remote_storage_queue_highest_sent_timestamp_seconds

Gauge

普罗分片里最新的时间戳

prometheus_remote_storage_bytes_total

Counter

压缩后队列发送的数据(非元数据)的总字节数

prometheus_remote_storage_shards

Gauge

当前用于并行发送到远程存储的分片数

prometheus_remote_storage_shards_max

Gauge

可用于并行发送到远程存储的分片数的最大值

prometheus_remote_storage_shards_min

Gauge

可用于并行发送到远程存储的分片数的最小值

prometheus_remote_storage_shards_desired

Gauge

分片队列期望基于输入样本和输出样本的比率运行的分片数

prometheus_remote_storage_shard_capacity

Gauge

用于并行发送到远程存储的队列中每个分片的容量

prometheus_remote_storage_pending_samples

Gauge

要发送到远程存储的队列分片中挂起的样本数

prometheus_tsdb_wal_segment_current

Gauge

TSDB当前正在写入的WAL段索引

prometheus_wal_watcher_current_segment

Gauge

WAL正在从中读取记录的当前段

prometheus_remote_storage_dropped_samples_total

Gauge

在通过远程写入发送之前,从WAL读取后丢弃的样本速率。

prometheus_remote_storage_failed_samples_total

Gauge

发送到远程存储时失败的样本失败速率,不可恢复的错误的次数。

prometheus_remote_storage_retried_samples_total

Gauge

在发送到远程存储时失败但由于发送错误可恢复而重试的次数

prometheus_remote_storage_enqueue_retries_total

Gauge

由于分片队列已满而入队失败重试的次数