Prometheus Server视图
Prometheus本地数据存储模式可以收集有关主机和应用程序的指标数据并存储在集群中,监控数据可以选择上报并存储到AOM或三方监控平台。Prometheus Server视图展示了Prometheus提供的一些内置指标,可用于监控和度量系统的性能和状态。
指标说明
Prometheus Server视图暴露的指标如下:
视图指标 |
单位 |
描述 |
---|---|---|
Target同步 |
秒 |
target指标采集时延 |
Target数量 |
个 |
target采集的指标总数 |
平均抓取间隔 |
秒 |
每一次指标采集的时间间隔 |
抓取失败 |
次 |
采集失败的次数 |
Samples添加速率 |
个 |
head 添加Samples的速率 |
Head中Series数量 |
个 |
head中Series数量 |
Head块数量 |
个 |
head块数量 |
查询速率 |
次/秒 |
每秒执行普罗query的次数 |
P90查询耗时 |
秒 |
不同分片的90%的操作的查询耗时 |
远端样本滞后比率 |
秒 |
存储在WAL中的样本的最高时间戳与远程写入成功的最高时间戳的比率 |
远程写流量 |
字节/秒 |
远程写入的速率 |
当前队列数 |
个 |
当前用于并行发送到远程存储的分片数 |
最大队列数 |
个 |
可用于并行发送到远程存储的分片数的最大值 |
最小队列数 |
个 |
可用于并行发送到远程存储的分片数的最小值 |
期望队列数 |
个 |
分片队列期望基于输入样本和输出样本的比率运行的分片数 |
队列容量 |
个 |
用于并行发送到远程存储的队列每个分片的容量 |
挂起中的样本数 |
个 |
用于并行发送到远程存储的队列中每个分片的容量 |
TSDB当前段 |
段 |
TSDB当前正在写入的WAL段索引 |
远程写入当前段 |
段 |
WAL watcher正在从中读取记录的当前段 |
样本丢弃率 |
次/秒 |
在通过远程写入发送之前,从WAL读取后丢弃的样本速率。 |
样本失败率 |
次/秒 |
发送到远程存储时失败的样本失败速率,不可恢复错误。 |
样本重试率 |
次/秒 |
在发送到远程存储时失败但由于发送错误可恢复而重试的样本速率 |
入队失败重试率 |
次/秒 |
由于分片队列已满而入队失败重试速率 |
指标清单
Prometheus Server视图使用的指标清单如下:
指标 |
类型 |
描述 |
---|---|---|
prometheus_target_sync_length_seconds_sum |
Summary |
不同的target的采集时延 |
prometheus_sd_discovered_targets |
Gauge |
不同的target采集的指标数 |
prometheus_target_interval_length_seconds_sum |
Summary |
指标采集间隔 |
prometheus_target_scrapes_exceeded_body_size_limit_total |
Counter |
采集失败的次数 |
prometheus_tsdb_head_samples_appended_total |
Counter |
head中添加的samples的总数 |
prometheus_tsdb_head_series |
Gauge |
head中保存的series数量 |
prometheus_tsdb_head_chunks |
Gauge |
head中存放的chunk数量 |
prometheus_engine_query_duration_seconds_count |
Counter |
查询普罗query的次数 |
prometheus_engine_query_duration_seconds |
Counter |
不同分片的响应时间耗时 |
prometheus_remote_storage_highest_timestamp_in_seconds |
Gauge |
远程存储里最新的时间戳 |
prometheus_remote_storage_queue_highest_sent_timestamp_seconds |
Gauge |
普罗分片里最新的时间戳 |
prometheus_remote_storage_bytes_total |
Counter |
压缩后队列发送的数据(非元数据)的总字节数 |
prometheus_remote_storage_shards |
Gauge |
当前用于并行发送到远程存储的分片数 |
prometheus_remote_storage_shards_max |
Gauge |
可用于并行发送到远程存储的分片数的最大值 |
prometheus_remote_storage_shards_min |
Gauge |
可用于并行发送到远程存储的分片数的最小值 |
prometheus_remote_storage_shards_desired |
Gauge |
分片队列期望基于输入样本和输出样本的比率运行的分片数 |
prometheus_remote_storage_shard_capacity |
Gauge |
用于并行发送到远程存储的队列中每个分片的容量 |
prometheus_remote_storage_pending_samples |
Gauge |
要发送到远程存储的队列分片中挂起的样本数 |
prometheus_tsdb_wal_segment_current |
Gauge |
TSDB当前正在写入的WAL段索引 |
prometheus_wal_watcher_current_segment |
Gauge |
WAL正在从中读取记录的当前段 |
prometheus_remote_storage_dropped_samples_total |
Gauge |
在通过远程写入发送之前,从WAL读取后丢弃的样本速率。 |
prometheus_remote_storage_failed_samples_total |
Gauge |
发送到远程存储时失败的样本失败速率,不可恢复的错误的次数。 |
prometheus_remote_storage_retried_samples_total |
Gauge |
在发送到远程存储时失败但由于发送错误可恢复而重试的次数 |
prometheus_remote_storage_enqueue_retries_total |
Gauge |
由于分片队列已满而入队失败重试的次数 |