更新时间:2024-04-29 GMT+08:00

ClickHouse集群支持的监控指标

功能说明

监控是保持CloudTable服务可靠性、可用性和性能的重要部分,通过监控,用户可以观察CloudTable服务器的运行状态。本章节定义了表格存储服务上报云监控服务的监控指标的命名空间、监控指标列表和维度定义。

命名空间

SYS.CloudTable

ClickHouse监控指标

表1 ClickHouse

指标名称

显示名

含义

指标最小单位

监控周期

cpu_usage

CPU使用率

每个节点的CPU使用率。

%

60

memory_usage

内存使用量

每个节点的内存使用量。

Byte

60

memory_usage_ratio

内存使用率

每个节点的内存使用率。

%

60

disk_usage

磁盘使用量

每个节点的磁盘使用量。

Byte

60

disk_usage_ratio

磁盘使用率

每个节点的磁盘使用率。

%

60

network_throughput_inbound_rate

网络吞吐流入速率

每个节点每秒的网络流入数据量。

Byte/s

60

network_throughput_outgoing_rate

网络吞吐流出速率

每个节点每秒的网络流出数据量。

Byte/s

60

clickhouse_process_survival

ClickHouse进程存活

clickhouse进程心跳检查。

-

60

number_of_mutations

Mutation个数

每个节点正在运行的修改任务数。

Count

60

number_of_run_merges

运行Merge个数

正在运行的合并任务个数。

Count

60

number_of_merges_thread

Merge中线程个数

正在合并中的线程数量。

Count

60

number_of_zookeeper_requests

ZK请求数

当前时间节点请求 ZK 的请求数。

Count

60

number_of_zk_session

ZK的 session个数

当前时间节点链接ZK 的 session个数。

Count

60

number_of_zookeeper_watches

ZK watch个数

当前时间节点链接ZK watch个数。

Count

60

number_of_zookeeper_nodes

Zookeeper中节点数

Zookeeper中创建临时的节点数。

Count

60

number_of_parts

part数量

part数量。

Count

60

clickhouse_zookeeper_disconnection

zookeeper连接状态

zookeeper连接状态。

-

60

number_of_threads_holding_read_locks

持有读锁的线程数

持有读锁的线程数。

Count

60

number_of_threads_waiting_to_be_read

等待读的线程数

等待读的线程数。

Count

60

number_of_threads_waiting_to_be_written

等待写的线程数

等待写的线程数。

Count

60

number_of_threads_holding_write_locks

持有写锁的线程数

持有写锁的线程数。

Count

60

number_of_active_tasks_background_processing_pool

后台处理池中活跃任务数

后台处理池中活跃任务数。

Count

60

maximum_number_of_active_blocks

最大活跃分块数

clickhouse实例最大的活跃分块个数。

Count

60

number_of_consistency_checkdata_blocks

一致性校验数据分块数

clickhouse实例一致性校验数据分块个数。

Count

60

extracting_the_number_of_data_chunks_from_the_replica

正在从副本中提取数据分块数

clickhouse实例正在从副本中提取的数据分块个数。

Count

60

number_of_data_chunks_being_sent_to_the_replica

正在发送到副本的数据分块数

clickhouse实例正在发送到副本的数据分块个数。

Count

60

number_of_readonly_replicas

只读副本个数

此指标反映了clickhouse实例中只读副本数。

Count

60

number_of_inserted_into_all_tables

插入行数

clickhouse实例中所有表插入行数。

Count

60

number_of_open_read_files

读文件打开数

clickhouse实例上的读文件打开数。

Count

60

number_of_open_write_files

写文件打开数

clickhouse实例上的写文件打开数。

Count

60

total_file_opens

文件打开总数

clickhouse实例上的文件打开数。

Count

60

number_of_read_file_descriptors

文件描述符读个数

文件描述符读个数。

Count

60

number_of_written_file_descriptors

文件描述符写个数

文件描述符写个数。

Count

60

instance_process_running_duration

实例进程运行时长

clickhouse实例进程运行时长。

s

60

number_of_threads_running_in_global_thread_pool

全局线程池中运行任务的线程数

clickhouse实例上的全局线程池中运行任务的线程数。

Count

60

number_of_threads_in_global_thread_pool

全局线程池中线程数

clickhouse实例上的全局线程池中线程数。

Count

60

number_of_threads_in_local_thread_pool

本地线程池中的线程数

clickhouse实例上的本地线程池中的线程数。

Count

60

number_of_threads_waiting_locked

Context中等待加锁的线程数

clickhouse实例上的context中等待加锁的线程数。

Count

60

number_of_threads_running_in_local_thread_pool

本地线程池中运行任务的线程数

clickhouse实例上的本地线程池中运行任务的线程数。

Count

60

number_of_tcp_connections

TCP连接数

TCP协议连接个数。

Count

60

number_of_http_connections

HTTP连接数

HTTP协议连接个数。

Count

60

number_of_databases

数据库数量

每个节点数据库数量。

Count

60

number_of_tables

表数量

每个节点本地表数量。

Count

60

write_size_per_second

每秒写入大小

每个节点单位时间写入的数据量。

Byte

60

number_of_running_queries

运行Query个数

每个节点正在运行的查询个数。

Count

60

number_of_query_threads

Query线程数

每个节点正在运行的查询线程数。

Count

60

number_of_distributed_ddls

分布式DDL个数

分布式DDL语句的个数。

Count

60

number_of_distributed_table_files

分布式表文件个数

向分布式表写数据时待插入数据的文件个数。

Count

60

number_of_concurrency

ClickHouse各节点并发度

当前ClickHouse各节点的并发度。

Count

60

zookeeper_quota_percentage

ZooKeeper数量配额百分比

ClickHouse服务在ZooKeeper上目录的数量配额使用百分比。

%

60

zookeeper_process_is_alive

zookeeper进程存活

zookeeper心跳检查,1表示正常,0表示异常。

-

60

number_of_global_sessions

全局session个数

当前全局的session个数。

Count

60

number_of_rejected_connections

拒绝链接个数

zookeeper拒绝链接的个数。

Count

60

number_of_request_submission_queues

请求提交队列个数

请求提交队列个数。

Count

60

waiting_time_of_the_preprocessing_queue

预处理队列等待时间

预处理队列等待时间。

s

60

number_of_zk_watches

ZK_watch 个数

当前时间 ZK_watch 个数。

Count

60

zk_heapmemory_usage

ZooKeeper使用的堆内存大小

ZooKeeper使用的堆内存大小。

Byte

60

zk_directmemory_usage

ZooKeeper使用的直接内存

ZooKeeper使用的直接内存。

Byte

60

zk_heapmemory_usage_ratio

ZooKeeper堆内存使用率

ZooKeeper堆内存使用百分比统计。

%

60

zk_directmemory_usage_ratio

ZooKeeper直接内存使用率

ZooKeeper直接内存使用百分比统计。

%

60

cluster_number_of_sent_packets

zookeeper发包个数

zookeeper 节点发送的 packet 个数。

Count

60

cluster_number_of_received_packets

zookeeper收包个数

zookeeper 节点接收的 packet 个数。

Count

60

cluster_preprocessing_time

预处理时间

单位时间内预处理时间。

s

60

rows_written_per_second

每秒写入行数

每个节点单位时间写入的行数。

Count

60

number_of_failed_queries

失败Query个数

失败的query语句个数。

Count

60

number_of_failed_insert_queries

失败Insert Query个数

失败的插入语句个数。

Count

60

number_of_failed_select_query_messages

失败Select Query个数

失败的select语句个数。

Count

60

number_of_delayed_inserts

delayed inserts个数

每个节点延迟插入个数。

Count

60

number_of_rows

字段数量

每个节点mergetree引擎字段数量。

Count

60

disk_throughput_read_rate

磁盘吞吐读速率

磁盘读取吞吐速率。

Byte

60

disk_throughput_write_rate

磁盘吞吐写速率

磁盘写入吞吐速率。

Byte

60

cmdForUsedStorageRate

已用存储空间比率

统计测量对象所在集群的已用存储空间大小占总配额的比率。

%

60

维度

Key

Value

cluster_id

CloudTable集群ID。

instance_name

CloudTable集群节点名称。