ClickHouse集群支持的监控指标
功能说明
监控是保持CloudTable服务可靠性、可用性和性能的重要部分,通过监控,用户可以观察CloudTable服务器的运行状态。本章节定义了表格存储服务上报云监控服务的监控指标的命名空间、监控指标列表和维度定义。
命名空间
SYS.CloudTable
ClickHouse监控指标
指标名称 |
显示名 |
含义 |
指标最小单位 |
监控周期 |
---|---|---|---|---|
cpu_usage |
CPU使用率 |
每个节点的CPU使用率。 |
% |
60 |
memory_usage |
内存使用量 |
每个节点的内存使用量。 |
Byte |
60 |
memory_usage_ratio |
内存使用率 |
每个节点的内存使用率。 |
% |
60 |
disk_usage |
磁盘使用量 |
每个节点的磁盘使用量。 |
Byte |
60 |
disk_usage_ratio |
磁盘使用率 |
每个节点的磁盘使用率。 |
% |
60 |
network_throughput_inbound_rate |
网络吞吐流入速率 |
每个节点每秒的网络流入数据量。 |
Byte/s |
60 |
network_throughput_outgoing_rate |
网络吞吐流出速率 |
每个节点每秒的网络流出数据量。 |
Byte/s |
60 |
clickhouse_process_survival |
ClickHouse进程存活 |
clickhouse进程心跳检查。 |
- |
60 |
number_of_mutations |
Mutation个数 |
每个节点正在运行的修改任务数。 |
Count |
60 |
number_of_run_merges |
运行Merge个数 |
正在运行的合并任务个数。 |
Count |
60 |
number_of_merges_thread |
Merge中线程个数 |
正在合并中的线程数量。 |
Count |
60 |
number_of_zookeeper_requests |
ZK请求数 |
当前时间节点请求 ZK 的请求数。 |
Count |
60 |
number_of_zk_session |
ZK的 session个数 |
当前时间节点链接ZK 的 session个数。 |
Count |
60 |
number_of_zookeeper_watches |
ZK watch个数 |
当前时间节点链接ZK watch个数。 |
Count |
60 |
number_of_zookeeper_nodes |
Zookeeper中节点数 |
Zookeeper中创建临时的节点数。 |
Count |
60 |
number_of_parts |
part数量 |
part数量。 |
Count |
60 |
clickhouse_zookeeper_disconnection |
zookeeper连接状态 |
zookeeper连接状态。 |
- |
60 |
number_of_threads_holding_read_locks |
持有读锁的线程数 |
持有读锁的线程数。 |
Count |
60 |
number_of_threads_waiting_to_be_read |
等待读的线程数 |
等待读的线程数。 |
Count |
60 |
number_of_threads_waiting_to_be_written |
等待写的线程数 |
等待写的线程数。 |
Count |
60 |
number_of_threads_holding_write_locks |
持有写锁的线程数 |
持有写锁的线程数。 |
Count |
60 |
number_of_active_tasks_background_processing_pool |
后台处理池中活跃任务数 |
后台处理池中活跃任务数。 |
Count |
60 |
maximum_number_of_active_blocks |
最大活跃分块数 |
clickhouse实例最大的活跃分块个数。 |
Count |
60 |
number_of_consistency_checkdata_blocks |
一致性校验数据分块数 |
clickhouse实例一致性校验数据分块个数。 |
Count |
60 |
extracting_the_number_of_data_chunks_from_the_replica |
正在从副本中提取数据分块数 |
clickhouse实例正在从副本中提取的数据分块个数。 |
Count |
60 |
number_of_data_chunks_being_sent_to_the_replica |
正在发送到副本的数据分块数 |
clickhouse实例正在发送到副本的数据分块个数。 |
Count |
60 |
number_of_readonly_replicas |
只读副本个数 |
此指标反映了clickhouse实例中只读副本数。 |
Count |
60 |
number_of_inserted_into_all_tables |
插入行数 |
clickhouse实例中所有表插入行数。 |
Count |
60 |
number_of_open_read_files |
读文件打开数 |
clickhouse实例上的读文件打开数。 |
Count |
60 |
number_of_open_write_files |
写文件打开数 |
clickhouse实例上的写文件打开数。 |
Count |
60 |
total_file_opens |
文件打开总数 |
clickhouse实例上的文件打开数。 |
Count |
60 |
number_of_read_file_descriptors |
文件描述符读个数 |
文件描述符读个数。 |
Count |
60 |
number_of_written_file_descriptors |
文件描述符写个数 |
文件描述符写个数。 |
Count |
60 |
instance_process_running_duration |
实例进程运行时长 |
clickhouse实例进程运行时长。 |
s |
60 |
number_of_threads_running_in_global_thread_pool |
全局线程池中运行任务的线程数 |
clickhouse实例上的全局线程池中运行任务的线程数。 |
Count |
60 |
number_of_threads_in_global_thread_pool |
全局线程池中线程数 |
clickhouse实例上的全局线程池中线程数。 |
Count |
60 |
number_of_threads_in_local_thread_pool |
本地线程池中的线程数 |
clickhouse实例上的本地线程池中的线程数。 |
Count |
60 |
number_of_threads_waiting_locked |
Context中等待加锁的线程数 |
clickhouse实例上的context中等待加锁的线程数。 |
Count |
60 |
number_of_threads_running_in_local_thread_pool |
本地线程池中运行任务的线程数 |
clickhouse实例上的本地线程池中运行任务的线程数。 |
Count |
60 |
number_of_tcp_connections |
TCP连接数 |
TCP协议连接个数。 |
Count |
60 |
number_of_http_connections |
HTTP连接数 |
HTTP协议连接个数。 |
Count |
60 |
number_of_databases |
数据库数量 |
每个节点数据库数量。 |
Count |
60 |
number_of_tables |
表数量 |
每个节点本地表数量。 |
Count |
60 |
write_size_per_second |
每秒写入大小 |
每个节点单位时间写入的数据量。 |
Byte |
60 |
number_of_running_queries |
运行Query个数 |
每个节点正在运行的查询个数。 |
Count |
60 |
number_of_query_threads |
Query线程数 |
每个节点正在运行的查询线程数。 |
Count |
60 |
number_of_distributed_ddls |
分布式DDL个数 |
分布式DDL语句的个数。 |
Count |
60 |
number_of_distributed_table_files |
分布式表文件个数 |
向分布式表写数据时待插入数据的文件个数。 |
Count |
60 |
number_of_concurrency |
ClickHouse各节点并发度 |
当前ClickHouse各节点的并发度。 |
Count |
60 |
zookeeper_quota_percentage |
ZooKeeper数量配额百分比 |
ClickHouse服务在ZooKeeper上目录的数量配额使用百分比。 |
% |
60 |
zookeeper_process_is_alive |
zookeeper进程存活 |
zookeeper心跳检查,1表示正常,0表示异常。 |
- |
60 |
number_of_global_sessions |
全局session个数 |
当前全局的session个数。 |
Count |
60 |
number_of_rejected_connections |
拒绝链接个数 |
zookeeper拒绝链接的个数。 |
Count |
60 |
number_of_request_submission_queues |
请求提交队列个数 |
请求提交队列个数。 |
Count |
60 |
waiting_time_of_the_preprocessing_queue |
预处理队列等待时间 |
预处理队列等待时间。 |
s |
60 |
number_of_zk_watches |
ZK_watch 个数 |
当前时间 ZK_watch 个数。 |
Count |
60 |
zk_heapmemory_usage |
ZooKeeper使用的堆内存大小 |
ZooKeeper使用的堆内存大小。 |
Byte |
60 |
zk_directmemory_usage |
ZooKeeper使用的直接内存 |
ZooKeeper使用的直接内存。 |
Byte |
60 |
zk_heapmemory_usage_ratio |
ZooKeeper堆内存使用率 |
ZooKeeper堆内存使用百分比统计。 |
% |
60 |
zk_directmemory_usage_ratio |
ZooKeeper直接内存使用率 |
ZooKeeper直接内存使用百分比统计。 |
% |
60 |
cluster_number_of_sent_packets |
zookeeper发包个数 |
zookeeper 节点发送的 packet 个数。 |
Count |
60 |
cluster_number_of_received_packets |
zookeeper收包个数 |
zookeeper 节点接收的 packet 个数。 |
Count |
60 |
cluster_preprocessing_time |
预处理时间 |
单位时间内预处理时间。 |
s |
60 |
rows_written_per_second |
每秒写入行数 |
每个节点单位时间写入的行数。 |
Count |
60 |
number_of_failed_queries |
失败Query个数 |
失败的query语句个数。 |
Count |
60 |
number_of_failed_insert_queries |
失败Insert Query个数 |
失败的插入语句个数。 |
Count |
60 |
number_of_failed_select_query_messages |
失败Select Query个数 |
失败的select语句个数。 |
Count |
60 |
number_of_delayed_inserts |
delayed inserts个数 |
每个节点延迟插入个数。 |
Count |
60 |
number_of_rows |
字段数量 |
每个节点mergetree引擎字段数量。 |
Count |
60 |
disk_throughput_read_rate |
磁盘吞吐读速率 |
磁盘读取吞吐速率。 |
Byte |
60 |
disk_throughput_write_rate |
磁盘吞吐写速率 |
磁盘写入吞吐速率。 |
Byte |
60 |
cmdForUsedStorageRate |
已用存储空间比率 |
统计测量对象所在集群的已用存储空间大小占总配额的比率。 |
% |
60 |
维度
Key |
Value |
---|---|
cluster_id |
CloudTable集群ID。 |
instance_name |
CloudTable集群节点名称。 |