ClickHouse集群监控指标说明
功能说明
监控是保持CloudTable服务可靠性、可用性和性能的重要部分,通过监控,用户可以观察CloudTable服务器的运行状态。本章节定义了表格存储服务上报云监控服务的监控指标的命名空间、监控指标列表和维度定义。
命名空间
SYS.CloudTable
ClickHouse监控指标
指标名称 | 显示名 | 含义 | 取值范围 | 指标单位 | 进制 | 测量对象(维度) | 监控周期 |
|---|---|---|---|---|---|---|---|
cmdProcessCPU | CPU使用率 | 统计测量对象的CPU使用率。 | 0~100 | % | 不涉及 | CloudTable实例节点 | 60s |
memory_usage | 内存使用量 | 每个节点的内存使用量。 | [0, 节点内存容量] | MiB | 1024(IEC) | CloudTable实例节点 | 60s |
cmdProcessMem | 内存使用率 | 统计测量对象的内存使用率。 | 0~100 | % | 不涉及 | CloudTable实例节点 | 60s |
disk_usage | 磁盘使用量 | 每个节点的磁盘使用量。 | [0, 节点磁盘容量] | MiB | 1024(IEC) | CloudTable实例节点 | 60s |
cmdForUsedStorageRate | 已用存储空间比率 | 统计测量对象所在集群的已用存储空间大小占总配额的比率。 | >=0 | % | 不涉及 | CloudTable实例节点 | 60s |
network_throughput_inbound_rate | 网络吞吐流入速率 | 每个节点每秒的网络流入数据量。 | >=0 | KiB/s | 1024(IEC) | CloudTable实例节点 | 60s |
network_throughput_outgoing_rate | 网络吞吐流出速率 | 每个节点每秒的网络流出数据量。 | >=0 | KiB/s | 1024(IEC) | CloudTable实例节点 | 60s |
number_of_mutations | Mutation个数 | 每个节点正在运行的修改任务数。 | >=0 | Count | 不涉及 | CloudTable实例节点 | 60s |
number_of_run_merges | 运行Merge个数 | 正在运行的合并任务个数。 | >=0 | Count | 不涉及 | CloudTable实例节点 | 60s |
number_of_merges_thread | Merge中线程个数 | 正在合并中的线程数量。 | [0, cpu核数] | Count | 不涉及 | CloudTable实例节点 | 60s |
number_of_zookeeper_requests | ZK请求数 | 当前时间节点请求ZK的请求数。 | >=0 | Count | 不涉及 | CloudTable实例节点 | 60s |
number_of_zk_session | ZK的session个数 | 当前时间节点链接ZK的session个数。 | >=0 | Count | 不涉及 | CloudTable实例节点 | 60s |
number_of_zookeeper_watches | ZK watch个数 | 当前时间节点链接ZK watch个数。 | >=0 | Count | 不涉及 | CloudTable实例节点 | 60s |
number_of_zookeeper_nodes | Zookeeper中节点数 | Zookeeper中创建临时的节点数。 | >=0 | Count | 不涉及 | CloudTable实例节点 | 60s |
number_of_parts | part数量 | part数量。 | >=0 | Count | 不涉及 | CloudTable实例节点 | 60s |
number_of_threads_holding_read_locks | 持有读锁的线程数 | 持有读锁的线程数。 | >=0 | Count | 不涉及 | CloudTable实例节点 | 60s |
number_of_threads_waiting_to_be_read | 等待读的线程数 | 等待读的线程数。 | >=0 | Count | 不涉及 | CloudTable实例节点 | 60s |
number_of_threads_waiting_to_be_written | 等待写的线程数 | 等待写的线程数。 | >=0 | Count | 不涉及 | CloudTable实例节点 | 60s |
number_of_threads_holding_write_locks | 持有写锁的线程数 | 持有写锁的线程数。 | >=0 | Count | 不涉及 | CloudTable实例节点 | 60s |
maximum_number_of_active_blocks | 最大活跃分块数 | clickhouse实例最大的活跃分块个数。 | >=0 | Count | 不涉及 | CloudTable实例节点 | 60s |
number_of_consistency_checkdata_blocks | 一致性校验数据分块数 | clickhouse实例一致性校验数据分块个数。 | >=0 | Count | 不涉及 | CloudTable实例节点 | 60s |
extracting_the_number_of_data_chunks_from_the_replica | 正在从副本中提取数据分块数 | clickhouse实例正在从副本中提取的数据分块个数。 | >=0 | Count | 不涉及 | CloudTable实例节点 | 60s |
number_of_data_chunks_being_sent_to_the_replica | 正在发送到副本的数据分块数 | clickhouse实例正在发送到副本的数据分块个数。 | >=0 | Count | 不涉及 | CloudTable实例节点 | 60s |
number_of_readonly_replicas | 只读副本个数 | 此指标反映了clickhouse实例中只读副本数。 | >=0 | Count | 不涉及 | CloudTable实例节点 | 60s |
number_of_inserted_into_all_tables | 插入行数 | clickhouse实例中所有表插入行数。 | >=0 | Count | 不涉及 | CloudTable实例节点 | 60s |
number_of_open_read_files | 读文件打开数 | clickhouse实例上的读文件打开数。 | >=0 | Count | 不涉及 | CloudTable实例节点 | 60s |
number_of_open_write_files | 写文件打开数 | clickhouse实例上的写文件打开数。 | >=0 | Count | 不涉及 | CloudTable实例节点 | 60s |
total_file_opens | 文件打开总数 | clickhouse实例上的文件打开数。 | >=0 | Count | 不涉及 | CloudTable实例节点 | 60s |
number_of_read_file_descriptors | 文件描述符读个数 | 文件描述符读个数。 | >=0 | Count | 不涉及 | CloudTable实例节点 | 60s |
number_of_written_file_descriptors | 文件描述符写个数 | 文件描述符写个数。 | >=0 | Count | 不涉及 | CloudTable实例节点 | 60s |
instance_process_running_duration | 实例进程运行时长 | clickhouse实例进程运行时长。 | >=0 | s | 不涉及 | CloudTable实例节点 | 60s |
number_of_threads_running_in_global_thread_pool | 全局线程池中运行任务的线程数 | clickhouse实例上的全局线程池中运行任务的线程数。 | >=0 | Count | 不涉及 | CloudTable实例节点 | 60s |
number_of_threads_in_global_thread_pool | 全局线程池中线程数 | clickhouse实例上的全局线程池中线程数。 | >=0 | Count | 不涉及 | CloudTable实例节点 | 60s |
number_of_threads_in_local_thread_pool | 本地线程池中的线程数 | clickhouse实例上的本地线程池中的线程数。 | >=0 | Count | 不涉及 | CloudTable实例节点 | 60s |
number_of_threads_waiting_locked | Context中等待加锁的线程数 | clickhouse实例上的context中等待加锁的线程数。 | >=0 | Count | 不涉及 | CloudTable实例节点 | 60s |
number_of_threads_running_in_local_thread_pool | 本地线程池中运行任务的线程数 | clickhouse实例上的本地线程池中运行任务的线程数。 | >=0 | Count | 不涉及 | CloudTable实例节点 | 60s |
number_of_tcp_connections | TCP连接数 | TCP协议连接个数。 | [0,4096] | Count | 不涉及 | CloudTable实例节点 | 60s |
number_of_http_connections | HTTP连接数 | HTTP协议连接个数。 | [0,4096] | Count | 不涉及 | CloudTable实例节点 | 60s |
number_of_databases | 数据库数量 | 每个节点数据库数量。 | [0, 5000] | Count | 不涉及 | CloudTable实例节点 | 60s |
number_of_tables | 表数量 | 每个节点本地表数量。 | [0, 5000] | Count | 不涉及 | CloudTable实例节点 | 60s |
write_size_per_second | 每秒写入大小 | 每个节点单位时间写入的数据量。 | >=0 | Byte、KiB、MiB、GiB、TiB、PiB | 1024(IEC) | CloudTable实例节点 | 60s |
number_of_running_queries | 运行Query个数 | 每个节点正在运行的查询个数。 | >=0 | Count | 不涉及 | CloudTable实例节点 | 60s |
number_of_query_threads | Query线程数 | 每个节点正在运行的查询线程数。 | >=0 | Count | 不涉及 | CloudTable实例节点 | 60s |
number_of_distributed_ddls | 分布式DDL个数 | 分布式DDL语句的个数。 | >=0 | Count | 不涉及 | CloudTable实例节点 | 60s |
number_of_distributed_table_files | 分布式表文件个数 | 向分布式表写数据时待插入数据的文件个数。 | >=0 | Count | 不涉及 | CloudTable实例节点 | 60s |
number_of_concurrency | ClickHouse各节点并发度 | 当前ClickHouse各节点的并发度。 | [0,100] | Count | 不涉及 | CloudTable实例节点 | 60s |
zookeeper_quota_percentage | ZooKeeper数量配额百分比 | ClickHouse服务在ZooKeeper上目录的数量配额使用百分比。 | 0~100 | % | 不涉及 | CloudTable实例节点 | 60s |
zookeeper_capacity_quota_percentage | ZooKeeper容量配额百分比 | ClickHouse服务在ZooKeeper上目录的容量配额使用百分比。 | 0~100 | % | 不涉及 | CloudTable实例节点 | 60s |
zookeeper_process_is_alive | zookeeper进程存活 | zookeeper心跳检查,1表示正常,0表示异常。 | [0, 1] | Count | 不涉及 | CloudTable实例节点 | 60s |
number_of_global_sessions | 全局session个数 | 当前时间全局的session个数。 | >=0 | Count | 不涉及 | CloudTable实例节点 | 60s |
number_of_rejected_connections | 拒绝链接个数 | 单位时间内zookeeper拒绝链接的个数。 | >=0 | Count | 不涉及 | CloudTable实例节点 | 60s |
number_of_request_submission_queues | 请求提交队列个数 | 当前时间请求提交队列个数。 | >=0 | Count | 不涉及 | CloudTable实例节点 | 60s |
waiting_time_of_the_preprocessing_queue | 预处理队列等待时间 | 单位时间内预处理队列等待时间。 | >=0 | s | 不涉及 | CloudTable实例节点 | 60s |
number_of_zk_watches | ZK_watch个数 | 当前时间ZK_watch个数。 | >=0 | Count | 不涉及 | CloudTable实例节点 | 60s |
zk_heapmemory_usage | ZooKeeper使用的堆内存大小 | ZooKeeper使用的堆内存大小。 | >=0 | Byte、KiB、MiB、GiB、TiB、PiB | 1024(IEC) | CloudTable实例节点 | 60s |
zk_directmemory_usage | ZooKeeper使用的直接内存 | ZooKeeper使用的直接内存。 | >=0 | Byte、KiB、MiB、GiB、TiB、PiB | 1024(IEC) | CloudTable实例节点 | 60s |
zk_heapmemory_usage_ratio | ZooKeeper堆内存使用率 | ZooKeeper堆内存使用百分比统计。 | 0~100 | % | 不涉及 | CloudTable实例节点 | 60s |
zk_directmemory_usage_ratio | ZooKeeper直接内存使用率 | ZooKeeper直接内存使用百分比统计。 | 0~100 | % | 不涉及 | CloudTable实例节点 | 60s |
cluster_number_of_sent_packets | zookeeper发包个数 | zookeeper节点发送的packet个数。 | >=0 | Count | 不涉及 | CloudTable实例节点 | 60s |
cluster_number_of_received_packets | zookeeper收包个数 | zookeeper节点接收的packet个数。 | >=0 | Count | 不涉及 | CloudTable实例节点 | 60s |
cluster_preprocessing_time | 预处理时间 | 单位时间内预处理时间。 | >=0 | s | 不涉及 | CloudTable实例节点 | 60s |
rows_written_per_second | 每秒写入行数 | 每个节点单位时间写入的行数。 | >=0 | Count | 不涉及 | CloudTable实例节点 | 60s |
number_of_failed_queries | 失败Query个数 | 失败的query语句个数。 | >=0 | Count | 不涉及 | CloudTable实例节点 | 60s |
number_of_failed_insert_queries | 失败Insert Query个数 | 失败的插入语句个数。 | >=0 | Count | 不涉及 | CloudTable实例节点 | 60s |
number_of_failed_select_query_messages | 失败Select Query个数 | 失败的select语句个数。 | >=0 | Count | 不涉及 | CloudTable实例节点 | 60s |
number_of_delayed_inserts | delayed inserts个数 | 每个节点延迟插入个数。 | >=0 | Count | 不涉及 | CloudTable实例节点 | 60s |
number_of_rows | 字段数量 | 每个节点mergetree引擎字段数量。 | >=0 | Count | 不涉及 | CloudTable实例节点 | 60s |
disk_throughput_read_rate | 磁盘吞吐读速率 | 磁盘读取吞吐速率。 | >=0 | Byte/s、KiB/s、MiB/s、GiB/s、TiB/s、PiB/s | 1024(IEC) | CloudTable实例节点 | 60s |
disk_throughput_write_rate | 磁盘吞吐写速率 | 磁盘写入吞吐速率。 | >=0 | Byte/s、KiB/s、MiB/s、GiB/s、TiB/s、PiB/s | 1024(IEC) | CloudTable实例节点 | 60s |
capacity_standard | 冷存储用量 | 该指标用于统计冷存储数据所占用的存储空间容量。 | >=0 | Bytes | 1024(IEC) | CloudTable实例节点 | 1800s |
standard_request_upload_bandwidths | 冷存储平均上传带宽 | 当前统计周期内冷存储所有PUT、POST类平均每秒上传对象大小总和。 | >=0 | Byte/s | 1024(IEC) | CloudTable实例节点 | 60s |
standard_request_download_bandwidths | 冷存储平均下载带宽 | 当前统计周期内冷存储所有GET类平均每秒下载对象大小总和。 | >=0 | Byte/s | 1024(IEC) | CloudTable实例节点 | 60s |
维度
Key | Value |
|---|---|
cluster_id | CloudTable集群ID。 该取值的获取方式:进入集群管理页面,单击“集群名称 > 详情”,进入“详情”页,在“集群信息 ”模块中获取集群ID。 |
instance_name | CloudTable集群节点名称。 该取值的获取方式:进入集群管理页面,单击“集群名称 > 详情”,进入“详情”页获取instance_name。 |

