更新时间:2025-09-15 GMT+08:00
分享

ClickHouse增强特性

MPP并行查询

一个任务下发到集群,所有节点会并行查询,多副本并行协调计算,节点内CPU多核并行计算,无依赖算子间并行计算。

列存储

相同类型数据单独一列存储,从多列中获取分析很少的列,对于分析型请求非常高效。

向量化执行

相比于传统火山模型中的逐行处理模式,向量化执行引擎采用批量处理模式,可以大幅减少函数调用开销,降低指令、数据的Cache Miss,提升 CPU利用效率。

编码压缩

ClickHouse采用列存储,相同列的数据连续存储,且底层数据在存储时是经过排序使得数据的局部规律性非常强,有利于获得更高的数据压缩比。在一些场景中,ClickHouse通常可以达到10:1的压缩比,大幅降低存储成本。同时,超高的压缩比又可以降低存储读取开销、提升系统缓存能力,从而提高查询性能

多索引技术

ClickHouse支持分区、主键及二级索引,二级索引类型丰富,在列裁剪优化的基础上,横向上再次对表记录进行切分,使用索引可以定位到所需数据块记录,进一步提升查询性能。

物化视图

对于针对高频查询模式,建立少量的物化视图,消耗可接受的计算、存储资源,进一步换取查询性能。

相关文档