更新时间:2025-09-15 GMT+08:00
分享

Doris增强特性

向量化计算

向量化引擎是数据存储引擎使用到的查询技术,向量化(vectorize)操作是针对单独(individualize)操作的,借助CPU的矢量寄存器实现矢量计算,可以加速数据库的执行效率。在列存储与向量化执行引擎的双重优化下,查询执行的速度会有提升大约3-5倍。

列裁剪

列裁剪是指在查询时只读取需要的列,忽略其他不必要的列,以减少数据读取的开销。当查询一个包含大量字段的大表时,如果只关心其中的几个字段,可以通过列裁剪减少需要读取的数据量。这不仅减少了网络传输的开销,还减少了在内存和磁盘上的存储开销。此外,列裁剪还可以提高查询的响应速度,特别是在处理大规模数据时,能够显著提升查询性能。

Pipeline引擎优化

Pipeline执行引擎基于多核CPU的特点,重新设计由数据驱动的执行引擎,充分释放多核CPU的计算能力,并对Doris查询线程的数目进行限制,解决了Doris的执行线程膨胀问题。

相关文档