文档首页> 数据仓库服务 GaussDB(DWS)> 技术白皮书> DWS核心技术> 全并行的数据查询处理

更新时间：2023-09-15 GMT+08:00

查看PDF

全并行的数据查询处理

功能描述

全并行的分布式查询处理是DWS中最核心的技术，它可以最大限度的降低查询时节点之间的数据流动，以提升查询效率。

DWS为达成高性能数据分析目标，实现了一套高性能的分布式执行引擎，执行引擎以SQL引擎生成的执行计划为输入，将元组按执行计划的要求进行加工并将结果返回给客户端。

技术原理

图1展示了DWS的全并行分布式查询技术。

图1 分布式查询示意图
点击放大

点击放大

运行在CN上的分布式执行引擎实现了分布式执行调度的功能。
节点内引入新的执行算子来支撑数据在计算节点之间的流动，这些新的执行算子称其为数据流操作符，根据数据流的输入、输出关系，可以细分为聚合流（Gather）、广播流（Broadcast）和重分布流（Redistribution）。聚合流将数据从多个查询片段聚合到一个。广播流将数据从一个查询片段的数据向多个传输。重分布流则将多个查询片段的数据，按照一定规则重组后向多个传输。
跨计算节点的数据传输依赖于查询分析阶段根据数据分布以及代价模型构建的数据流动拓扑结构，并根据此结构来建立节点之间的网络连接，驱动数据流动于此拓扑结构之上。

父主题： DWS核心技术

上一篇：数据并行导入

下一篇：向量化执行和行列混合引擎

相关文档

相关产品

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！您可在我的云声建议查看反馈及问题处理状态。

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

直接提交取消

如您有其它疑问，您也可以通过华为云社区问答频道来与我们联系探讨

智能客服提问云社区提问