更新时间:2022-12-19 GMT+08:00

分布式环境的数据布局

技术背景

为了解决PB级海量数据的高性能查询和数据导入,DWS采用了两层数据布局机制来利用并发度提高性能:第一层,用户可在创建表时指定数据分布策略(Hash分布、复制分布),数据写入系统时根据对应的分布策略确定存储在哪一个节点上。第二层,节点内部数据进一步通过分区规则进行细分。