DWS 3.0简介
GaussDB(DWS)全新推出云原生数仓DWS 3.0版本,利用云基础设施提供的资源池化和海量存储能力,结合MPP数据库技术,采用计算存储分离架构,实现了极致弹性、数据实时共享和湖仓一体等特性。
简介
云原生数仓DWS 3.0采用计算存储分离架构,解决了计算存储必须等比例缩放的问题。赋能用户面向业务峰谷时,对计算能力进行快速且独立的扩缩要求,同时保证存储无限扩展、按需付费,做到快速、敏捷的响应业务变化,同时具有更高的性价比,进一步助力企业降本增效。
DWS 3.0具有以下优势:
- 湖仓一体:提供简单、易维护的湖仓一体体验,无缝对接DLI,支持元数据自动导入、外部表查询加速、内外表关联查询,支持数据湖格式读写,简化数据入湖入仓。
- 极致弹性:计算资源快速伸缩,存储空间按需使用,同时大幅度降低存储成本。历史数据无需再迁移到其他存储介质上,让数据分析更简单,一站式解决金融、互联网等行业快速增长的数据分析需求。
- 数据共享:一份数据承载多样负载,数据实时共享,多写多读的使用模式,在支持不同业务数据快速共享的同时,具备良好的计算资源隔离能力。
架构说明
- Serverless云原生架构
- 存算管的三层分离,计算存储资源独立、灵活、快速伸缩。
- 高性价比满足用户变化多样的负载需求和严格的负载隔离要求。
- 极致弹性
- 多样的弹性方式逻辑集群(Virtual Warehouse)扩缩容。
- 多逻辑集群间数据实时共享,一份数据承载多样负载,无需拷贝。
- 通过逻辑集群实现吞吐/并发的线性提升,同时具备良好的读写分离、负载隔离能力。
- 湖仓一体
- 数据湖与数据仓库数据无缝混合查询。
- 数据湖分析体验数仓的极致性能和精准管控度。
产品形态对比
数仓类型 |
DWS 2.0 |
DWS 3.0 |
||
---|---|---|---|---|
适用场景 |
融合分析业务,一体化OLAP分析场景。主要应用于金融、政企、电商、能源等领域。 |
融合分析,离线一体化OLAP分析场景。针对互联网场景进行了深度优化。 |
||
产品优势 |
性价比高。 支持冷热数据分析,存储、计算弹性伸缩。 |
成本低,并发高。 支持存算分离,存储按需使用,计算快速伸缩,无限算力、无限容量等。 支持数据共享,支持湖仓一体。 |
||
功能特点 |
支持海量数据离线处理和交互查询,数据规模大、复杂数据挖掘具有很好的性能优势。 |
支持实时分析、离线处理和交互查询,数据规模大、复杂数据挖掘具有很好的性能优势。 |
||
SQL语法 |
SQL语法兼容性高,语法通用,易于使用。 |
SQL语法兼容性高,语法通用,易于使用。 |
||
GUC参数 |
丰富的GUC参数,根据客户业务场景适配最适合客户的数仓环境。 |
丰富的GUC参数,根据客户业务场景适配最适合客户的数仓环境。 |
应用场景
- 湖仓一体
- 无缝访问数据湖
- 对接Hive Metastore元数据管理,直接访问数据湖的数据表定义,无需用户创建外表,只需创建external schema即可。
- 支持主要数据格式:ORC, Parquet。
- 融合查询
- 混合查询数据湖和仓内的任意数据。
- 查询一步到位输出到仓内/数据湖,无需额外数据中转拷贝。
- 极致查询性能
- 使用数仓高质量的查询计划和高效的执行引擎。
- 使用数仓的负载管理手段,精准控制。
- 无缝访问数据湖
- 极致弹性
计算资源快速伸缩,存储空间按需使用,同时大幅度降低存储成本。适用于稳态业务和敏态业务。
- 提供两种弹性模式,既可以对当前集群进行扩缩容,也可以新增逻辑集群。
- 快速对当前集群进行扩缩容,无需数据重分布、拷贝。
- 新增逻辑集群可以提高并发和吞吐,也适用于把不同的业务绑定在不同的VW上,实现读写分离、负责隔离;适用于业务负载周期性变化的场景,比如,00:00-7:00跑批业务增加。
- 数据共享
一份数据承载多样负载,数据实时共享,支持不同业务数据快速共享。
- 任意逻辑集群均可承载读写负载。
- 多逻辑集群间共享数据,无需拷贝,数据在多逻辑集群间实时可见。