更新时间:2024-03-20 GMT+08:00
分享

DWS 3.0简介

GaussDB(DWS)全新推出云原生数仓DWS 3.0版本,利用云基础设施提供的资源池化和海量存储能力,结合MPP数据库技术,采用计算存储分离架构,实现了极致弹性、数据实时共享和湖仓一体等特性。

简介

云原生数仓DWS 3.0采用计算存储分离架构,解决了计算存储必须等比例缩放的问题。赋能用户面向业务峰谷时,对计算能力进行快速且独立的扩缩要求,同时保证存储无限扩展、按需付费,做到快速、敏捷的响应业务变化,同时具有更高的性价比,进一步助力企业降本增效。

DWS 3.0具有以下优势:

  • 湖仓一体:提供简单、易维护的湖仓一体体验,无缝对接DLI,支持元数据自动导入、外部表查询加速、内外表关联查询,支持数据湖格式读写,简化数据入湖入仓。
  • 极致弹性:计算资源快速伸缩,存储空间按需使用,同时大幅度降低存储成本。历史数据无需再迁移到其他存储介质上,让数据分析更简单,一站式解决金融、互联网等行业快速增长的数据分析需求。
  • 数据共享:一份数据承载多样负载,数据实时共享,多写多读的使用模式,在支持不同业务数据快速共享的同时,具备良好的计算资源隔离能力。

架构说明

图1 云原生3.0架构

  • Serverless云原生架构
    • 存算管的三层分离,计算存储资源独立、灵活、快速伸缩。
    • 高性价比满足用户变化多样的负载需求和严格的负载隔离要求。
  • 极致弹性
    • 多样的弹性方式逻辑集群(Virtual Warehouse)扩缩容。
    • 多逻辑集群间数据实时共享,一份数据承载多样负载,无需拷贝。
    • 通过逻辑集群实现吞吐/并发的线性提升,同时具备良好的读写分离、负载隔离能力。
  • 湖仓一体
    • 数据湖与数据仓库数据无缝混合查询。
    • 数据湖分析体验数仓的极致性能和精准管控度。

产品形态对比

表1 DWS 3.0与DWS 2.0差异

数仓类型

DWS 2.0

DWS 3.0

适用场景

融合分析业务,一体化OLAP分析场景。主要应用于金融、政企、电商、能源等领域。

融合分析,离线一体化OLAP分析场景。针对互联网场景进行了深度优化。

产品优势

性价比高。

支持冷热数据分析,存储、计算弹性伸缩。

成本低,并发高。

支持存算分离,存储按需使用,计算快速伸缩,无限算力、无限容量等。

支持数据共享,支持湖仓一体。

功能特点

支持海量数据离线处理和交互查询,数据规模大、复杂数据挖掘具有很好的性能优势。

支持实时分析、离线处理和交互查询,数据规模大、复杂数据挖掘具有很好的性能优势。

SQL语法

SQL语法兼容性高,语法通用,易于使用。

SQL语法兼容性高,语法通用,易于使用。

GUC参数

丰富的GUC参数,根据客户业务场景适配最适合客户的数仓环境。

丰富的GUC参数,根据客户业务场景适配最适合客户的数仓环境。

应用场景

  • 湖仓一体
    • 无缝访问数据湖
      • 对接Hive Metastore元数据管理,直接访问数据湖的数据表定义,无需用户创建外表,只需创建external schema即可。
      • 支持主要数据格式:ORC, Parquet。
    • 融合查询
      • 混合查询数据湖和仓内的任意数据。
      • 查询一步到位输出到仓内/数据湖,无需额外数据中转拷贝。
    • 极致查询性能
      • 使用数仓高质量的查询计划和高效的执行引擎。
      • 使用数仓的负载管理手段,精准控制。

  • 极致弹性

    计算资源快速伸缩,存储空间按需使用,同时大幅度降低存储成本。适用于稳态业务和敏态业务。

    • 提供两种弹性模式,既可以对当前集群进行扩缩容,也可以新增逻辑集群。
    • 快速对当前集群进行扩缩容,无需数据重分布、拷贝。
    • 新增逻辑集群可以提高并发和吞吐,也适用于把不同的业务绑定在不同的VW上,实现读写分离、负责隔离;适用于业务负载周期性变化的场景,比如,00:00-7:00跑批业务增加。
  • 数据共享

    一份数据承载多样负载,数据实时共享,支持不同业务数据快速共享。

    • 任意逻辑集群均可承载读写负载。
    • 多逻辑集群间共享数据,无需拷贝,数据在多逻辑集群间实时可见。
分享:

    相关文档

    相关产品