应用场景
数据仓库迁移
数据仓库是企业的重要数据分析系统,随着业务量的增长,自建数仓性能逐渐不能满足实际要求,同时扩展性差、成本高,也使扩容极为困难。GaussDB(DWS)作为云上企业级数据仓库,具备高性能、低成本、易扩展等特性,满足大数据时代企业数据仓库业务诉求。
优势
大数据融合分析
随着信息技术的发展和进步,数据资源已经成为企业的核心资源。整合数据资源,构建大数据平台,发现数据价值,成为企业经营的新趋势和迫切诉求。而如何从海量数据中快速挖掘“价值”,成为助力用户实现预测性分析的关键要素。
优势
增强型ETL和实时BI分析
数据仓库在整个BI系统中起到了支柱的角色,更是海量数据收集、存储、分析的核心。为金融、教育、移动互联网、O2O(Online to Offline)等行业提供强大的商业决策分析支持。
优势
实时数据分析
移动互联网场景下会产生大量实时数据,为了快速获取数据价值,需要对数据进行实时分析,GaussDB(DWS)的快速入库和查询能力可支持实时数据分析。
优势
湖仓一体
- 无缝访问数据湖
- 对接Hive Metastore元数据管理,直接访问数据湖的数据表定义,无需用户创建外表,只需创建external schema即可。
- 支持主要数据格式:ORC,Parquet。
- 融合查询
- 混合查询数据湖和仓内的任意数据。
- 查询一步到位输出到仓内/数据湖,无需额外数据中转拷贝。
- 极致查询性能
- 使用数仓高质量的查询计划和高效的执行引擎。
- 使用数仓的负载管理手段,精准控制。
实时写入
提供H-Store存储引擎,微批数据存放在本地,周期合并到OBS存储,支持高吞吐实时写入与更新,同时支持大批量写入场景。
数据实时写入并经实时计算之后,可以用于实时大屏、实时分析、实时监控、实时风控、实时推荐。
多VW支持业务隔离和极致弹性(存算分离架构)
- 通过多VW实现业务的负载隔离,相比资源管理的软隔离,基于VW的虚拟机级别的硬隔离可以最大化的降低业务间的互相影响。
- 支持多经典VW和多弹性VW。
- 通过经典VW实现业务隔离:
- 根据业务需要,可部署多个VW,不同业务绑定不同的VW,经典VW允许建表。
- VW之间资源隔离,实现业务之间互不影响。
- VW之间数据实时共享。
- 固定VW的大小在MPP架构下决定了单SQL性能上限。
- 固定VW适合承载实时接入、实时加工等稳定负载/低时延作业,根据业务变化提前规划大小。
- 通过弹性VW实现并发扩展:
- VW在高并发场景下业务出现排队时,动态弹出弹性VW,弹性VW支持读写,不支持建表。
- 排队查询自动路由到弹性VW。
- 通过弹性VW,减少查询排队,提升业务整体并发度。
- 业务并发下降后,自动回收弹性VW。
- 弹性VW实现计算资源按需供给,用户设定弹性上限。
- 弹性VW规格与固定VW相同,在弹性VW上运行的SQL,性能与固定VW基本相同。
- 弹性VW按资源使用时长计费。
- 弹性VW适合承载突增、周期性的查询、加工负载。
比如:客户有多个业务部门,那么可以为每个业务部门绑定一个经典VW,实现不同业务之间的资源隔离,如果业务1使用一个3节点VW,业务2使用一个4节点VW。如果业务1,在每天的10:00-12:00有业务高峰,那么可以为业务1配置弹性VW,在高峰期弹出弹性VW,在高峰期过后销毁。