更新时间:2025-07-18 GMT+08:00

DataArtsFabric SQL功能介绍

DataArtsFabric SQL介绍

DataArtsFabric SQL是一个全托管式数据平台,利用华为云基础设施提供的资源池化和海量存储能力,结合并行执行、元数据解耦、计算持久化分离架构,实现了极致弹性和湖仓一体等能力,提供先进软件及服务(SaaS)技术。全新的无服务器架构可以让您在使用SQL语言处理组织复杂业务时,无需管理基础架构。

DataArtsFabric SQL架构基于华为云DataArtsFabric平台,主要由服务接入层、计算层与存储层组成。平台实现了元数据服务、计算、缓存和存储的分层解耦和弹性,让每一层动态分配资源而不会影响另一层的性能或可用性。语句级别的弹性扩缩、高性能分布式分析引擎可帮助您在几秒钟内查询TB级别数据,在几分钟内查询PB级别数据。

DataArtsFabric SQL支持加工和分析Iceberg、ORC、Parquet等开放结构化数据格式,支持开放湖生态,让您可以在使用多个数据湖生态服务时共享同一份数据。

DataArtsFabric SQL积极拥抱Data+AI生态并提供了Python UDF特性,支持用户在SQL中直接运行Python脚本,使能一站式AI数据处理;

DataArtsFabric SQL提供可视化界面,并提供JDBC驱动,方便与现有应用和第三方工具交互。同时提供REST API接口和Python API接口,方便开发者使用熟悉的编程语言转换和管理数据。

产品架构图

图1 DataArtsFabric SQL产品架构图

功能介绍

下表介绍了DataArtsFabric SQL的关键功能。

表1 DataArtsFabric SQL产品功能

特性

特性及规格描述

支持标准SQL语法

基于ANSI标准SQL规范扩展,支持GBK、UTF-8、SQL ASCII以及Latin-1字符集。

DDL

支持SCHEMA、TABLE的Create/Alter/Drop/Show/Describe。

数据类型

支持smallint, int, bigint, float, double, numeric, timestamp, date, varchar, char, bool, binary, string。

应用程序接口

标准JDBC 4.0、Restful API、Python Connector API。

事务能力

支持分区级别事务能力,支持并发控制。

ICEBERG支持完整的事务能力。

多租户

不同租户通过不同的CN/DN隔离,CN/DN通过独占POD来进行隔离。

数据导入导出

数据导入通过INSERT INTO导入,导出也通过insert into。从外表导出外表,格式转换支持:Parquet/ORC -> Parquet/ORC。

弹性能力

支持两级弹性,资源池内根据查询特征秒级弹性计算单元(节点弹性速度秒级<2s),根据资源水位线触发额外计算资源扩缩容。

说明:

Beta特性,扩容操作需要通过管控面触发DataArtsFabric服务购买容器。

SMP

提供节点内SMP并行计算能力,充分利用多核CPU资源,默认开启query_dop。

向量化执行

向量化执行引擎,提升OLAP性能。

统计信息搜集

Analyze完成统计信息搜集,提升优化器评估精度,确保数据库性能稳定高效。

存储格式支持

支持PARQUET/ORC/Iceberg格式。

DML支持

支持Insert Into/Insert Overwrite。

分区表

PARQUET/ORC/Iceberg均支持分区表。

视图

支持视图。

用户自定义函数(UDF)

支持用户以自定义函数的方式扩展SQL并统一执行,当前编程语言仅支持Python。

弹性计算规模

单查询最大规模256 弹性计算节点。

细粒度访问控制

表元数据由LakeFormation管理,使用IAM权限管理,当前由Lakeformation负责整体的权限控制。