更新时间:2026-01-06 GMT+08:00
分享

Doris内核3.0.6版本能力地图

本章节介绍CloudTable Doris 3.0.6版本存算分离支持的内核特性,请参见表1表2

  • 使用说明介绍:
    • 可以使用:经过产品团队质量加固和充分测试。
    • 受限使用:需要客户基于业务场景在测试环境进行充分测试后,确保业务稳定运行后可在生产环境中使用。
    • 不建议使用:社区能力不够成熟,存在一些可靠性问题。不建议使用的特性,可参考表2 不建议使用特性列表中的“使用建议”。
  • 能力说明:
    • 自研:由产品团队自研的易用性、性能、DFX等内核引擎特性,如缓存加速优化、checkpointer优化。
    • 质量加固:产品团队基于社区开源能力,对已知bug和客户的需求,进行质量加固和充分测试。
    • 纯开源:能力和开源社区版本能力保持一致,未进行质量加固。
表1 使用特性列表

一级特性

二级特性

三级特性

使用说明

使用建议

数据表设计

数据划分

表索引

可以使用

-

表分桶

可以使用

-

表分区

受限使用

建议使用的动态分区类型包括:dynamic partition、range分区、list分区和手动分区。

不建议使用auto partition进行自动分区,因为该方法存在一些社区尚未解决的问题,且其数据划分不够合理。

数据类型

基本字段类型

可以使用

-

复合字段类型

受限使用

建议使用variant类型。

压缩算法

可以使用

-

数据模型

Duplicate明细模型

可以使用

-

Unique主键模型

可以使用

-

Aggregate聚合模型

可以使用

-

同步物化视图

可以使用

-

异步物化视图

受限使用

多表物化视图在存算分离版本中仍存在许多未修复的开源问题,包括新增的多表物化视图透明改写能力的增强,该功能目前仍受限使用。

数据操作

DML

表数据的增删改查操作

可以使用

-

Load类型任务管理

可以使用

-

DDL

数据库表索引视图的增删改查

可以使用

-

函数

可以使用

-

资源管理

可以使用

-

SQL函数

自有函数

可以使用

-

自定义UDF

可以使用

-

辅助命令

HELP命令

可以使用

-

Show命令

可以使用

-

数据导入

Stream Load

可以使用

-

Broker Load

可以使用

-

Routine Load

受限使用

推荐使用flink导入,从Kafka导入数据。

使用限制:安全模式不支持kafka。

Insert into select

可以使用

-

Insert into values

可以使用

-

数据导出

数据导出export

可以使用

-

查询结果集导出insert into outfile

可以使用

-

数据更新及删除

主键模型表中的Sequence列

可以使用

-

主键模型表中的Upsert

可以使用

-

Load任务中数据的批量删除和更新

可以使用

-

湖仓能力

多源Catalog

Hive Catalog

可以使用

-

Hudi Catalog

可以使用

-

Paimon

受限使用

未进行任何质量加固,且开源存在较多未解决问题,建议充分测试后投产使用。

Iceberg

受限使用

未进行任何质量加固,且开源存在较多未解决问题,建议充分测试后投产使用。

JDBC Catalog

受限使用

可以使用经过质量加固的MySQL、PostgreSQL类型的JDBC目录,其他JDBC类型建议充分测试后投产使用。

Connector

Flink Connector

可以使用

-

Spark Connector

受限使用

不支持date/datetime类型以及复合类型的查询,其他基础类型均支持。

资源负载能力

compaction

base compaction、cumulative compaction、vertical compaction

可以使用

-

慢查询/审计日志表

-

可以使用

-

数据负载均衡

-

可以使用

-

多租户与资源隔离

Workload Group

受限使用

推荐Compute Group。

Compute Group

可以使用

-

原生页面

原生UI

-

受限使用

建议在调试,运维场景使用,禁止用于生产业务。

3.0.x新增变化

存算分离

新增FDB和MetaService服务

可以使用

-

Storage Vault管理及应用

可以使用

-

Compute Group计算组管理及应用

可以使用

-

湖仓一体

外部表SQL拦截

受限使用

SQL拦截功能(SQL Block Rule)现在支持外部表。

数据操作

半结构化Variant读写

受限使用

使用Variant分析Json数据仍存在许多未解决的开源问题。对于固定格式的Json,且字段类型为基本类型、非超长数据的表格,可以受限使用。除此之外,不建议使用。

倒排索引增强,增加了对Array类型的支持

可以使用

-

新增函数

可以使用

-

其他

函数类

受限使用

支持Java UDTF。

资源隔离

可以使用

-

自研增强

慢查询

-

可以使用

-

审计日志表

-

可以使用

-

checkpointer优化

-

可以使用

-

存算分离优化

短路径下推性能加速

可以使用

-

Cache缓存命中度提升

可以使用

-

存算分离缓存盘均衡及健康检测

可以使用

-

安全可靠性

通信链路通道加密

可以使用

-

支持UDF标准路径及沙箱策略

可以使用

-

Doris元数据容错加载

可以使用

-

审计日志

入库任务审计能力增强

可以使用

-

表2 不建议使用特性列表

一级特性

二级特性

三级特性

使用说明

使用建议

数据表设计

数据模型

外表物化视图

不建议使用

例如对hive外表的物化视图,存在诸多开源BUG和受限操作,能力不完善。

数据操作

数据导入

MySQL Load

不建议使用

推荐Stream Load

备份恢复和迁移

Backup & restore

不支持

备份恢复和迁移仅支持存算一体架构。

CCR集群间数据同步

不支持

CCR集群间数据同步仅支持存算一体架构。

高并发导入优化

Group Commit

不建议使用

高并发导入Group Commit功能在Doris 3.0.x版本中不稳定,不建议使用该功能。

资源负载能力

Arrow Flight

-

不建议使用

Doris 2.1版本引入了高性能的新接口,目前仅进行了安全加固。然而,社区中存在较多未解决的问题,因此,非必要不建议使用。

冷热分离

-

不支持

冷热分离是存算一体架构下降低存储成本的方案,存算分离架构不涉及。

多租户与资源隔离

Resource Group

不建议使用

推荐Compute Group。

湖仓能力

湖仓一体

数据回写数据湖功能

不建议使用

Doris 3.0.6版本增加了Hive、Iceberg数据回写功能、Insert Overwrite支持Iceberg表不成熟,且开源存在诸多限制和问题。

新增多种数据源连接器connector

不建议使用

Delta Lake、Kudu、BigQuery、Kafka等多种Connector的适配不成熟,开源存在诸多限制和问题。

ES Catalog

不建议使用

支持ES Catalog,将Elasticsearch中的nested或object类型映射为Doris的JSON类型。在ES外部源场景中,由于开源字段类型映射不全,仍存在较多未解决的开源问题。

新增多种数据源Catalog

不建议使用

包括MaxCompute、Delta Lake、BigQuery、Kudu、Elasticsearch、JDBC、MySQL JDBC、PostgreSQL JDBC、Oracle JDBC、SQL Server JDBC、IBM Db2 JDBC、Clickhouse JDBC、SAP HANA JDBC、Oceanbase JDBC在内的多种场景,这些多为非主流场景,且开源社区中存在较多未解决的问题。

其他

显示事务(begin..commit..rollback)

不建议使用

显式事务支持对INSERT INTO SELECT、DELETE和UPDATE操作提供显式事务;显式多事务调用时,任务异常回滚的代价较高,且存在未解决的开源问题。

相关文档