更新时间:2026-06-04 GMT+08:00
分享

StarRocks内核3.3.18版本能力地图

本章节介绍CloudTable StarRocks 3.3.18版本支持的内核特性,请参见表1表2

  • 使用说明介绍:
    • 可以使用:经过产品团队质量加固和充分测试。
    • 受限使用:需要客户基于业务场景在测试环境进行充分测试后,确保业务稳定运行后可在生产环境中使用。
    • 不建议使用:社区能力不够成熟,存在一些可靠性问题。不建议使用的特性,可参考表2中的“使用建议”。
  • 能力说明:
    • 自研:由产品团队自研的易用性、性能、DFX等内核引擎特性。
    • 质量加固:产品团队基于社区开源能力,对已知问题和客户的需求,进行质量加固和充分测试。
    • 纯开源:能力和开源社区版本能力保持一致,未进行质量加固。
表1 使用特性列表

一级特性

二级特性

三级特性

使用说明

使用建议

数据表设计

数据划分

表索引

可以使用

支持前缀索引与排序键、倒排索引、BloomFilter 索引、N-Gram 索引。

表分桶

可以使用

-

表分区

可以使用

支持使用的动态分区类型包括:dynamic partition、range分区、list分区和手动分区。

数据类型

基本字段类型

可以使用

-

复合字段类型

受限使用

建议使用Array、JSON、MAP和Struct类型。

压缩算法

可以使用

内表自带压缩算法LZ4、ZSTD。

数据模型

Duplicate明细模型

可以使用

-

Unique主键模型

可以使用

-

Aggregate聚合模型

可以使用

-

同步物化视图

可以使用

-

异步物化视图

受限使用

-

数据操作

DML

表数据的增删改查操作

可以使用

-

Load类型任务管理

可以使用

-

DDL

数据库表索引视图的增删改查

可以使用

-

函数

可以使用

-

资源管理

可以使用

-

SQL函数

自有函数

可以使用

-

自定义UDF

受限使用

联系技术支持后台上传自定义UDF。

辅助命令

HELP命令

可以使用

-

Show命令

可以使用

-

数据导入

Stream Load

可以使用

-

Broker Load

可以使用

支持导入HDFS、OBS数据。

Routine Load

受限使用

推荐使用Flink导入,从Kafka导入数据。

使用限制:安全模式不支持从Kafka导入数据。

Insert into select

可以使用

-

Insert into values

可以使用

-

数据导出

数据导出(export)

可以使用

-

主键模型表中的Upsert

可以使用

Upsert操作即为主键表正常写入,覆盖旧的数据。

Load任务中数据的批量删除和更新

可以使用

-

湖仓能力

多源Catalog

Hive Catalog

可以使用

-

Hudi Catalog

受限使用

StarRocks当前版本不支持查询Hudi mor多级分区表。

Paimon

受限使用

-

Iceberg

受限使用

未进行任何质量加固,且开源存在较多未解决问题,建议充分测试后投产使用。

JDBC Catalog

受限使用

可以使用经过质量加固的MySQL类型的JDBC Catalog,其他JDBC类型建议充分测试后投产使用。

Connector

Flink Connector

受限使用

推荐使用开源的starrocks-flink-connector,且建议充分测试后投产使用。

Spark Connector

受限使用

推荐使用开源的starrocks-spark-connector,且建议充分测试后投产使用。

资源负载能力

compaction

base compaction、cumulative compaction、vertical compaction

可以使用

-

数据负载均衡

-

可以使用

-

多租户与资源隔离

Resource Group

可以使用

-

原生页面

原生UI

-

受限使用

建议在调试、运维场景使用,禁止用于生产业务。

自研增强

升级JDK 21

-

可以使用

-

慢查询

-

可以使用

-

大SQL防御

-

可以使用

-

备份恢复

-

可以使用

-

审计日志表

-

可以使用

-

安全可靠性

-

可以使用

-

表2 不建议使用特性列表

一级特性

二级特性

三级特性

使用说明

使用建议

数据表设计

数据划分

表分区

不建议使用

自动分区Auto Partition存在一些开源未解决问题,且往往自动分区得到的数据划分不合理。

数据模型

外表物化视图

不建议使用

例如对Hive外表的物化视图,存在诸多开源问题和受限操作,能力不完善。

数据操作

数据导入

MySQL Load

不建议使用

推荐Stream Load。

MySQL Load仅针对小数据量导入操作,如果数据量不可预估则很容易出现异常,因此不建议使用此功能。

数据导出

SELECT INTO OUTFILE

不支持

-

资源负载能力

冷热分离

-

不支持

-

湖仓能力

湖仓一体

数据回写数据湖功能

不建议使用

增加了Hive、Iceberg数据回写功能、Insert Overwrite支持Iceberg表不成熟,且开源存在诸多限制和问题。

新增多种数据源连接器Connector

不建议使用

Delta Lake、Kudu、BigQuery、Kafka、TPCH、TPCDS等多种Connector的适配不成熟,开源存在诸多限制和问题。

Elasticsearch Catalog

不建议使用

支持Elasticsearch Catalog,将Elasticsearch中的nested或object类型映射为Doris的JSON类型。在Elasticsearch外部源场景中,由于开源字段类型映射不全,仍存在较多未解决的开源问题。

新增多种数据源Catalog

不建议使用

包括MaxCompute、Delta Lake、BigQuery、Kudu、Elasticsearch、JDBC、MySQL JDBC、PostgreSQL JDBC、Oracle JDBC、SQL Server JDBC、IBM DB2 JDBC、ClickHouse JDBC、SAP HANA JDBC、Oceanbase JDBC、Kudu Catalog在内的多种场景,这些多为非主流场景,且开源社区中存在较多未解决的问题。

外部表

不支持

对于查询Hive、Iceberg、Hudi 数据源的场景,推荐使用Catalog。

对于查询MySQL、PostgreSQL、Oracle和SQLServer的场景推荐使用JDBC catalog。

相关文档