更新时间:2026-06-11 GMT+08:00
分享

查询表数据

前提条件

在Spark中使用Iceberg前,需先配置Spark目录,spark_catalog和prod目录配置请参见Iceberg Catalog配置。Iceberg基于Apache Spark的DataSourceV2 API实现数据源和目录功能。

约束与限制

MRS 3.6.0.1及之后版本,使用Spark查询Iceberg表数据不支持矢量读操作。

查询表数据

在Spark中,表的标识符需包含目录名称。查询表数据操作为:

创建表,例如:

CREATE TABLE prod.db.table (id bigint, data string, category string, ts timestamp, shard int) USING iceberg PARTITIONED BY (category);
  • 查询表数据:
    SELECT * FROM prod.db.table; 
  • 对于历史记录、snapshots快照等元数据表,可将Iceberg表名作为命名空间来访问,例如:
    SELECT * FROM prod.db.table.snapshots;

相关文档