更新时间:2024-12-27 GMT+08:00
分享

Hudi

Hudi是一种数据湖的存储格式,在Hadoop文件系统之上提供了更新数据和删除数据的能力以及消费变化数据的能力。支持多种计算引擎,提供IUD接口,在HDFS的数据集上提供了插入更新和增量拉取的功能。

表1 支持类别

类别

详情

支持Flink表类型

源表、结果表

支持hudi表类型

MOR表,COW表

支持读写类型

批量读,批量写,流式读,流式写

相关文档