更新时间:2025-07-03 GMT+08:00
分享

确定表类型

表类型

优点

缺点

优选场景

mor

  • 写得快,增量数据写log文件。
  • 读得慢,读时合并log文件和parquet文件。
  • 需要定期执行表服务维护操作Compaction/Clean/Archive,否则mor表读的越来越慢。
  • spark/flink(migration实时任务)流场景,实时写入。
  • Spark微批场景(CDM迁移任务,DataArts Studio定时Spark任务),业务对写入性能有要求,小分钟级写入,比如5分钟内。

cow

  • 读得快,cow只有parquet文件。
  • 不需要做Compaction,只需要做Clean和Archive。

写得慢,写时合并增量数据和存量parquet文件。

  • Spark批场景(CDM迁移任务,DataArts Studio定时Spark任务), 业务对写入性能无要求,大分钟级写入,比如几十分钟到小时级。
  • insert overwrite场景。

相关文档