更新时间:2024-11-29 GMT+08:00

CLEAN

命令功能

用于根据配置对Timeline上的Instant进行clean,删除老旧的历史版本文件,以减少hudi表的数据存储及读写压力。

命令格式

RUN CLEAN ON tableIdentifier;

RUN CLEAN ON tablelocation;

参数描述

表1 参数描述

参数

描述

tableIdentifier

Hudi表的名称

tablelocation

Hudi表的存储路径

示例

run clean on h1;
run clean on "/tmp/hudi/h1";

注意事项

对表执行clean操作时需要表的owner才可以执行。

如果需要修改clean默认的参数,需要在执行前以set 方式设置好需要保留的commit数等参数

系统响应

可在driver日志和客户端中查看命令运行成功或失败。