CLEANING
命令功能
对Hudi表进行cleaning操作,具体作用可以参考Hudi Clean操作说明章节。
命令格式
call run_clean(table=>'[table]', clean_policy=>'[clean_policy]', retain_commits=>'[retain_commits]', hours_retained=> '[hours_retained]', file_versions_retained=> '[file_versions_retained]');
参数描述
参数 |
描述 |
是否必填 |
---|---|---|
table |
需要查询表的表名,支持database.tablename格式 |
是 |
clean_policy |
清理老版本数据文件的策略,默认KEEP_LATEST_COMMITS |
否 |
retain_commits |
仅对KEEP_LATEST_COMMITS策略有效 |
否 |
hours_retained |
仅对KEEP_LATEST_BY_HOURS策略有效 |
否 |
file_version_retained |
仅对KEEP_LATEST_FILE_VERSIONS策略有效 |
否 |
示例
call run_clean(table => 'hudi_table1');
call run_clean(table => 'hudi_table1', retain_commits => 2);
call run_clean(table => 'hudi_table1', clean_policy => 'KEEP_LATEST_FILE_VERSIONS', file_version_retained => 1);
注意事项
cleaning操作只有在满足触发条件后才会对分区的老版本数据文件进行清理,不满足触发条件虽然执行命令成功也不会执行清理。
系统响应
可以检查任务状态是否成功,查看任务结果,查看任务日志确认有无异常。