CLEANARCHIVE
命令功能
用于对Hudi表的归档文件进行清理,以减少Hudi表的数据存储及读写压力。
命令格式
set hoodie.archive.file.cleaner.policy = KEEP_ARCHIVED_FILES_BY_SIZE;
set hoodie.archive.file.cleaner.size.retained = 5368709120;
run cleanarchive on tableIdentifier/tablelocation;
set hoodie.archive.file.cleaner.policy = KEEP_ARCHIVED_FILES_BY_DAYS;
set hoodie.archive.file.cleaner.days.retained = 30;
run cleanarchive on tableIdentifier/tablelocation;
参数描述
参数 |
描述 |
---|---|
tableIdentifier |
Hudi表的名称。 |
tablelocation |
Hudi表的存储路径。 |
hoodie.archive.file.cleaner.policy |
清理归档文件的策略:目前仅支持KEEP_ARCHIVED_FILES_BY_SIZE和KEEP_ARCHIVED_FILES_BY_DAYS两种策略,默认策略为KEEP_ARCHIVED_FILES_BY_DAYS。
|
hoodie.archive.file.cleaner.size.retained |
当清理策略为KEEP_ARCHIVED_FILES_BY_SIZE时,该参数可以设置保留多少字节大小的归档文件,默认值5368709120字节(5G)。 |
hoodie.archive.file.cleaner.days.retained |
当清理策略为KEEP_ARCHIVED_FILES_BY_DAYS时,该参数可以设置保留多少天以内的归档文件,默认值30(天)。 |
注意事项
归档文件,没有备份,删除之后无法恢复。
系统响应
可在driver日志和客户端中查看命令运行成功或失败。