CLUSTERING

命令功能

对Hudi表进行clustering操作，具体作用可以参考Clustering章节。

命令格式

执行clustering：
call run_clustering(table=>'[table]', path=>'[path]', predicate=>'[predicate]', order=>'[order]');
查看clustering计划：
call show_clustering(table=>'[table]', path=>'[path]', limit=>'[limit]');

参数描述

表1 参数描述
参数	描述	是否必填
table	需要查询表的表名，支持database.tablename格式	否
path	需要查询的表的路径	否
predicate	需要定义的谓语句	否
order	指定clustering的排序字段	否
limit	展示查询结果的条数	否

示例

call show_clustering(table => 'hudi_table1');

call run_clustering(table => 'hudi_table1', predicate => '(ts >= 1006L and ts < 1008L) or ts >= 1009L', order => 'ts');

call run_clustering(path => '/user/hive/warehouse/hudi_test2', predicate => "dt = '2021-08-28'", order => 'id');

注意事项

table与path参数必须存在一个，否则无法判断需要执行clustering的表。
如果需要对指定分区进行clustering，参考格式：predicate => "dt = '2021-08-28'"

系统响应

可在客户端中查看查询结果。

父主题： CALL COMMAND

上一篇：ROLL_BACK

下一篇：Cleaning

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

直接提交取消