更新时间:2024-11-29 GMT+08:00
        
          
          
        
      
      
      
      
      
      
      
      
  
      
      
      
        
CLUSTERING
命令功能
对Hudi表进行clustering操作,具体作用可以参考Clustering章节。
命令格式
参数描述
| 
        参数  | 
      
        描述  | 
      
        是否必填  | 
     
|---|---|---|
| 
        table  | 
      
        需要查询表的表名,支持database.tablename格式  | 
      
        否  | 
     
| 
        path  | 
      
        需要查询的表的路径  | 
      
        否  | 
     
| 
        predicate  | 
      
        需要定义的谓语句  | 
      
        否  | 
     
| 
        order  | 
      
        指定clustering的排序字段  | 
      
        否  | 
     
| 
        limit  | 
      
        展示查询结果的条数  | 
      
        否  | 
     
示例
call show_clustering(table => 'hudi_table1'); call run_clustering(table => 'hudi_table1', predicate => '(ts >= 1006L and ts < 1008L) or ts >= 1009L', order => 'ts'); call run_clustering(path => '/user/hive/warehouse/hudi_test2', predicate => "dt = '2021-08-28'", order => 'id');
注意事项
- table与path参数必须存在一个,否则无法判断需要执行clustering的表。
 - 如果需要对指定分区进行clustering,参考格式:predicate => "dt = '2021-08-28'"
 
系统响应
可在客户端中查看查询结果。
   父主题: CALL COMMAND