SET/RESET
命令功能
此命令用于动态Add,Update,Display或Reset Hudi参数,而无需重新启动driver。
命令格式
参数描述
参数 |
描述 |
---|---|
parameter_name |
其值需要被动态添加(add),更新(update)或显示(display)的参数名称。 |
parameter_value |
将要设置的“parameter_name”的新值。 |
注意事项
以下为分别使用SET和RESET命令进行动态设置或清除操作的属性:
属性 |
描述 |
---|---|
hoodie.insert.shuffle.parallelism |
insert方式写入数据时的spark shuffle并行度。 |
hoodie.upsert.shuffle.parallelism |
upsert方式写入数据时的spark shuffle并行度。 |
hoodie.delete.shuffle.parallelism |
delete方式删除数据时的spark shuffle并行度。 |
hoodie.sql.insert.mode |
指定Insert模式,取值为strict、non-strict及upsert。 |
hoodie.sql.bulk.insert.enable |
指定是否开启bulk insert写入。 |
spark.sql.hive.convertMetastoreParquet |
sparksql把parquet表转化为datasource表进行读取。当hudi的provider为hive的情况下,使用sparksql或sparkbeeline进行读取,需要将该参数设置为false。 |
示例
- 添加(Add)或更新(Update):
set hoodie.insert.shuffle.parallelism = 100; set hoodie.upsert.shuffle.parallelism = 100; set hoodie.delete.shuffle.parallelism = 100;
- 重置(Reset):
RESET
系统响应
- 若运行成功,将记录在driver日志中。
- 若出现故障,将显示在用户界面(UI)中。