使用BulkLoad工具批量更新HBase数据

操作场景

HBase BulkLoad工具支持根据RowKey的命名规则、RowKey的范围、字段名以及字段值进行批量更新数据。

使用BulkLoad工具批量更新HBase数据

执行如下命令更新从“row_start”到“row_stop”的行，并且把输出结果定向到“/output/destdir/”。

hbase com.huawei.hadoop.hbase.tools.bulkload.UpdateData 
  -Dupdate.rowkey.start="row_start" 
  -Dupdate.rowkey.stop="row_stop" 
  -Dupdate.hfile.output=/user/output/  
  -Dupdate.qualifier=f1:c1,f2  
  -Dupdate.qualifier.new.value=0,a  
  'table1'

-Dupdate.rowkey.start="row_start"：表示开始行号为“row_start”。
-Dupdate.rowkey.stop="row_stop"：表示结束行号为“row_stop”。
-Dupdate.hfile.output=/user/output/：表示执行结果输出路径为“/user/output/”。

当HBase已经配置透明加密后，“批量更新”操作注意事项请参考7。

执行以下命令，加载HFiles：

hbase org.apache.hadoop.hbase.mapreduce.LoadIncrementalHFiles <path/for/output> <tablename>

注意事项

批量更新会把满足条件的行对应的字段值替换为要更新的值。
如果要更新的字段上建有索引，批量更新是不允许的。
如果不设置执行结果输出文件，默认是（/tmp/updatedata/表名）。

父主题： 增强HBase BulkLoad工具数据迁移能力

上一篇：使用BulkLoad工具批量导入HBase数据

下一篇：使用BulkLoad工具批量删除HBase数据

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

直接提交取消