更新时间:2024-09-18 GMT+08:00

使用BulkLoad工具查询HBase表的行统计数

操作场景

HBase BulkLoad工具支持根据rowkey的命名规则、rowkey的范围、字段名以及字段值统计符合条件的行数。

操作步骤

直接执行如下命令统计满足如下条件的行数。rowkey在从“row_start”到“row_stop”的范围,字段“f3:age”的值为“25”,rowkey的前两个字符为“mi”的行数。

hbase com.huawei.hadoop.hbase.tools.bulkload.RowCounter -Dcounter.rowkey.start="row_start" -Dcounter.rowkey.stop="row_stop" -Dcounter.qualifier="f3:age:25" -Dcounter.rowkey.value="substring(0,2) == 'mi'" table1

  • -Dcounter.rowkey.start="row_start":表示开始的rowkey为“row_start”。
  • -Dcounter.rowkey.stop="row_stop":表示结束的rowkey为“row_stop”。
  • -Dcounter.qualifier="f3:age:25":表示列族f3中列为age的列值为25。
  • -Dcounter.rowkey.value="substring(0,2) == 'mi'":表示rowkey的值中前两个为mi。

如果指定了“row_start”和“row_stop”,则统计的为大于等于“row_start”并且小于“row_stop”的数据。