更新时间:2024-07-24 GMT+08:00

HBase输出

概述

“HBase输出”算子,用于配置已生成的字段输出到HBase表的列。

输入与输出

  • 输入:需要输出的字段
  • 输出:HBase表

参数说明

表1 算子参数说明

参数

含义

类型

是否必填

默认值

HBase表类型

配置HBase表类型,可选项为normal(普通HBase表)和phoenix表。

enum

normal

NULL值处理方式

配置NULL值处理方式。选中单选框时是将转换为空字符串并保存。不选中单选框时是不保存数据。

boolean

不选中单选框

HBase输出字段

配置HBase输出信息:

  • 字段名:配置输出字段的字段名。
  • 表名:配置HBase表名。
  • 列族名:配置HBase列族名,如果HBase/Phoenix建表时未配置列族名,默认列族名为 '0'。
  • 列名:配置HBase列名。
  • 类型:配置字段类型,字段类型为“DATE”“TIME”“TIMESTAMP”时,需指定特定时间格式,其他类型指定无效。时间格式如:“yyyyMMdd HH:mm:ss”
  • 长度:配置字段长度,字段值实际长度太长则按配置的长度截取,“类型”“CHAR”时实际长度不足则空格补齐,“类型”“VARCHAR”时实际长度不足则不补齐。
  • 主键:配置是否为主键列。普通HBase表主键只能指定一个;phoenix表主键可以指定多个,配置多个列为主键时,会按照配置列的先后顺序对其进行拼接。必须配置一个主键列。

map

数据处理规则

  • 将字段值输出到HBase表中。
  • 原始数据包含NULL值,如果“NULL值处理方式”选中单选框时,将转换为空字符串并保存。如果“NULL值处理方式”不选中单选框时,不保存数据。

样例

以表输入为例,生成字段后,由HBase输出到对应的HBase表中,数据存放于test表中,如下图:

创建HBase表:

create 'hbase_test','f1','f2';

配置“HBase输出”算子,如下图:

作业执行成功后,查看hbase_test表中数据: