更新时间:2022-09-30 GMT+08:00
分享

定义不适用的数据行

操作场景

BulkLoad支持定义不适用数据行的功能,不适用数据行不会存储到HBase中,这些数据会被保存到指定的文件中。

您可以在“configuration.xml”文件中定义多个方式来批量导入数据。

列的名称不能包含特殊字符,只能由字母、数字和下划线组成。

操作步骤

定义不适用的行,配置样例如下所示。

<!-- Define bad line filter rule --> 
<badlines>SMS_ID &lt; 7000 &amp;&amp; SMS_NAME == 'HBase'</badlines>

SMS_ID < 7000 && SMS_NAME == 'HBase'

针对“<badlines>”标签中的算符和对应的参数类型如表1所示。

表1 算符和对应的参数类型

算符类型

参数类型

&&

对应的参数类型应为布尔型。

&

对应的参数类型应为整数。

|

对应的参数类型应为整数。

^

对应的参数类型应为整数。

/

对应的参数类型应为数字。

==

对应的参数类型应为字符串。

>=

对应的参数类型应为数字。

>

对应的参数类型应为数字。

<<

对应的参数类型应为整数。

<=

对应的参数类型应为数字。

<

对应的参数类型应为数字。

%

对应的参数类型应为数字。

*

对应的参数类型应为数字。

!=

对应的参数类型应为字符串。

||

对应的参数类型应为布尔型。

+

对应的参数类型应为数字和字符串。

>>

对应的参数类型应为整数。

-

对应的参数类型应为字符串。

>>>

对应的参数类型应为整数。

分享:

    相关文档

    相关产品