定义不适用的数据行
操作场景
BulkLoad支持定义不适用数据行的功能,不适用数据行不会存储到HBase中,这些数据会被保存到指定的文件中。
您可以在“configuration.xml”文件中定义多个方式来批量导入数据。
列的名称不能包含特殊字符,只能由字母、数字和下划线组成。
操作步骤
定义不适用的行,配置样例如下所示。
<!-- Define bad line filter rule --> <badlines>SMS_ID < 7000 && SMS_NAME == 'HBase'</badlines>
SMS_ID < 7000 && SMS_NAME == 'HBase'
针对“<badlines>”标签中的算符和对应的参数类型如表1所示。
算符类型 |
参数类型 |
---|---|
&& |
对应的参数类型应为布尔型。 |
& |
对应的参数类型应为整数。 |
| |
对应的参数类型应为整数。 |
^ |
对应的参数类型应为整数。 |
/ |
对应的参数类型应为数字。 |
== |
对应的参数类型应为字符串。 |
>= |
对应的参数类型应为数字。 |
> |
对应的参数类型应为数字。 |
<< |
对应的参数类型应为整数。 |
<= |
对应的参数类型应为数字。 |
< |
对应的参数类型应为数字。 |
% |
对应的参数类型应为数字。 |
* |
对应的参数类型应为数字。 |
!= |
对应的参数类型应为字符串。 |
|| |
对应的参数类型应为布尔型。 |
+ |
对应的参数类型应为数字和字符串。 |
>> |
对应的参数类型应为整数。 |
- |
对应的参数类型应为字符串。 |
>>> |
对应的参数类型应为整数。 |