更新时间:2022-09-30 GMT+08:00
分享

组合rowkey

操作场景

支持用户自定义的组合rowkey。BulkLoad组合rowkey即通过一些规则将多个列名经过一些自定义处理,组合生成新的rowkey。

列的名称不能包含特殊字符,只能由字母、数字和下划线组成。

配置方法

关于组合rowkey在“configuration.xml”文件中的配置如下所示。

样例:定义组合rowkey为列“SMS_ID”、“SMS_NAME”的取第二个字符开始的三个字符以及“SMS_SERAIL”的反转(各部分用'_'连接)。

 <columns> 
                         <column index="1" type="int">SMS_ID</column> 
                         <column index="2" type="string">SMS_NAME</column> 
                         <column index="3" type="string">SMS_ADDRESS</column> 
                 </columns> 

                 <rowkey> 
                        SMS_ID+'_'+substring(SMS_NAME,1,4)+'_'+reverse(SMS_ADDRESS)
                 </rowkey>     
表1 rowkey字段处理函数

函数原型

描述

示例

format(data,"DataType")

格式化字符串数据。

例如,format(data,"0.000")是指将数据按照"0.000"格式输出。

converse(data,"yyyy-MM-dd","yyyyMMdd")

转化日期格式。

例如,converse(data,"yyyy-MM-dd","yyyyMMdd")是指将日期格式从"yyyy-MM-dd"转化为"yyyyMMdd"。

rand

随机一个整数,只支持int类型。

replace(data,"A","B")

数据替换。

例如,replace(data,"A","B")是指将A用B替换。

reverse(data)

将字符串反转。

例如,reverse(ABC)将"ABC"反转成"CBA"。

substring(data,Length1,Length2), or substring(data,Length3)

截取字符串。

例如,substring(data,1,5), or substring(data,3)是指将data字符串进行截取[1,5)或[3,data.length)。

to_number("data")

将字符串转化成数值型,支持返回Long类型。

例如,to_number("123")是指将"123"转化为123,注意当前data必须为数值。

分享:

    相关文档

    相关产品