更新时间:2022-12-14 GMT+08:00

剪切字符串

概述

“剪切字符串”算子,截取已有字段的值,生成新的字段。

输入与输出

  • 输入:需要截取的字段
  • 输出:截取后生成的新字段

参数说明

表1 算子参数说明

参数

含义

类型

是否必填

默认值

被截取的字段

配置被截取字段相关信息:

  • 输入字段名:配置输入字段名,需填写上一个转换步骤生成的字段名。
  • 输出字段名:配置输出字段名。
  • 开始位置:截取开始位置,从序号1开始。
  • 结束位置:截取结束位置,不确定字符串长度时,可指定为-1表示被截取字段的末尾。
  • 输出字段类型:输出字段的类型。
  • 输出字段长度:配置字段长度,字段值实际长度太长则按配置的长度截取,“输出字段类型”“CHAR”时实际长度不足则空格补齐,“输出字段类型”“VARCHAR”时实际长度不足则不补齐。

map

数据处理规则

  • 用开始位置和结束位置去截取原字段的值,生成新字段。
  • 结束位置为“-1”时,表示字段的末尾。其它情况下,结束位置不能小于开始位置。
  • 字符截取的开始位置或结束位置,大于输入字段的长度时,当前行成为脏数据。

样例

通过“CSV文件输入”算子,生成两个字段A和B。

源文件如下:

abcd,product
FusionInsight,Bigdata

配置“剪切字符串”算子后,生成两个新字段C和D:

转换后,分别输出这三个字段:

abcd,product,abc,prod
FusionInsight,Bigdata,Fus,Bigd