更新时间:2024-07-24 GMT+08:00
固定宽度文件输入
概述
“固定宽度文件输入”算子,将文件的每一行,按可配置长度的字符或字节,转换成多个输入字段。
输入与输出
- 输入:文本文件
- 输出:多个字段
参数说明
参数 |
含义 |
类型 |
是否必填 |
默认值 |
---|---|---|---|---|
换行符 |
用户根据数据实际情况,填写字符串作为换行符。支持任何字符串。默认使用操作系统的换行符。 |
string |
否 |
\n |
分割长度单位 |
长度单位,可选择“char”字符或“byte”字节。 |
enum |
是 |
char |
输入字段 |
配置输入字段相关信息:
|
map |
是 |
无 |
数据处理规则
- 按照输入字段的长度依次截取源文件,生成字段。
- 当字段的值与实际的类型不匹配时,该行数据会成为脏数据。
- 配置字段分割长度,大于原字段值的长度,则数据分割失败,当前行成为脏数据。
样例
源文件如下图:
配置“固定宽度文件输入”算子,生成三个字段A、B和C。
将三个字段依次输出,结果如下:
父主题: Loader输入类算子