更新时间:2025-12-16 GMT+08:00
固定宽度文件输入
概述
“固定宽度文件输入”算子,将文件的每一行,按可配置长度的字符或字节,转换成多个输入字段。
输入与输出
- 输入:文本文件
- 输出:多个字段
参数说明
参数 | 含义 | 类型 | 是否必填 | 默认值 |
|---|---|---|---|---|
换行符 | 用户根据数据实际情况,填写字符串作为换行符。支持任何字符串。默认使用操作系统的换行符。 | string | 否 | \n |
分割长度单位 | 长度单位,可选择“char”字符或“byte”字节。 | enum | 是 | char |
输入字段 | 配置输入字段相关信息:
| map | 是 | 无 |
数据处理规则
- 按照输入字段的长度依次截取源文件,生成字段。
- 当字段的值与实际的类型不匹配时,该行数据会成为脏数据。
- 配置字段分割长度,大于原字段值的长度,则数据分割失败,当前行成为脏数据。
样例
源文件如下图:

配置“固定宽度文件输入”算子,生成三个字段A、B和C。

将三个字段依次输出,结果如下:

父主题:Loader输入类算子

