CSV文件输入
概述
“CSV文件输入”算子,用于导入所有能用文本编辑器打开的文件。
输入与输出
- 输入:文本文件。
- 输出:多个字段。
参数说明
| 参数 | 含义 | 类型 | 是否必填 | 默认值 |
|---|---|---|---|---|
| 分隔符 | CSV文件的列分隔符,用于分隔每行的数据。 | string | 是 | , |
| 换行符 | 用户根据数据实际情况,填写字符串作为换行符。支持任何字符串。默认使用操作系统的换行符。 | string | 否 | \n |
| 文件名是否作为字段 | 自定义一个字段,以当前数据所在的文件名作为该字段值。 | string | 否 | 无 |
| 绝对路径 | 配置“文件名是否作为字段”引用文件名环境,选中单选框时是带绝对路径的文件名;不选中单选框时是不带路径的文件名。 | boolean | 否 | 不选中 |
| 验证输入字段 | 是否检验输入字段与值的类型匹配情况,值为“NO”,不检查;值为“YES”,检查。若不匹配则跳过该行。 | enum | 是 | YES |
| 输入字段 | 配置输入字段的相关信息:
| map | 是 | 无 |
数据处理规则
- 将每行数据按照指定的分隔符,分隔成多个字段,供之后的转换算子使用。
- 当字段的值与实际的类型不匹配时,该行数据会成为脏数据。
- 输入字段列数不等于原始数据实际包含字段列数,该行数据会保存为脏数据。
样例
源文件如下图:

配置“CSV文件输入”算子,分隔符为“,”,生成两个字段A、B。

将A、B输出,结果如下:
