CSV文件输入
概述
“CSV文件输入”算子,用于导入所有能用文本编辑器打开的文件。
输入与输出
- 输入:文本文件
- 输出:多个字段
参数说明
参数 |
含义 |
类型 |
是否必填 |
默认值 |
---|---|---|---|---|
分隔符 |
CSV文件的列分隔符,用于分隔每行的数据。 |
string |
是 |
, |
换行符 |
用户根据数据实际情况,填写字符串作为换行符。支持任何字符串。默认使用操作系统的换行符。 |
string |
否 |
\n |
文件名是否作为字段 |
自定义一个字段,以当前数据所在的文件名作为该字段值。 |
string |
否 |
无 |
绝对路径 |
配置“文件名是否作为字段”引用文件名环境,选中单选框时是带绝对路径的文件名;不选中单选框时是不带路径的文件名。 |
boolean |
否 |
不选中 |
验证输入字段 |
是否检验输入字段与值的类型匹配情况,值为“NO”,不检查;值为“YES”,检查。如果不匹配则跳过该行。 |
enum |
是 |
YES |
输入字段 |
配置输入字段的相关信息:
|
map |
是 |
无 |
数据处理规则
- 将每行数据按照指定的分隔符,分隔成多个字段,供之后的转换算子使用。
- 当字段的值与实际的类型不匹配时,该行数据会成为脏数据。
- 输入字段列数不等于原始数据实际包含字段列数,该行数据会保存为脏数据。
样例
源文件如下图:
配置“CSV文件输入”算子,分隔符为“,”,生成两个字段A、B。
将A、B输出,结果如下: