创建数据表
操作场景
表是由行与列组合成的。每一列被当作是一个字段。每个字段中的值代表一种类型的数据。
用户可通过管理控制台或SQL语句创建数据表。本章节介绍在管理控制台创建数据表的操作步骤。
注意事项
当OBS的目录下有同名文件夹和文件时,创建OBS表指向该路径会优先指向文件而非文件夹。
创建表入口
创建表的入口有两个,分别在“数据开发”和“数据表管理”页面。
- 在“数据表管理”页面创建表
- 在离线分析定福菜单栏中,选择“数据表管理”。
- 在“数据管理”页面左边栏,选择“用户业务数据”。
- 点击“新建表”按键。
数据表管理页面-新建表
- 在“数据表开发”页面创建表
- 在离线分析定福菜单栏中,选择“数据开发”
- 在“数据开发”页面右边栏,选择“用户业务数据”
- 点击“新建表”按钮。
数据开发页面-新建表
创建表
数据表支持两种创建方式,数据管道导入及自定义创建。
数据管道导入:
使用数据管道导入方式创建表,该方式给数据管道输出数据创建数据表。此方式下列名称和列类型是固定的,由上游的“数据管道”模块的“数据存储输出”算子设定。在这里选择相应的数据存储名称,然后选择该数据存储的全部或部分属性作为数据表的列,创建表后即可对管道输出数据进行数据分析。
创建数据管道导入表说明
参数名称 |
描述 |
示例 |
---|---|---|
创建方式 |
创建方式有数据管道导入和自定义导入两种。 |
数据管道导入 |
数据存储 |
下拉选择已创建的数据存储。括号里显示相应的数据管道名称。 |
PipLinetest ( Pipeline : test-donotdelete ) |
表名 |
表名称只能包含数字、字母、下划线,但不能是纯数字,不能以下划线或数字开头,长度为小于64位。默认是"t_"+数据存储名称。 |
t_PipLinetest |
别名 |
数据表的别名,可以是中文。在列出表时会优先显示表别名,表别名为空时显示表名。默认是数据存储名称。 |
PipLinetest |
表分类 |
数据表文件夹名称。不能是“平台系统表”,默认是“用户业务数据”,或可创建新的文件夹。 |
用户业务数据。 |
表描述 |
描述一下表的用途。 |
|
列名 |
数据名称。 |
wk4 |
列类型 |
数据类型。 |
integer |
列描述 |
描述一下列的含义。 |
自定义创建。
使用自定义创建表的方式,用户先定义表的结构,然后使用“数据导入”功能将OBS中 的数据文件导入,数据导入后即可进行数据分析。
自定义数据表支持两种数据格式,CSV及Parquet。
创建Parquet表
创建Parquet表说明
参数名称 |
描述 |
示例 |
---|---|---|
创建方式 |
创建方式有数据管道导入和自定义导入两种。 |
自定义创建 |
表名 |
表名称只能包含数字、字母、下划线,但不能是纯数字,不能以下划线或数字开头,长度为小于64位。 |
t_vehicle |
别名 |
数据表的别名,可以是中文。在列出表时会优先显示表别名,表别名为空时显示表名. |
汽车 |
表分类 |
数据表文件夹名称。不能是“平台系统表”,默认是“用户业务数据”,或可创建新的文件夹。 |
用户业务数据。 |
数据格式 |
数据格式支持CSV和Parquet两种。 |
Parquet |
表描述 |
描述一下表的用途。 |
汽车表。 |
列名 |
列名不能重复,只能包含数字、字母、下划线,但不能是纯数字,不能以下划线或数字开头,长度为小于64位。 |
vehicle_id |
列类型 |
在下拉列表选择合适的数据类型。 |
string |
列描述 |
描述一下列的含义。 |
VIN ID |
创建CSV表
CSV表高级选项说明
参数名称 |
描述 |
示例 |
---|---|---|
添加表头 |
当数据文件包含表头时选中此项。 |
选中 |
自定义分隔符 |
选择CSV文件使用的分隔符。 |
逗号 |
自定义引用字符 |
选择CSV文件使用的引用字符。 |
不选中 |
自定义转义字符 |
选择CSV文件使用的转义字符。 |
不选中 |
