新建数据表
您可以通过可视化模式、DDL模式或SQL脚本方式新建数据表。
- (推荐)可视化模式:您可以直接在DataArts Studio数据开发模块通过No Code方式,新建数据表。
- (推荐)DDL模式:您可以在DataArts Studio数据开发模块,通过选择DDL方式,使用SQL语句新建数据表。
- SQL脚本方式:您也可以在DataArts Studio数据开发模块或对应数据湖产品的SQL编辑器上,开发并执行用于创建数据表的SQL脚本,从而创建数据表。
本章节以可视化模式和DDL模式为例,介绍如何在数据开发模块新建数据表。
前提条件
- 已创建数据库及DWS数据库模式,请参见新建数据库和(可选)新建数据库模式。
- 已在数据开发模块中创建与数据表类型匹配的数据连接,请参见新建数据连接。
新建数据表(可视化模式)
- 参考访问DataArts Studio实例控制台,登录DataArts Studio管理控制台。
- 在DataArts Studio控制台首页,选择对应工作空间的“数据开发”模块,进入数据开发页面。
- 在数据开发主界面的左侧导航栏,选择 。
- 在脚本开发导航栏,选择,展开数据连接层级至“tables”,右键单击“新建数据表”或者单击新建数据表。
- 在弹出的对话框中,显示“配置基本属性”页面,参见表1配置相关参数。
- 单击“下一步”,在“配置表结构”页面配置如表2所示的参数。
- 单击“保存”,新建数据表。
新建数据表(DDL模式)
- 参考访问DataArts Studio实例控制台,登录DataArts Studio管理控制台。
- 在DataArts Studio控制台首页,选择对应工作空间的“数据开发”模块,进入数据开发页面。
- 在数据开发主界面的左侧导航栏,选择 。
- 在脚本开发导航栏,选择,展开数据连接层级至“tables”,右键单击“新建数据表”或者单击新建数据表。
- 单击“DDL模式建表”,如表3所示的参数,系统自动默认,并在下方的编辑器中输入SQL语句。例如:
CREATE TABLE userinfo ( id INT, name STRING);
不同数据源的SQL语法有所差异,开发SQL语句前请预先了解各数据源的语法参考文档。
- 单击“保存”,新建数据表。
相关操作
- 查看表详情:在脚本开发导航栏,选择,展开下方的数据连接至数据表层级,右键单击表名称,选择“查看表详情”,可查看如表4所示的数据表信息。
- 删除表:在脚本开发导航栏,选择,展开下方的数据连接至数据表层级,右键单击表名称,选择“删除”后,在弹出的页面中单击“确定”完成删除。
删除操作不可撤销,请谨慎操作。
参数说明
参数 |
是否必选 |
说明 |
---|---|---|
基本属性 |
||
表名 |
是 |
数据表的名称。只能包含英文小写字母、数字、“_”,不能为纯数字,不能以“_”开头,且长度为1~63个字符。 |
别名 |
否 |
数据表的别名,只能包含中文字符、英文字母、数字、“_”,不能为纯数字,不能以“_”开头,且长度为1~63个字符。 |
数据连接类型 |
是 |
数据表所属的数据连接类型。系统默认。 |
数据连接 |
是 |
数据表所属的数据连接。系统默认。 |
数据库 |
是 |
数据表所属的数据库。系统默认。 |
数据位置 |
是 |
选择数据存储的位置:
|
数据格式 |
是 |
选择数据的格式。“数据位置”为“OBS”时,配置该参数。
|
路径 |
是 |
选择数据存储的OBS路径。“数据位置”为“OBS”时,配置该参数。 如果OBS路径不存在或者OBS桶不存在,系统支持可以自动创建OBS目录。
说明:
如果OBS桶创建超过上限,系统会自动提示“创建obs目录失败,错误原因:[Create OBS Bucket failed:TooManyBuckets:You have attempted to create more buckets than allowed]”。 |
表描述 |
否 |
数据表的描述信息。 |
表结构 |
||
列类型 |
是 |
选择列类型。包含分区列和普通列。系统默认普通列。 |
列名 |
是 |
填写列名,列名不能重复。 |
类型 |
是 |
选择数据类型,具体说明请参见《数据湖探索SQL语法参考》的数据类型。 |
列描述 |
否 |
填写列的描述信息。 |
操作 |
否 |
单击,增加列。 单击,删除列。 |
参数 |
是否必选 |
说明 |
---|---|---|
基本属性 |
||
表名 |
是 |
数据表的名称。只能包含英文字母、数字、“_”,不能为纯数字,不能以“_”开头,且长度为1~63个字符。 |
别名 |
否 |
数据表的别名,只能包含中文字符、英文字母、数字、“_”,不能为纯数字,不能以“_”开头,且长度为1~63个字符。 |
数据连接类型 |
是 |
数据表所属的数据连接类型。系统默认。 |
数据连接 |
是 |
数据表所属的数据连接。系统默认。 |
数据库 |
是 |
数据表所属的数据库。系统默认。 |
模式 |
是 |
选择数据库的模式。 |
表描述 |
否 |
数据表的描述信息。 |
高级选项 |
否 |
提供以下高级选项:
|
表结构 |
||
列名 |
是 |
填写列名,列名不能重复。 |
数据分类 |
是 |
选择数据类型的类别:
|
类型 |
是 |
选择数据类型,具体说明请参见《数据仓库服务开发指南》的数据类型。 |
列描述 |
否 |
填写列的描述信息。 |
是否建ES索引 |
否 |
单击复选框时,表示需要建立ES索引。建立ES索引时,请同时在“CloudSearch集群名”中选择建立好的CSS集群。如何创建CSS集群,请参见《云搜索服务用户指南》的创建集群。 |
ES索引数据类型 |
否 |
选择ES索引的数据类型:
|
操作 |
否 |
单击,增加列。 单击,删除列。 |
参数 |
是否必选 |
说明 |
---|---|---|
基本属性 |
||
表名 |
是 |
数据表的名称。只能包含英文小写字母、数字、“_”,不能为纯数字,不能以“_”开头,且长度为1~63个字符。 |
别名 |
否 |
数据表的别名,只能包含中文字符、英文字母、数字、“_”,不能为纯数字,不能以“_”开头,且长度为1~63个字符。 |
数据连接类型 |
是 |
数据表所属的数据连接类型。系统默认。 |
数据连接 |
是 |
选择数据表所属的数据连接。系统默认。 |
数据库 |
是 |
选择数据表所属的数据库。系统默认。 |
表描述 |
否 |
数据表的描述信息。 |
表结构 |
||
列名 |
是 |
填写列名,列名不能重复。 |
数据分类 |
是 |
选择数据类型的类别:
|
类型 |
是 |
选择数据类型,具体说明请参见LanguageManual DDL。 |
列描述 |
否 |
填写列的描述信息。 |
操作 |
否 |
单击,增加列。 单击,删除列。 |
参数 |
是否必选 |
说明 |
---|---|---|
基本属性 |
||
表名 |
是 |
数据表的名称。只能包含英文小写字母、数字、“_”,不能为纯数字,不能以“_”开头,且长度为1~63个字符。 |
别名 |
否 |
数据表的别名,只能包含中文字符、英文字母、数字、“_”,不能为纯数字,不能以“_”开头,且长度为1~63个字符。 |
数据连接类型 |
是 |
数据表所属的数据连接类型。系统默认。 |
数据连接 |
是 |
选择数据表所属的数据连接。系统默认。 |
数据库 |
是 |
选择数据表所属的数据库。系统默认。 |
表描述 |
否 |
数据表的描述信息。 |
表结构 |
||
列名 |
是 |
填写列名,列名不能重复。 |
数据分类 |
是 |
选择数据类型的类别:
|
类型 |
是 |
选择数据类型,具体说明请参见LanguageManual DDL。 |
列描述 |
否 |
填写列的描述信息。 |
操作 |
否 |
单击,增加列。 单击,删除列。 |