多表级联建模
在数据分析时,当需要分析的数据存储在不同的表,您可以通过数据关联,把多个表连接起来,形成模型进行数据分析。
DataArts Insight支持左外连接、内连接、右外连接、全连接的连接方式。
本节操作介绍多表关联的操作步骤。
关联关系
- 左外连接:是以左表为基础,根据某种条件将两表连接起来。结果会将左表所有的查询信息列出,而右表只列出条件与左表满足的部分。
- 内连接:同时将两表作为参考对象,根据给出的条件将两表连接起来。结果则是两表同时满足条件的部分才会列出。
- 右外连接:是以右表为基础,根据某种条件将两表连接起来。结果会将右表所有的查询信息列出,而左表只列出条件与右表满足的部分。
- 全连接:同时以两个表作为参考,根据条件将两个表格连接起来,去掉重复部分。
操作步骤
- 登录智能数据洞察控制台。
- 单击管理控制台左上角的,选择区域。
- 单击左下角的企业项目选择企业项目。
- 在控制台项目列选择对应的项目,单击进入项目页面。
- 在数据管理下单击“数据集”进入数据集页面,单击“新建数据集”。
- 在新建数据集页面我的数据源下,选择需要的数据源。
- 选择数据表。选择当前数据源下的数据库名称和Schema。
- 选择或创建关联的表。
您可以选择数据表关联数据表、数据表关联SQL代码创建表、SQL代码创建表关联数据表。
SQL代码的编辑操作请参考自定义SQL创建数据集,且在数据集内仅支持创建一张sql数据表。
- 数据表关联数据表,根据下图操作步骤创建关联数据表(将关联的表格从左列表中拖到图片中箭头指的地方)。
图1 数据表关联数据表
- 数据表关联SQL代码创建表:
- 先拖拽一个表格,然后单击“SQL编辑”,进入SQL编辑页面编辑SQL语句。
- 然后运行SQL语句,SQL运行成功,单击“完成并退出”按钮。
- 进入数据集管理页面,多表关联成功。
图2 创建SQL表
图3 数表关联SQL代码创建表
- SQL代码创建表关联数据表:
- 先单击“SQL编辑”,进入SQL编辑页面编辑SQL语句。
- 然后运行SQL语句,SQL运行成功,单击“完成并退出”按钮。
- 进入数据集管理页面,拖拽数据表完成多表关联。
图4 创建SQL表
- 数据表关联数据表,根据下图操作步骤创建关联数据表(将关联的表格从左列表中拖到图片中箭头指的地方)。
- 编辑表的关联关系。
- 当分析的模型复杂需要多张表进行关联,关联表关系支持对端点表进行选择。
图5 端点表选择
- 选择字段:按需选择数据表的字段。
- 选择关联关系:
- 左外连接:是以左表为基础,根据某种条件将两表连接起来。结果会将左表所有的查询信息列出,而右表只列出条件与左表满足的部分。
- 内连接:同时将两表作为参考对象,根据给出的条件将两表连接起来。结果则是两表同时满足条件的部分才会列出。
- 右外连接:是以右表为基础,根据某种条件将两表连接起来。结果会将右表所有的查询信息列出,而左表只列出条件与右表满足的部分。
- 全连接:同时以两个表作为参考,根据条件将两个表格连接起来,去掉重复部分。
- 配置关联字段。
- 当分析的模型复杂需要多张表进行关联,关联表关系支持对端点表进行选择。
- 单击“确定”,完成数据关联。
- 单击“刷新预览”查看关联后的数据。