智能数据洞察 DataArts Insight
智能数据洞察 DataArts Insight
链接复制成功!
多表级联建模
在进行数据分析的过程中,可能会遇到需要处理分散在不同表格中的数据,通过多表级联,您可以将这些分散的数据表连接起来,构建一个综合的数据模型进行深入分析。多表级联不仅能够跨越不同的数据源,还能够整合来自多个表格的信息,从而使得分析结果更加全面。DataArts Insight支持左外连接、内连接、右外连接、全连接的连接方式。本文为您介绍如何多表级联建模。
操作步骤
- 登录智能数据洞察控制台。
- 单击管理控制台左上角的
,选择区域,单击左下角的企业项目选择企业项目。
- 在控制台右侧“我的项目”单击项目名称,进入项目页面。
- 单击“数据管理 > 数据集 > 新建数据集 ”,进入新建数据集页面。
- 选择需要的数据源后,选择库名和Schema。
- 选择或创建关联的表,支持选择数据表关联数据表、数据表关联SQL代码创建表、SQL代码创建表关联数据表。
- 数据表关联数据表:将需要关联的表格从左侧中拖拽至操作面板(图1)。
- 数据表关联SQL代码创建表:
- 从左侧拖拽表格至操作面板后,单击“SQL编辑”,进入SQL编辑页面。
- SQL语句编辑完成后,单击“运行”,运行成功后单击“完成并退出”。
- 进入数据集管理页面,多表关联成功。
图2 SQL代码创建表图3 数据表关联SQL代码创建表
- SQL代码创建表关联数据表:
- 单击“SQL编辑”,进入SQL编辑页面。
- SQL语句编辑完成后,单击“运行”,运行成功后单击“完成并退出”。
- 进入数据集管理页面,从左侧拖拽数据表完成多表关联。
图4 创建SQL表
- 编辑表的关联关系。
- 当分析的模型复杂需要多张表进行关联,关联表关系支持对端点表进行选择。
图5 端点表选择
- 选择字段:按需选择数据表的字段。
- 选择关联关系:
- 左外连接:返回左表所有记录,即使右表中没有匹配的记录。对于右表中没有匹配的记录,结果中相应的字段将显示为NULL。
- 是以左表为基础,根据某种条件将两表连接起来。结果会将左表所有的查询信息列出,而右表只列出条件与左表满足的部分。
- 内连接:返回两个表中都有匹配的记录,即返回两个表的交集。
- 右外连接:返回右表的所有记录,即使左表中没有匹配的记录。对于左表中没有匹配的记录,结果中相应的字段将显示为NULL。
- 全连接:返回两个表中的所有记录,无论它们是否有匹配,重复部分将被去除。
- 配置关联字段:配置数据关联时,关联字段必须是已选的存在于被关联的数据表中。
- 当分析的模型复杂需要多张表进行关联,关联表关系支持对端点表进行选择。
- 单击“确定”,完成数据关联,单击“刷新预览”可查看关联后的数据。
父主题: 数据建模