更新时间:2024-08-26 GMT+08:00
分享

多表级联建模

在数据分析时,当需要分析的数据存储在不同的表,您可以通过数据关联,把多个表连接起来,形成模型进行数据分析。

DataArts Insight支持左外连接、内连接、右外连接、全连接的连接方式。

本节操作介绍多表关联的操作步骤。

关联关系

  • 左外连接:是以左表为基础,根据某种条件将两表连接起来。结果会将左表所有的查询信息列出,而右表只列出条件与左表满足的部分。
  • 内连接:同时将两表作为参考对象,根据给出的条件将两表连接起来。结果则是两表同时满足条件的部分才会列出。
  • 右外连接:是以右表为基础,根据某种条件将两表连接起来。结果会将右表所有的查询信息列出,而左表只列出条件与右表满足的部分。
  • 全连接:同时以两个表作为参考,根据条件将两个表格连接起来,去掉重复部分。

前提条件

  • 已开通DataArts Insight服务。
  • 已创建项目,请参见创建项目

操作步骤

  1. 登录智能数据洞察控制台
  2. 单击管理控制台左上角的,选择区域。
  3. 单击左下角的企业项目选择企业项目。
  4. 在控制台项目列选择对应的项目,单击进入项目页面。
  5. 在数据管理下单击“数据集”进入数据集页面,单击“新建数据集”。
  6. 在新建数据集页面我的数据源下,选择需要的数据源。
  7. 选择数据表。选择当前数据源下的数据库名称和Schema。
  8. 选择或创建关联的表。

    您可以选择数据表关联数据表、数据表关联SQL代码创建表、SQL代码创建表关联数据表。

    SQL代码的编辑操作请参考自定义SQL创建数据集,且在数据集内仅支持创建一张sql数据表。

    1. 数据表关联数据表,根据下图操作步骤创建关联数据表(将关联的表格从左列表中拖到图片中箭头指的地方)。
      图1 数据表关联数据表
    2. 数据表关联SQL代码创建表:
      1. 先拖拽一个表格,然后单击“SQL编辑”,进入SQL编辑页面编辑SQL语句。
      2. 然后运行SQL语句,SQL运行成功,单击“完成并退出”按钮。
      3. 进入数据集管理页面,多表关联成功。
        图2 创建SQL表
        图3 数表关联SQL代码创建表
    3. SQL代码创建表关联数据表:
      1. 先单击“SQL编辑”,进入SQL编辑页面编辑SQL语句。
      2. 然后运行SQL语句,SQL运行成功,单击“完成并退出”按钮。
      3. 进入数据集管理页面,拖拽数据表完成多表关联。
        图4 创建SQL表
  9. 编辑表的关联关系。
    1. 当分析的模型复杂需要多张表进行关联,关联表关系支持对端点表进行选择。
      图5 端点表选择
    2. 选择字段:按需选择数据表的字段。
    3. 选择关联关系:
      • 左外连接:是以左表为基础,根据某种条件将两表连接起来。结果会将左表所有的查询信息列出,而右表只列出条件与左表满足的部分。
      • 内连接:同时将两表作为参考对象,根据给出的条件将两表连接起来。结果则是两表同时满足条件的部分才会列出。
      • 右外连接:是以右表为基础,根据某种条件将两表连接起来。结果会将右表所有的查询信息列出,而左表只列出条件与右表满足的部分。
      • 全连接:同时以两个表作为参考,根据条件将两个表格连接起来,去掉重复部分。
    4. 配置关联字段。

      配置数据关联时,关联字段必须是已选的存在于被关联的数据表中。

  10. 单击“确定”,完成数据关联。
  11. 单击“刷新预览”查看关联后的数据。

相关文档