更新时间:2024-05-27 GMT+08:00
分享

数据集连接

概述

“连接”节点是关系数据库中常用的方法之一,用于以特定的方式将两个数据集联接在一起。

输入

参数

子参数

参数说明

inputs

left_dataframe

inputs为字典类型,left_dataframe为执行连接操作的左数据集

right_dataframe

inputs为字典类型,right_dataframe为执行连接操作的右数据集

输出

参数

子参数

参数说明

outputs

output_port_1

dataframe类型的数据集合并结果

参数说明

参数名称

是否必选

参数描述

默认值

join_column_pairs_str

关联条件,等式对之间以”;“分割,等式之间以”,“分割;

eg. left_col1,right_col1;left_col2,right_col2;

join_type

支持左连接、右连接、内连接和全连接(left_join、right_join、inner_join和full join)。

left_join

mapjoin

是否进行mapjoin优化(将小表进行broadcoast广播)。

true

output_left_cols

左表输出字段列

如果不选择,则默认为所有字段

output_right_cols

右表输出字段列

如果不选择,则默认为所有字段

样例

数据样本

"Persons" 表:

Id_P

LastName

FirstName

Address

City

1

Adams

John

Oxford Street

London

2

Bush

George

Fifth Avenue

New York

3

Carter

Thomas

Changan Street

Beijing

"Orders" 表:

Id_O

OrderNo

Id_P

1

77895

3

2

44678

3

3

22456

1

4

24562

1

5

34764

65

配置流程

运行流程

算法参数设置

查看结果

分享:

    相关文档

    相关产品