更新时间:2023-05-16 GMT+08:00
分享

三元组转kv

概述

三元组转kv,用于将三元组表转换为kv表,三元组表为(row, key, value)的形式,kv表为(row, [key_id:value])的形式,同时会生成关于(key, key_id)的表格。

输入

参数

子参数

参数说明

inputs

dataframe

inputs为字典类型,dataframe为pyspark中的DataFrame类型对象,一般为三元组表

输出

参数

子参数

参数说明

output

key_value

output为字典类型,key_value为输出的kv表

key_id

output为字典类型,key_id为输出的key的id对照表

参数说明

参数

是否必选

参数说明

默认值

keep_col

不改变的列

key_col

key列

value_col

value列

key_value_delimiter

key与value间的分隔符

:

pair_delimiter

key-value对之间的分隔符

;

样例

数据样本

idx

word

val

1

a

1

1

b

21

1

c

3

1

d

5

2

a

6

2

c

7

2

e

8

3

a

9

3

c

8

配置流程

运行流程

参数设置

查看结果

word

key_id

d

1

e

2

c

3

a

4

b

5

idx

key_value

1

3:3;1:5;5:21;4:1

2

3:7;2:8;4:6

3

4:9;3:8

分享:

    相关文档

    相关产品