更新时间:2022-02-22 GMT+08:00

标签传播算法(Label Propagation)

概述

标签传播算法(Label Propagation)是一种基于图的半监督学习方法,其基本思路是用已标记节点的标签信息去预测未标记节点的标签信息。利用样本间的关系建图,节点包括已标注和未标注数据,其边表示两个节点的相似度,节点的标签按相似度传递给其他节点。标签数据就像是一个源头,可以对无标签数据进行标注,节点的相似度越大,标签越容易传播。

适用场景

标签传播算法(Label Propagation)适用于资讯传播、广告推荐、社区发现等场景。

参数说明

表1 标签传播算法(Label Propagation)参数说明

参数

是否必选

说明

类型

取值范围

默认值

coveragence

收敛精度

Double

0~1,不包括0和1

0.00001

max_iterations

最大迭代次数

Int

1~2000

1000

initial

点上用作初始化标签的属性名称

String

空或字符串。

  • 空:每个节点各自分配一个特有的初始化标签;适用于事先没有任何节点标注信息的情况。
  • 字符串:将节点的对应的属性字段取值作为初始化标签(类型为string,对于未知标签的点,初始化标签字段赋空);适用于已标注部分节点标签,预测未知节点标签的情况。
说明:

当initial取值非空时,对于具有初始化标签的点,其数量应大于0,小于点总数。

-

注意事项

标签传播算法(Label Propagation)默认使用ID作为标签。

示例

输入参数coverage=0.00001,max_iterations=1000,计算得到带有不同标签的子图会展示在绘图区,节点颜色根据不同标签来区别,JSON结果会展示在查询结果区。