更新时间:2023-06-30 GMT+08:00

PageRank算法

概述

PageRank算法又称网页排名算法,是一种由搜索引擎根据网页(节点)之间相互的超链接进行计算的技术,用来体现网页(节点)的相关性和重要性。

  • 如果一个网页被很多其他网页链接到,说明这个网页比较重要,也就是其PageRank值会相对较高。
  • 如果一个PageRank值很高的网页链接到其他网页,那么被链接到的网页的PageRank值会相应地提高。

适用场景

PageRank算法适用于网页排序、社交网络重点人物发掘等场景。

参数说明

表1 PageRank算法参数说明

参数

是否必选

说明

类型

取值范围

默认值

alpha

权重系数(又称阻尼系数)

Double

0~1,不包括0和1

0.85

convergence

收敛精度

Double

0~1,不包括0和1

0.00001

max_iterations

最大迭代次数

Int

1~2000

1000

directed

是否考虑边的方向

Bool

true或false

true

  • alpha决定跳转概率系数,也称为阻尼系数,是算法内的计算控制变量。
  • convergence为每次迭代各个点相较于上次迭代变化的绝对值累加和上限,当小于这个值时认为计算收敛,算法停止。
  • 收敛精度(convergence)设置较大值时,迭代会较快停止。

注意事项

收敛精度(convergence)设置较大值时,迭代会较快停止。

示例

需要在图引擎编辑器的算法区内,选定该算法进行操作。具体操作详见使用算法分析图

输入参数alpha=0.85,coverage=0.00001,max_iterations=1000,directed=true,计算结果中的top节点组成的子图会展示在绘图区,节点大小根据PageRank值的大小来区别,JSON结果会展示在查询结果区。