更新时间:2022-02-22 GMT+08:00
PageRank算法
概述
PageRank算法又称网页排名算法,是一种由搜索引擎根据网页(节点)之间相互的超链接进行计算的技术,用来体现网页(节点)的相关性和重要性。
- 如果一个网页被很多其他网页链接到,说明这个网页比较重要,也就是其PageRank值会相对较高。
- 如果一个PageRank值很高的网页链接到其他网页,那么被链接到的网页的PageRank值会相应地提高。
适用场景
PageRank算法适用于网页排序、社交网络重点人物发掘等场景。
参数说明
参数 |
是否必选 |
说明 |
类型 |
取值范围 |
默认值 |
---|---|---|---|---|---|
alpha |
否 |
权重系数(又称阻尼系数) |
Double |
0~1,不包括0和1 |
0.85 |
convergence |
否 |
收敛精度 |
Double |
0~1,不包括0和1 |
0.00001 |
max_iterations |
否 |
最大迭代次数 |
Int |
1~2000 |
1000 |
directed |
否 |
是否考虑边的方向 |
Bool |
true或false |
true |
- alpha决定跳转概率系数,也称为阻尼系数,是算法内的计算控制变量。
- convergence为每次迭代各个点相较于上次迭代变化的绝对值累加和上限,当小于这个值时认为计算收敛,算法停止。
- 收敛精度(convergence)设置较大值时,迭代会较快停止。
注意事项
收敛精度(convergence)设置较大值时,迭代会较快停止。
示例
输入参数alpha=0.85,coverage=0.00001,max_iterations=1000,directed=true,计算结果中的top节点组成的子图会展示在绘图区,节点大小根据PageRank值的大小来区别,JSON结果会展示在查询结果区。
父主题: 算法参考