PageRank算法介绍

news2024/10/7 20:27:15

互联网上有数百亿个网页,可以分为这么几类:不含有用信息的,比如垃圾邮件;少数人比较感兴趣的,但范围不是很广的,比如个人博客、婚礼公告或家庭像册;很多人感兴趣的并且十分有用的,比如社交网站、新闻网站或某个公司的网站。

如此大量的网页对搜索引擎来说是个问题,因为搜索结果可能会有百万个甚至千万个。比如,你想访问“知乎”,但是不知道它具体的URL,这时你会在搜索框里输入“知乎”两个字,假设搜索结果有几百万条,那么最热门的那一条或者说“最正确”的那一条该如何来确定呢?

一个比较有效的方法是数inlinks,以知乎为例,数有多少个链接指向它。PageRank就是基于这种链接分析(link analysis)的算法。

PageRank计算过程示例

假设有三个网页,他们的结构如下:

对于网页C来说,它的PageRank表示为PR(C),则有PR(c) = \frac{PR(A)}{2} + PR(B)。因为对于C来说,它的inlinks来自于A和B。而A有两个指向外部的链接,指向C的占其中的二分之一。同理,对于

A来说,有 

PR(A)=PR(C);PR(B)=PR(A)2

假设,每个网页的初始值为$\frac{1}{3}$,则经过几次迭代后,PageRank会收敛到某个值。过程如下:

初始值: 

PR(A)=13,PR(B)=13,PR(C)=13

第一次迭代: 

PR(A)=PR(C)=0.33,PR(B)=PR(A)2=0.17,PR(C)=PR(A)2+PR(B)=0.332+0.33=0.5

。注意:利用上一次迭代的值进行计算

第二次迭代: 

PR(A)=0.5,PR(B)=0.17,PR(C)=0.332+0.17=0.33

第三次迭代:

PR(A)=0.33,PR(B)=0.25,PR(C)=0.42

第四次迭代:

PR(A)=0.42,PR(B)=0.21,PR(C)=0.42

第n次迭代...

经过更多次的迭代后,PR值收敛在

PR(A)=0.4,PR(B)=0.2,PR(C)=0.4

PageRank的矩阵表示及计算过程

以下是python示例

import numpy as np

# 确定网页图的结构
m = int(input('网页的总个数'))
map_page = [[-1 for i in range(m)] for j in range(m)]
map_page[0][1] = 1
map_page[0][2] = 1
map_page[1][3] = 1
map_page[2][0] = 1
map_page[2][1] = 1
map_page[2][3] = 1
map_page[3][2] = 1


Pr = np.ones((m,))/m
print('原始页面重要性初始化:\n')
print(Pr)

n = int(input('经过多少次迭代:'))
for k in range(n):
    new_Pr = [0 for i in range(m)]
    d = [0 for i in range(m)]
    for i in range(m):

        for j in range(len(map_page[i])):
            # 统计第i个节点的出度
            if map_page[i][j] == 1:
                d[i] += 1
    for i in range(m):
        for j in range(len(map_page[i])):
            if map_page[j][i] == 1:
                new_Pr[i] += Pr[j]/d[j]
    print(f'经过{k+1}次迭代以后的结果为:\n')
    Pr = new_Pr.copy()
    print(Pr)

print(f'经过{n}次迭代以后的结果为:\n')
print(Pr)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/417826.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于DBN神经网络的语音分类识别

目录 背影 DBN神经网络的原理 DBN神经网络的定义 受限玻尔兹曼机(RBM) DBN的语音分类识别 基本结构 主要参数 数据 MATALB代码 结果图 展望 背影 DBN是一种深度学习神经网络,拥有提取特征,非监督学习的能力,是一种非常好的分类算法,本文将DBN算法应用于语音分类 DBN神…

排污口漂浮物监测系统 yolov5

排污口漂浮物监测系统通过YOLOV5网络模型技术,排污口漂浮物监测算法模型对河道两岸各处排污口进行7*24小时不间断实时监测,当监测到河道两岸的排污口违规乱排乱放时,不需人为干预系统立即抓拍存档告警。我们选择当下YOLO卷积神经网络YOLOv5来…

实现数字化转型升级,快速开发平台流辰信息来助力!

在如今迅猛发展的年代里,科技的力量是伟大的,可以让老百姓的生活变得丰富多彩,也可以让各行各业的企业实现办公自动化,朝着数字化转型升级,快速提升办公协作效率。快速开发平台流辰信息作为一家低代码平台服务商&#…

(顺序栈)有效括号序列

文章目录前言:问题描述:问题解析:代码实现:总结:前言: 此篇是针对顺序栈的经典练习题。 问题描述: 给定一个只包括 ‘(’,‘)’,‘{’,‘}’,‘…

iOS / iPadOS 15.7.4发布安全更新 旧版iPhone和ipad无法升级系统解决方法

苹果于昨日面向无法升级到 iOS / iPadOS 16 的旧款 iPhone 和 iPad,发布了 iOS / iPadOS 15.7.4 更新。本次更新并未引入新的功能,而是重点修复了存在于 WebKit 的两个“关键”漏洞。 iOS / iPadOS 15.7.4发布安全更新: 目前已经有充足的证据…

adb基本操作操作

Mumu模拟器 进入终端 cd C:\Program Files\Netease\MuMuPlayer-12.0\shell 获取root权限 adb root 连接手机 adb connect 127.0.0.1:7555 adb shell 查看连接多少台设备 adb devices 安装程序apk adb install C:\Android\CalcTest.apk adb install -r C:\Android\CalcT…

遥感常用库的比较:Rasterio vs GDAL

一、前言本博客对三种栅格处理工具做一个小小的比较:Python (rasterio) 和 GDAL。当我开始使用 GIS 和栅格处理时,我并没有真正关注我编写的脚本和使用的工具的性能。 但现在,处理更大的数据、更高的空间分辨率、快速处理我的光栅文件是成功的…

国产PIE-SAR软件

1.产品定位 PIE-SAR是一款针对国内外主流星载SAR传感器的数据处理分析软件,提供图形化操作界面。目前已支持国内外主流星载SAR传感器的数据处理与分析,包括强度图像基础处理、区域网平差处理(含异源匹配、RD/RPC区域网平差)、InS…

TensorFlow 1.x 深度学习秘籍:1~5

原文:TensorFlow 1.x Deep Learning Cookbook 协议:CC BY-NC-SA 4.0 译者:飞龙 本文来自【ApacheCN 深度学习 译文集】,采用译后编辑(MTPE)流程来尽可能提升效率。 不要担心自己的形象,只关心如…

知识图谱学习笔记——(二)知识图谱的表示

一、知识学习 声明:知识学习中本文主体按照浙江大学陈华钧教授的《知识图谱》公开课讲义进行介绍,并个别地方加入了自己的注释和思考,希望大家尊重陈华钧教授的知识产权,在使用时加上出处。感谢陈华钧教授。 (一&…

Node版本管理工具

一、nvm简述 官网地址:https://nvm.uihtm.com/ nvm(全称:node.js version management),是一个nodejs的版本管理工具,为解决node.js各种版本存在不兼容问题,可以使用nvm工具快速安装和切换不同版…

领英精灵安全吗?附LinkedIn(领英)开发客户的关键点

面对全球最大的职场社交平台——LinkedIn(领英),很多蠢蠢欲动的外贸新人经常会问到:为什么那么多的外贸培训课程,机构和讲师以及一些外贸老鸟都会提到“如果想要把LinkedIn(领英)经营成一个有效的客户开发渠道,都会建议利用针对Li…

【机器学习】P17 梯度下降 与 梯度下降优化算法(BGD 等 与 Adam Optimizer、AdaGrad、RMSProp)

梯度下降与梯度下降算法梯度下降梯度下降算法基础优化算法批量梯度下降 BGD随机梯度下降 SGD小批量梯度下降 MBGD动量梯度下降 MGD基础优化算法上的改进和优化的算法自适应梯度算法 Adagrad均方根传播算法 RMSProp自适应矩估计算法 Adam代码如何实现梯度下降如何判断收敛梯度下…

pytorch搭建ResNet50实现鸟类识别

🍨 本文为🔗365天深度学习训练营 中的学习记录博客 🍦 参考文章地址: 365天深度学习训练营-第J1周:ResNet-50算法实战与解析 🍖 作者:K同学啊 理论知识储备 深度残差网络ResNet(dee…

KD2511N高精度直流低电阻值测试仪

一、产品简介 KD2511N直流低电阻测试仪采用32bits CPU和高密度 SMD贴装工艺, 拥有0.05%的 电阻测量精度及1uΩ 小电阻分辨率,内部比较器可让使用者自行设定上限/下限参考比较值。高达每秒15次的测试速度能显著提高工作效率,免清零的设计在小电…

数据结构刷题笔记 | 数组、字符串、链表、栈、队列、数、图

本篇为笔者学习数据结构时,在牛客网站的刷题笔记。 数据结构分为: 逻辑结构【面向问题的】 集合结构线性结构(一对一)树形结构(一对多的层次关系)图形结构(多对多) 物理结构&#x…

Docker 实战笔记-基础

转载请标明出处:http://blog.csdn.net/zhaoyanjun6/article/details/130181636 本文出自【赵彦军的博客】 文章目录官网下载安装安装Docker 镜像常用命令docker infodocker imagesdocker versiondocker 仓库官方仓库:[https://hub.docker.com/](https://…

移动端树形结构

该组件依据需求来做,当前包含三种选择状态,选中,未选中,半选。由于不需要做树形的收缩展开故没有写相关内容。树形展开与收缩与选中类似,只需要在节点上挂载相关字段即可实现。由于需求需要增加不限的功能,…

Moonbeam操作指南 | 如何设置Moonbeam开发节点

Moonbeam开发节点是为本地构建和测试应用的个人开发环境。对以太坊开发者来说,可以和Ganache相媲美。可以使你快速上手,且无需中继链的支出即可轻松实现。 有2种方式可以开始运行节点:使用Docker运行一个预构建的二进制文件,或者…

Java面试宝典

JDK,JRE,JVM 三者关系? JDK 是 JAVA 程序开发时用的开发工具包,其内部也有 JRE 运行环境 JRE。JRE 是 JAVA 程序运行时需要的运行环境,就是说如果你光是运行 JAVA 程序而不是去搞开发的话,只安装 JRE 就能运行已经存在的 JAVA 程…