CS224W3.2——随机游走(Random Walk)

news2024/11/25 20:55:30

上一文中说道定义节点相似度函数的时候使用Random Walk方法:

  • CS224W3.1——节点Embedding

这节课来说一下Random Walk方法。在这篇中,我们来看一个更有效的相似函数——在图上随机游走的节点共现的概率。我们介绍随机游走背后的直觉,我们将优化的目标函数,以及我们如何有效地执行优化。我们引入了node2vec,它结合了BFS和DFS来推广随机游走的概念。

文章目录

  • 1. 背景
  • 2. Random Walk定义
  • 3. 为什么使用Random Walk?
  • 4. 无监督学习
  • 5. Random Walk流程
  • 6. 随机游走策略
    • 6.1 node2vec
    • 6.2 其他随机游走策略
  • 7. 总结

1. 背景

在这里插入图片描述

2. Random Walk定义

在这里插入图片描述

我们要怎样定义相似性和概率的概念?

在这里插入图片描述

下面是思想:

在这里插入图片描述

  • 首先,我们需要通过随机游走策略(后面会说)估计出,从节点u到节点v的概率。
  • 然后我们要优化embedding,用这种方式来编码随机游走统计。

3. 为什么使用Random Walk?

我们想使用随机漫步,因为它们很有表现力,很灵活。给出了一种灵活的随机节点相似度定义,该定义结合了具有信息的局部和高阶邻居。

这个想法是,如果通过随机游走,从节点u访问到节点v,那么节点u和节点v很可能是相似的(它们有类似的网络邻居它们彼此靠得很近,它们之间可能有多条路径等等)。

这在某种程度上也是有效的因为我们在训练时不需要考虑所有的节点对。我们只需要考虑随机漫步中共出现的成对。

4. 无监督学习

在这里插入图片描述

设置优化问题:

在这里插入图片描述

  • 随机游走优化:

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

但是这样计算复杂度很高:

在这里插入图片描述

来自softmax的归一化项是罪魁祸首:

在这里插入图片描述

答案是可以的:

在这里插入图片描述

其中的负采样:

在这里插入图片描述

也就是说度越高的节点,越可能被选为负例。

  • 随机梯度下降(Stochastic Gradient Descent)优化损失函数:

在这里插入图片描述

在这里插入图片描述

5. Random Walk流程

在这里插入图片描述

6. 随机游走策略

在这里插入图片描述

6.1 node2vec

在这里插入图片描述

在这里插入图片描述

node2vec的思想是通过设置偏见(biased)去调整随机游走策略,可以是更倾向于广度优先搜索,那么这个时候就会更体现局部信息,也可以更倾向深度优先搜索,那么这个时候就会更体现全局信息。

在这里插入图片描述

两个超参数:

在这里插入图片描述

在这里插入图片描述

思想是记住来路。

参数设置:

在这里插入图片描述

在这里插入图片描述

总结:

在这里插入图片描述

6.2 其他随机游走策略

在这里插入图片描述

7. 总结

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1147143.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

中电文思海辉:塑造全球AI能力,持续强化诸多行业战略

【科技明说 | 重磅专题】 中电文思海辉以前就是叫文思海辉, 这是由之前两家上市软件外包公司文思信息和海辉软件合并而来,2018年当时各自股票以1:1的比例进行整合,双方股东各持有新公司50%的股权,合并后新公司名称为文…

私有云:【4】Esxi安装Server2012R2

私有云:【4】Esxi安装Server2012R2 1、使用Esxi安装虚拟机2、启动虚拟机3、安装必要服务及打补丁 1、使用Esxi安装虚拟机 选择esxi虚拟机挂在Win2012的镜像iso 使用Esxi客户端新建虚拟机 设置虚拟机名称及系统作为模板,如图所示 选择数据存储&#xff0…

mysql 增删改查基础命令

数据库是企业的重要信息资产,在使用数据库时,要注意(查和增,无所谓,但是删和改,要谨慎! ) 数据库管理系统(DBMS) :实现对数据的有效组织,管理和存取的系统软件 mysgl 数据库是一个系统, 是一个人机系统,硬件, gs,数据库…

软件设计师做题技巧(下午题)

第一题 数据流图 名词解释外部实体系统外部现实世界存在的物体 矩形表示数据存储一般都是数据库表名 矩形表示数据流数据如何在系统中流动和传输加工/数据处理系统的计算或者操作 圆角矩阵表示数据流图等级数据流图等级是指所涉及的数据项和处理的复杂程度 采用结构化语言对x…

【5G PHY】5G SS/PBCH块介绍(二)

博主未授权任何人或组织机构转载博主任何原创文章,感谢各位对原创的支持! 博主链接 本人就职于国际知名终端厂商,负责modem芯片研发。 在5G早期负责终端数据业务层、核心网相关的开发工作,目前牵头6G算力网络技术标准研究。 博客…

链式存储方式下字符串的replace(S,T1,T2)运算

链式存储方式下字符串的replace运算 ⭐️题目⭐️思路⭐️代码✨定义结点✨打印字符串函数✨计算字符串函数✨初始化字符串函数✨代码解读✨字符串替换函数✨字符串替换函数解读✨ 主函数✨完整代码 实现在链式存储下字符串的replace(S,T1,T2),来自课本习题的一道题…

[Linux]线程池

[Linux]线程池 文章目录 [Linux]线程池线程池的概念线程池的优点线程池的应用场景线程池的实现 线程池的概念 线程池是一种线程使用模式。线程池是一种特殊的生产消费模型,用户作为生产者,线程池作为消费者和缓冲区。 线程过多会带来调度开销&#xff0c…

【计算机视觉】对极几何

文章目录 一、极线约束(Epipolar Constraint)二、相机标定过的情况三、相机没有标定过的情况四、八点算法(eight-point algorithm) 我的《计算机视觉》系列参考UC Berkeley的CS180课程,PPT可以在课程主页看到。 在上一…

进行商城的测试用例设计思路是什么?

进行商城的测试用例设计时,可以考虑以下思路: 1. 功能测试:测试商城的基本功能是否正常工作,包括用户注册、登录、浏览商品、搜索商品、添加商品到购物车、下单、支付等。 2. 数据验证测试:验证商城中的数据是否正确…

深入浅出认识Kubernetes

用来管理容器,容器编排工具 容器化有助于打包软件来实现这些目标,从而使应用程序可以轻松快速地发布和更新,而无需停机。Kubernetes可帮助您确保那些容器化的应用程序在所需的位置和时间运行,并帮助他们找到工作所需的资源和工具。…

10阶杨辉三角

【任务需求】 定义一个函数,根据杨辉三角的数学概念,使用循环嵌套进行编写实现杨辉三角的关,并用for循环实现10阶杨辉三角,最后输出时需使10阶杨辉三角每行数字左右对称,按要求编写程序。 def triangle(rows):triang…

将数据文件,控制文件,日志文件分别放在不同的目录下,且数据库正常启动

一、定位数据文件、控制文件、日志文件的位置 注意:后序需要用到这些文件的位置,可以在查询完毕之后先截图保存 1.以管理员身份登录数据库 sqlplus / as sysdba2.查找数据文件位置 SELECT name FROM v$datafile;3.查找控制文件位置 SELECT name FROM …

设计模式:享元模式(C#、JAVA、JavaScript、C++、Python、Go、PHP)

上一篇《原型模式》 下一篇《责任链模式》 简介: 享元模式,它是一种结构型设计模式,旨在有效地支持大量细粒度的对象共享,通过共享对象来减少内存消耗和…

【C++】缺省参数及函数重载

📙 作者简介 :RO-BERRY 📗 学习方向:致力于C、C、数据结构、TCP/IP、数据库等等一系列知识 📒 日后方向 : 偏向于CPP开发以及大数据方向,欢迎各位关注,谢谢各位的支持 目录 1. 缺省参数1.1 缺省…

常见持久层框架赏析,到底是什么让你选择 MyBatis?

在绝大多数在线应用场景中,数据是存储在关系型数据库中的,当然,有特殊要求的场景中,我们也会将其他持久化存储(如 ElasticSearch、HBase、MongoDB 等)作为辅助存储。但不可否认的是,关系型数据库…

Ubuntu20.04操作系统安装及重中之重:系统分区

最近因为学习原因,需要将电脑设置为双系统,在windows10的系统下去安装Ubuntu操作系统。本来看网上相关的安装教程蛮多的,以为比较简单,结果一路过五关斩六将,坑的七零八落的,折腾了好久,才算安装…

【Java】LinkedList 集合

LinkedList集合特点 LinkedList 底层基于双向链表实现增删 效率非常高,查询效率非常低。 LinkedList源码解读分析 LinkedList 是双向链表实现的 ListLinkedList 是非线程安全的(线程是不安全的)LinkedList 元素允许为null,允许重复元素Linked…

基于 ARM+FPGA+AD的高精度数据采集系统设计

随着图像处理 、 工业控制 、 无线通信等领域的飞速发 展 , 对数据采集系统的速度 、 精度等性能要求也越来越高 。 这些要求都对数据采集系统的设计和实现提出了新的挑 战 。 目前数据采集系统的设计方案通常分为以下几类 : 1 &#xff0…

【持续交付】个人网站

今天给大家演示下如何基于Vuepress尝试持续交付博客网站。 也尝试过其他的方案,比如使用Typora导出html文件,并scp该文件到服务器上。 效果图 该持续交付主流程如下图 提交代码后会触发webHook生成version.txt,部署脚本每分钟轮询一次检测是否存在vers…

私有云:【14】桌面映射外网

私有云:【14】桌面映射外网 1、选择服务器设置2、选中以下项,填写自己的公网IP3、最后这个也修改掉 1、选择服务器设置 2、选中以下项,填写自己的公网IP 3、最后这个也修改掉 桌面映射外网设置完成,前提要有公网IP噶,…