GNN Algorithms (1): DeepWalk

news2025/1/10 20:39:17

DeepWalk Concept

图表示Graph Embedding based on Random Walk

-> Graph GNN based neighbor aggregation

Graph Embedding使用低维稠密向量的形式表示图中的节点,使得在原始图中相似的节点在低维表达空间中也相似。

DeepWalk关键基础是Random Walk和word2vec,word2vec关键基础是SkipGram

->DeepWalk通过Random Walk方式在图中进行节点采样

-> node sequence来模拟语料库中的语料,进而使用word2vec学习图中节点与节点的共线关系

-> 相邻节点的权重矩阵,进而学习到节点的向量表示。

Random Walk

Random Walk用于随机生成一条节点序列node sequence

随机游走是一种可重复访问已访问节点的深度优先遍历算法。给定当前访问起始节点,从其邻居中随机采样节点作为下一个访问节点,重复此过程,直到访问序列长度满足预设条件。

word2vec~CBOW model

词袋模型,CBOW的目标是根据上下文contextual words来预测当前中心词的概率,且上下文所有单词对当前中心词出现的概率影响权重是一样的,如在袋子中取词,取出足够数量的词就可以了,与取出词的先后顺序无关。

word2vec~skip-gram model

根据中心词来预测上下文词概率。

V,语料库词汇量

N,隐藏层神经单元数量 = word embedding size

C,窗口大小,是预测单词的最大的上下文位置,那么总共的上下文词位置数目K=2c,比如预测上下文单词窗口为2,那么我们将会在(t-2), (t-1), (t+1), (t+2)的上下文位置预测contextual word。

|v|,输入向量维度,one-hot编码

[|v|, N],hidden layer权重矩阵W的维度,权重矩阵每一列对应着一个神经元,执行Σ加权求和操作

H[N],hidden layer输出向量,维度是N。

W’,输出层的权重矩阵,维度是[N, |v|]。

U,输出层的输出向量,概率向量,维度是|v|,没有激活成0-1向量

输入:only one中心词v-dimensional one-hot向量。

输出:2*c上下文词的one-hot vectors!

w(t)是中心词,也叫输入词input word,其中只有一个隐藏层,它执行权重矩阵输入向量w(t)之间的点积运算。隐藏层中不需要使用激活函数

然后,隐藏层中的点积运算结果被传送到输出层,输出层计算隐藏层输出向量输出层权重矩阵之间的点积。

最后,使用softmax函数来计算在给定上下文位置中,输出层输出单词向量出现在w(t)上下文中的概率。

skip-gram steps

1) 利用one-hot编码将语料库单词转化为one-hot向量,这些向量维度[1,|V|]。

2) 输入中心词one-hot向量w(t)从|v|神经元被传递到hidden layer

3) 隐藏层执行权重矩阵W[|V|, N]和输入向量w(t)之间的点积运算。[1, V]*[V, N] -> [1, N]隐藏层不适用激活函数,所以H会直接传递到输出层

4) 输出层执行H[1,N]和输出权重矩阵W'之间的点积运算,得到output vector u

5) 使用softmax函数,得到激活后的输出相邻output vector y。

如果要预测2c=K个上下文位置的contextual words,那么对于一个给定中心词w(t),要生成K个相同的contextual word vector,与真实的K个one-hot vector对比,继而进行反向传播更新权重,那么对于语料库中v个单词,总共的计算次数为|v|*K。

6) 通过交叉熵损失函数loss function来进行BP反向传播,更新权重矩阵W和W'。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/94978.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Hubbell EDI 855 采购订单确认报文详解

Hubbell于纽约证券交易所上市,全球员工近12000名,在欧美地区以其高品质获得人们的青睐,成为家喻户晓的品牌,同类产品占有份额达95%以上。 在数字化的今天,HUBBELL延续了在一个多世纪前建立的增长和创新传统&#xff0…

Sql Server 生成 Word 文档 表结构

打开数据库编辑器,输入以下代码并执行(F5) SELECT 表名 case when a.colorder1 then d.name else end, 表说明 case when a.colorder1 then isnull(f.value,) else end, 序号 a.colorder, 列名 a.name, …

QT6+CloudCompare显示3D点云

CloudCompare是一个三维点云(网格)编辑和处理软件。最初,它被设计用来对稠密的三维点云进行直接比较。它依赖于一种特定的八叉树结构,在进行点云对比这类任务时具有出色的性能。此外,由于大多数点云都是由地面激光扫描…

文本转语音免费 微软Azure官网,在线就可以转语音。

使用跨 140 种语言和变体的 400 种神经网络语音吸引全球受众。使用极具表现力和类似人类的声音,使文本阅读器和已启用语音的助理等方案栩栩如生。神经网络文本转语音支持多种朗读风格,包括新闻广播、客户服务、呼喊、耳语以及高兴、悲伤等情感。 地址 文…

【Java寒假打卡】Java基础-数组学习笔记

【Java寒假打卡】Java基础-数组学习笔记一、定义二、定义格式三、数组动态初始化四、数组元素访问五、内存分配六、多个数组的不同内存图七、数组的静态初始化八、数组操作的两个小问题九、求数组的最大值十、查找数组的特定值一、定义 数组是一个容器,存储一种数组…

6 CPP之C风格字符串

CPP之C风格字符串 c中的string类,封装了C风格的字符串。 使用方便,能自动扩展,不用担心内存问题 在某些场景中,C风格字符串更方便,更高效 C标准库、Linux系统和开源库,大部分开源库一定有C语言版本&…

Vue前端浏览器链接/接口参数实现加密

场景 由于项目创建之前后端设计不合理,导致详情页链接参数id为顺序序数(例:1,2,3…等等),安全系数非常低(虽然我们前端做了菜单权限、按钮权限、Api权限等等),现在要前端解决下浏览器链接/接口参数实现加密…

《Linux运维总结:基于xtrabackup8工具全量物理备份Mysql8数据自动化工具(方案一)》

一、背景信息 说明:由于业务系统的特殊性,对数据的备份要求非常高,且数据量非常大,所以这里采用xtrabackup工具来对Mysql数据库进行全量物理备份。由于xtrabackup工具操作复杂,这里为了简便,基于xtrabackup…

张驰咨询:快速提高流程效率的5个关键精益生产工具

精益,又称“精益制造”或“精益生产”,注重通过消除浪费、消除缺陷,实现客户价值最大化。精益工具是关于理解过程,发现浪费,防止错误和记录你所做的事情。 让我们来看看流程改进中使用的五种精益工具,它们…

建立企业数据共享机制,打破数据壁垒

很多人可能也比较疑惑,为什么数据这么重要,能够有着数据治理、数据标准、数据管理以及我们接下来要讲的数据共享,各种针对数据的机制体系。一方面是因为数据在数字经济和数字化转型进程中发挥了巨大作用,甚至可以称得上是两者的核…

RCNN网络源码解读(Ⅰ) --- 获取数据并预处理数据

目录 1.RCNN是什么东西 2.处理数据集 2.1 code:下载VOC数据集(pascal_voc.py) 2.2 code: 数据集预处理(pascal_voc_car.py) 3.code区域候选建议(selectivesearch.py) 1.RCNN是什…

Web(十)JavaScript知识训练-JS函数

1、下列选项中,( B)可用于检查某个值是否为无穷大的数。 A、 isNaN() B、 isFinite() C、 parseInt() D、 parseFloat() 2、函数parseInt(15.36)…

燕东微在科创板上市:市值263亿元,北京电控、亦庄国投等为股东

12月16日,北京燕东微电子股份有限公司(下称“燕东微”,SH:688172)在上海证券交易所科创板上市。本次在上市,燕东微的发行价为21.98元/股,募资总额约为39.53亿元,募资净额约为37.57亿元&#xff…

【Java寒假打卡】Java基础-方法

【Java寒假打卡】Java基础-方法一、定义二、方法的定义和调用三、方法调用过程四、带参数的方法和调用五、debug查看方法参数传递六、带返回值的方法的调用七、方法重载八、方法传递数据九、返回一个数组的最大值和最小值一、定义 方法就是一段具有独立功能的代码块&#xff0…

Java中的Set系列集合

Set系列集合Set系列集合Set系列集合概述HashSet元素的底层原理:哈希表HashSet元素去重复的底层原理实现类:LinkedHashSet实现类:TreeSetCollection体系的特点、使用场景终结补充知识:可变参数集合工具类CollectionsCollection体系…

Unity PolyNav2D(2D寻路) 插件

下载地址 https://download.csdn.net/download/qq_27461747/87300286 组件 PolyNav2D 寻路地图,一般来说 有且只有一个, 寻路的主要接口就在这个组件里PolyNavObstacle 障碍物PolyNavAgent 导航代理, 带有移动功能。这个可有可无,可以自己…

重点| 系统集成项目管理工程师考前50个知识点(6)

本文章总结了系统集成项目管理工程师考试背记50个知识点!!! 帮助大家更好的复习,希望能对大家有所帮助 比较长,放了部分,需要可私信!! 40、冲突的下列特点: &#xff…

css知识复习点

四种css使用方式&#xff1a;内嵌式、外链式、行内式、导入式 复合选择器 后代选择器 选择器之间需要用空格隔开&#xff0c;后代不一定是儿子 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>复合…

渗透测试-crlf注入原理

目录 概念 HTTP报文结构与漏洞原理 漏洞检测 Bottle之CRLF漏洞 nginx配置错误之CRLF漏洞 漏洞危害 会话固定 修复建议 漏洞检测POC 概念 这个漏洞一般很少出现。 CRLF是CR和LF两个字符的拼接&#xff0c;它们分别代表”回车换行”&#xff08;\r\n&#xff09;。十六…

[附源码]Nodejs计算机毕业设计基于的学生事务管理系统Express(程序+LW)

该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程。欢迎交流 项目运行 环境配置&#xff1a; Node.js Vscode Mysql5.7 HBuilderXNavicat11VueExpress。 项目技术&#xff1a; Express框架 Node.js Vue 等等组成&#xff0c;B/S模式 Vscode管理前后端分…