GNN Algorithms (1): DeepWalk

news2025/1/10 20:39:17

DeepWalk Concept

图表示Graph Embedding based on Random Walk

-> Graph GNN based neighbor aggregation.

Graph Embedding使用低维稠密向量的形式表示图中的节点，使得在原始图中相似的节点在低维表达空间中也相似。

DeepWalk关键基础是Random Walk和word2vec，word2vec关键基础是SkipGram

->DeepWalk通过Random Walk方式在图中进行节点采样

-> node sequence来模拟语料库中的语料，进而使用word2vec学习图中节点与节点的共线关系

-> 相邻节点的权重矩阵，进而学习到节点的向量表示。

Random Walk

Random Walk用于随机生成一条节点序列node sequence。

随机游走是一种可重复访问已访问节点的深度优先遍历算法。给定当前访问起始节点，从其邻居中随机采样节点作为下一个访问节点，重复此过程，直到访问序列长度满足预设条件。

word2vec~CBOW model

词袋模型，CBOW的目标是根据上下文contextual words来预测当前中心词的概率，且上下文所有单词对当前中心词出现的概率影响权重是一样的，如在袋子中取词，取出足够数量的词就可以了，与取出词的先后顺序无关。

word2vec~skip-gram model

根据中心词来预测上下文词概率。

V，语料库词汇量

N，隐藏层神经单元数量 = word embedding size

C，窗口大小，是预测单词的最大的上下文位置，那么总共的上下文词位置数目K=2c，比如预测上下文单词窗口为2，那么我们将会在(t-2), (t-1), (t+1), (t+2)的上下文位置预测contextual word。

|v|，输入向量维度，one-hot编码

[|v|, N]，hidden layer权重矩阵W的维度，权重矩阵每一列对应着一个神经元，执行Σ加权求和操作。

H[N]，hidden layer输出向量，维度是N。

W’，输出层的权重矩阵，维度是[N, |v|]。

U，输出层的输出向量，概率向量，维度是|v|，没有激活成0-1向量。

输入：only one中心词v-dimensional one-hot向量。

输出：2*c上下文词的one-hot vectors！

w(t)是中心词，也叫输入词input word，其中只有一个隐藏层，它执行权重矩阵和输入向量w(t)之间的点积运算。隐藏层中不需要使用激活函数。

然后，隐藏层中的点积运算结果被传送到输出层，输出层计算隐藏层输出向量和输出层权重矩阵之间的点积。

最后，使用softmax函数来计算在给定上下文位置中，输出层输出单词向量出现在w(t)上下文中的概率。

skip-gram steps

1) 利用one-hot编码将语料库单词转化为one-hot向量，这些向量维度[1,|V|]。

2) 输入中心词one-hot向量w(t)从|v|神经元被传递到hidden layer

3) 隐藏层执行权重矩阵W[|V|, N]和输入向量w(t)之间的点积运算。[1, V]*[V, N] -> [1, N]隐藏层不适用激活函数，所以H会直接传递到输出层。

4) 输出层执行H[1,N]和输出权重矩阵W'之间的点积运算，得到output vector u

5) 使用softmax函数，得到激活后的输出相邻output vector y。

如果要预测2c=K个上下文位置的contextual words，那么对于一个给定中心词w(t)，要生成K个相同的contextual word vector，与真实的K个one-hot vector对比，继而进行反向传播更新权重，那么对于语料库中v个单词，总共的计算次数为|v|*K。

6) 通过交叉熵损失函数loss function来进行BP反向传播，更新权重矩阵W和W'。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/94978.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Hubbell EDI 855 采购订单确认报文详解

Hubbell EDI 855 采购订单确认报文详解

Hubbell于纽约证券交易所上市，全球员工近12000名，在欧美地区以其高品质获得人们的青睐，成为家喻户晓的品牌，同类产品占有份额达95%以上。在数字化的今天，HUBBELL延续了在一个多世纪前建立的增长和创新传统&#xff0…

阅读更多...

Sql Server 生成 Word 文档表结构

Sql Server 生成 Word 文档表结构

打开数据库编辑器，输入以下代码并执行（F5） SELECT 表名 case when a.colorder1 then d.name else end, 表说明 case when a.colorder1 then isnull(f.value,) else end, 序号 a.colorder, 列名 a.name, …

阅读更多...

QT6+CloudCompare显示3D点云

QT6+CloudCompare显示3D点云

CloudCompare是一个三维点云（网格）编辑和处理软件。最初，它被设计用来对稠密的三维点云进行直接比较。它依赖于一种特定的八叉树结构，在进行点云对比这类任务时具有出色的性能。此外，由于大多数点云都是由地面激光扫描…

阅读更多...

文本转语音免费微软Azure官网，在线就可以转语音。

文本转语音免费微软Azure官网，在线就可以转语音。

使用跨 140 种语言和变体的 400 种神经网络语音吸引全球受众。使用极具表现力和类似人类的声音，使文本阅读器和已启用语音的助理等方案栩栩如生。神经网络文本转语音支持多种朗读风格，包括新闻广播、客户服务、呼喊、耳语以及高兴、悲伤等情感。地址文…

阅读更多...

【Java寒假打卡】Java基础-数组学习笔记

【Java寒假打卡】Java基础-数组学习笔记

【Java寒假打卡】Java基础-数组学习笔记一、定义二、定义格式三、数组动态初始化四、数组元素访问五、内存分配六、多个数组的不同内存图七、数组的静态初始化八、数组操作的两个小问题九、求数组的最大值十、查找数组的特定值一、定义数组是一个容器，存储一种数组…

阅读更多...

6 CPP之C风格字符串

6 CPP之C风格字符串

CPP之C风格字符串 c中的string类，封装了C风格的字符串。使用方便，能自动扩展，不用担心内存问题在某些场景中，C风格字符串更方便，更高效 C标准库、Linux系统和开源库，大部分开源库一定有C语言版本&…

阅读更多...

Vue前端浏览器链接/接口参数实现加密

Vue前端浏览器链接/接口参数实现加密

场景由于项目创建之前后端设计不合理，导致详情页链接参数id为顺序序数(例：1,2,3…等等)，安全系数非常低（虽然我们前端做了菜单权限、按钮权限、Api权限等等），现在要前端解决下浏览器链接/接口参数实现加密…

阅读更多...

《Linux运维总结：基于xtrabackup8工具全量物理备份Mysql8数据自动化工具(方案一)》

《Linux运维总结：基于xtrabackup8工具全量物理备份Mysql8数据自动化工具(方案一)》

一、背景信息说明：由于业务系统的特殊性，对数据的备份要求非常高，且数据量非常大，所以这里采用xtrabackup工具来对Mysql数据库进行全量物理备份。由于xtrabackup工具操作复杂，这里为了简便，基于xtrabackup…

阅读更多...

张驰咨询：快速提高流程效率的5个关键精益生产工具

张驰咨询：快速提高流程效率的5个关键精益生产工具

精益，又称“精益制造”或“精益生产”，注重通过消除浪费、消除缺陷，实现客户价值最大化。精益工具是关于理解过程，发现浪费，防止错误和记录你所做的事情。让我们来看看流程改进中使用的五种精益工具，它们…

阅读更多...

建立企业数据共享机制，打破数据壁垒

建立企业数据共享机制，打破数据壁垒

很多人可能也比较疑惑，为什么数据这么重要，能够有着数据治理、数据标准、数据管理以及我们接下来要讲的数据共享，各种针对数据的机制体系。一方面是因为数据在数字经济和数字化转型进程中发挥了巨大作用，甚至可以称得上是两者的核…

阅读更多...

RCNN网络源码解读（Ⅰ） --- 获取数据并预处理数据

RCNN网络源码解读（Ⅰ） --- 获取数据并预处理数据

目录 1.RCNN是什么东西 2.处理数据集 2.1 code：下载VOC数据集（pascal_voc.py） 2.2 code： 数据集预处理（pascal_voc_car.py） 3.code区域候选建议（selectivesearch.py） 1.RCNN是什…

阅读更多...

Web(十)JavaScript知识训练-JS函数

Web(十)JavaScript知识训练-JS函数

1、下列选项中，（ B）可用于检查某个值是否为无穷大的数。 A、 isNaN（） B、 isFinite（） C、 parseInt（） D、 parseFloat（） 2、函数parseInt(15.36)…

阅读更多...

燕东微在科创板上市：市值263亿元，北京电控、亦庄国投等为股东

燕东微在科创板上市：市值263亿元，北京电控、亦庄国投等为股东

12月16日，北京燕东微电子股份有限公司（下称“燕东微”，SH:688172）在上海证券交易所科创板上市。本次在上市，燕东微的发行价为21.98元/股，募资总额约为39.53亿元，募资净额约为37.57亿元&#xff…

阅读更多...

【Java寒假打卡】Java基础-方法

【Java寒假打卡】Java基础-方法

【Java寒假打卡】Java基础-方法一、定义二、方法的定义和调用三、方法调用过程四、带参数的方法和调用五、debug查看方法参数传递六、带返回值的方法的调用七、方法重载八、方法传递数据九、返回一个数组的最大值和最小值一、定义方法就是一段具有独立功能的代码块&#xff0…

阅读更多...

Java中的Set系列集合

Java中的Set系列集合

Set系列集合Set系列集合Set系列集合概述HashSet元素的底层原理：哈希表HashSet元素去重复的底层原理实现类：LinkedHashSet实现类：TreeSetCollection体系的特点、使用场景终结补充知识：可变参数集合工具类CollectionsCollection体系…

阅读更多...

Unity PolyNav2D(2D寻路) 插件

Unity PolyNav2D(2D寻路) 插件

下载地址 https://download.csdn.net/download/qq_27461747/87300286 组件 PolyNav2D 寻路地图，一般来说有且只有一个， 寻路的主要接口就在这个组件里PolyNavObstacle 障碍物PolyNavAgent 导航代理, 带有移动功能。这个可有可无，可以自己…

阅读更多...

重点| 系统集成项目管理工程师考前50个知识点（6）

重点| 系统集成项目管理工程师考前50个知识点（6）

本文章总结了系统集成项目管理工程师考试背记50个知识点！！！ 帮助大家更好的复习，希望能对大家有所帮助比较长，放了部分，需要可私信！！ 40、冲突的下列特点： &#xff…

阅读更多...

css知识复习点

css知识复习点

四种css使用方式：内嵌式、外链式、行内式、导入式复合选择器后代选择器选择器之间需要用空格隔开，后代不一定是儿子 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>复合…

阅读更多...

渗透测试-crlf注入原理

渗透测试-crlf注入原理

目录概念 HTTP报文结构与漏洞原理漏洞检测 Bottle之CRLF漏洞 nginx配置错误之CRLF漏洞漏洞危害会话固定修复建议漏洞检测POC 概念这个漏洞一般很少出现。 CRLF是CR和LF两个字符的拼接，它们分别代表”回车换行”（\r\n）。十六…

阅读更多...

[附源码]Nodejs计算机毕业设计基于的学生事务管理系统Express(程序+LW)

[附源码]Nodejs计算机毕业设计基于的学生事务管理系统Express(程序+LW)

该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程。欢迎交流项目运行环境配置： Node.js Vscode Mysql5.7 HBuilderXNavicat11VueExpress。项目技术： Express框架 Node.js Vue 等等组成，B/S模式 Vscode管理前后端分…

阅读更多...

推荐文章

最新文章