主要思想
Deepwalk是一种将随机游走和word2vec两种算法相结合的图结构数据的挖掘算法。该算法可以学习网络的隐藏信息,能够将图中的节点表示为一个包含潜在信息的向量,
Deepwalk算法
该算法主要分为随机游走和生成表示向量两个部分,首先利用随机游走算法(Random walk)从图中提取一些顶点序列,然后借助自然语言处理思路,将生成的顶点序列看作由单词组成的句子,所有的序列可以看作一个大的语料库,最有利用自然语言处理工具word2vec将每一个顶点表示为一个维度为 d d d的向量。
符号定义 一个图可以表示为:
G
=
(
V
,
E
)
G = (V,E)
G=(V,E)
其中
V
V
V表示顶点的集合,
E
E
E表示边的集合,且
E
⊆
V
×
V
E \subseteq V \times V
E⊆V×V
算法
随机游走算法
定义
所谓随机游走,就是在网络上不断重复的随机选择游走路径,最终形成一条贯穿网络的路径。
从一个顶点出发,然后按照一定的概率随机移动到一个邻居节点,并将该节点作为一个新的当前节点,如此循环执行若干步,得到一条游走路径。
经验
先大致了解,慢慢的将其全部都搞定
经验
深度游走算法 → \rightarrow →图嵌入算法, 慢慢的将其全部都搞定。会自己全部都将其搞完整都行啦的回事与打算。