common neighbors(CN)
公共邻居的数量。
Jaccard
用于比较有限样本集之间的相似性与差异性。Jaccard系数值越大,样本相似度越高。
preferential attachment(PA)
节点倾向于连接到节点度较高的节点上,(强者越强,一个节点如果已经接受了很多连接,那么它就越容易被新来的节点所连接)。
Adamic-Adar(AA)
节点 x 的权重 w(x) 为 x 的邻居集合 N(x) 的模取以 10 为底的对数后再取倒数:
邻居越少的节点权重越大,
AA 指标用两个节点共同邻居的权重和描述它们的紧密度。值越大,代表两个节点越紧密;如果值为 0 意味着两个节点不紧密。
resource allocation(RA)
指标假设网络中每一个节点都有一定的资源,没有直接相连的两个节点之间通过共同邻居作为媒介传递资源。每个节点都将自己的资源平均分配给它所有邻居。把此时目标节点接受到的资源数定义为这两个节点的相似度。
Katz
两节点相似度的定义:
walks(x,y)是从x到y的长度为l的路径集合
β 为权重衰减因子,为了保证数列的收敛性, β 的取值须小 于邻接矩阵 A 最大特征值的倒数。
矩阵A的第l次幂的每个项等于相应节点对之间长度为l的路径的个数。
衰减因子的最优值只能通过大量的实验验证获得, 因此具有一定的局限性。
变量为衰减因子β
PageRank(PR)
节点 x 的有根 PageRank 计算从 x开始的随机游走者的平稳分布,该随机游走者以概率α迭代地移动到其当前位置的随机邻居,或以概率 1 -α回到x。
令P为转移矩阵,则平稳分布为Π,当用于链接预测时,(x, y) 的分数由 [πx]y 给出(或 [πx]y + [πy]x 表示对称)。
其中总和被接管w 从 x 开始并在 y 结束(可能多次接触 x 和 y)。对于步行 w = < v0, v1, · · · , vk> , len(w) := |<v0, v1, · · · , vk>|是步行的长度。项P[w] 定义为 可以解释为旅行w的概率。
变量为α
SimRank
两个节点如果它们的邻居也相似,则它们是相似的。它以以下递归方式定义:如果 x = y,则 s(x, y) := 1;否则
其中 γ 是一个介于 0 和 1 之间的常数