Social Network Influence Maximization Based on Graph Attention Mechanisms

news2024/9/20 15:08:29

摘要

  社交网络中的关键节点对整个网络具有重要的影响力,而社交网络中的一些节点可能位于网络的中心,而另一些节点则可能位于网络的边缘,传统的影响力最大化算法忽略了这种不平衡。通过忽略位于网络边缘但连接到中心的节点来导致信息的传播。为了避免陷入局部最优解而无法达到全局最优,从而找到影响力最大的种子节点,提出一种基于图注意力机制的社交网络影响力最大化算法(GATSH)。利用GATSH算法在4个公共网络数据集上进行实验,结果表明该方法能够有效评估网络节点的重要性。

关键词社交网络;图注意力网络;结构孔;关键节点;影响力最大化

I. INTRODUCTION

  随着科技的加速进步,社交网络平台的应用日益普及[1],涵盖了国内外众多主流产品,这些都在推动社交行为从传统物理空间大规模迁移到虚拟平台。用户在社交网络平台上发布的信息量极其庞大,借助高速网络技术,信息可以高效、即时地传递和共享[2]。社交网络影响力研究在数字营销[3]和社交媒体营销领域的重要性日益显现,企业通过这些平台直接与消费者接触,通过用户的分享和传播行为来促进品牌传播和推广。

  受Kempe等人[4]研究的启发,影响力最大化问题近年来引起了学术界的广泛关注和研究兴趣。然而,大多数研究仅从实际应用的角度关注网络内单一信息传播的现象,这在一定程度上限制了其在复杂的现实网络环境中的适应性。 Velikovi等人[5]提出了一种图注意力神经网络,其核心是放弃传统的依赖全局拉普拉斯矩阵的节点更新方法,将注意力机制嵌入到每个节点更新过程的状态中。目的是准确评估邻近节点的重要性并相应地分配权重,以重点关注那些具有重大影响的节点,从而提高模型的整体性能。 Yang J等人[6]提出了一种融合覆盖度和结构孔洞的影响力最大化算法(NCSH),该算法融合节点的覆盖度和结构孔洞属性来综合评估节点的影响力,有效解决了传统启发式算法性能不稳定的问题基于拓扑结构,但这种贪心策略可能会导致算法陷入局部最优解而无法达到全局最优。

   传统的关键节点识别方法在解析图中嵌入的信息时存在局限性[7],例如,在社交网络中,某些用户节点可能占据网络的核心,而其他用户节点则分布在网络的边缘。传统的影响力最大化算法往往会忽略此类节点分布的位置,因此无法对位于网络边缘但能有效连接到中心区域的节点,即处于结构孔位置的节点给予足够的关注。信息传播分析。结构孔位置处的节点 [8] 尽管它们可能不是网络中最明显的,但由于其独特的位置而具有潜在的影响力。鉴于此,本文引入结构洞的概念[9]作为衡量节点影响力的指标,同时考虑网络的整体架构。在充分考虑节点属性特征的基础上,构建了基于图注意力网络和结构洞(GATSH)的影响力最大化模型。为了验证GATSH算法的有效性,本文将GATSH算法与其他几种算法进行了比较,并利用SIR模型和Kendall相关系数τ来说明该算法的优越性[10]。 GATSH算法解决网络节点之间的不平衡问题,动态分配权重并优先考虑重要节点,使信息传播更加均衡、高效;提高信息传播效率,在广告推广、舆情监测等领域具有重要应用价值;优化社交网络结构,有助于提高社交网络的稳定性和传播效率。

II. RELATED TECHNOLOGIES

  社交网络影响最大化(IM)问题首先由 Kempe 等人定义为离散优化问题 [4]:给定社交网络 (,) GVE 和预算 k,目的是找到社交网络中影响力最大的前k个用户作为种子节点,以最大化最终影响的节点数量,从而使网络影响力传播最大化。社交网络被描述为图 ,其中  G 中的节点集合,表示 G 中的节点集合G 中的边,每条边 (,) uvE ⊆ 表示节点 u 到节点 v 的影响关系[11]。 IM问题是找到V中的k个节点作为种子集S,使得影响()S ρ 最大化。如(1)所示。

A. Graph Attention Network

图注意力层 (GAL) [12] 接收一组节点特征作为输入;其中N代表节点总数; F代表节点单个节点包含的特征数量。经过 GAL 运算后,生成一组新的节点特征,并以 作为输出; F'表示其维度对应于每个节点的输出特征的数量。具体来说,对于任意节点 i 和节点 j,首先应用权重矩阵 FF WR≥ ⊆ 进行映射[13],然后使用注意力机制计算它们之间的注意力系数 :FF aRRR ≥↑,如图所示在(2)中:

其中,节点i对其邻居节点j的重要性用ij e 表示,ij e 值的增大意味着节点j对节点i的影响力增大。这种重要性通过softmax函数[14]进行归一化,如(3)中所定义,这确保了节点之间的相对重要性转化为合理的概率分布。

B. Structural Hole

  结构洞理论最早由美国社会学家伯特提出[8]。结构空洞是指社会关系网络中两个不重复的行为者之间的间隔,或者说两个个体之间存在的空白空间。当两个行为者之间既没有直接联系也没有间接联系,并且他们拥有互补的资源或信息时,这种间隔或间隙区域就像网络中的一个洞穴,因此被称为结构洞。从网络结构上分析,结构洞中的节点通常是传统关键节点识别方法所忽略的重要节点,但它们能够控制或掌握信息流及其在洞中的流动,从而在信息传递中发挥关键作用Burt[9]提出利用约束系数来识别结构孔节点,节点 i 的结构孔约束系数越小,该节点越有可能成为结构孔节点。 ,该节点越容易成为结构孔节点,对应的节点影响力越大。约束系数定义如下:

其中,节点 q V 为节点 i V 和节点 j V 的公共邻居节点; ij p 表示节点 j V 在节点 i V 的所有邻居节点中所占的权重比例[9]。本文根据计算对节点的约束系数从小到大进行排序,根据排序结果,可以选择约束系数较小的节点作为影响力较大的种子节点集合。

III. INFLUENCE MAXIMISATION ALGORITHMS BASED ON STRUCTURED HOLES AND GRAPH ATTENTION NETWORKS

  传统的影响力最大化方法通常采用贪心算法等启发式方法来选择种子节点,容易陷入局部最优解而不是达到全局最优,并且只考虑网络的拓扑结构,忽略了属性特征的影响节点对影响传播的影响。图注意力网络可以通过学习到的节点表示来减少对网络拓扑的依赖,从而降低计算复杂度并提高算法的效率。同时,结构洞可以揭示网络中的隐藏信息和关键路径,更准确地识别关键节点,提高影响力最大化的效果,避免算法陷入局部最优解,提高算法的准确性和稳定性。

A. Algorithm description

  GATSH算法首先通过嵌入技术将图中的每个节点转换为特征向量,其中包含节点的属性、标签等信息。其次,利用图注意力机制学习节点的属性特征并动态计算节点之间的权重。每个节点的注意力系数是通过聚合相邻节点的信息来计算的,这些注意力系数用于更新节点的特征表示。然后,利用学习到的特征表示来构造网络的权重矩阵。根据这个权重矩阵,计算每个节点的约束系数。当节点的约束系数较低时,表明该节点在网络中处于相对独立的状态,更可能处于结构空洞位置。因此,它的影响力更大。 GATSH算法示意图如图1所示:

图1.GATSH算法示意图。

  通过注意力机制,我们根据邻居节点的特征属性来学习和区分其重要性,并通过系统地为节点在信息传播过程中的影响力大小分配差异化权重来映射其各自的影响力贡献。利用特殊节点所在的结构洞位置来解决社交网络中影响力最大化的问题。在 GAT 模型中,注意力机制被巧妙地实现为两阶段过程 [15]。首先,参数化权重矩阵A。该阶段的目的是让模型具有学习和调整节点之间关系的能力。接下来,LeakyReLU 函数被用作非线性激活手段,旨在捕获潜在的复杂交互效应 [16]。随后,借助softmax函数进行归一化,以确保得到的注意力系数ij a构成有效的概率分布[17]。最后,将社交网络中的节点在学习图注意力机制后更新的属性特征作为节点的特征矩阵,通过遍历更新后的邻域矩阵并计算节点的连接强度来计算节点的约束系数。公共邻居节点,并利用(4)和(5)将节点的属性信息与节点在社交网络中的重要性和影响力相关联。节点i的约束系数公式:

B. Ranking of Social Network Influence

为了解决IM问题,即找到影响力最大的种子节点集合,选择影响力较高的节点作为种子节点可以提高影响力传播效率。通过对节点进行排序,可以选择排名靠前的节点进行分析计算,直接分析大规模社交网络中所有节点的影响力是非常耗时的。考虑到社交网络节点之间的复杂关系,本文通过训练GAT模型并利用节点的表示向量对影响力进行评估和排序,根据排序结果从大到小,可以将节点向量得分较高的节点被选为影响力较大的种子节点集合。为了识别社交网络中具有桥梁作用的关键节点,结构洞考虑了节点之间的联系,因此可以更全面地考虑节点之间的关系,并可以发现那些具有潜在影响力的节点,从而更准确地评估节点的影响力。这反过来又促进了信息传播并加强了社区之间的联系,从而最大限度地发挥了社交网络的影响。

本文根据计算对节点的约束系数从小到大进行排序,根据排序结果,约束系数越小,越小的节点可以被选为影响力较大的种子节点集合。 GATSH算法的流程图如图2所示。

图 2. GATSH 算法的流程图。

IV. ANALYSIS OF EXPERIMENTAL DATA AND RESULTS

A. Experimental Settings

  本文所有实验均在Intel(R) Core(TM) i7-10700 CPU、Radeon Pro WX 5100、32GB RAM、Window操作系统平台上进行,使用PyCharm开发工具和Python编程语言。

 选择来自不同领域的四个真实网络进行实验,如表1所示:空手道俱乐部社交网络空手道网络[18],其中每条边代表成员之间维持的社会关系; Cora[19]和Citation Graph[20]是文献引用网络数据集,网络中的每个节点代表一篇论文文档,每条边代表一个引用关系; WikiCS [21] 是一个基于维基百科的数据集,用于评估图神经网络的性能。数据集的统计特征如表1所示,其中n为节点总数,m为连接边总数,<k>为平均度,C为聚类系数,<d>为平均值最短路径长度,th α 是SIR模型[22]的传播速率阈值,即实验中使用的传播概率。

表 I. 实验数据集

B. Simulation Experiment

 为了验证本文提出的GATSH算法的有效性,通过Karate网络进行了仿真实验,其网络结构如图3所示。

图 3.空手道的网络结构。

六种方法,DC[23]、BC[24]、EC[25] ]、GAT[5]、N-Burt[9]、GATSH进行比较,得到网络前10个节点的影响力最大化排名,如表2所示。

表二。空手道网络节点影响力排名评估结果

对Karate网络拓扑和节点影响力排名评估结果的分析表明,在GAT算法中,节点29和节点30虽然邻居数量较少,但节点影响力排在前面,这是由于它们是都连接到节点34,仅考虑邻居节点的重要性无法进一步区分该节点的重要性。本文提出的GATSH方法从节点局部和全局信息的角度考虑节点自身的结构空洞特征和网络位置信息以及邻居节点的影响力,进一步改善了社交网络中种子节点的影响力传播。 GATSH算法通过仿真实验得到的前10个最具影响力的节点与其他算法得到的结果相似,这一实验现象进一步说明了该算法的有效性。

C. Experimental Analysis

    本节分析不同算法在四个真实网络数据集上的实验结果。选取DC[23]、BC[24]、EC[25]、GAT[5]、N-Burt[9]、GATSH等6种方法进行比较,比较各算法与SIR模型之间的Kendall相关系数对不同传播速率的排序结果进行比较,如图4所示。

   使用SIR模型来量化节点的传播效率,并相应地生成排序列表σ,并进一步与之间的Kendall相关系数进行比较算法得到的排名σ和实际传播能力排名。相关性越接近1,节点重要性的评估越准确[26]。如图4所示,当传播速率β取值接近传播阈值αth时,GATSH方法的τ值均高于其他算法。此外,当传播速率β显着低于传播阈值αth时,DC和GAT算法在Karate和Cora数据集中相对于GATSH算法在相关性上表现出一定程度的优越性。因此,GATSH算法能够更有效地找到刀影响力最大的种子节点。通过图注意力网络寻找关键节点,让网络更加关注节点对于整体图结构或特定任务更重要,而结构洞的存在有利于网络不同部分之间的信息交换,有助于信息传播。找到这些关键节点可以帮助识别网络中的关键路径,减少信息传递的冗余,提高网络的效率。而本文提出的GATSH算法可以优化网络结构,提高网络的稳定性和信息传输的效率,并且可以更准确地识别在网络中起关键作用的种子节点。

图 4. 不同传播速率下 SIR 和各个算法之间的 Kendall 相关系数。

V. CONCLUSIONS

  本文提出的GATSH方法考虑了节点的局部特征,利用结构洞特征和图注意力网络,从影响力传播最有效的社交网络中准确过滤出由k个节点组成的种子集,使得种子集可以最大化对其他节点的影响。实验结果表明,GATSH算法在影响力传播方面具有优越的性能。具体来说,算法选择的节点集合在传播影响力方面表现出很强的竞争力,这一发现进一步证实了GATSH算法的有效性和实用性。尽管本研究提出的GATSH算法取得了一定的成功,但它仍然存在计算复杂度高和数据依赖性高的问题。对于大规模图数据,图注意力网络和结构化空洞算法的计算复杂度可能会显着增加,导致处理效率低下甚至无法处理。因此,可以探索更有效的计算策略,例如启发式算法。此外,图嵌入技术可用于将图数据缩小到低尺度维度空间,提高计算效率。另一方面,GATSH 算法依赖于输入图数据的质量和特征。如果数据中节点特征不足、图结构复杂或存在噪声,则可能导致算法性能下降。为了提高算法对数据质量的鲁棒性,可以引入节点特征嵌入、图结构简化等数据预处理和增强技术。此外,可以利用无监督学习或自监督学习方法从原始数据中提取更多有用的信息。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2132343.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

openai最新模型o1全面解读

OpenAI发布o1模型 1.1 o1模型的命名背景 在人工智能的浩瀚星空中&#xff0c;每一次新模型的发布都像是一颗新星的诞生&#xff0c;而OpenAI最新发布的o1模型&#xff0c;无疑是这星空中的璀璨新星。那么&#xff0c;这个神秘的“o1”究竟有何深意呢&#xff1f; 首先&#x…

HT760 2x30W1²S Input, Inductor Free, Stereo Class D Amplifier

FEATURE Power supply: -PVDD:4.5V-22V: -DVDD: 3.3V "Audio Performance -BTL,2x33W(PVDD22V,RL8Ω THDN10%) -PBTL, 50W(PVDD22V, RL4Ω,THDN1%) -THDN0.05%(PVDD12V,RL4Ω,PO1W) -Noise: 100uV(Gain 19dBV, A weighted) Low Quiescent Current -12mA at PVDD 12V, no…

单个 java 虚拟机 生产者消费者

一、通过 java.lang.Object#wait()&#xff0c;java.lang.Object#notify&#xff0c;java.lang.Object#notifyAll来实现 生产者&#xff0c;消费者 public abstract class Goods {protected String type;protected String goodName;protected int number;public abstract …

redis高级教程

一 关系型数据库和 NoSQL 数据库 数据库主要分为两大类&#xff1a;关系型数据库与 NoSQL 数据库 关系型数据库 &#xff0c;是建立在关系模型基础上的数据库&#xff0c;其借助于集合代数等数学概念和方法来处理数据库中的数据主流的 MySQL 、 Oracle 、 MS SQL Server 和 D…

基于SpringBoot+Vue+MySQL的美术馆管理系统

系统展示 用户前台界面 管理员后台界面 系统背景 随着文化艺术产业的蓬勃发展&#xff0c;美术馆作为展示与传播艺术的重要场所&#xff0c;其管理工作变得日益复杂。为了提升美术馆的运营效率、优化参观体验并加强艺术品管理&#xff0c;我们开发了基于SpringBootVueMySQL的美…

树莓派!干农活!

农作物种植是一个需要精准操作的行业&#xff0c;而农业的长期趋势是朝着机械化方向发展。Directed Machines公司的土地护理机器人&#xff08;Land Care Robot&#xff09;&#xff0c;基于Raspberry Pi4和RP2040构建&#xff0c;是解放稀缺人力资本的一种经济高效方式。 Dir…

墨西哥海外仓市场如何?如何选择墨西哥海外仓系统?

随着全球电商市场的迅猛发展&#xff0c;墨西哥作为拉美地区的重要市场&#xff0c;其电商增速在2023年高达24.6%&#xff0c;位居世界第一&#xff0c;这一数据无疑展示了墨西哥电商市场的巨大潜力和繁荣景象。 作为拉美地区最大的电商平台&#xff0c;美客多在墨西哥市场的扩…

iPhone 16分辨率,屏幕尺寸,PPI 详细数据对比 iPhone 16 Plus、iPhone 16 Pro、iPhone 16 Pro Max

史上最全iPhone 机型分辨率&#xff0c;屏幕尺寸&#xff0c;PPI详细数据&#xff01;已更新到iPhone 16系列&#xff01; 点击放大查看高清图 &#xff01;

传承中华文脉·弘扬北疆文化“四季内蒙古演出季”区内外文艺院团交流演出活动即将启动

为推进“北疆文化”品牌建设&#xff0c;由内蒙古自治区文化和旅游厅、呼和浩特市人民政府主办&#xff0c;呼和浩特市文化旅游广电局承办的传承中华文脉弘扬北疆文化——“四季内蒙古演出季”区内外文艺院团交流演出活动将于9月14日至11月期间在呼和浩特市举办。 传承中华文脉…

新书推荐:《智人之上:AI时代的信息网络简史》——尤瓦尔·赫拉利的深刻哲学警示

导言&#xff1a;AI革命的到来与历史性的深思 随着人工智能&#xff08;AI&#xff09;的快速发展&#xff0c;越来越多的学者、科学家和哲学家开始反思AI带来的潜在威胁与机遇。以色列著名历史学家尤瓦尔赫拉利&#xff08;Yuval Noah Harari&#xff09;&#xff0c;以其广受…

用Kimi输出流程图

1.输入 我希望设计一个ERP系统&#xff0c;请帮我简单列一个流程图&#xff0c;用mermaid输出2.输出

电脑重装系统后硬盘数据可以恢复吗?系统重装后以前的文件怎么找回来?

重装系统是指对电脑的操作系统例如Windows重新安装。系统重装可以解决各种系统问题&#xff0c;例如电脑感染病毒、系统文件受损、系统变慢、崩溃无法启动、蓝屏等。正常的重装系统操作是将原来的系统分区&#xff08;通常是C盘&#xff09;格式化&#xff0c;然后再重新安装Wi…

opencv学习:calcHist 函数绘制图像直方图及代码实现

cv2.calcHist 函数是 OpenCV 库中用于计算图像直方图的函数。直方图是一种统计图像中像素值分布的工具&#xff0c;它可以提供图像的亮度、颜色等信息。这个函数可以用于灰度图像和彩色图像。 函数语法 hist cv2.calcHist(images, channels, mask, histSize, ranges, accumu…

IO中断原理浅析

目录 什么是中断 什么是IO中断 无中断的情况 有中断的情况 什么是中断 中断是指&#xff0c;在程序运行过程中&#xff0c;系统出现一个必须由CPU立即处理的情况&#xff0c;此时CPU暂时中止程序的执行转而处理这个新情况的过程叫做中断。 什么是IO中断 I/O中断通过中断处理…

操作系统的重点笔记-1

一、操作系统的设计目标 1.易用性 使计算机易于使用&#xff0c;提供文件抽象后&#xff0c;对文件的操作就是对磁盘的操作&#xff0c;不再需要考虑如何通过控制磁盘移动&#xff0c;实现对磁盘某个信号的读写细节 2.高效性 完成特定功能的效率&#xff0c;如时间效率&…

音视频开发之旅(93)-图像超分增强之Real-ESRGAN

目录 1、背景和问题 2、高清-低清 数据集构建 3、Real-ESRGAN模型结构 4、源码分析 5、不足与局限性 6、资料 一、背景和问题 图像超分一直是一个活跃的研究课题&#xff0c;旨在从低分辨率&#xff08;LR&#xff09;重建高分辨率&#xff08;HR&#xff09;图像。在数…

中秋节了,送大家一个月饼

按F12&#xff0c;直接在浏览器控制台输入下面代码&#xff0c;你就会得到下面的月饼 console.log("%c\uD83E\uDD6E","font-size: 20em")

pandas中基于范围条件进行表连接

来自&#xff1a;Python大数据分析 费弗里 表连接是我们日常开展数据分析过程中很常见的操作&#xff0c;在pandas中基于join()、merge()等方法&#xff0c;可以根据左右表连接依赖字段之间对应值是否相等&#xff0c;来实现常规的表连接。 但在有些情况下&#xff0c;我们可能…

JDBC与MyBatis:数据库访问技术的变迁【后端 15】

JDBC与MyBatis&#xff1a;数据库访问技术的变迁 JDBC的基本使用 Java Database Connectivity (JDBC) 是Java提供的一种标准API&#xff0c;用于与数据库进行交互。它提供了一系列的接口和类&#xff0c;使得开发人员能够直接使用Java代码来编写SQL语句并执行数据库操作。JDBC…