Rumor Mitigation in Social Media Platforms with Deep Reinforcement Learning

news2024/9/23 3:00:25

ABSTRACT

社交媒体平台已成为人们传播和获取信息的主要渠道之一,其可靠性受到网络谣言的严重威胁。现有的辟谣手段如暂停用户、播放真实信息等,要么成本高,要么扰乱用户。在本文中,我们引入了一种新颖的谣言缓解范例,其中仅干预社交网络中的极少量链接来减缓谣言的传播,以较低的业务成本和用户意识来反击错误信息。开发了一种体现谣言传播机制的知识知情代理,它通过用于捕获社交媒体平台中的信息流的图神经网络和用于选择链接的策略网络来干预社交网络。在真实社交媒体平台上的实验表明,该方法可以有效减轻谣言的影响,使受影响的人群大幅减少25%以上。本文的代码发布于https://github.com/tsinghua-fib-lab/DRL-Rumor-Mitigation。

1 INTRODUCTION

  谣言的迅速传播成为前所未有的挑战,对公共安全、健康和民主造成有害影响。错误信息快速传播的核心是信息级联现象,即社交网络用户受到感知信息的影响,采用或分享该信息,从而导致战略性放置的错误信息触发和操纵的级联效应 [2, 3]。因此,开发一种能够自动合成谣言缓解措施的智能算法来应对社交网络上每天出现的大量谣言至关重要。目前缓解谣言的方法遵循两个主要范式。首先,选择并暂停一部分用户,即从网络中删除节点以阻止谣言的传播[9]。其次,将真实信息引入网络,选择多个种子节点来广播真实信息,以最大化其对网络的影响力[1]。然而,这些方法往往成本高昂并且给用户带来很大的烦恼。因此,在本文中,我们关注一种新的范式,其中谣言以较低的业务成本得到缓解,并且用户几乎不知道缓解措施[14]。我们保留所有节点,仅屏蔽社交网络中的一小部分链接,以减缓谣言的信息级联,从而最大限度地减少用户干扰并保持信息完整性。通过删除链接来缓解谣言面临三个主要挑战。首先,候选干预选项非常大,因为社交网络中的链接比节点多得多,导致解决方案空间巨大。其次,由于谣言传播的复杂性和随机性,很难捕捉到谣言传播的潜在机制。因此,现有文献在很大程度上尚未探索如何有效利用社交网络的领域知识。第三,现实世界的社交网络往往表现出不同的拓扑和动态[12]。因此,有必要开发一种具有足够泛化能力的算法,使其适用于真正的谣言消除任务。

    为了应对这些挑战,我们开发了一个用于缓解谣言的深度强化学习(DRL)框架。为了利用丰富的领域知识,我们首先根据社交网络理论提取关键特征,捕获每个节点和边缘在谣言传播中的贡献。然后我们设计一个图神经网络网络(GNN),具有链路路由感知消息传递,分别捕获链路的本地和全局角色。进一步开发了面向谣言的策略网络来选择删除链接,同时考虑谣言来源和社区结构。我们的知识型代理体现了谣言传播机制,有效提高了生成的谣言缓解解决方案的准确性和可解释性。最后,我们设计了一个随机训练环境,模拟具有不同拓扑和谣言传播模式的社交网络,这保证了我们方法的泛化能力。

总而言之,本文的贡献如下:

• 我们以低成本和用户干扰的新范式解决谣言缓解问题,该范式仅干预社交网络的极小部分链接。 • 我们开发了知识型智能体和随机训练算法,以实现普遍化的谣言缓解。

• 在现实社交网络上的实验证明,我们的方法可以将谣言的影响大幅降低 25% 以上。

2 PROBLEM STATEMENT

  考虑一个有向社交网络 G = (N, E),其中 N 和 E 代表用户并影响他们之间的关系(即关注者和被关注者)。假设谣言从源 s ∈ N 发起,通过扩散模型 μ 传播,导致社交网络中的 k 个节点接收谣言。谣言的影响可以定义为受影响人口的百分比,

其中 E[x] 表示随机变量 x 的期望,|N |表示集合 N 中的元素数量。谣言缓解可以定义为选择图中的边子集进行删除,以最大程度地减少谣言的传播。删除的最佳边集可以表示为:

其中 ED 表示删除的边集

3 METHOD

图 1:(上)环境提供对社交网络的观察,根据代理选择的操作控制网络,并通过谣言传播模拟返回奖励。 (下)知识驱动的边缘选择,通过使用 GNN 在原始图和线图上传递链路路由感知消息来聚合邻居信息,最后使用面向谣言的策略网络选择边缘。

  图 1 展示了所提出的框架的概述,其中代理依次删除社交网络上的边缘以防止谣言传播。知识知情模型旨在实现良好的边缘选择,它使用链接路由感知的 GNN 模型编码丰富的传播相关特征,同时考虑谣言源和传播动态。面向谣言的策略网络旨在进行边缘排序,感知分层结构以及与谣言源的关联,从而实现高质量的边缘阻止以减轻谣言。此外,我们开发了一种随机强化学习训练方法来增强模型的泛化能力,解决拓扑结构多样化和谣言来源不确定的挑战。

3.1 Knowledge-informed Edge Selection

  拓扑和传播的特征。谣言传播涉及谣言来源、网络结构、传播机制等多个方面。我们设计了丰富的拓扑和社交网络中节点(FN)和边(FE)的谣言传播相关特征,包含谣言传播的先验知识,可以分为两类。

• 拓扑特征包括度(FN1、FE6)、中心性(FN2)和扩散重要性(FE7)[8],描述了社交网络的拓扑结构,并为分析谣言的传播提供了有价值的见解。例如,扩散重要性表示信息通过边缘传播的效率,因此封锁具有较高扩散重要性的边缘可以有效防止谣言到达更多用户。

• 谣言传播特征包括到谣言源的最短路径长度(FN4)、是否有谣言源(FN5)、中介中心性(FN3、FE8)等,这些特征与谣言传播的特征密切相关。显然,接近消息来源的用户往往更早受到谣言的影响。因此,为了缓解谣言,靠近源的边缘预计具有更高的删除优先级。

  值得注意的是,边缘去除改变了社交网络的拓扑结构,因此这些特征在每一步都是动态变化的。链路路由感知消息传递。由于边代表影响关系,是谣言传播的关键组成部分,因此有必要考虑它们作为本地用户链接和全球传播路线的多重角色。因此,我们提出了一种链接路由感知 GNN 来学习综合边缘嵌入,同时考虑到这两个方面,如图 1 所示。我们计算原始图和双线图中节点和边的表示,如下所示:

其中 Ani 和 Aeij 是节点和边的输入属性,Wk n 和 Wk e 是线性层。节点和边嵌入分别从原始图和导出双线图中获得,其中原始图上的边对应于折线图上的节点,星号表示折线图中的元素。最后一个传播层的输出 nL i 和 eL i j 是节点和边的嵌入,其中 L 是超参数,∥ 表示串联。

通过组合每条边的关联两个节点嵌入 n Li 和 nL j ,我们可以捕获本地用户链接的影响关系。同时,线图上的边嵌入 eL ij 捕获了每条边的全局传播路径作用。因此,链路路由感知消息传递有效地编码了边缘在连接用户和传播谣言中的作用,为后续边缘选择提供了有价值的见解。谣言导向的政策网络。我们开发了一个面向谣言的策略网络,考虑了 GNN 的边缘嵌入、谣言源和社交网络社区。如图 1 所示,策略网络通过多层感知器 (MLP) 计算边的分数,如下所示:

其中Ci捐赠节点i所属的社区,ns捐赠GNN计算的谣言源的嵌入。然后,代理根据对策略网络的边缘分数进行归一化而获得的概率对边缘进行采样。

3.2 Generalized Model Training

 由于现实世界的社交媒体平台在网络拓扑和传播动态方面表现出不同的特征,因此预计谣言缓解算法可以在不同的场景中推广。为了实现这一目标,我们引入了一个随机强化学习框架,允许代理从大量不同的谣言传播任务中学习有效的谣言缓解策略。具体来说,我们使用随机网络拓扑来训练代理,其中在每个情节中环境都会生成不同的社交网络。同时,对于同一个社交网络,我们通过在每次训练时随机选择不同的节点作为谣言源来模拟谣言在各种拓扑结构中的传播,这大大增加了训练社交网络的数量。

4 EXPERIMENTS

4.1 Experiment Settings

  社交网络数据。我们基于现实世界的在线社交网络进行实验,包括来自斯坦福大学大型网络数据集的 Twitter 和 Facebook [6]。表 1 总结所采用数据集的基本属性。对于每个网络,我们应用易感-感染-恢复(SIR)模型[4]来模拟谣言传播,其中γ = 0.20和β = 0.08[15]。基线和评估。我们包括传统方法,例如 Pagerank (PR) [10]、K-EDGEDELETION (KED) [13] 和 Greedy with Bond Percolation (GBP) [5]。我们还将我们的模型与基于度(HSD)和介数(HSB)的启发式搜索方法以及包括遗传算法(GA)[11]和模拟退火(SA)[7]的进化算法进行比较。此外,我们还包括一个最近的 DRL 基线 [9],它根据 GNN 计算的嵌入来选择节点(DRLN)。

4.2 Overall Performance

我们删除了社交网络中 10% 的影响关系,同时为每个用户保留至少 60% 的影响关系。表 2 说明了我们的模型和基线的结果,我们有以下观察结果:

• 与其他基线相比,基于 DRL 的方法具有显着优势。基于 DRL 的方法在不同的社交网络上优于 HSC、KED 和贪婪方法。具体来说,它们在小型、中型和大型社交网络中分别平均提高了 10.9%、9.5% 和 19.5%,超过了贪婪方法。此外,基于 DRL 的方法可以轻松应用于复杂的社交网络,具有稳定的结果和合理的计算成本。

• 我们提出的模型实现了最佳性能。我们的方法最大限度地减少各种社交网络上的谣言。具体来说,我们观察到比次优解决方案至少提高了 19.1%。值得注意的是,随着社交网络规模的增加,我们的方法在谣言缓解方面的性能进一步提高,仅通过阻止 10% 的边缘就实现了超过 37% 的谣言传播减少,并且与其他基线相比的改进从 19 % 至 25%。

图 2:(a) 每个传播步骤受影响用户的累积百分比。 (b) 在每个传播步骤中散布谣言的用户比例。

我们将图 2 中每一步的谣言传播可视化。在原始网络中,谣言一出现就迅速传播,仅 10 步就达到峰值,影响了总共 60% 以上的用户。实施拟议的谣言缓解策略后,谣言得到了实质性压制。具体来说,在传播的前10步中受到影响的用户不超过20%,谣言的峰值影响也从35.6%大幅下降至10.1%。从全球角度来看,我们的方法减少了受谣言影响的总用户比例从 83.6% 到 23.7%,而基线只是暂时阻止谣言,导致至少 58.8% 的用户最终受到影响。

4.3 Ablation Study

我们进行了消融实验,以展示知识知情模型的几个关键设计的有效性。拓扑和传播的特征 图 3 通过从训练有素的模型中单独删除每个特征来显示每个特征的重要性。删除与传播相关的边缘中心性(FE8)会导致最显着的性能下降(-39.6%),并且传播相关的节点中心性(FN3)的下降也很显着(-20.5%),这与传播相关的中心性一样是合理的识别谣言传播的关键边缘。精心设计的拓扑结构和传播特征可以捕捉谣言传播的关键因素,这对于谣言缓解至关重要。

链接路由感知消息传递所提出的 GNN 模型结合了边缘的功能,作为谣言传播中的链接和路由。为了评估传播消息的影响,我们通过消除节点和边之间的消息传递进行实验,如图3所示。我们可以发现,消除节点和边传播导致缓解率分别降低了7.4%和12.3% , 分别。这一结果证实了我们的链路路由感知消息传递在聚合本地和全局信息方面的优势。

图 3:消融实验的结果,分别删除了节点 (FN) 和边 (FE)、GNN(链路和路由)以及策略网络中面向谣言的设计(社区和源)的特征。最好以彩色形式观看。

  面向谣言的策略网络 如图 3 所示,消融实验证明了社区和谣言源身份在实现高质量边缘选择方面的重要性。具体来说,当我们忽略与谣言来源的相关性时,缓解效果下降了16.9%。而且,当我们忽略社区信息时,下降更加明显,达到25.11%。

5 CONCLUSION

  在本文中,我们提出了一种 RL 框架,以消除社交媒体平台上错误信息的影响,同时降低用户意识和商业成本。我们提出了一种使用随机算法训练的知识型代理,该代理可以阻止最小的一组链接以减少谣言。通过在现实世界的社交媒体平台上进行的广泛实验,我们的方法证明了在遏制错误信息传播方面具有显着的有效性,与基线方法相比,性能提高了 21.1% 以上。未来,我们的目标是扩展我们的框架,以解决更复杂的错误信息挑战,例如在动态变化的社交网络中打击多个谣言来源。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2156410.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

springboot每次都需要重设密码?明明在springboot的配置中设置了密码

第一步:查看当前的密码是什么? 打开redis-cli.exe,输入config get requirepass,查看当前的密码是什么? 接着,修改redis的配置文件,找到redis的安装目录,找到相关的conf文件&#x…

Spring高手之路24——事务类型及传播行为实战指南

文章目录 1. 编程式事务(不推荐)2. 声明式事务(推荐)3. 事务的传播行为(复杂混合事务场景及时序图说明)3.1 NESTED和REQUIRES_NEW传播行为的区别 1. 编程式事务(不推荐) 定义&#…

如何从 Nutanix 迁移至 SmartX 超融合?解读 4 类迁移方案和 2 例迁移实践

2022 年底,Nutanix(路坦力)正式宣布将中国市场交由合作伙伴(联想)主导销售,并于 2023 年 8 月完成全面转型。转型后,虽然中国用户依旧可以使用 Nutanix 产品,但在软件的续保和维保方…

企业EMS -能源管理系统-能源管理系统源码-能源在线监测平台

能源管理系统是以帮助工业生产企业在扩大生产的同时,合理计划和利用能源,降低单位产品能源消耗,提高经济效益,降低CO2排放量为目的信息化管控系统。 我国能源管理从上世纪80年代中期开始,通过“能量平衡测试”、“能源…

安卓数据存储——SharedPreferences

共享参数 SharedPreferences 1、sharedPreferences是Android的一个轻量级存储工具,采用的存储结构是key - value的键值对方式 2、共享参数的存储介质是符合XML规范的配置文件。保存路径是:/data/data/应用包名/shared_prefs/文件名.xml 使用场景&…

【Java】掌握Java:基础概念与核心技能

文章目录 前言:1. 注释2. 字面量3. 变量详解3.1 变量的定义3.2 变量里的数据存储原理3.3 数据类型3.4 关键字、标识符 4. 方法4.1 方法是啥?4.2 方法的完整定义格式4.3 方法如何使用:4.4 方法的其他形式4.5 方法的其他注意事项4.5.1 方法是可…

WebMagic:强大的Java网络爬虫框架

上班苦上班累,上班就想打瞌睡。 在当今信息爆炸的时代,数据的获取和处理变得越来越重要。网络爬虫作为获取网络数据的重要工具,已经成为许多开发者和数据科学家的必备技能。今天,我们将介绍一个广受欢迎的Java网络爬虫框架——We…

2024PDF内容修改秘籍:工具推荐与技巧分享

现在我们使用PDF文档的频率越来越高了,很多时候收到的表格之类的资料也都是PDF格式的,如果进行转换之后编辑再转换为PDF格式还是有点麻烦的,那么pdf怎么编辑修改内容呢?这篇文章我将介绍几款可以直接编辑PDF文件的工具来提高我们的…

鸿蒙开发(NEXT/API 12)【跨设备互通NDK开发】协同服务

跨设备互通提供跨设备的相机、扫描、图库访问能力,平板或2in1设备可以调用手机的相机、扫描、图库等功能。 说明 本章节以拍照为例展开介绍,扫描、图库功能的使用与拍照类似。 用户在平板或2in1设备上使用富文本类编辑应用(如:…

JVM —— 类加载器的分类,双亲委派机制

文章目录 一、类加载器的分类【理解】1.1 概述1.2 JDK8及之前的版本1.2.1 启动类加载器1.2.2 扩展类加载器和应用程序类加载器扩展类加载器应用程序类加载器 1.3 JDK9之后的类加载器1.4 ClassLoader 中的两个方法【应用】 二、双亲委派模型【理解】2.1 什么是双亲委派机制面试题…

在vue中嵌入vitepress,基于markdown文件生成静态网页从而嵌入社团周报系统的一些想法和思路

什么是vitepress vitepress是一种将markdown文件渲染成静态网页的技术 其使用仅需几行命令即可 //在根目录安装vitepress npm add -D vitepress //初始化vitepress,添加相关配置文件,选择主题,描述,框架等 npx vitepress init //…

9.20日学习记录及相关问题解答

部分一 今天看了一本古老的书。学到了一些有关计算机的远古的知识。弥补了一些之前没有意识到的空白点。 原来上个世纪就有AI这个东西了 现阶段的主流模式,在许多年前其实是将来要发展的对象。 B/S指的是客户机/服务器结构模式 C/S是在B/S基础上发展过来的。三层结…

兼容多个AI应用接口,支持用户自定义切换AI接口

项目背景 2023年ChatGPT横空出世,给IT行业造成了巨大的反响。我第一次发现这个ChatGPT有着如此神奇的功能(智能对话,知识问答,代码生成,逻辑推理等),我感到非常吃惊!经过一番学习和…

一文看懂 Python 正则表达式,解决你的字符串难题!(Python正则表达式使用指南)

文章目录 📖 介绍 📖🏡 演示环境 🏡📒 Re正则 📒📝 re 模块简介📝 正则表达式语法总结📝 re 模块参数总结📝 常用方法📝 正则表达式的技巧与注意事项📝 使用 `re.compile()` 实现编译模式⚓️ 相关链接 ⚓️📖 介绍 📖 在编程世界中,有一种强大的…

Lanterns (dp 紫 线段树 二分 维护dp)

Lanterns - 洛谷 | 计算机科学教育新生态 (luogu.com.cn) 让所有点被覆盖,那么状态可以设计成覆盖一段前缀,并且中间不允许出现断点 由于CF崩了,所以暂时没提交代码。 记f(i) 为前 i 个灯笼点亮的最长前缀。 由于答案具有保留性&#xff…

9.22算法题数组篇

数组的遍历 485.最大连续1的个数 题解 class Solution {public int findMaxConsecutiveOnes(int[] nums) {int maxcount0,count0;for (int i 0;i<nums.length;i){if(nums[i]1){count;}else{maxcountMath.max(maxcount,count);count0;}}maxcountMath.max(maxcount,count);r…

基于kubernetes-nmstate配置节点网络

kubernetes-nmstate 简介 kubernetes-nmstate 通过 Kubernetes API 驱动的声明式节点网络配置。 随着混合云的出现&#xff0c;节点网络设置变得更加具有挑战性。不同的环境有不同的网络要求。 容器网络接口&#xff08;CNI&#xff09;标准实现了不同的解决方案&#xff0c;…

【MySQL】 索引

MySQL与磁盘存储 MySQL就是提供数据存储服务的&#xff0c;而最终存储的位置就是磁盘&#xff0c;但是磁盘存储速度慢&#xff0c;所以MySQL如何与磁盘交互&#xff0c;提高数据存储效率&#xff0c;即是MySQL和磁盘交互。 磁盘基础知识回顾 物理结构 磁道&#xff1a;磁盘是…

AI运动小程序开发常见问题集锦一

截止到现在写博文时&#xff0c;我们的AI运动识别小程序插件已经迭代了23个版本&#xff0c;成功应用于健身、体育、体测、AR互动等场景&#xff1b;为了让正在集成或者计划进行功能扩展优化的用户&#xff0c;少走弯路、投入更少的开发资源&#xff0c;我们归集了一部分集中的…

想复制其他设备上的软件?看这里!-未来之窗行业应用跨平台架构

一、多好用的软件&#xff0c;已经没有apk安装包&#xff0c;很遗憾 1. 用户体验受损 &#xff1a;对于那些曾经依赖并喜爱这些软件的用户来说&#xff0c;无法再获取和使用它们&#xff0c;极大地影响了用户的日常体验和工作效率。 2. 功能缺失 &#xff1a;可能导致特定的功…