协调活动调节有机用户的行为和情绪:有关加沙冲突的推文案例研究
https://dl.acm.org/doi/pdf/10.1145/3589335.3651483
目录
摘要
1 INTRODUCTION
2 DATA
3 METHODOLOGY
3.1 Coordinated Activity Detection
3.3 用户互动动态特征
3.4 Organic Users’ Behavior After Interactions
4 RESULTS
4.1 Effectiveness of Coordinated Activity
4.2 Interactions Increase Over Time
4.3 Emotion Modulation by Coordinated Users
摘要
社交媒体已成为全球危机期间迅速传播信息的重要渠道。然而,这也为恶意行为者操纵叙事铺平了道路。
本研究深入探讨了加沙冲突期间 Twitter 上协调(恶意)实体与有机(普通)用户之间的互动动态。
通过分析来自 130 多万用户的约 350 万条推文,我们的研究发现,协同用户对信息格局产生了重大影响,成功地在网络上传播了他们的内容:他们的信息有相当一部分被普通用户采纳和分享。
此外,研究还记录了有机用户对协同内容的参与度逐渐增加,与此同时,他们在随后的交流中也明显转向了情感上更加极化的表达方式。
这些结果凸显了对社交媒体平台上信息操纵的警惕性和细致入微的理解的重要性。
1 INTRODUCTION
社交媒体已成为传播当前危机事件信息、连接用户并促进及时信息交流的关键平台。然而,社交媒体的广泛影响力也使其成为恶意实体的有力工具。通过精心策划的努力,这些行为者可以操纵叙事、传播错误信息并倡导特定的政治意识形态,从而塑造对他们有利的话语[10, 21]。
越来越多的文献记录了社交媒体被用于此类邪恶目的,从政治辩论到健康讨论 [2, 3]。这些研究阐明了错误信息活动和网上尖刻言论的传播如何严重导致数字生态系统的扭曲[8,9,15]。例如,研究表明了“假新闻”对公众认知和行为的不利影响 [7, 18],而其他研究则强调了在 COVID-19 大流行等危机中错误信息和不可靠信息的扩散 [4, 6]
事实证明,社交媒体平台上与协调实体的互动和受操纵的内容会导致用户行为和心理健康发生显着变化[19]。接触错误信息与加剧的焦虑和痛苦有关 [1],同时人们对数字资源越来越不信任,并且不愿参与有争议的问题的讨论 [14, 16]
基于这些发现,我们的研究深入研究了 Twitter 上关于加沙冲突的协调和有机用户之间的动态,旨在揭示信息传播机制及其对用户行为的影响。
本研究致力于阐明协同内容传播对有机用户的行为和情绪状态的潜在影响,并以下列问题为指导:
问题 1 协同用户在有机用户中传播其内容的效果如何?
问题 2 有机用户和协同用户之间的互动时间模式是什么?
问题 3 有机用户的行为和情绪表达在与协同用户互动后有何变化?
利用从 2023 年 9 月至 11 月收集的、来自 130 多万用户的约 350 万条推文数据集,我们调查了围绕加沙冲突的言论。我们的分析显示
- 协调用户通过至少十分之一的网络有效传播了他们的信息,超过三分之一的内容被有机用户转发。
- 对协同内容的参与是逐步展开的,需要长时间的持续互动才能观察到协同用户参与的显著上升。
- 在与协调用户互动后,有机用户的负面情绪表达明显增加,尤其是悲观、悲伤和恐惧。更重要的是,愤怒等情绪会在反复互动中引发用户之间的两极分化,从而凸显出此类互动在情感和心理上的重大影响。
2 DATA
在这项关于加沙冲突的研究中,我们分析了协调用户和有机用户之间的 Twitter 互动(转发和回复)。我们的数据集涵盖了从 2023 年 9 月 1 日(即 2023 年以色列-哈马斯战争开始前)到 2023 年 11 月 1 日的 62 天。在战争正式开始的 10 月 7 日之后,我们观察到推文数量明显增加。我们使用人工编辑的英语、阿拉伯语和希伯来语关键词列表收集数据,例如西岸、炸弹、加沙、耶路撒冷、导弹。我们还使用了 #football、FIFA、Buckwheat、PROMO Alert、BLM、blacklivesmatter 等关键词来过滤无关内容。我们收集了 57 种语言的 3,584,175 条推文,其中以英语(93%)为主,其次是阿拉伯语(6.71%)和希伯来语(0.04%)。由于英文推文超过 330 万条,因此我们将分析重点放在英文推文上。我们确定了 4 种推文类型: 2,935,621 次转发、206,663 次回复、150,997 次推文和 40,001 次引用
3 METHODOLOGY
3.1 Coordinated Activity Detection
人们提出了多种技术来揭示社交媒体上的协调活动 [ 12, 17 , 20 ]。我们利用一种新技术[13]来构建基于不同行为指标的用户相似性网络1。该网络包含五种行为轨迹,包括分享相同的 URL 链接、标签、推文内容、再次分享相同的推文以及快速转发(在 1 分钟内再次分享相同的推文)。每种追踪都会形成一个相似性网络,用户的相似性通过边缘权重来表示。然后,我们将这些网络合并成一个融合图,其中节点之间的链接表示任何单个网络中的连接。
为了识别协调用户,我们根据中心性修剪节点,选择具有最高 5% 特征向量中心性的节点。我们检测到 1,034 个协调用户。在 100 名手动分析的用户中,62 人已删除帐户或被暂停,9 人的推文受到保护。此外,68 位用户的关注者数量较少(< 2,000 名关注者),而 32 位用户的发帖次数超过 10 万次。
3.3 用户互动动态特征
为了衡量互动变化,我们分析了有机用户和协调用户的内容分布在 1、2 和 3 次互动后的变化情况。为此,我们计算了第 k 次互动和 k+ 1 次互动(k ∈ {1,2,3})之间所有活动的组间(有机→协调,协调→有机)和组内(有机→有机,协调→协调)互动比例的平均值。对于第三次互动,我们考虑了 2023 年 11 月 1 日之前的所有活动。
为进一步观察有机用户行为的变化,我们对其在 1、2 和 3 次互动(k∈ {1、2、3})后以及在不同时间窗口(t∈ {1天、3天、1周})内的群组间互动比例进行了分析。例如,对于k = 1 和t = 1 小时,如果用户在上午 11 点进行了第一次互动,在上午 11:58 进行了第二次互动,则上午 11:00 至上午 11:58 之间的所有互动都会被考虑在内。然后,我们计算与协调用户互动的比例,并将其记为 O2C prop。同样,对于所有其他有机用户,我们计算 k= 1, t= 1 天内的 O2C prop。然后计算所有用户的平均值 O2C prop。我们对剩余的互动步骤和时间窗口重复这一过程。
3.4 Organic Users’ Behavior After Interactions
为了分析用户行为的变化,我们研究了有机用户在与协调用户互动后发布的原始内容(推文)。我们研究了不同时间窗口(t)和互动步骤(k)中所表达情感的变化。我们利用 [5] 分析文本,并为 11 种情绪分配概率(从 0 到 1 不等):期待、喜悦、爱、乐观、惊喜、信任、愤怒、厌恶/蔑视、恐惧、悲观和悲伤。
为了为研究有机用户的内容变化建立一个基线,我们首先探讨了协调用户和普通用户之间的差异。我们使用 Mann-Whitney (MW) 检验(= 0.01,0.001)来衡量这些差异的显著性。为了检验各互动步骤之间的内容变化,我们在指定的时间窗口t内识别第 k 次互动前后的推文。对于每个互动步骤和时间窗口,我们计算所有推文和用户的后概率(互动步骤后撰写的推文的情感概率)与前概率(互动步骤前撰写的推文的情感概率)之差的平均值,从而得出情感阈值。
4 RESULTS
接下来,我们将研究协调用户在网络中传播内容的成功率(问题 1)、协调用户和有机用户之间的互动在互动步骤中的变化(问题 2),以及用户在与协调内容互动后其内容是否会发生变化(问题 3)。
4.1 Effectiveness of Coordinated Activity
我们估算了 1034 个协调用户(通过融合网络识别)在加沙冲突相关讨论中获得有机用户参与和支持的效果。我们确定了 1766 名与协调用户互动(转发或回复)的有机用户,以及 1326 695 名与协调用户没有任何互动的用户。使用第 3.2 节中概述的四个指标,我们观察到以下数值: RTP(10.51%)、RR(10.62%)、O2CR(9.87%)和 TSR(36.58%)。
我们发现,有机用户回复协调用户的频率略高于转发协调用户的频率。虽然只有不到 10%的有机用户互动涉及协同用户(O2CR),但有超过三分之一的协同用户生成的内容有一定的参与度(TSR),这表明协同内容在整个网络中得到了大量传播。与 [ 14] 相比,我们注意到 RTP 和 RR 较低,但 O2CR 和 TSR 却相当。这说明,虽然有机用户主要是相互接触,但协调内容的很大一部分渗透到了网络的各个部分,包括脆弱的有机受众。
4.2 Interactions Increase Over Time
在本节中,我们将研究普通用户和协调用户之间随着时间推移而不断发展的互动。图 2 展示了两组用户在互动过程中内容分布的变化。随着互动次数的增加,我们观察到以下内容呈下降趋势组内互动。不过,我们也看到群组间的互动比例有所上升,这表明共序用户有能力通过重复互动与有机用户发起讨论。
4.3 Emotion Modulation by Coordinated Users
我们的第三个研究问题是,重复互动是否会改变有机用户的内容。我们在图 1 中比较了协调内容和有机内容中表达的情绪。我们展示了五种情绪(2 种积极情绪:爱、乐观,3 种消极情绪:恐惧、悲观、悲伤)的分布情况,这五种情绪之间存在显著差异(MW 检验,= 0.01)。我们的研究结果表明,与有机用户相比,协调用户在他们的内容中较少出现爱和乐观等企业情绪,这从较窄的概率范围(0 至 0.5 和 0 至 0.8)中可以看出。其他积极情绪(期待、喜悦、惊喜、信任)也出现了类似的模式。然而,协调内容往往表现出更高的愤怒和厌恶/蔑视等情绪概率,这表明负面情绪的使用总体上更多。
我们的分析表明,与协调用户的互动往往决定了有机用户如何创建新帖子并在信息中表达情绪。他们的内容中有相当一部分倾向于表现出强烈的负面情绪。有趣的是,就愤怒等特定情绪而言,用户在一段时间内形成了不同的群体,有些人表现出更多的愤怒,而另一些人则似乎变得更加麻木。