论文笔记:基于细粒度融合网络和跨模态一致性学习的多模态假新闻检测

news2024/11/19 13:26:00

整理了MMAsia2023 Cross-modal Consistency Learning with Fine-grained Fusion Network for Multimodal Fake News Detection 论文的阅读笔记

  • 背景
  • 模型
    • 筛选模块
  • 实验
    • 消融实验
    • 超参数讨论
    • 可视化

背景

  尽管以往的工作已经观察到假新闻中文字与图像的不匹配,但他们仍致力于探索多模态新闻的一致性,而没有研究多模态内容中细粒度片段之间的关系。为了获得公众的信任,假新闻往往在文字和图片中包含相关的部分,这使得多模态特征看起来似乎是一致的。本文提出了一种新的一致性学习细粒度融合网络(CFFN),该网络分别从高相关和低相关的词区域对中探索一致性和不一致性。
  CFFN从高相关的词区对中提取真实新闻的一致性,并从低相关的词区对中揭示假新闻的不一致性。对于一致性部分,采用跨模态注意机制融合相关信息来探索一致性。对于不一致候选部分,计算每个词-区域对的不一致分数以捕获不一致点。最后,使用选择模块选择主要线索(一致性或不一致性)来识别多模态新闻的可信度。此外,通过构建一个分割损失,鼓励模型选择一致部分的线索来识别真实新闻,选择不一致候选部分的线索来识别假新闻

模型

  CFFN的概述如图2所示。主要由三个部分组成:特征提取模块、融合模块和选择模块。对于特征提取,CFFN使用了细粒度的预训练模型BERT和Swin-T。CFFN旨在根据相关度得分将词-区域对分成两部分。从高相关部分探讨一致性,从低相关部分探讨不一致性:
在这里插入图片描述
  传统的方法往往通过注意力机制获取另一模态的高相关信息,以此推断一致性,然而,他们忽视了低相关部分对假新闻检测的重要性。在这项工作中,作者试图从高相关部分探索真实新闻的一致性,从低相关部分探索假新闻的不一致性。首先利用余弦相似度来评估不同模态片段之间的相关性得分: s i j = t i v j T ∣ ∣ t i ∣ ∣   ∣ ∣ v j ∣ ∣       i ∈ [ 1 , N ] , j ∈ [ 1 , M ] s_{ij}=\frac{t_iv^T_j}{||t_i||\ ||v_j||}\ \ \ \ \ i\in[1,N],j\in[1,M] sij=∣∣ti∣∣ ∣∣vj∣∣tivjT     i[1,N],j[1,M]  ,其中, s i j s_{ij} sij表示 t i t_i ti(第i个文本片段)和 v j v_j vj(第j个视觉片段)之间的相关程度, M , N M,N M,N分别是视觉和文本片段的数量。为了将高低相关度的片段分离,作者使用一个阈值来将相关度矩阵 S S S分为两部分: { S m = { s i j > λ } S c = { s i j < = λ } \begin{cases} S_m=\{s_{ij}>\lambda\} \\S_c=\{s_{ij}<=\lambda\}&\end{cases} {Sm={sij>λ}Sc={sij<=λ}  其中, 𝑆 𝑚 𝑆_𝑚 Sm表示一致部分,词-视觉区域对高度相关,而 𝑆 𝑐 𝑆_𝑐 Sc表示不一致候选部分,其中词-视觉区域对弱相关或不相关。
  对于一致性部分的词-区域对,通过注意机制来汇总这些区域的特征,从而获得成对信息: t ^ i = ∑ j = 1 M σ ( s i j ) v j + t i      { i , j } ∈ S m \hat t_i=\sum^M_{j=1}\sigma(s_{ij})v_j+t_i\ \ \ \ \{i,j\}\in S_m t^i=j=1Mσ(sij)vj+ti    {i,j}Sm  对于不一致区域,则直接进行加法: c i j = t i ⊕ v j       { i , j } ∈ S c c_{ij}=t_i\oplus v_j\ \ \ \ \ \{i,j\}\in S_c cij=tivj     {i,j}Sc  为了探索一致部分和不一致候选部分的线索,本文分别计算一致分数和不一致分数,然后用这些分数聚合相应部分的特征。以不一致分数为例: s i j c = s i g m o i d ( M L P ( c i j ) ) s_{ij}^c=sigmoid(MLP(c_{ij})) sijc=sigmoid(MLP(cij))  类似地,将 t ^ i \hat t_i t^i转换为一致分数 s i m s_i^m sim。最后,将聚合过程记为: { z m = ∑ i = 1 N s i m t ^ i      i ∈ S m z c = ∑ i = 1 N ∑ j = 1 M s i j c c i j      { i , j } ∈ S c \begin{cases} z_m=\sum^N_{i=1}s_i^m\hat t_i\ \ \ \ i\in S_m\\z_c=\sum^N_{i=1}\sum^M_{j=1}s_{ij}^cc_{ij}\ \ \ \ \{i,j\}\in S_c&\end{cases} {zm=i=1Nsimt^i    iSmzc=i=1Nj=1Msijccij    {i,j}Sc  其中, 𝑚 ∈ R 1 × 𝑑 𝑚∈R^{1×𝑑} mR1×d 𝑐 ∈ R 1 × 𝑑 𝑐∈R^{1×𝑑} cR1×d分别表示一致部分和不一致候选部分。

筛选模块

  到目前为止,我们的得到了一致性特征和不一致性特征 z m z_m zm z c z_c zc,本文的做法是根据这两个特征(拼接起来)获取权重: w m c = σ ( w m ∘ w c ) w_{mc}=\sigma(w_m\circ w_c) wmc=σ(wmwc)  其中, w m w_m wm w c w_c wc z m z_m zm z c z_c zc分别过了一个线性层映射,根据得到的 w m c w_{mc} wmc融合 z m z_m zm z c z_c zc z = w m c [ z m ∘ z c ] T z=w_{mc}[z_m\circ z_c]^T z=wmc[zmzc]T  将 z z z送入分类器,我们可以获得预测值和交叉熵损失。此外,在本文中,作者试图从高相关部分探索真实新闻的一致性,从弱相关部分探索假新闻的不一致性。因此,为了鼓励模型从正确的部分中选择线索,构造了分区标签,并设计了分区损失函数: L p = ∣ ∣ y p − w m c ∣ ∣ 2 2 \mathcal{L}_p=||y_p-w_{mc}||^2_2 Lp=∣∣ypwmc22   𝑤 𝑚 𝑐 𝑤_{𝑚𝑐} wmc是一个二维向量,第一维表示一致部分的权重,第二维表示不一致候选部分的权重。因此,标签 𝑦 𝑝 = ( 1 , 0 ) 𝑦_𝑝=(1,0) yp=(1,0)是真新闻扩大一致部分的权重,而 𝑦 𝑝 = [ 0 , 1 ] 𝑦_𝑝=[0,1] yp=[0,1]是假新闻扩大inconsistency-candidate部分的权重。最终的损失由交叉熵和分区损失共同组成: L f i n a l = L + β L p \mathcal{L}_{final}=\mathcal{L}+\beta\mathcal{L}_p Lfinal=L+βLp

实验

  作者在微博和推特数据集上验证了CAFF的有效性,对比实验的结果如表1:
在这里插入图片描述
  我们可以观察到:首先,对于单峰方法,VS和CNN分别从图像和文本中挖掘线索。VS在Twitter上优于CNN,而CNN在微博上优于VS。这意味着,对于不同的数据集,视觉内容和文本内容可能扮演不同的角色。必须考虑两种检测假新闻的方式的内容;其次,由于预训练模型的强大功能,SpotFake和HMCAN等方法具有预训练的语言模型和预训练的视觉模型,优于其他方法。此外,细粒度方法HMCAN优于SAFE、CAFE和SpotFake,后者在池化操作后利用了每种模式的全局特征。这些观察结果表明,预训练模型和不同模式之间的细粒度交互对于提高检测性能都很重要;最后,CFFN利用预训练模型BERT和Swin-T对不同的模态进行细粒度融合,达到了最好的性能。

消融实验

  在消融实验部分,作者设计了四种CFFN的变体:(1)w/o consistent part:仅使用不一致性候选部分来探索不一致性;(2)w/o inconsistent part:变体只捕捉一致部分的一致性,用于假新闻检测;(3) w/o partition loss L p \mathcal{L}_p Lp:变体可以自适应地从一致部分和不一致候选部分推断线索;(4) w/o separation:变体直接利用跨模态注意融合相关区域作为文本内容中每个单词的补充信息。
在这里插入图片描述
  在所有变体中,w/o separation的性能最差,这表明分离世界区域对在假新闻检测中探索一致性和不一致性的有效性。此外,我们观察到:(1)w/o consistent part和w/ow/o inconsistent part的性能都不如CFFN。这证明了从一致性部分探索一致性和从不一致性候选部分探索不一致性都是必要的。(2)与CFFN相比,w/ow/o partition loss L p \mathcal{L}_p Lp的性能分别下降了约1%和1.9%,证明了分配模型对真实新闻的一致性挖掘和对假新闻的不一致性推断的有效性。

超参数讨论

  CFFN的超参数主要包括两个:权衡参数 β \beta β和阈值 λ \lambda λ,来训练我们的CFFN。结果如图3所示:
在这里插入图片描述

可视化

  在CFFN中,不一致性和一致性分别是识别假新闻和真实新闻的必要条件。图4中量化了CFFN对不同新闻的多模式内容的关注:
在这里插入图片描述
  对于图4 (a)中的三个假新闻示例,CFFN关注的是不一致点,即图像中的猪头和描述文本中的“鱼”,它们位于不一致候选部分。相比之下,对于图4 (b)文本中的单词“car”,CFFN捕获图像中的一致区域用于识别真实新闻,该词-区域对属于一致部分。©中的失效案例揭示了CFFN的局限性。由于缺乏外部知识,CFFN无法识别图片中的人物,只能捕捉到单词“Together”与两个人站在一起的区域的一致性,从而做出错误的决定。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2183783.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

大数据毕业设计选题推荐-民族服饰数据分析系统-Python数据可视化-Hive-Hadoop-Spark

✨作者主页&#xff1a;IT研究室✨ 个人简介&#xff1a;曾从事计算机专业培训教学&#xff0c;擅长Java、Python、微信小程序、Golang、安卓Android等项目实战。接项目定制开发、代码讲解、答辩教学、文档编写、降重等。 ☑文末获取源码☑ 精彩专栏推荐⬇⬇⬇ Java项目 Python…

DNS with libevent

DNS with libevent: high-level and low-level functionality libevent提供了少量用于解析DNS名字的API&#xff0c;以及用于实现简单DNS服务器的机制。 我们从用于名字查询的高层机制开始介绍&#xff0c;然后介绍底层机制和服务器机制。 Portable blocking name resolution…

八、SPOOLING技术

1.早期脱机技术 外围控制机更高速的设备--磁带 作用:缓解设备与CPU的速度矛盾&#xff0c;实现预输入、缓输出 批处理阶段引入了脱机输入/输出技术(用磁带完成): 引入脱机技术后&#xff0c;缓解了CPU与慢速I/O设备的速度矛盾。另一方面&#xff0c;即使CPU在忙碌&#xff0…

【Windows】在任务管理器中隐藏进程

在此前的一篇&#xff0c;我们已经介绍过了注入Dll 阻止任务管理器结束进程 -- Win 10/11。本篇利用 hook NtQuerySystemInformation 并进行断链的方法实现进程隐身&#xff0c;实测支持 taskmgr.exe 的任意多进程隐身。 任务管理器 代码&#xff1a; // dllmain.cpp : 定义 …

MongoDB微服务部署

一、安装MongoDB 1.在linux中拉去MongoDB镜像文件 docker pull mongo:4.4.18 2. 2.创建数据挂载目录 linux命令创建 命令创建目录: mkdir -p /usr/local/docker/mongodb/data 可以在sshclient工具查看是否创建成功。 进入moogodb目录&#xff0c;给data赋予权限777 cd …

2024-09-04 深入JavaScript高级语法十五——浏览器原理-V8引擎-js执行原理

目录 1、浏览器的工作原理1.1、认识浏览器内核1.2、浏览器渲染过程 2、JS引擎2.1、认识 JavaScript 引擎2.2、浏览器内核和JS引擎的关系2.3、V8引擎的原理2.4、V8引擎的架构2.5、V8执行的细节 3、全局代码的执行过程3.1、初始化全局对象3.2、执行上下文栈&#xff08;调用栈&am…

World of Warcraft [CLASSIC][80][Grandel] Call to Arms: Victory in Wintergrasp

Wintergrasp 冬拥湖 120 VS 120 Victory in Wintergrasp - Quest - 魔兽世界怀旧服WLK3.35数据库_巫妖王之怒80级魔兽数据库_wlk数据库

逆向-下字符串查找的条件断点

为了跟踪console程序在访问某个文件时失败的问题&#xff0c;在内核中下了断点&#xff0c;但是内核中文件部分调用太频繁了&#xff0c;无法等到自己的文件。所以最好还是根据条件来下断点。 程序如下 想要在FileName是指定文件时停下来&#xff0c;例如FileName是c:\temp\f…

「轻盈」之旅:OOM故障重现与解决

前期准备 本项目均采用 VisualVM 2.1.10 进行dump文件的分析。JDK1.8及之前所在目录的bin目录下有自带的VisualVM&#xff0c;JDK1.8以后需要自行手动安装下载。 下载地址&#xff1a;https://visualvm.github.io/download.html IDEA插件配置&#xff1a;在Plugins里搜索visual…

2-109 基于matlab-GUI的BP神经网络

基于matlab-GUI的BP神经网络&#xff0c;10种不同分布的数据样本&#xff0c;9种不同的激活函数&#xff0c;可更改升级网络结构参数&#xff0c;对比各种方法参数下的训练测试效果&#xff0c;实时显示预测过程。程序已调通&#xff0c;可直接运行。 下载源程序请点链接&…

【简介Sentinel-1】

Sentinel-1是欧洲航天局哥白尼计划&#xff08;GMES&#xff09;中的地球观测卫星&#xff0c;由Sentinel-1A和Sentinel-1B两颗卫星组成。以下是对Sentinel-1的详细介绍&#xff1a; 一、基本信息 卫星名称&#xff1a;Sentinel-1 所属计划&#xff1a;欧洲航天局哥白尼计划…

【CSS】兼容处理

兼容前缀兼容查询 由于不同浏览器对CSS标准的支持程度不同&#xff0c;可能会导致在不同浏览器中出现样式差异。为了解决这个问题&#xff0c;需要采取一些措施来提高CSS的兼容性 兼容前缀 兼容前缀针对的浏览器-webkit-WebKit 内核浏览器&#xff0c;如&#xff1a;Safari 、…

.NET Core 集成 MiniProfiler性能分析工具

前言&#xff1a; 在日常开发中&#xff0c;应用程序的性能是我们需要关注的一个重点问题。当然我们有很多工具来分析程序性能&#xff1a;如&#xff1a;Zipkin等&#xff1b;但这些过于复杂&#xff0c;需要单独搭建。 MiniProfiler就是一款简单&#xff0c;但功能强大的应用…

进击J9:Inception v3算法实战与解析

&#x1f368; 本文为&#x1f517;365天深度学习训练营 中的学习记录博客&#x1f356; 原作者&#xff1a;K同学啊 一、实验目的&#xff1a; 了解并学习InceptionV3相对于InceptionV1改进了哪些地方&#xff08;重点&#xff09;使用Inception v3完成天气识别案例 二、实验环…

Android 12.0 关于定制自适应AdaptiveIconDrawable类型的动态时钟图标的功能实现系列一

1.前言 在12.0的系统rom定制化开发中,在关于定制动态时钟图标中,原系统是不支持动态时钟图标的功能,所以就需要从新 定制动态时钟图标关于自适应AdaptiveIconDrawable类型的样式,就是可以支持当改变系统图标样式变化时,动态时钟 图标的背景图形也跟着改变,所以接下来就来…

OpenFeign微服务部署

一.开启nacos 和redis 1.查看nacos和redis是否启动 docker ps2.查看是否安装nacos和redis docker ps -a3.启动nacos和redis docker start nacos docker start redis-6379 docker ps 二.使用SpringSession共享例子 这里的两个例子在我的一个博客有创建过程&#xff0c…

通信工程学习:什么是LTE长期演进

LTE:长期演进 LTE(Long Term Evolution,长期演进)是由3GPP(The 3rd Generation Partnership Project,第三代合作伙伴计划)组织制定的UMTS(Universal Mobile Telecommunications System,通用移动通信系统)技术标准的长期演进。以下是对LTE的详细解释: 一、定…

音乐制作软件FL Studio 24.1.1.4285 中文完整版新功能介绍及如何安装激活FL Studio 24

FL Studio 24.1.1.4285 中文完整版又被国内网友称之为水果音乐制作软件24&#xff0c;是Image-Line公司成立26周年而发布的一个版本&#xff0c;是目前互联网上最优秀的完整的软件音乐制作环境或数字音频工作站&#xff0c;包含了编排&#xff0c;录制&#xff0c;编辑&#xf…

笔墨歌盛世 丹青绘匠心,艺术赋能“百千万工程”

9月30日上午&#xff0c;乡村有“艺”思——2024 年三乡镇乡村文化艺术周启动仪式暨“崛起的力量”余镇河深中通道主题美术作品展开幕仪式在中山市三乡镇古鹤村成荣美术馆举行。 中山市文联党组成员、专职副主席卢曙光&#xff0c;三乡镇党委委员艾立强&#xff0c;中山市文化馆…

leetcode每日一题day21(24.10.1)——最低票价

看到题目&#xff0c;最低消费又有各种的方案&#xff0c;与结合往期每日一题很就没出动态规划&#xff0c;就感觉这题很像动态规划。 思路:对于第X天&#xff0c;买票有三种方案&#xff0c;即从&#xff0c;X-1天买一天的票&#xff0c;X-7买7天的票&#xff0c;X-30买三十天…