Game-On论文阅读

news2024/11/28 20:57:19

异质性是多模态研究中最重要的关注点

文章目录

  • Abstract
  • 1. Introduction
  • 2. Related Work
    • 2.1 多模态假新闻检测 **以往的研究方法**
    • 2.2 GNNs在多模态研究中的地位
    • 3. 方法论
    • 3.1 视觉和文本特征编码器
    • 3.2 共享多模态空间和多模态图构建
    • 3.3 图注意层
    • 3.4 假新闻检测器
  • 4. 实验与结果
    • 4.1 数据集
    • 4.2 实现细节
    • 4.3多模态的baseline总结
    • 4.4 实验结果
    • 4.5 消融研究
  • 5. 总结
  • 参考文献
  • 代码注解
    • 文本单模态Graph
    • 文本单模态评估结果

1、梯度裁剪+dropout实现梯度爆炸问题

2、全连接图的问题:如果使用多模态的是全连接,那经过GAT以后的每个结点的特征是不是都一样了,这样GAME-ON是如何解决的{看代码~}

Abstract

社交媒体在当今时代有着越来越大的影响力。在这些平台上传播的假新闻对我们的生活产生了破坏性和破坏性的影响。此外,由于多媒体内容比文本数据更能提高帖子的可见性,因此已经观察到多媒体经常被用于创建虚假内容。大量以前的多模态工作试图解决在识别虚假内容时对异构模态进行建模的问题。然而,这些工作有以下局限性:

(1)在模型的后期阶段,通过在模态上使用简单的连接运算符来对模态间关系进行低效编码,这可能导致信息丢失;(2)在小而复杂的现实生活中的多模态数据集上训练具有非常深的神经网络,且它具有不成比例数量的参数,这导致过拟合的可能性更高

为了解决这些局限性,我们提出了GAME-ON,这是一种基于图神经网络的端到端可训练框架,允许不同模态内和跨模态的粒度交互,以学习更强大的数据表示,用于多模态假新闻检测。我们使用两个公开的假新闻数据集,Twitter和微博,进行评估。我们的模型在Twitter上的表现平均优于11%,在微博上保持了2.6%的竞争力,同时使用的参数比最佳可比的最先进baseline少65%。

1. Introduction

多模态的重要性

无论新闻的真实性 ,社交媒体的快速发展为信息的传播创造了一个完美的环境。然而,如果对传播的信息没有任何质量控制,假新闻会产生深远的后果**[Zhao et al.,2015年]。例如,2016年美国总统大选期间假新闻的影响[Bovet and Makse,2019],众多“神话”的传播,以及关于COVID-19大流行的误导性信息[Melki et al.,2021; Sharma等人,2021年]。特别是假新闻发起者,使用在文本中添加视觉信息的策略来制作更具吸引力和争议性的帖子来欺骗用户[Verstraete等人,2021年]。因此,在考虑多模态数据的同时检测假新闻至关重要。

先前采用方法:迁移学习、交叉注意力网络融合不同模态

最近,研究人员对多模态假新闻检测领域的兴趣越来越大。已经提出了各种基于深度学习的架构[Khattar等人,2019; Wang等人,2018年]。此外,迁移学习策略在识别假新闻方面越来越受欢迎[Singhal et al.,2019; Singhal等人,2020年]。研究人员还专注于通过以复杂模型为代价使用交叉注意力网络融合不同模态 来进行模态间交互[Wu et al.,2021 a; Qian等人,2021年]。

先前工作方法的缺点:1、简单concat导致信息丢失;2、无法明确多模态数据中出现的异质性差距;3、复杂模型导致的过拟合问题

对于异质性差距的说明:摘自论文《Deep Multimodal Representation Learning: A Survey》:由于来自不同模式的特征向量最初位于不相等的子空间中,与相似语义相关联的向量表示将是完全不同的。这种现象被称为异质性差距—>多模态特征值及其规模的差异】

以前的工作的缺点是使用复杂的模型的不同模态的融合效率低下。在模型中的稍后点使用简单的连接来融合模态,特别地,可能导致信息丢失。此外,以前利用级联运算符对多式的concat关系进行编码的工作未能明确解决多模态数据中出现的异质性差距[Peng和Qi,2019]。即使是试图解决上述问题的研究也使用了具有大量参数的复杂模型[Qian等人,2021],这可能会导致更高的过拟合几率。

使用Graphs背后的动机:
在这里插入图片描述

图1:GAME-On框架的图构造pipline概述。(A)给定一个多模式帖子(新闻样本),取自Twitter数据集,我们为两种模式提取单独的完全连通图。(B)从图像中找到目标并提取其特征表示vi。( C )对于文本图,我们首先对文本进行标记化,并提取其特征表示ti

考虑一个包含文本和视觉内容的多模态帖子(见图1)。在文本的情况下(图1(c)),由于每个单词都很重要,并且为了检测假新闻而与其他单词相连,我们创建了一个文本单模态的图。具体来说,节点表示每个词的embedding,其中包括语义(文本作为一个整体)和语法级(单词作为一个整体)表示,而图中的表示embedding之间的关系。从而,表示单个文本(模态)的多个节点。所有节点之间存在连接,以 避免任何信息丢失。类似地,在图像的情况下(图1(B)),很明显,图像中的每个提取对象都与另一个对象相连接,覆盖图像的语义(图像作为一个整体)和细粒度(对象级)表示。因此, (i)为每个模态(节点)提取细粒度和全局表示有助于模型以图的方式更有效地学习真实世界数据中模态内和模态之间的复杂关系(边),以及 (ii)通过不同模态节点之间的直接和间接连接增加交互的实例有助于减少由不同模态节点的分布不一致引起的异质性差距,语义相似的模式。

图神经网络的发展

图神经网络(GNN)已经彻底改变了许多领域,包括网络科学,语义取证,健康,视觉对话,并在许多任务上取得了优异的性能。此外,在当代多模态表示学习工作中,只有少数人采用了这些强大的GNN技术[Mai et al.,2020; Chen和Zhang,2020; Han等人,2020; Sabir等人,2021; Jiang等人,2020; Arya等人,2019年]。然而,这些作品要么引入对离群值敏感的基于张量分解的方法,要么利用单独的阶段进行模态间和模态内编码。因此,与我们提出的框架不同,前者引入了不必要的复杂性,而后者不能同时建模模态间和模态内的关系。虽然我们的论文重点是多模态假新闻检测作为其应用,我们的框架也可以推广到其他多媒体任务。

【离群值的定义:离群点是指一个数据与其他数据相比,其数值过高或过低。例如,在一个高中班级里,几乎所有的学生都在18岁左右,然而有一个学生的年龄是35岁。离群值会扭曲模型,导致训练时间延长,准确性降低,性能变差。例如,RMSE损失函数对离群值很敏感,在有离群值的情况下会大得多,所以损失函数会试图根据这些离群值来调整模型,甚至牺牲其他样本。】

在这里插入图片描述

【张量分解的定义:张量通常是动态增长的,它的增长通常可以用三种形式来实现:1、维度的增长;2、维度中数据的增长;3、观测数据的增长;现实情况下,往往由于采集数据工具(如采集交通数据的传感器)的故障以及其他异常情况导致数据中往往存在部分缺失值,对这些缺失值的修补称之为“补全”,张量领域的缺失值修复即张量补全。张量补全是根据已有数据对缺失值的影响和低秩假设实现缺失值补全,主要分为两类方法:一种是基于张量补全中给定的秩和更新因子;一种是直接最小化张量秩并更新低秩张量】

基于以前文献中关于多模态假新闻检测的空白和GNN最近的成功,我们工作的主要贡献如下:

模型框架

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1286440.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

12.5作业

1. #include <iostream>using namespace std;class Animal { private:string name; public:Animal(){}Animal(string name):name(name){cout << "animal" << endl;}virtual void perfrom(){cout << "实现不同表演行为" << …

竞赛选题 题目:基于深度学习的图像风格迁移 - [ 卷积神经网络 机器视觉 ]

文章目录 0 简介1 VGG网络2 风格迁移3 内容损失4 风格损失5 主代码实现6 迁移模型实现7 效果展示8 最后 0 简介 &#x1f525; 优质竞赛项目系列&#xff0c;今天要分享的是 基于深度学习卷积神经网络的花卉识别 该项目较为新颖&#xff0c;适合作为竞赛课题方向&#xff0c…

深入了解c语言中的结构体

介绍&#xff1a; 在C语言中&#xff0c;结构体是一种用户自定义的数据类型&#xff0c;它允许我们将不同类型的数据组合在一起&#xff0c;形成一个更为复杂的数据结构。结构体可以用来表示现实世界中的实体&#xff0c;如人员、学生、图书等。本篇博客将介绍结构体的基本概念…

Token 和 N-Gram、Bag-of-Words 模型释义

ChatGPT&#xff08;GPT-3.5&#xff09;和其他大型语言模型&#xff08;Pi、Claude、Bard 等&#xff09;凭何火爆全球&#xff1f;这些语言模型的运作原理是什么&#xff1f;为什么它们在所训练的任务上表现如此出色&#xff1f; 虽然没有人可以给出完整的答案&#xff0c;但…

使用node实现链接数据库并对数据库进行增删改查的后端接口

环境 node npm 编辑器 vscode 项目配置 新建目录 用vscode打开 终端输入 npm init -y npm install mysql npm install express 代码 安装好之后的代码页面 新建 在根目录新建api.js文件 const express require(express); const db require(./db/index); const app…

国产智能运维操作系统新选择-浪潮KeyarchOS

1.背景 在CentOS停更&#xff0c;国有企业纷纷摒弃原有的开发与运维工具&#xff0c;全面拥抱国产。我司也顺应号召&#xff0c;更换原有CentOS系统。 在新系统选型上&#xff0c;我司有以下要求&#xff1a; 国产、快速更新迭代、社区活跃&#xff1b;拥有一定知名度&#x…

数据库Delete的多种用法

数据库的Delete操作是用来删除数据库中的数据记录的&#xff0c;它是数据库操作中的一种重要操作&#xff0c;能够帮助用户删除不需要的数据&#xff0c;以便保持数据库的整洁和高效。在使用Delete操作时&#xff0c;需要注意确保操作的准确性和安全性&#xff0c;以免误删重要…

【Mysql】聚合函数和分组(查找)

聚合函数 函数说明COUNT([DISTINCT] expr)返回查询到的数据的 数量SUM([DISTINCT] expr)返回查询到的数据的 总和&#xff0c;不是数字没有意义AVG([DISTINCT] expr)返回查询到的数据的 平均值&#xff0c;不是数字没有意义MAX([DISTINCT] expr)返回查询到的数据的 最大值&…

最新发布SPAB模块,YOLOv5改进之SPAB

目录 一、原理 二、代码 三、应用到YOLOv5 一、原理 单幅图像超分辨率(SISR)是低分辨率计算机视觉中的一项重要任务,旨在从低分辨率图像中重建高分辨率图像。传统的注意机制虽然显著提高了S

批量获取 Btsow 网站搜索到的磁力链接

BTSOW 是个不错的种子或磁力链接搜索网站&#xff0c;本脚本可以按需要批量抓取 磁力链接&#xff08;老司机必备&#xff09; 功能: 1.获取最新地址&#xff08;网站经常失联&#xff09; 2.最多50页内容&#xff08;网站限制&#xff09; 3.结果生成CSV文件&#xff08;可用e…

全网最新最牛的Appium自动化:Appium常用操作之TouchAction操作

TouchAction操作 Appium的辅助类&#xff0c;主要针对手势操作&#xff0c;比如滑动、长按、拖动等。其原理是将一系列的动作放在一个链条中&#xff0c;然后将该链条传递给服务器。服务器接受到该链条后&#xff0c;解析各个动作&#xff0c;逐个执行。 TouchAction类支持的动…

Verilog基础:编译指令`timescale

相关阅读 Verilog基础https://blog.csdn.net/weixin_45791458/category_12263729.html?spm1001.2014.3001.5482 timescale编译指令用于指定指令后模块的时间单位和时间精度。时间单位是时间值的度量单位&#xff0c;例如延迟值和仿真时间&#xff1b;而仿真精度决定了最小可分…

《SpringBoot项目实战》第六篇—接口防抖(防重复提交)的一些方式

系列文章导航 第一篇—接口参数的一些弯弯绕绕 第二篇—接口用户上下文的设计与实现 第三篇—留下用户调用接口的痕迹 第四篇—接口的权限控制 第五篇—接口发生异常如何统一处理 第六篇—接口防抖(防重复提交)的一些方式 本文参考项目源码地址&#xff1a;summo-springboot-i…

15.Servlet [一篇通]

文章目录 1.Servlet 是什么2.第一个 Servlet 程序2.1创建项目2.2引入依赖2.3创建目录2.4编写代码2.5打包程序2.6部署程序2.7验证程序 3.更方便的部署方式3.1安装 Smart Tomcat 插件3.2配置 Smart Tomcat 插件 4.访问出错怎么办?4.1出现 4044.2出现 4054.3出现 5004.4出现 &quo…

前端面试高频考点—事件循环Event loop

目录 事件循环 执行步骤 概念讲解 主线程 微任务(micro task) 宏任务(macro task) Event Loop经典例题 这段代码的执行结果是什么&#xff1f; 正确答案&#xff1a; 具体流程&#xff1a; 事件循环 主线程从"任务队列"中读取执行事件&#xff0c;这个过程…

WeiPHP 微信开发平台 SQL注入漏洞复现

0x01 产品简介 weiphp 是一个开源,高效,简洁的微信开发平台,基于 oneThink 内容管理框架实现。 0x02 漏洞概述 weiphp 微信开发平台 _send_by_group、 wp_where、 get_package_template等接口处存在 SQL 注入漏洞,攻击者利用此漏洞可获取数据库中的信息(例如,管理员后台…

【Docker】部署若依项目——保姆级教程亲测

目录 1.部署后端 步骤1&#xff1a;修改mysql地址 步骤2&#xff1a;修改redis地址 步骤3&#xff1a;修改后端端口 步骤4&#xff1a;将项目打包成Jar包 ​编辑 步骤5&#xff1a;编写Dockerfile 步骤6&#xff1a;制作镜像 启动容器 步骤7&#xff1a;访问 2.前端打…

国产接口测试工具APIpost

说实话&#xff0c;了解APIpost是因为&#xff0c;我的所有接口相关的文章下&#xff0c;都有该APIpost水军的评论&#xff0c;无非就是APIpost是中文版的postman&#xff0c;有多么多么好用&#xff0c;虽然咱也还不是什么啥网红&#xff0c;但是不知会一声就乱在评论区打广告…

论文阅读-Null-text Inversion for Editing Real Images using Guided Diffusion Models

一、论文信息 作者团队&#xff1a; 论文链接&#xff1a;https://arxiv.org/pdf/2211.09794.pdf 代码链接&#xff1a;https://github.com/google/prompt-to-prompt 二、Conditional Diffusion&#xff08;classifier-free guidance) Classifier-free guidance方法训练&…

Honeywell PM43 loadfile.lp RCE漏洞复现(CVE-2023-3710)

0x01 产品简介 Honeywell PM43 是美国霍尼韦尔&#xff08;Honeywell&#xff09;公司的一款打印机产品。 0x02 漏洞概述 Honeywell PM43 P10.19.050004之前版本存在输入验证错误漏洞&#xff0c;攻击者可通过该漏洞在服务器端任意执行代码&#xff0c;写入后门&#xff0c;获…