谣言检测文献阅读十二—A Convolutional Approach for Misinformation Identification

news2024/11/14 21:37:22

系列文章目录

  1. 谣言检测文献阅读一—A Review on Rumour Prediction and Veracity Assessment in Online Social Network
  2. 谣言检测文献阅读二—Earlier detection of rumors in online social networks using certainty‑factor‑based convolutional neural networks
  3. 谣言检测文献阅读三—The Future of False Information Detection on Social Media:New Perspectives and Trends
  4. 谣言检测文献阅读四—Reply-Aided Detection of Misinformation via Bayesian Deep Learning
  5. 谣言检测文献阅读五—Leveraging the Implicit Structure within Social Media for Emergent Rumor Detection
  6. 谣言检测文献阅读六—Tracing Fake-News Footprints: Characterizing Social Media Messages by How They Propagate
  7. 谣言检测文献阅读七—EANN: Event Adversarial Neural Networks for Multi-Modal Fake News Detection
  8. 谣言检测文献阅读八—Detecting breaking news rumors of emerging topics in social media
  9. 谣言检测文献阅读九—人工智能视角下的在线社交网络虚假信息 检测、传播与控制研究综述

文章目录

  • 系列文章目录
  • 前言
  • 2.相关工作
  • 3.数据集分析
  • 4.提出的CAMI模型
    • 4.1问题定义
    • 4.2拟议模型
  • 结果分析


前言

文章:A Convolutional Approach for Misinformation Identification
发表会议:International Joint Conference on Artificial Intelligence(CCF A)
时间:2017年


  • 首先,GRU-2(MaJing 2016)不适用于输入错误信息序列有限的实际早期检测任务。有限的输入序列可能不够长,无法体现动态时序信号,因此GRU2在某些情况下无法捕获动态时序信号特性。
  • 经过训练的RNN模型具有恒定的递归转移矩阵,并在每两个连续输入之间诱导序列信号的不可变传播,这不适用于动态和复杂场景。
  • 上述GRU-2模型偏向于输入序列的最新元素[Mikolov等人,2011]。但关键特征不一定出现在输入序列的后部。
       如上所述,基于特征工程的方法无法塑造重要特征之间复杂的高层交互,以模拟真实世界的社交媒体场景,而CNN不仅可以从输入实例中自动提取局部和全局重要特征,还可以揭示这些高层交互。此外,基于RNN的方法不能胜任早期检测任务。此外,这些方法偏向于最新的输入元素,并试图获得不变的传播序列特征,而CNN中的卷积结构和k-max池运算可以灵活地提取分散在一个输入序列中的关键特征。
       我们提出了一个用于错误信息识别和早期检测任务的CAMI模型。首先,我们调查了所采用数据集中的数据分布(详见第3节),并观察了错误信息和真实信息的长尾分布。然后,基于上述观察,我们提出了一种将每个事件划分为几个阶段的适当方法。随后,所有事件都被分成几组微博帖子。通过段落向量学习各组的表示[Le和Mikolov,2014]。因此,CAMI的输入序列由一组事件组成。CAMI不仅能够从输入实例中自动提取局部和全局重要特征,揭示这些高级交互,而且能够灵活地提取分散在一个输入序列中的关键特征。最后,我们从CAMI模型的可视化实验中获得了一些观察结果,这有助于更好地理解网络空间中的人类行为,更准确地塑造现实世界的社交媒体场景。
       这项工作的主要贡献如下:
  • 我们使用无监督方法段落向量学习输入微博帖子的表示,使用有监督方法CNN自动获取错误信息和真实信息的关键特征。
  • 我们将所提议的模型捕捉到的内容可视化,这将帮助我们理解社交媒体上的信息所具有的固有属性。
  • 在两个真实数据集上进行的实验表明,CAMI更有效,在错误信息识别和早期检测任务方面明显优于最先进的方法。

2.相关工作

3.数据集分析

  我们在两个大型微博数据集上评估模型:微博和Twitter数据集,该数据集由[Castillo等人,2011;Kwon等人,2013;Ma等人,2016]开发和使用。Twitter数据集中分别属于错误信息和真实信息的事件数量为498和494,微博数据集中分别为2313和2351。
  我们调查了数据集中错误信息和真实信息的数据分布。以微博数据集为例,数据分布如图1所示。每个点代表相应时间点0.1小时内微博帖子的百分比。即使在半对数坐标中也可以显示错误信息和真实信息的长尾分布(否则曲线几乎与一般坐标重合)。

在这里插入图片描述

图1:半对数坐标下微博数据集中错误信息和真实信息的长尾分布。

4.提出的CAMI模型

4.1问题定义

   给定一组事件,每个事件包括一系列相关的微博帖子,每个微博帖子都与时间戳相关联。这里的任务是在事件级别识别事件是否是错误信息,即通过分析事件的相关微博帖子序列来检测事件是否为错误信息。

4.2拟议模型

  • 将事件的所有相关微博帖子分成几个组。
      我们收集所有相关微博帖子的时间戳,并从每个事件的所有时间戳中减去相应事件的起始时间戳。然后将这些时间戳标准化为 0-1 比例。最后将整组时间戳按时间顺序平均分成 20 份,每个时间窗口公式为

在这里插入图片描述  其中 t i t_i ti是第 i 个份额的终点。请注意,在某些事件中,可能有一些时间窗口组,没有任何微博帖子。

  • 通过段落向量学习每个组的表示
      我们将一个时间窗口的微博帖子视为一个事件阶段,并用一系列阶段对事件的整体特征进行建模。为方便起见,此处使用段落向量 [Le and Mikolov, 2014]。并且一个时间窗口内一组微博帖子的一个事件阶段可以看成一个段落来学习段落表示 g j g_j gj
    在这里插入图片描述
      预测是通过softmax进行的,
    在这里插入图片描述  给定 N 个单词的段落,单词由 W 中的列向量 w n w_n wn 表示,段落由 D 中的列向量 g j g_j gj 表示。此外,θ 是 softmax 参数,h 是连接或平均操作。利用上下文词和段落记忆来预测当前词。
      此外,那些没有任何微博帖子的组用零向量表示。值得指出的是,该模型的输入固定大小为 20,CAMI 输入层的段落向量在后续训练过程中不会更新
  • 通过 CNN 对高级交互进行建模。
      CNN 的常用架构包括卷积层、k-max 池化层和全连接层。
    在这里插入图片描述图 2:CAMI 的框架。自下而上:根据分布将原始内容按时间顺序分组;学习所有组的段落向量;使用 CNN 从低级到高级提取特征。
    微博数据集CAMI的参数设置为d = 72, m = [6, 4], w = [7, 5],Twitter 数据集d = 56, m = [6, 4], w = [7, 5 ] (m,w 是特征图的数量和两层的过滤器宽度)

结果分析

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1946026.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

FreeModbus学习——读输入寄存器eMBFuncReadInputRegister

FreeModbus版本:1.6 当功能码为04时,也就是读输入寄存器MB_FUNC_READ_INPUT_REGISTER 看一下它是怎么调用读输入寄存器处理函数的 当功能码为04时,调用读输入寄存器处理函数 这个函数在数组xFuncHandlers中,也就是eMBFuncRead…

Mysql数据库第四次作业

mysql> create table student(sno int primary key auto_increment,sname varchar(30) not null unique,Ssex varchar(2) check (Ssex男 or Ssex女) not null,Sage int not null,Sdept varchar(10) default计算机 not null); mysql> create table Course(Con int primar…

【通信协议-RTCM】MSM语句(2) - RINEXMSM7语句总结(重要!自动化开发计算卫星状态常用)

注释: 在工作中主要负责的是RTCM-MSM7语句相关开发工作,所以主要介绍的就是MSM7语句相关内容 1. 相位校准参考信号 2. MSM1、MSM2、MSM3、MSM4、MSM5、MSM6和MSM7的消息头内容 DATA FIELDDF NUMBERDATA TYPENO. OF BITSNOTES Message Number - 消息编…

1. Docker的介绍和安装 (二)

5 Docker的原理 5.1 Namespace Namespace(命名空间)提供了一个独立的工作环境,Docker使用Namespace来隔离容器,使得每个容器都有自己独立的系统资源(如进程ID、主机名、网络等)。 PID Namespace&#xf…

SBTI科学碳目标认证是什么?SBTI科学碳目标的重要性

SBTI科学碳目标认证,作为企业在应对气候变化和追求可持续发展道路上的重要里程碑,其认证过程严谨而系统。以下是获得SBTI科学碳目标认证的详细步骤: 首先,企业需要在线注册并提交承诺书,郑重承诺在未来24个月内提交科学…

Linux网络-配置IP

作者介绍:简历上没有一个精通的运维工程师。希望大家多多关注作者,下面的思维导图也是预计更新的内容和当前进度(不定时更新)。 本来IP配置应该放在Linux安装完成的就要配置的,但是由于那个时候对Linux不怎么熟悉,所以单独列了一个…

每日一题 LeetCode03 无重复字符的最长字串

1.题目描述 给定一个字符串 s ,请你找出其中不含有重复字符的最长字串的长度。 2 思路 可以用两个指针, 滑动窗口的思想来做这道题,即定义两个指针.一个left和一个right 并且用一个set容器,一个length , 一个maxlength来记录, 让right往右走,并且用一个set容器来…

扫雷-C语言

一、前言: 众所周知,扫雷是一款大众类的益智小游戏,它的游戏目标是在最短的时间内根据点击格子出现的数字找出所有非雷格子,同时避免踩雷,踩到一个雷即全盘皆输。 今天,我们的目的就是通过C语言来实现一个简…

Open函数使用 Json与pickle Os模块

一. 文件操作与 open() 函数 Open函数是Python中用于打开文件的内置函数,其基本语法如下: open(file, moder, buffering-1, encodingNone, errorsNone, newlineNone, closefdTrue, openerNone) 各参数说明: file: 要打开的文件…

34_YOLOv5网络详解

1.1 简介 YOLOV5是YOLO(You Only Look Once)系列目标检测模型的一个重要版本,由 Ultralytics 公司的Glenn Jocher开发并维护。YOLO系列以其快速、准确的目标检测能力而闻名,尤其适合实时应用。YOLOV5在保持高效的同时&#xff0c…

El-Table 表格的表头字段切换

最近写了一个小功能,比较有意思,特此博客记录。 提出需求:需要表头字段变化,但是我在官网上的表格相关上查找,没有发现便捷方法。 于是我有两个想法:1.做三个不同的表格。2.做一个表格使用不同的表头字段。…

2024.7.24 远程连接到另一设备(win)上的vrep时无响应(防火墙!)

Windows防火墙禁止了软件的端口的通信,打开即可 如何设置Windows 7 防火墙端口规则

字典集合案例

1.统计字符 统计字符串中每个字符出现的次数 s l like summer very much #去掉空格 s s.replace(" ","") d dict() for i in s:if i in d:d[i] 1else:d[i] 1 for i in d:print(i,d[i]) 2.求不重复的随机数 #导入随机数 import random a int(input(&q…

VMware 上安装 CentOS 7 教程 (包含网络设置)

**建议先看一些我安装VMware的教程,有些网络配置需要做一下 1.打开VMware,创建虚拟机 2.勾选自定义,点击下一步 3.点击下一步 4.勾选“稍后安装操作系统”,点击下一步 5.勾选linux,勾选centos7,点击下一步…

每日Attention学习12——Exterior Contextual-Relation Module

模块出处 [ISBI 22] [link] [code] Duplex Contextual Relation Network for Polyp Segmentation 模块名称 Exterior Contextual-Relation Module (ECRM) 模块作用 内存型特征增强模块 模块结构 模块思想 原文表述:在临床环境中,不同样本之间存在息肉…

Python算法基础:解锁冒泡排序与选择排序的奥秘

在数据处理和算法设计中,排序是一项基础且重要的操作。本文将介绍两种经典的排序算法:冒泡排序(Bubble Sort)和选择排序(Selection Sort)。我们将通过示例代码来演示这两种算法如何对列表进行升序排列。 一…

BGP选路之Local Preference

原理概述 当一台BGP路由器中存在多条去往同一目标网络的BGP路由时,BGP协议会对这些BGP路由的属性进行比较,以确定去往该目标网络的最优BGP路由。BGP首先比较的是路由信息的首选值(PrefVal),如果 PrefVal相同,就会比较本…

python-NLP:2词性标注与命名实体识别

文章目录 词性标注命名实体识别时间命名实体(规则方法)CRF 命名实体识别方法 词性标注 词性是词汇基本的语法属性,通常也称为词类。词性标注是在给定句子中判定每个词的语法范畴,确定其词性并加以标注的过程。例如,表示…

爱回收严选买的二手iPad Air 4已经使用一周啦!

有多少人是跟我一样,手里一旦有点小钱就留不住,只想花出去的? 本24届应届生目前刚开始实习工作,虽然工资低的可怜,但是比起大学时期还是宽裕了不少。 于是发完工资的我就非常想消费!而我最近最想要的就是…

Fedora40安装telnet-server启用telnet服务

Fedora40安装telnet-server启用telnet服务 安装 telnet-server sudo yum install telnet-server或 sudo dnf install telnet-server启用服务 fedora40 或 CentosStream9 不能用 yum或dnf安装xinetd, telnet-server 的服务名为: telnet.socket 启用 telnet.socket.service …