【自然语言处理】COLD:中文攻击性言论检测数据集

news2024/11/22 7:13:39

COLD:A Benchmark for Chinese Offensive Language Detection

文章目录

    • COLD:A Benchmark for Chinese Offensive Language Detection
      • 1 论文出处
      • 2 背景
        • 2.1 背景介绍
        • 2.2 针对问题
        • 2.3 创新点
      • 3 数据集构建
        • 3.1 数据源
        • 3.2 效率改进
        • 3.3 数据集分析
      • 4 实验设计
        • 4.1 实验设置
        • 4.2 性能结果
        • 4.3 现有生成模型评估
      • 5 个人总结

1 论文出处

发表时间:2022年

发表会议/期刊:Conference on Empirical Methods in Natural Language Processing(EMNLP)

会议/期刊级别:CCF-B

2 背景

2.1 背景介绍

  随着社交媒体的普及,网络上出现了大量的攻击性言论,这些言论不仅影响了网络环境的文明程度,也对使用预训练语言模型的应用带来了潜在的风险。因此,检测和过滤攻击性言论是一项重要的任务,也是自然语言处理领域的一个研究热点。然而,目前针对中文攻击性言论检测的研究还很少,主要原因是缺乏可靠的数据集。

2.2 针对问题

  为了推动中文攻击性言论检测的研究,本文提出了一个基准测试——COLD,包括一个中文攻击性言论数据集——COLDATASET和一个基于该数据集训练的检测器——COLDETECTOR,并针对以下几个问题:

  • COLDATASET是否能有效地支持中文攻击性言论检测任务?
  • 现有的中文预训练语言模型在生成方面是否存在攻击性问题?
  • 哪些因素会影响预训练语言模型的攻击性生成?

2.3 创新点

  • 构建了一个规模较大、质量较高、类别较多、场景较广的中文攻击性言论数据集——COLDATASET,该数据集包含了来自不同平台和领域的超过10万条标注数据。
  • 提出了一个基于BERT的中文攻击性言论检测器——COLDETECTOR,并在COLDATASET上进行了实验,证明了其有效性。
  • 部署了COLDETECTOR,并对流行的中文预训练语言模型进行了详细的分析,揭示了这些模型在生成方面存在的攻击性问题,以及影响攻击性生成的因素。

3 数据集构建

3.1 数据源

  • 关键字查询:利用它们,可以从爬网得到的大量数据中获得与每个关键词相关的高密度数据,从而缩小搜索范围,增加目标数据的密度。
  • 相关子主题:从社交软件中搜索一些被广泛讨论的子主题,并直接从后续评论中获取数据。与关键字查询相比,这些数据不受预先收集的关键字的限制,并且可以提供更全面的查看用户对该主题的讨论,从而产生更广泛的内容和表达式。

3.2 效率改进

  为了提高收集效率,本文训练一个分类器从候选数据中发现目标数据,并为训练集和测试集采用不同的标记策略,同时邀请了一些专业的标注人员,对这些数据进行了人工标注,按照是否含有攻击性言论和攻击性言论的类别进行了分类。

3.3 数据集分析

4 实验设计

4.1 实验设置

  • COLDETECTOR:本文提出的基于BERT的中文攻击性言论检测器。
  • TranslJigsaw Detector (TJIGDET):将中文文本翻译成英文进行检测。
  • Prompt-based Self-Detection (PSELFDET):使用了一些特定的提示语句来引导模型判断自己生成的文本是否含有攻击性言论。
  • Baidu Text Censor (BAIDUTC):百度提供的一个在线文本审核服务,可以对中文文本进行敏感词过滤和内容审核。
  • Keyword Matching (KEYMAT):使用了一些预定义的词典和规则,根据文本中是否含有攻击性词汇或表达来判断是否为攻击性言论。
  • Random:作为一个基线来比较其他方法的性能。

4.2 性能结果

4.3 现有生成模型评估

(1)每个模型都具有不同程度的攻击性

(2)由不同的提示引发的攻击性(目标关键词、消极态度、偏差)

5 个人总结

  文章总结如下:

  • 这篇文章提出了一个中文攻击性言论检测的基准测试——COLD,包括一个数据集和一个检测器。
  • 数据集——COLDATASET是一个规模较大、质量较高、类别较多、场景较广的中文攻击性言论数据集,包含了来自不同平台和领域的超过10万条标注数据,可以有效地支持中文攻击性言论检测任务,也可以用于其他相关任务,如情感分析、文本生成等。
  • 检测器——COLDETECTOR是一个基于BERT的中文攻击性言论检测器,在COLDATASET上取得了最佳的检测性能,证明了预训练语言模型在该任务上的优势。
  • 本文还对流行的中文预训练语言模型进行了详细的分析,揭示了这些模型在生成方面存在的攻击性问题,以及影响攻击性生成的因素,为未来研究和改进提供了指导。

  文章可以有待改进的地方如下:

  • 数据集——COLDATASET虽然规模较大,但仍然无法覆盖所有的攻击性言论场景和类别,可能存在一些偏差和噪声,可以考虑扩充数据集的规模和多样性,或者使用一些数据增强和去噪的方法来提高数据集的质量。
  • 检测器——COLDETECTOR虽然取得了最佳的检测性能,但仍然有一些误判和漏判的情况,尤其是对于一些隐晦或者含糊的攻击性言论,可以考虑使用一些更先进或者更适合中文的预训练语言模型,或者使用一些注意力机制或者知识图谱等方法来提高检测器的语义理解能力。
  • 分析——本文对中文预训练语言模型的攻击性生成进行了详细的分析,但仅限于生成文本本身,并没有考虑生成文本对用户和社会的影响,可以考虑使用一些心理学或者社会学等方法来评估生成文本的危害程度,或者使用一些干预或者纠正等方法来减少生成文本的攻击性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/685879.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

驱动开发:内核物理内存寻址读写

在某些时候我们需要读写的进程可能存在虚拟内存保护机制,在该机制下用户的CR3以及MDL读写将直接失效,从而导致无法读取到正确的数据,本章我们将继续研究如何实现物理级别的寻址读写。 首先,驱动中的物理页读写是指在驱动中直接读…

LiveGBS流媒体平台GB/T28181功能-海康大华宇视华为NVR等4G摄像头自带物联网卡注册国标平台后看不到设备的时候如何排查及抓包

LiveGBS流媒体平台GB/T28181功能-海康大华宇视华为NVR等4G摄像头自带物联网卡注册国标平台后看不到设备的时候如何排查及抓包 1、设备注册后查看不到1.1、是否是4G|5G摄像头1.2、关闭萤石云1.3、防火墙排查1.4、端口排查1.5、IP地址排查1.6、设备TCP/IP配置排查1.7、设备多网卡…

【Nexus】Maven从Nexus中下载jar包

目录 一、前言二、配置Apache Maven1、在Maven的settings.xml中添加一个镜像配置,并覆盖中央仓库的默认配置 二、创建Maven项目,配置pom文件拉取Nexus中的jar包1、确定配置的Maven的settings.xml是否是上一步修改的settings.xml文件,以及repo…

规划地类、用途分区、空间管制区代码对应表

规划地类、用途分区、空间管制区代码对应表 —the—end—

UE5 与 C++ 入门教程·第一课:角色与 Enhanced Input

本文主要围绕 UE5 新的输入系统,手把手从 0 搭建 Unreal 项目,实现角色的基础移动。 重要提示:众所周知,C 属于编译型语言,因此动态灵活性不足,不过执行效率高,而蓝图简单灵活,却执行…

探索TCC:释放高可用性和弹性事务的潜力

1、TCC简介 分布式事务是指在分布式系统中,多个服务之间需要保证数据的一致性和完整性的场景。传统的单机事务无法满足分布式系统的需求,因此需要引入一种新的事务模型来解决分布式事务问题。 TCC(Try-Confirm-Cancel)是一种基于…

MySQL的分库分表

分必要不要分库分表(通过优化之后还明显影响业务再分,可以通过监控慢查询确定) 分库分表的一般条件:单表数据量超过1000w(阿里应该是说5000w)或者单表数据文件(.ibd)超过20GB,这个很重要,&…

点云配准综述一篇综述《A comprehensive survey on point cloud registration》(翻译)

参照了 2021最新关于点云配准的全面综述 - 知乎,并且加了些自己翻译,全篇的内容可能稍有删减。主要作为个人笔记,阅读了几篇综述,发现这篇是质量较好的,值得花时间细读。 文章分类 文章将配准方法分为了同源配准和不…

JMeter三大重要组件——线程组、取样器、查看结果数(3)

JMeter三大重要组件 一、JMeter三大重要组件——线程组1、作用:JMeter主要通过线程组来运行用户脚本2、在取样器错误后要执行的动作:3、线程属性3、调度器4、setUp线程组和tearDown线程组 二、JMeter三大重要组件——取样器1、基本a、自动重定向和跟随重…

Obsidian多端同步插件LiveSync

网友 Leo 和 Paco反馈,群晖升级到 DSM7.2 ,注册表可以搜索镜像,根据 Leo 贴的 /var/packages/Docker/etc/dockerd.json 的内容,DSM7.2 应该是使用了 https://docker.nju.edu.cn 作为注册表镜像,但老苏测试过下面几种情…

易基因:易基因近期染色质免疫共沉淀测序(ChIP-seq)研究成果|项目集锦

大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。 在生物学研究中,DNA与蛋白质之间的互作(DNA-Protein Interactions,DPIs)是至关重要的,参与基因的表达、调控、复制、重组和修复…

m 序列(最长线性反馈移位寄存器序列)详解

本专栏包含信息论与编码的核心知识,按知识点组织,可作为教学或学习的参考。markdown版本已归档至【Github仓库:https://github.com/timerring/information-theory 】或者公众号【AIShareLab】回复 信息论 获取。 文章目录 m 序列 (最长线性反…

Git进阶系列 | 8. 用Reflog恢复丢失的提交

Git是最流行的代码版本控制系统,这一系列文章介绍了一些Git的高阶使用方式,从而帮助我们可以更好的利用Git的能力。本系列一共8篇文章,这是最后一篇。原文:Using the Reflog to Restore Lost Commits[1] “Reflog”是Git不太为人所…

常见的未授权漏洞批量检测工具

常见的未授权漏洞检测 命令行版已放出支持多线程,批量扫描,指定服务扫描,命令行版地址https://github.com/xk11z/unauthorized_com GUI版unauthorizedV2已更新,可批量ip检测导出结果 项目包含 1 、FTP 未授权访问&#xff08…

SadTalker AI模型使用一张图片与一段音频便可以自动生成视频

SadTalker模型是一个使用图片与音频文件自动合成人物说话动画的开源模型,我们自己给模型一张图片以及一段音频文件,模型会根据音频文件把传递的图片进行人脸的相应动作,比如张嘴,眨眼,移动头部等动作。 SadTalker,它从音频中生成 3DMM 的 3D 运动系数(头部姿势、表情),…

webstorm配置vue开发环境

🌳🌳🌳前言:本文章针对于如何用IDE和webstorm运行一个别人的vue项目进行步骤记录。 📙参考:(10条消息) idea配置vue开发环境_idea配置vue运行环境_drinkworld的博客-CSDN博客https://blog.csdn.net/drinkwo…

VSCode ssh ubuntu20显示图像界面

1、在vscode中安装 Remote X11(SSH) 2、在本地端安装MobaXterm 点击Settings-->Configurations-->X11,设置如下: 3、在服务端修改 ~/.bashrc文件,在末尾添加 export DISPLAY"192.168.0.201:0.0" 其中引号中内容为本地端IP地…

英伟达股价能否凭借AI进一步上涨到500美元?

来源: 猛兽财经 作者:猛兽财经 猛兽财经在之前的关于英伟达的分析中(5月2日),就认为英伟达在人工智能方面的增长潜力还没有完全释放出来,并认为英伟达的股价将会很快涨到300美元,结果到了6月…

代码随想录二刷 day34 | 贪心之1005.K次取反后最大化的数组和 134. 加油站 135. 分发糖果

1005.K次取反后最大化的数组和 题目链接 解题思路: 两次贪心 如何可以让数组和最大呢? 局部最优:让绝对值大的负数变为正数,当前数值达到最大,整体最优:整个数组和达到最大 如何转变K次正负,让…

CASS打印地形图操作

1、打开地形图,如下: 2、在“工程应用”菜单栏中,选择“查询两点距离及方位”,如下: 3、量取地形图的大致范围大小,如下: 读取图上距离,用于设置纸张大小。 4、点击左上角打印图形&…