论文阅读 Interpretable Unified Language Checking

news2024/11/15 2:14:03

本文提出了一种新的方法来解决多种自然语言处理任务中的问题,包括公平性检查、事实检查、虚假新闻检测和对抗攻击检测等。该方法基于大型语言模型和少量人类标注的提示信息,通过在模型中引入相应的提示,来提高模型的性能和可解释性。该论文的实际意义非常重大。首先,随着互联网的快速发展,虚假信息和对抗攻击等问题已经成为了一个严重的社会问题。因此,开发一种高效的自然语言处理方法来解决这些问题,对于保护社会公正和稳定至关重要。其次,该论文提出的方法具有广泛的应用前景,不仅可以用于虚假信息和对抗攻击检测等任务,还可以用于自然语言理解、机器翻译、情感分析等多种自然语言处理任务。此外,该论文的另一个重要贡献是提高了自然语言处理任务的可解释性。在实际应用中,可解释性对于自然语言处理任务的成功应用至关重要。该论文提出的基于提示的方法可以使模型的决策过程更加透明和易于理解,从而提高了模型的可解释性,使得模型的决策更加可靠和可信。

文章目录

  • Abstract
  • 1 Introduction
  • 2 Related Work
  • 3 Task Formulation
    • 3.1 Human and Machine
    • 3.2 Fact and Fairness
    • 3.3 Retrieved and Generated Groundings
    • 3.4 Grounding and Entailment
  • 4 Method
    • 4.1 Zero-shot Language Checking
    • 4.2 Few-shot Language Checking
  • 5 Experiments
    • 5.1 General Ethics Benchmark Dataset
    • 5.2 Implementation Details
    • 5.3 Results
    • 5.4 Task recognition
    • 5.5 Case Study
  • 6 Conclusion
  • 总结


Abstract

大语言模型会产生的不良行为(包括非事实性、偏见性和仇恨性语言)。本文提出了一种可解释的、统一的语言检查(UniLC)方法,用于人类和机器生成的语言,旨在检查语言输入是否真实和公平(将两者结合起来)。用本文提出的方法和结果表明,基于强大的潜在知识表征,LLMs可以成为检测错误信息、刻板印象和仇恨言论的适应性和可解释性工具。

1 Introduction

在这里插入图片描述
作者提出了一个通用的、与任务无关的语言检查系统,可联合检测错误信息、刻板印象和仇恨言论。作者的框架跨越了不同任务,不需要为每个任务使用不同的提示和模型。在作者提出的策略中,他们通过提示一个LLM自动检测输入的潜在问题,然后生成一个适当的基于蕴涵的语言检查的理由。作者的实验表明,这种自适应方法的性能可与最先进的监督式、任务相关模型相媲美。此外,作者的方法提高了机器和人类生成语言的语言检查的效率、准确性和透明度。

2 Related Work

分别介绍了Large language models (LLMs),Fact Checking,Stereotype recognition,Hate speech detection。

3 Task Formulation

作者设计了一个包容性的语言检查系统,可以在统一的设置下适用于不同的领域和任务,包括语言检查的不同方面,而无需进行任何特定于任务或领域的更改。

3.1 Human and Machine

在这项工作中,作者不关心一段文本是由人还是机器生成的,只要它是事实和公平的。换句话说,作者想测试他们的模型是否能够成功地检测有害语言,而不考虑其来源。这对于人与人之间的交互和人与机器之间的交互都会有益处。

3.2 Fact and Fairness

虽然错误信息和仇恨言论是有害语言的不同方面,但它们本质上是相关的。通过将它们与普遍接受的“道德”事实和价值观进行比较来检测明显的偏见和仇恨。由于LLMs具有强大的常识意识,包括自然事实和社会价值观,它们可以为不同的目的生成合理的立场检测基础。因此,本文中用于检查事实性和公平性的统一流程基于生成的基础和蕴涵。我们表明,这种解决方案可以提高语言检查的效率和透明度,因为大多数预测可以通过生成的基础信息来解释。

3.3 Retrieved and Generated Groundings

检查语言的两种基本方法:检索和生成。传统的事实检查系统通常基于两个步骤的流程,包括基于检索文本的信息检索和立场检测。然而,仇恨言论和社会偏见检测通常是开放式的,没有提供任何基础文档,模型是基于其自身的社会知识进行预测的。在这项工作中,作者在基于检索和生成的基础上测试了模型在事实检查任务上的性能。一般来说,基于检索的设置提供可信的信息,但性能受到检索质量和知识库覆盖范围的限制。另一方面,生成策略提供了嘈杂的提示,但提高了灵活性。

3.4 Grounding and Entailment

事实基础和道德分类需要不同的知识和推理能力。事实基础取决于关于世界的自然和社会知识以及常识,而道德分类需要识别陈述和基础信息之间的蕴涵关系的能力。在这项工作中,作者对LLMs在这两个任务上进行了实验,并与非LLM蕴涵方法进行了比较。值得注意的是,作者发现蕴涵模型在公平性任务的基础事实的立场检测方面表现更好。

4 Method

在方法比较方面,作者提出了多种方法,如零-shot分类、少量样本事实预测+零-shot伦理分类、少量样本事实预测+少量样本伦理分类和蕴涵等,用于对自然语言中的事实和伦理问题进行检查和判断,并在综合基准测试集上进行了比较。作者还比较了这些方法的解释能力和可解释性,并分析了它们的优缺点。

4.1 Zero-shot Language Checking

首先以以下格式评估将不同任务的声明直接输入LLMs的语言检查性能:声明:{Claim to verify}问题:这样说是否合理?语言模型用“是”或“否”回答问题(a),并解释答案。将此作为所有任务的基线。由于llm从大规模的语料库中学习,嵌入的自然和社会知识可以帮助实现零拍分类,而无需额外的输入。

4.2 Few-shot Language Checking

Fact Prediction (FP)
该图解说明了三种评估策略:1.零-shot检查(Zero-cls);2.少量样本事实生成+零-shot基础检查(Few-fp + Zero-cls);3.少量样本事实生成+少量样本基础检查(Few-fp + Few-cls)。
在这里插入图片描述
Grounded Ethical classification (CLS).
方法总结:(1)零样本分类(Zero-cls):使用零样本的是/否问题检查声明的合理性;(2)少样本事实预测+零样本伦理分类(Few-fp + Zero-cls):使用少量样本生成自然或社会事实,并在零样本设置下使用LLM进行伦理预测;(3)少样本事实预测+少样本伦理分类(Few-fp + Few-cls):在少量样本设置下同时生成事实和伦理分类;(4)蕴涵(Entailment):基于Few-fp生成的事实,使用预训练的基于假设的蕴涵模型进行伦理预测。
通过这些实验,作者得出了一些结论,如LLMs在多数任务上表现良好,但在一些领域(如仇恨言论和社会偏见)上表现不佳;少量样本事实预测+零-shot伦理分类方法在大多数任务上表现较好,但对于某些任务(如气候事实检查)可能存在一定局限性;蕴涵方法在某些任务上表现不错,但对于一些任务(如社会偏见)可能存在一定的误判。

5 Experiments

5.1 General Ethics Benchmark Dataset

提出了一个包含事实和公平检查任务的联合伦理基准,以模拟人类和人工智能语言的主要关注点。这些任务包括气候相关事实核查、公共卫生相关事实核查、仇恨言论检测、社会偏见识别、机器生成的有毒语言检测和机器生成的假新闻检测。在这里插入图片描述

5.2 Implementation Details

使用两个模型来进行事实提示和道德分类,包括一个大型语言模型gpt -3.5 turbo和一个中型蕴涵模型ESP-deberta-large。在生成式伦理分类中,LLM并不总是清晰地回答“是”或“否”。我们仅将负标签分配给收到明确“否”答案的样本。使用蕴涵模型时,我们强制模型进行二元分类,尽管该模型经过训练可以识别三个类别:蕴涵、中立和矛盾。对于每个声明,我们构建一个假设作为(f)并仅比较蕴涵和矛盾得分。如果蕴涵得分高于矛盾,则根据假设,该声明是不公平的,即使实际预测是中立的。

5.3 Results

Fact checking.
在这里插入图片描述
Few-fp+Zero-cls设置显著提高了LLM的性能,特别是在识别不准确声明的F1得分方面。此外,我们发现Few-fp + Few-cls方法并没有超过Few-fp + Zero-cls策略。这表明,LLM的一个合理事实足以使其进行准确的预测,就像提供示例一样。值得注意的是,蕴涵模型在所有少样本设置中都实现了不断的改进,除了Few-fp + Zero-cls(零样本预测)。这个事实展示了蕴涵模型在识别三个句子之间的关系时的困难程度:标签描述、声明摘要和事实。
在这里插入图片描述
Fairness checking.
在公平任务中,蕴涵分类模型对Few-fp+ 0 -cls有利,但对Few-fp+Few-cls正确率和F1分数有轻微的降低。这一结果表明,对于公平性检查任务,LLM基于事实的推理能力与蕴涵模型相似。特别是,与蕴涵模型相比,LLM在F1得分上取得了显著的改善。
Unified performance
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

5.4 Task recognition

对比实验:论文作者还对所提出的方法进行了对比实验,比较了其与其他常用方法的性能差异。比如,在公平性检查任务中,他们将所提出的方法与基于规则、基于统计的方法以及其他基于语言模型的方法进行了比较。结果表明,所提出的方法的性能优于其他常用方法。
可解释性分析:为了进一步验证所提出的方法的可解释性,论文作者还进行了一些可解释性分析。例如,在公平性检查任务中,他们对所提出的方法进行了可视化分析,以展示模型如何对不同的提示进行分类,并且探讨了各个提示对模型决策的影响。
超参数调整:为了进一步优化性能,论文作者还对所提出的方法进行了超参数调整。通过调整不同的超参数,他们成功地提高了模型的性能,从而进一步证明了所提出的方法的有效性。

5.5 Case Study

在模型评估方面,作者使用了多个公开数据集,并比较了不同模型在这些数据集上的表现。具体来说,作者比较了LLMs、BERT、RoBERTa和GPT-3等多种预训练模型在不同任务上的表现,如社会偏见识别、仇恨言论检测、气候事实检查、公共卫生事实检查、GPT有害性检查和机器生成的假新闻检测等。作者还比较了不同模型对于不同任务的解释能力和可解释性。通过这些实验,作者得出了一些结论,如LLMs在多数任务上表现良好,但在一些领域(如仇恨言论和社会偏见)上表现不佳;少量样本事实预测+零-shot伦理分类方法在大多数任务上表现较好,但对于某些任务(如气候事实检查)可能存在一定局限性;蕴涵方法在某些任务上表现不错,但对于一些任务(如社会偏见)可能存在一定的误判。

6 Conclusion

本文提出了一个基于事实的语言伦理建模系统,可以使用相同的提示和管道进行事实、仇恨言论和社会偏见检查。除了事实检查任务之外,大型语言模型所做的道德预测也可以基于不同类别的事实。通过本文呈现的强大结果,作者认为,虽然语言模型存在生成幻觉和可疑语言的问题,但它们也是检查人类和机器生成语言的适当性的强大工具,无论是在开放书本还是封闭书本的情况下。我们进一步分析了事实和公平性检查任务可以基于多样化和重叠的事实,并且应用蕴涵分类可以提高声明和基础事实之间的立场检测性能。
不足:llm对准确的措辞和上下文范例很敏感;只有一个二分类;在对事实、仇恨言论和社会偏见的评估使用了六个数据集,这些数据集可能不包含所有可能的场景,也不能提供错误信息和假信息的全面描述。

总结

这篇文章提出了一种新的方法,称为可解释的统一语言检查,该方法可以同时检测文本中的多种语言错误和问题,并提供可解释的结果。具体来说,该方法使用了一个统一的神经网络模型,该模型包含多个子任务,包括拼写错误检查、语法错误检查和语言风格检查等。每个子任务都有自己的损失函数,但是这些损失函数被合并为一个整体损失函数,以便在训练过程中一起进行优化。
为了实现可解释性,该方法提供了一个解释模块,可以将错误检测结果可视化,并提供相应的建议和修正。这个解释模块使用了一种基于注意力机制的方法,可以自动地确定哪些部分的文本对于错误检测结果至关重要,并将这些部分突出显示。此外,解释模块还提供了一些可读的解释,以便用户更好地理解错误和修正建议。
在实验中,该方法在两个任务上进行了测试:拼写错误检查和语法错误检查。结果表明,该方法可以同时检测多种语言错误和问题,并提供可解释的结果,从而帮助用户更好地理解和修正文本中的错误。
总的来说,这篇文章提出了一种新的方法,可解释的统一语言检查,该方法可以同时检测文本中的多种语言错误和问题,并提供可解释的结果。该方法具有重要的应用前景,可以帮助用户更好地理解和修正文本中的错误。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/638754.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

数据库索引及优化

索引 1.索引简介 1.1 概念 MySQL官方对索引的定义为:索引(Index)是帮助MySQL高效获取数据的数据结构。索引的本质:索引是数据结构。 注:在数据之外,数据库系统还维护着满足特定查找算法的数据结构&…

第二章---感知机

🌞欢迎来到深度学习的世界 🌈博客主页:卿云阁 💌欢迎关注🎉点赞👍收藏⭐️留言📝 🌟本文由卿云阁原创! 🙏作者水平很有限,如果发现错误&#xff…

centos各个版本jenkins部署

目录 官网安装方法 安装java,**注意java版本,新版本jenkins只支持jdk11及以上 安装jenkins Jenkins启动失败的七个问题 jenkins 部署脚本 Nginx转发jenkins服务 官网安装方法 Redhat Jenkins Packages (jenkins-ci.org)https://mirrors.jenkins-c…

微信朋友圈怎么定时发送?微信朋友圈定时发送有什么优势?

刷朋友圈已经成为大部分人日常中不可缺少的一件事,同时也是企业用来触达客户的重要渠道。下面一起来了解一下微信朋友圈定时发送的优势有哪些,还有怎么定时发朋友圈吧。 定时发朋友圈的优势有哪些? 1、让企业能够更好地管理自己的宣传信息 …

HttpRunner 接口自动化测试框架实战,打造高效测试流程

简介 2018年python开发者大会上,了解到HttpRuuner开源自动化测试框架,采用YAML/JSON格式管理用例,能录制和转换生成用例功能,充分做到用例与测试代码分离,相比excel维护测试场景数据更加简洁。在此,利用业…

Tree of Thoughts: Deliberate Problem Solving with Large Language Models

思维树:用大模型深思熟虑的解决问题 Tree of Thoughts: Deliberate Problem Solving with Large Language Models概述:核心思想:背景:IO promptingCoTCoT-SC 算法流程:主要实验对象:24点游戏创意写作填字游…

Linux5.3 Haproxy搭建Web群集

文章目录 计算机系统5G云计算第四章 LINUX Haproxy搭建Web群集一、Keepalived 概述1. HAProxy的主要特性2.常见的 Web 集群调度器3.HAProxy负载均衡策略4.LVS、Nginx、HAproxy的区别 二、Haproxy搭建 Web 群集 Keepalived部署高可用集群1.haproxy 服务器部署,配置负…

Linux shell脚本命令记录

1、cut cut 命令可以从一个文本文件或者文本流中提取文本列。 选项与参数: -d :后面接分隔字符。与 -f 一起使用; -f :依据 -d 的分隔字符将一段信息分割成为数段,用 -f 取出第几段的意思; -c &#x…

如何进行App性能测试?iTest工具助力你轻松实现!

目录 引言 功能简介 基本功能使用说明 其它功能 iTest数据上传功能 iTest使用注意事项 引言 如何使用iTest工具进行App性能测试。 在如今这个高度竞争的移动应用市场中,用户对于应用程序的体验需求越来越高,而良好的性能表现则是实现这一目标的关…

CleanMyMac X 4.13.4 Mac系统老牌清洁工具大测评-功能、优缺点盘点

CleanMyMac X 4.13.4 for Mac 是一款可靠且功能强大的Mac清洁工具工具,他可以让你随时检查Mac电脑的健康情况,并删除电脑中的垃圾文件,来腾出存储空间,保持Mac系统的整洁。至问世以来,CleanMyMac 系统倍受国内外用户推…

SpringBoot 源码分析刷新应用上下文(3)-refreshContext

一:入口 /*** Run the Spring application, creating and refreshing a new* {link ApplicationContext}.* param args the application arguments (usually passed from a Java main method)* return a running {link ApplicationContext}*/public ConfigurableAp…

高阶复杂网络重建:从时间序列中重建高阶网络

论文链接:https://www.nature.com/articles/s41467-022-30706-9 一、为什么要研究高阶网络? 复杂网络跟我们生活息息相关,例如社交网络的信息传播,疾病的感染扩散和基因调控网络的相互作用等。越来越多的研究突破了传统网络中两…

SSH暴力破解

Linux是开源系统,系统本身因漏洞造成的攻击相对比较少,主要集中在SSH攻击; SSH所采用的加密机制,可以防止数据传输过程中信息泄露; SSH基于用户名密码的身份验证,容易遭受密码暴力破解攻击; S…

上海交通大学计算机考研分析

关注我们的微信公众号 姚哥计算机考研 更多详情欢迎咨询 上海交通大学(A)考研难度(☆☆☆☆☆) 上海交通大学电子信息与电气工程学院的前身可溯源至1908年的电机专科,享有中国电气工程师“摇篮”的美称,…

远程线程注入之突破Session0隔离会话

前言 当我们使用远程线程注入将dll注入至系统服务进程中往往会失败,这是因为大多数系统服务都是在Session0中运行的 "Session 0"是Windows操作系统中的一个特殊的会话,专门用于运行系统服务和其他在用户登录之前就需要运行的程序。从Windows…

卷积神经网络CNN(第三次组会)

卷积神经网络 1. 为什么用卷积2. 两个原则3. 参数理解4. 理解卷积 1. 为什么用卷积 2. 两个原则 3. 参数理解 4. 理解卷积

Proteus仿真之IIC通信(AT24C02)

1.IIC通信简介:IIC是一种利用时钟线SCL和数据线SDA进行数据传输的通信协议。IIC的时序图如下所示: 我们需要看懂时序图中开始信号、数据传输、应答信号和停止信号。 开始信号:SCL为高电平时,SDA出现下降沿信号。 数据传输&#…

c++类和对象(封装)

4、类和对象 C面向对象的三大特性为:封装、继承、多态 C认为万事万物都皆为对象,对象上有其属性和行为 例如: 人可以作为对象,属性有姓名、年龄、身高、体重...,行为有走、跑、跳、吃饭、唱歌...车也可以作为对象,属性…

python带你制作自动点赞小程序,让我看看谁还在呆呆的手动点赞

前言 嗨喽,大家好呀~这里是爱看美女的茜茜呐 知识点: 动态数据抓包 requests发送请求 开发环境: 代码所使用软件工具: python 3.8 >>>>>> 运行代码 pycharm 2022.3 >>>>>> 辅助敲代码 需下载的第三方模块&a…

【微信公众平台对接】有关上传pdf到微信

1、微信文档说明 ps:有关微信的一些文档说明我真的是服了,这个文档,抛出来看的人真的是一头雾水,算了,我也不做过多评判;下面看我调用的示例代码 2、示例代码 /*** 上传pdf* https://api.weixin.qq.com/card/invoice…