如何减轻大语言模型中的幻觉?

news2024/11/24 1:15:36

ChatGPT、LLaMA 和 Mistral 等大型语言模型 (LLMs) 是强大的自然语言处理 (NLP) 工具,能够为各种应用生成流畅且连贯的文本。然而,他们也有一个主要缺点:他们倾向于产生幻觉,而这些事实或细节不受输入或现实世界的支持。这可能会导致虚假或误导性信息,从而给用户和社会带来严重后果。

在本文中,我们将探讨导致幻觉的原因以及如何使用各种技术减轻幻觉。我们还将讨论这些技术的挑战和局限性,并为未来的研究提出一些方向。

LLMs 中的幻觉是什么?

LLMs 中的幻觉是模型生成看似合理但实际上不正确的文本的实例。例如,LLM 可能会生成错误的问题答案、摘要中的错误声明或故事中的错误细节。

产生幻觉的原因有多种,例如:

  • 模型没有足够的数据或有噪音的数据可供学习。
  • 模型对任务或领域的理解很差
  • 模型对某些单词或短语有偏见或偏好
  • 模型缺乏外部知识或常识
  • 模型在流畅性准确性之间进行权衡

根据错误的来源、严重程度和影响,幻觉可以分为不同的类型。例如,某些幻觉可能是无害的或有趣的,而另一些幻觉可能是有害的或恶意的。有些幻觉可能很容易被发现和纠正,而另一些幻觉可能很微妙且具有欺骗性。

如何减轻LLMs中的幻觉?

人们提出了许多技术来减轻LLMs中的幻觉,从反馈机制外部信息检索生成后的改进。在论文“A Comprehensive Survey of Hallucination Mitigation Techniques in Large Language Models”中,作者根据以下分类法将 32 种最新的幻觉缓解技术分为 2 个粗粒度组和 7 个细粒度组(可以进一步划分)。
请添加图片描述

提示工程(Prompt Engineering)

根据上述分类法,第一类主要方法是提示工程。它被定义为“尝试各种指令以从人工智能文本生成模型获得最佳输出的过程”(the process of experimenting with various instructions to get the best output possible from an AI text generation model)。在缓解幻觉方面,这个过程可以提供特定的背景和预期的结果”。它分为以下3个子类别:

  1. 检索增强生成 (RAG):RAG 方法(而不是仅仅依赖可能过时的训练数据或模型自身的记忆)使用外部的、值得信赖的知识来源来使 LLMs 的输出更好。换句话说,RAG 通过提供清晰准确的上下文来增强 LLMs 的可靠性。属于此类别的一些值得注意的方法是 LLM-AugmenterFreshPromptD&QEVERRARR,它们在输出生成之前、期间或之后是否使用信息检索系统方面有所不同。

  2. 通过反馈和推理进行自我完善:LLM 提供特定提示的输出后,有关输出的适当的自我或人工反馈可以使 LLM 提供更好、更准确的输出在其连续迭代中。此类别中的关键策略是 ChatProtect、MixAlign、CoVe和 CoNLI。例如,Cove 采用以下 4 个步骤进行工作:
    i) 起草初步答复,
    ii) 计划验证问题以对草案进行事实核查,
    iii) 独立回答这些问题以获得公正的答案,
    iv) 生成最终经过验证的答复。

  3. 提示调优(Prompt Tuning):它被定义为“在微调阶段调整提供给预训练LLM的指令以使模型在特定任务上更有效的技术”。这里,LLM不使用固定提示,而是通过模型本身在微调过程中调整权重来学习它们。重要的方法是 UPRISE 和 SynTra。

部署模型

正如论文作者所定义的,第二类主要方法被称为“部署模型(Developing Models)”。这是一个活跃的研究领域,其目标是实现设计用于本质上解决幻觉的新模型架构,而不是调整模型输出或微调现有模型。根据上述分类,它有以下4种变体:

  1. 引入新的解码策略:解码策略涉及专门针对模型生成阶段的技术的开发。当应用于 LLMs 时,这些技术可以“通过引导生成阶段走向真实或特定于上下文的生成”(“by guiding the generation phase towards authentic or context-specific generation”)来防止生成的输出中出现幻觉。相关方法有 CAD 和 DoLa。

  2. 利用知识图谱(Knowledge Graphs):像Wikidata这样的知识图谱是包含有关现实世界实体(例如人物、地点、组织或产品)以及它们的特征和与图中其他实体的连接的信息的组织化数据集合。因此,它们构成了在大语言模型(LLMs)上下文中进行扎实推理、数据分析和信息检索的可靠知识来源。依赖知识图谱的重要技术包括RHO和FLEEK。

  3. 引入基于忠实度的损失函数:这种方法的目的是设计新的度量标准,在训练过程中进一步强制模型匹配真实数据。在此背景下,忠实度被定义为“模型能够忠实且正确地反映输入数据,而不添加错误、遗漏或扭曲”(Information-Theoretic Text Hallucination Reduction for Video-grounded Dialogue - ACL Anthology)和 损失加权方法。

  4. 监督微调 (Supervised Fine-Tuning):SFT 是一种成熟的技术,用于使用标记数据对齐 LLMs,从而强制模型遵循人类命令来执行特定任务,并最终提高其可信度。流行的方法是 Halo、HAR 和 TWEAK。

这些方法的挑战和局限性是什么?

虽然这些方法可以减少LLMs中幻觉的发生和影响,但它们也面临一些挑战和限制,例如:

  • 数据和知识源的可用性和质量,尤其是资源匮乏的语言。
  • 检索和集成过程的可扩展性和效率。
  • 流畅性、准确性和多样性之间的权衡和平衡。

此外,幻觉现象仍然难以评估和测量,幻觉的伦理和社会影响仍未得到充分研究。
因此,该领域仍有很大的改进和创新空间,需要更多的研究来解决这些问题并开发更有效和可靠的方法。

结论

LLMs 中的幻觉是一个严重的问题,可能会影响生成文本的质量和可信度。为了缓解这个问题,基于数据、模型、知识和输出,人们提出了各种技术。然而,这些技术也存在一些挑战和局限性,需要更多的研究来克服它们。更详细的内容请参考论文“A Comprehensive Survey of Hallucination Mitigation Techniques in Large Language Models”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1846469.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

《传感器系列》温度传感器

温度传感器是一种能够测量温度并将温度信号转换为电信号或其他可输出信号的装置。 它在众多领域都有广泛应用,比如: - 工业生产: 用于监测生产过程中的温度,确保生产工艺的正常进行和产品质量的稳定。 - 智能家居: …

PCB设计中的via孔和pad孔

原文出自微信公众号【小小的电子之路】 在PCB设计过程中,经常会提到via孔和pad孔,下面就简单介绍一下二者的区别。 via称为过孔,主要起到电气连接的作用,用于网络在不同层的导线之间的连接。PCB设计中一般做盖油处理。 via孔 vi…

Kotlin 中的可见修饰符

Java 和 Kotlin 中的可见修饰符: Java:public、private、protected 和 default(什么都不写);Kotlin:public、private、protected 和 internal; 比较: 对于 public 修饰符:在 Java 和 Kotlin 中…

Linux网络 - 再谈、详谈UDP和TCP协议

文章目录 前言预备netstatpidofcat /etc/services 一、UDP协议UDP协议端格式UDP的缓冲区基于UDP的应用层协议 二、TCP协议1.TCP协议段格式确认应答(ACK)机制三次握手疑问1 最后一次客户端发给服务端的ACK请求怎么保证服务端能够收到? 四次挥手疑问2 为什么挥手是四次…

openssl 命令行生成密钥对,生成hash,PSS填充签名,校验

生成密钥对 openssl genpkey -algorithm RSA -out private_key.pem -pkeyopt rsa_keygen_bits:4096 openssl rsa -pubout -in private_key.pem -out public_key.pem将源文件data.txt生成hash值(sha-256) openssl dgst -sha256 -binary data.txt > d…

利用LabVIEW项目管理和组织LabVIEW应用程序

如何利用LabVIEW项目管理和组织LabVIEW应用程序,提供了关于文件定义、磁盘上的文件组织、LabVIEW项目浏览器、交叉链接和相关资源的建议。这些推荐在开发前就应建立,以确保应用程序能扩展到大量VIs并适应多开发者环境。 目录 定义和识别应用程序文件 磁…

第106天:权限提升-WIN 系统AD域控NetLogonADCSPACKDCCVE 漏洞

目录 案例一:WIN-域控提权-CVE-2014-6324 案例二:WIN-域控提权-CVE-2020-1472 案例三:WIN-域控提权-CVE-2021-42287 案例四:WIN-域控提权-CVE-2022-26923 案例一:WIN-域控提权-CVE-2014-6324 首先先部署域控 项目…

神经阻滞术——慢性腰痛、颈痛与关节痛治疗的新选择

北京精诚博爱医院所实施的神经阻滞术是一种针对患者局部疼痛治疗手段,通过向特定部位注射局麻药或其他特定药物,来暂时性地阻断神经传导,进而达到减轻或消除疼痛的目的。这种疗法在慢性腰痛、颈痛或关节痛等常见疼痛疾病的治疗中,…

案例分享:同为科技与军工项目合作

国防数字化建设发展,同为科技提供智能PDU电源管理器系列产品与服务 项目要求描述: 竖装智能PDU电源管理器 63A输入 2P空气开关 SNMP协议智能型表头 3米310平方阻燃A级线缆 监测总输入电压、总负载电流、总负载视在功率、有功功率、无功功率、总负载…

构建有效的财务规划合作伙伴关系

在这个日益注重分类、定义和正规化的时代,财务规划与分析作为企业环境中发展最快的功能之一,已经从典型的数据管理角色逐步演变成企业框架中必不可少的身份。与其他新兴趋势一样,财务规划也开始采用更加创新的理念来吸引高技能投资&#xff0…

每个程序员都要有 3 份收入!

见字如面,我是军哥! 现在这个就业环境,是真的冷,找工作也确实相比前几年难太多。 程序员人群要想没有收入危机,未来的生活压力,我的建议是一定要提前构建自己的三份收入! 哪三份收入呢&#xff…

帮企商城PC端分销商城企业网站源码系统 带源代码包+搭建部署教程

系统概述 帮企商城 PC 端分销商城企业网站源码系统是一款集企业网站建设、商品管理、分销体系、支付系统等多种功能于一体的综合性平台。它为企业提供了一个全面的电子商务解决方案,帮助企业快速搭建自己的在线商城,并实现高效的运营和管理。 该系统采…

短视频批量下载工具源码逻辑解析(软件)

短视频批量提取第三篇关于视频提取下载的思路 一:概述 因为上一篇不完整,这里其实就是补充第二篇关于源码思路。这里不针对视频评论的提取,只对视频分享链接批量导入下载进行思路解析 二:难点 通常情况下如果直接访问详情页进行…

Hi3861 OpenHarmony嵌入式应用入门--LiteOS Thread

目录 Thread API 主要接口说明 测试代码编写 代码分析 hi3861使用的实时系统主要是基于Huawei LiteOS-M,这是华为针对物联网领域推出的轻量级物联网操作系统内核。LiteOS-M是Huawei LiteOS的一个分支,专为IoT领域构建,主要面向没有MMU&am…

永磁同步电机FOC调试记录(一)

永磁同步电机FOC调试记录(一) 前言架构硬件架构软件架构 调试过程元器件选型开环控制编码器调试速度采样电流检测中断优先级的确定电流环部分烧坏IPM速度-电流环位置-电流环 结语 前言 这是我个人从零开始尝试永磁同步电机(PMSM)…

别只看影响因子了!又1本毕业神刊偷偷被On Hold了!请谨慎投递

【SciencePub学术】昨日,2023JCR正式发布,现在影响因子的话题依旧是“热搜第一”。大家可以根据自己的研究方向,参考最新发布的JCR报告进行投稿选刊。若大家对于投稿选刊方面有任何问题,都可联系张老师为您解答! 相关…

Qt源码阅读笔记:初步了解QtCore模块目录结构

Qt框架是一个跨平台的C应用程序框架,广泛用于开发图形用户界面程序以及用于无界面后台操作的工具和服务器。它由多个模块组成,其中QtCore模块提供了核心的非GUI功能。 QtCore 提供了元对象系统,扩展了c 在元对象系统的基础上,qt又…

timescaledb:创建real-time aggregate

创建hypertable【chz_a】 create table chz_a (time timestamp,device_id int8, value double precision,primary key (time) ); SELECT create_hypertable(chz_a, by_range(time) );往表里面写入数据 # 当天的数据 insert into chz_a (time, device_id, value) values (now(…

七人拼团:互助共赢,电商新动力

在当前繁荣的电商领域中,七人互助拼团模式以其别具一格的激励机制和互助合作理念,成为了消费者和商家共同瞩目的焦点。接下来,我们将详细解读这一模式中的直推激励、滑落补偿以及团队成就奖,并探讨其如何体现互助合作的精神。 一、…

Android面试题:App性能优化之电量优化和网络优化

本文首发于公众号“AntDream”,欢迎微信搜索“AntDream”或扫描文章底部二维码关注,和我一起每天进步一点点 电量优化 Doze模式 系统的行为进入Doze后看看App有没有奔溃就可以 Standby待机模式 针对某个应用 处于上述模式,App会无法访问…