逼迫大模型消除幻觉,就像杨永信电击治疗网瘾少年

news2025/1/11 5:59:05

在科技高速发展的领域,进步往往伴随着争议。数字化时代,我们被海量信息所环绕,利用大模型来提取信息和生成答案,有时会遇到模型给出的所谓“幻觉(hallucination)”回应。这就带来了一个问题:是否应该逼迫 AI 大模型停止产生幻觉?这里所说的“幻觉”,并非指心理学上的异常现象,而是指模型在处理复杂问题时产生的非预期、类人的创新性输出。

以杨永信曾经大力推崇的电击治疗网瘾为例,这种伤害身体来控制行为的做法往往治标不治本。这种方法和控制大模型产生幻觉的做法看似不同,实则极其相似。表面上看,很多人都在期待大模型纯粹基于事实回答,但正如电击最终会对青少年造成伤害一样,太过苛求大模型消除幻觉,可能会适得其反,削弱它们的创造性发散能力。在这个问题上,我们必须寻求平衡,切忌矫枉过正

图片

因此,我们究竟应该如何看待大规模模型产生的“幻觉”呢?我们别急于给出答案,在追求信息的绝对真实性之前,我们应先深思这一模型特性应如何被合理理解和接受,甚至可能赋予它全新的价值。

何为大模型的“幻觉”?

究竟是“叮当猫”还是耳熟能详的“叮(口当)猫”?实际上,“叮当猫”一直是唯一正确的名称。这种现象反映了心理学中的曼德拉效应,它描述记忆与现实错位的情况。类似的,我们将要探讨的所谓大模型的“幻觉”,本质上也是指模型产生的内容与现实事实不符的现象。

在人工智能领域,“幻觉”通常是指模型生成的内容与现实世界事实或用户输入不一致的现象[1],简而言之,就是模型一本正经地“胡说八道”

这种情况可能是因为模型在训练过程中对数据中的某些模式形成了过分的依赖,于是在特定的情境下就会输出错误或不准确的信息。举例来说,如果训练数据中“加拿大”与“多伦多”常常一同出现,模型就可能错误地认为多伦多是加拿大的首都。此外,大模型还可能因为长尾知识回忆不足难以应对复杂推理而产生幻觉。

通常,大模型的幻觉可以被分为两类[2]:

  • 事实性幻觉:生成内容与现实世界的事实不相符

  • 忠实性幻觉:生成内容与用户输入不一致

模型产生幻觉的三大来源包括数据源、训练过程和推理流程

  • 数据源中的问题可能导致模型过度依赖训练数据中的某些模式,而当训练和测试阶段数据存在较大差距时,会有数据偏置问题,导致模型产生幻觉。

  • 训练过程中,预训练模型可能偏好其参数中的知识而非新输入,从而导致幻觉。以及编码器理解能力的缺陷和解码器策略错误以及解码器可能关注错误的输入部分,或使用增加幻觉风险的策略,都会导致模型产生幻觉。

  • 推理流程中,模型固有的抽样随机性也可能导致模型产生幻觉。

大模型幻觉可能造成的问题

在实际应用中,大型模型的幻觉可能导致错误信息的传播。模型在追求创造性的同时,很可能产生虚构或不准确的内容,进而误导用户。而且这种异常比较隐蔽,不太容易被人发现,因为它的无知或混淆的记忆常常会被自信满满的言论掩盖。

图片

▲大模型的幻觉(违背道德伦理与常识-贾母是贾宝玉的祖母)

这种错误信息的传播会对企业和普通用户都带来一系列挑战:

  1. 误导性信息的传播:大模型产生的幻觉可能导致误导性信息的传播,尤其是在社交媒体、新闻报道等领域。这种误导性信息可能对公众意见形成、决策过程产生负面影响[3]。

  2. 决策错误:在依赖大模型进行决策支持的场景中,例如在医疗、金融等严谨的领域,幻觉现象可能会导致错误的决策,从而产生严重后果[4]。

  3. 用户信任度下降:频繁出现幻觉现象可能导致用户对大模型的信任度下降。这不仅影响模型的使用率,还可能对开发者和企业的声誉造成损害[5],对企业的信任度将受到极大的影响。

  4. 法律和伦理问题:幻觉现象可能引发法律和伦理问题,尤其是当生成的内容传播虚假信息或者违反隐私政策时。这要求开发者在设计和部署大模型时必须考虑相应的法律和伦理问题[6]。

为了减少幻觉现象的负面影响,研究者也在探索多种方法,包括改进数据质量、优化训练策略、引入人类反馈机制、开发更加鲁棒的模型架构等。通过这些技术和监管的进步,可以在保持模型创造性的同时,减少误导性信息的产生,平衡事实与幻觉之间的关系。

如何消除大模型存在的幻觉?

既然幻觉像一把双刃剑,我们也应当直视它可能制约用户放心地使用大模型这一问题,需要思考如何保持忠实性和真实性,消除大模型存在的幻觉问题。这并非是要抹杀其创造性,而是保持对事实的追求。

因为有时候在学习和工作中,尤其是在不擅长的领域,我们会向大模型寻求帮助,这个时候并不需要它有多好的创造性,往往只是想跟搜索引擎一样得到相对可信的回答。

技术层面

为了缓解幻觉现象,研究者们提出了一些策略[2]:

  • 对于数据相关的幻觉,可以通过收集高质量的事实数据并进行数据清理以消除偏见,或者通过知识编辑和检索增强生成来弥合知识差距。

  • 对于训练相关的幻觉,可以通过完善有缺陷的模型架构和预训练策略来应对。

如图 1 所示[7],有基于检索增强的方法、基于反馈的策略或提示微调等提示工程;以及采用新的解码策略、基于知识图谱的优化、新增的损失函数组成部分以及监督微调等开发新模型的方法

图片

▲图1 消除 LLM 幻觉方法一览

具体来说,有这样一些缓解幻觉问题的方法[8]:

  • 构建更忠诚的数据集:手动创建含准确目标的数据集,或用标注员标记所生成数据中的幻觉。

  • 数据清洗:通过数据清洗技术去除训练数据中的噪声和标注错误,提高数据质量,以及在实例级别过滤掉幻觉内容。

  • 数据增强:同时,采用数据增强技术扩充训练数据集,增强模型的泛化能力[9]。

  • 强化学习:使用奖励优化模型,以减少幻觉。

  • 监督微调和人类反馈:通过有监督的微调和人类反馈,可以显著减少幻觉的输出。尽管无法完全消除幻觉,但这种方法可以有效提高模型生成内容的准确性和可靠性[10]。

  • 利用知识图谱:包含实体、特征及它们之间关系的知识图谱,可以为复杂推理、数据分析和信息检索提供基础。

图片

▲训练方法的框架

然而,尽管这些方法可以在一定程度上减轻幻觉问题,但完全将其消除仍是一个艰巨的挑战,还需要持续研究和技术创新来确保大模型在高风险领域安全、道德和可靠部署[11]。

未来方向

评估标准设计方面,可以进一步研究事实核查等方法来降低外部幻觉的影响,同时设计更适合评估幻觉现象的度量标准,以便更准确地评估生成内容的质量,便于后续深入研究。

在监管层面,也可以建立一系列标准和框架来规范大模型幻觉及其落地的界限。比如,为不同用例定义模型的适用性和可接受的“幻觉”水平,从而限制可以落地的大模型,并确保工业界和研究人员能够遵守这一规范。

大模型的幻觉真的不可取吗?

然而,对于幻觉的讨论不应局限于如何消除它,而更应关注在满足多元用户需求的同时,如何巧妙应对不同类型用户的期望。

当不同用户群体在使用大模型时,对幻觉的接受程度存在显著差异:

  • 科研人员、教育工作者、新闻记者等专业用户群体关注信息的事实性和准确性,他们需要的是可靠、经过验证的数据和信息来支持他们的工作和决策,并且需要大模型具有高度忠实性

  • 艺术家、作家、市场营销人员等创意职业的用户可能更看重大模型在创新和创造性任务中的应用,即使这些应用涉及到一定程度的“幻觉”或与现实不太一致。对于这些用户来说,大模型生成的创新和独特内容可以作为灵感的来源,帮助他们创作出新颖的艺术作品、文学作品或营销策略[12]。

“幻觉”对创造的催化

尽管很多研究将幻觉视为大模型的缺陷,都在努力抑制大模型产生幻觉,但幻觉真的一无是处吗?其实在文艺创造、虚构作品撰写等领域,产生“幻觉”展现了大模型的创造能力,能够跳出已有知识的条条框框,也不失为一件好事:

  1. 创作灵感:在艺术创作过程中,幻觉现象可能激发艺术家创作出更具创意和独特性的作品[13]。

  2. 突破传统:幻觉现象可能帮助艺术家和作家突破传统的创作模式,创造出与现实世界不一致但富有想象力和创意的作品,这种不一致性可能会为艺术作品赋予更多的内涵和深度。

  3. 艺术创新:幻觉现象可能促使艺术家和作家探索新的表达方式和艺术手法,这种探索可能会带来新颖的艺术形式和文学风格[14],拓展艺术和文学作品的内涵,激发观众和读者的思维。

总结

通过探讨,我们不难发现,“幻觉”并非全然具有负面影响,正如 OpenAI 现任知名科学家、特斯拉前 AI 总监 Andrej Karpathy 所说,会产生幻觉是大模型工作的本质,它同时也展现了大模型的巨大潜力,意味着可以承载无限创造的可能。

图片

▲Karpathy 在推特发表的看法[15]

其实我们并不怕所谓的“幻觉”,有时候这并非是评价大模型表现差的指标,这也意味着模型具有创造性,而这也是这些大模型一年前出圈的原因,相比于搜索引擎给出冷冰冰的答案,大模型能够更了解我们的需求,可以整合、创造、延伸这些问题,为我们提供思路。

追求“零幻觉”并非唯一的选择,与其一味压制,不如寻求中庸之道,寻找一个平衡点,在实践中通过持续的调整和迭代进行权衡。我们应理性对待大型模型产生的幻觉,努力找到那个能够既展现模型创造力又确保内容真实准确的平衡点。这样不仅能使大型模型更稳定地为用户提供服务,而且对于营造可持续发展的 AIGC 生态系统至关重要。或许,正是在创造性与事实性的交汇处,AI 领域的进步才能体现真正的价值。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1486501.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2024阿里云服务器ECS--安全,稳定,购买灵活,低成本

阿里云服务器ECS英文全程Elastic Compute Service,云服务器ECS是一种安全可靠、弹性可伸缩的云计算服务,阿里云提供多种云服务器ECS实例规格,如经济型e实例、通用算力型u1、ECS计算型c7、通用型g7、GPU实例等,阿里云百科aliyunbai…

设计模式—命令模式:探索【命令模式】的奥秘与应用实践!

命令模式 命令模式是一种行为设计模式,它的主要目的是将请求封装成一个对象,从而使得请求的发送者和接收者之间进行解耦。 在命令模式中,命令被封装为一个对象,包含了需要执行的操作以及执行这些操作所需的所有参数。 命令的发送者…

【详识JAVA语言】抽象类和接口

抽象类 抽象类概念 在面向对象的概念中,所有的对象都是通过类来描绘的,但是反过来,并不是所有的类都是用来描绘对象的,如果 一个类中没有包含足够的信息来描绘一个具体的对象,这样的类就是抽象类。 比如:…

经典的算法面试题(1)

题目: 给定一个整数数组 nums,编写一个算法将所有的0移到数组的末尾,同时保持非零元素的相对顺序。 示例: 输入: [0,1,0,3,12] 输出: [1,3,12,0,0] 注意:必须在原数组上操作,不能拷贝额外的数组。尽量减少操作次数。 这…

[Redis]——Redis命令手册set、list、sortedset

🌳List类型常见命令 LPUSH / RPUSH [KEY] [element] …… 向列表左侧或者右侧插入一个或多个元素 LPOP / RPOP [key] 删除左边或者右边第一个元素 LRANGE [key] start end 返回索引start到end的元素(索引从0开始) BLPOP / BRPOP [key] [等…

Vue.js+SpringBoot开发社区买菜系统

目录 一、摘要1.1 项目介绍1.2 项目录屏 二、系统设计2.1 功能模块设计2.1.1 数据中心模块2.1.2 菜品分类模块2.1.3 菜品档案模块2.1.4 菜品订单模块2.1.5 菜品收藏模块2.1.6 收货地址模块 2.2 可行性分析2.3 用例分析2.4 实体类设计2.4.1 菜品分类模块2.4.2 菜品档案模块2.4.3…

使用 frp 实现 windows 远程

前提条件: 拥有一台公网 ip 的服务器; 被远程控制的 windows 系统为专业版(家庭版的其它方式没有尝试过); frp 下载包及使用说明 frp release 包的下载网址:https://github.com/fatedier/frp/releases 中…

从零开始搭建web组态

成果展示:by组态[web组态插件] 一、技术选择 目前只有两种选择,canvas和svg Canvas: 是一个基于像素的渲染引擎,使用JavaScript API在画布上绘制图像,它的优点包括: Canvas渲染速度快,适合处理大量图像和…

芯来科技发布最新NI系列内核,NI900矢量宽度可达512/1024位

参考:芯来科技发布最新NI系列内核,NI900矢量宽度可达512/1024位 (qq.com) 本土RISC-V CPU IP领军企业——芯来科技正式发布首款针对人工智能应用的专用处理器产品线Nuclei Intelligence(NI)系列,以及NI系列的第一款AI专用RISC-V处理器CPU IP…

第15集《灵峰宗论导读》

《灵峰宗论》导读。诸位法师,诸位同学,阿弥陀佛!(阿弥陀佛!) 请大家打开讲义第44面。 我们这次的《灵峰宗论》基本上是分五科,这五科就是发心、正见、持戒、止观跟净土。那么这五科我们基本上…

A Brief Introduction of the Tqdm Module in Python

DateAuthorVersionNote2024.02.28Dog TaoV1.0Release the note. 文章目录 A Brief Introduction of the Tqdm Module in PythonIntroductionKey FeaturesInstallation Usage ExamplesBasic UsageAdvanced Usage A Brief Introduction of the Tqdm Module in Python Introducti…

【详识JAVA语言】面向对象程序三大特性之三:多态

多态 多态的概念 多态的概念:通俗来说,就是多种形态,具体点就是去完成某个行为,当不同的对象去完成时会产生出不同的状态。 多态实现条件 在java中要实现多态,必须要满足如下几个条件,缺一不可&#xf…

golang实现openssl自签名双向认证

第一步:生成CA、服务端、客户端证书 1. 生成CA根证书 生成CA证书私钥 openssl genrsa -out ca.key 4096创建ca.conf 文件 [ req ] default_bits 4096 distinguished_name req_distinguished_name[ req_distinguished_name ] countryName …

【Web】速谈FastJson反序列化中JdbcRowSetImpl的利用

目录 简要原理分析 exp 前文:【Web】速谈FastJson反序列化中TemplatesImpl的利用 简要原理分析 前文的TemplatesImpl链存在严重限制,即JSON.parseObject()需要开启Feature.SupportNonPublicField fastjson的第二条链JdbcRowSetImpl,主要…

(亲测可用)Adobe Photoshop 2024下载与安装

背景介绍:Adobe Photoshop 2024 是全球最受欢迎的图像编辑软件之一,2024年的版本带来了一系列令人印象深刻的功能: AI增强的自动选择和蒙版工具:现在,用户可以更轻松地选择和处理复杂的图像元素。更多的3D渲染功能&…

2023.3.3周报

目录 摘要 一、文献阅读 1、题目 2、摘要 3、模型架构 4、文献解读 一、Introduction 二、实验 三、结论 二、PINN 一、PINN比传统数值方法有哪些优势 二、PINN方法 三、正问题与反问题 三、PINN实验 一、数学方程 二、模型搭建 总结 摘要 本周我阅读了一篇…

(二)逻辑回归与交叉熵--九五小庞

什么是逻辑回归 线性回归预测的是一个连续值,逻辑回归给出的“是”和“否”的回答 Singmoid sigmoid函数是一个概率分布函数,给定某个输入,它将输出为一个概率值 逻辑回归损失函数 平方差所惩罚的是与损失为同一数量级的情形&#xff0…

数据结构——基本术语和概念

目录 1.数据 2.数据元素 3.数据项 4.数据对象 数据元素与数据对象 5.数据结构 1.逻辑结构 逻辑结构的种类 划分方式1 1.线性结构 2.非线性结构 ​ 划分方式2——四类基本逻辑结构 2.物理结构(存储结构) 1.顺序存储结构 2.链接存储结构 3…

软件实例,佳易王账单账本记账汇总统计管理系统软件教程

软件实例,佳易王账单账本记账汇总统计管理系统软件教程 一、前言 以下软件程序教程 以 佳易王账单记账汇总统计管理系统软件V17.0为例说明 软件文件下载可以点击最下方官网卡片——软件下载——试用版软件下载 账单可以记录 1、收入明细 2、支出明细 3、客户…

JetCache源码解析——API实现(持续更新中……)

在JetCache中不仅可以通过在类和接口的函数上使用注解Cached、CacheUpdate和CacheInvalidate等实现缓存加载、更新和删除操作,也支持通过调用API接口的形式来实现缓存的加载、更新和删除操作。 缓存接口 缓存接口的定义如下: /*** 缓存接口&#xff0…