清华大学第五弹:《DeepSeek与AI幻觉》

news2025/2/23 8:48:14

作者:清华大学新闻与传播学院新媒体研究中心、人工智能学院(新媒沈阳团队)
时间:2025年2月

完整版下载地址:夸克网盘分享


一、AI幻觉的定义与分类
  1. 定义
    • 学术定义:模型生成与事实不符、逻辑断裂或脱离上下文的内容,本质是统计概率驱动的“合理猜测”。
    • 通俗解释:“一本正经地胡说八道”。
  1. 分类
    • 事实性幻觉:内容与可验证的现实事实不一致(如错误回答“蜂蜜适合糖尿病患者”)。
    • 忠实性幻觉:内容与用户指令或上下文意图偏离(如回答偏题)。

二、AI幻觉的成因
  1. 数据偏差:训练数据中的错误或片面性被放大(如医学领域过时论文导致错误结论)。
  2. 泛化困境:模型难以处理训练集外的复杂场景(如预测南极冰层融化对非洲农业的影响)。
  3. 知识固化:模型依赖参数化记忆,缺乏动态更新能力(如虚构2023年后的事件)。
  4. 意图误解:用户提问模糊时模型“自由发挥”(如“介绍深度学习”可能偏离实际需求)。

三、AI幻觉的潜在风险
  1. 信息污染:虚假内容泛滥,污染下一代模型训练数据。
  2. 信任危机:用户难以辨别专业场景(医疗、法律)内容的真实性。
  3. 安全漏洞:错误信息用于自动化系统(金融分析、工业控制)可能引发连锁反应。
  4. 控制欠缺:开源模型易被滥用为恶意工具。

四、AI幻觉的评测与案例分析
  1. 评测方法
    • 通用性测试:模拟真实用户场景,人工标注幻觉率(如DeepSeekV3幻觉率2%)。
    • 事实性测试:覆盖多领域的300道测试题(如DeepSeekV3事实性幻觉率29.67%)。
  1. 典型案例
    • 金融行业:某银行利用DeepSeek构建因果归因网络,降低不良率4.2%。
    • 医疗领域:Whisper转录病例时出现50%的幻觉内容(如篡改患者死亡年龄)。
    • 文学/历史:模型虚构《水浒传》情节(如李逵大闹五台山)。

五、应对AI幻觉的策略
  1. 技术方案
    • RAG框架:检索增强生成,结合权威数据库。
    • 外部知识库:强化垂直领域知识。
    • 推理增强:通过思维链(如DeepSeek R1)降低逻辑错误。
  1. 用户策略
    • 提示词工程:限定时间、知识来源、专业身份(如“基于2023年前文献回答”)。
    • 双AI验证:多模型交叉审查。
    • 联网搜索:实时获取最新信息降低幻觉率(如开启后DeepSeekV3通用幻觉率降至0%)。
  1. 高风险场景防护
    • 医疗诊断、法律咨询、金融预测等领域需严格限制生成内容,附加风险提示。

六、AI幻觉的创造力价值
  1. 科学发现
    • 利用“错误折叠”启发新型蛋白质设计(如2024年诺贝尔化学奖案例)。
  1. 文艺与设计
    • 生成超现实角色、虚拟环境,突破人类思维定式(如游戏开发灵感)。
  1. 技术创新
    • 从“缺陷”到方法论转化(如AI生成虚构导管设计优化实验结果)。
  1. 新型科研范式
    • “AI幻觉→实验验证→理论重构”三阶段流程推动创新闭环。

七、总结与展望
  • 核心观点:AI幻觉既是技术局限性的折射,也是超越人类想象的创新源泉。
  • 应对哲学:与其追求“绝对正确”,需学会与AI的“想象力”共舞,平衡风险与创造力。
  • 未来方向:开发自动化幻觉识别工具,完善对齐机制,探索幻觉驱动的跨学科创新。

八、演示文稿精彩展示

九、往期精彩

《DeepSeek从入门到精通》——清华大学

《DeepSeek如何赋能职场应用》——清华大学

《普通人如何抓住DeepSeek的红利》——清华大学

《DeepSeek+DeepResearch:让科研像聊天一样简单》——清华大学

《DeepSeek原理与效应》——天津大学

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2303837.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

分布式数据库解析

title: 分布式数据库解析 date: 2025/2/20 updated: 2025/2/20 author: cmdragon excerpt: 通过金融交易、社交平台、物联网等9大真实场景,结合Google Spanner跨洲事务、DynamoDB毫秒级扩展等38个生产级案例,揭示分布式数据库的核心原理与工程实践。内容涵盖CAP定理的动态…

Zotero 快速参考文献导出(特定期刊引用)

目录 一、添加样式 每次投期刊时每种期刊的引用方式不一样,就很麻烦。发现zeotero添加期刊模板再导入很方便 一、添加样式 然后就能导出自己想要的期刊格式的引用了

库的制作与原理(一)

1.库的概念 库是写好的,现成的可以复用的代码。本质上库是一种可执行的二进制形式,可以被操作系统载入内存执行。库有俩种:静态库 .a[Linux] .lib[windows] 动态库 .so[Linux] .dll[windows] 就是把.c文件变成.o文件,把…

go 日志框架

内置log import ("log""os" )func main() {// 设置loglog.SetFlags(log.Llongfile | log.Lmicroseconds | log.Ldate)// 自定义日志前缀log.SetPrefix("[pprof]")log.Println("main ..")// 如果用format就用PrintF,而不是…

Rust配置笔记

1.Node.js下载配置 2.c环境配置 C我是用vs装的点击这个installer 点击修改 选择C环境就行,这个时候它就帮忙配置环境了 3.Rust下载配置 4.装napi-rs框架 npm install -g napi-rs/cliRust下载网站 下完之后直接打开 一开始下包会比较慢,多等等 下好之后跑项目前第一件事配置…

具有整合各亚专科医学领域知识能力的AI智能体开发纲要(2025版)

整合各亚专科医学领域知识能力的AI代理的开发与研究 一、引言 1.1 研究背景 在科技飞速发展的当下,人工智能(AI)已成为推动各行业变革的关键力量,医疗领域也不例外。近年来,AI 在医疗行业的应用取得了显著进展,从医学影像诊断到疾病预测,从药物研发到个性化医疗,AI 技…

数据表的存储过程和函数介绍

文章目录 一、概述二、创建存储过程三、在创建过程中使用变量四、光标的使用五、流程控制的使用六、查看和删除存储过程 一、概述 存储过程和函数是在数据库中定义的一些SQL语句的集合,然后直接调用这些存储过程和函数来执行已经定义好的SQL语句。存储过程和函数可…

为AI聊天工具添加一个知识系统 之117 详细设计之58 思维导图及观察者效应 之2 概念全景图

(说明:本文和上一篇问题基本相同,但换了一个模型 deepseek-r1) Q1227、在提出项目“为使用AI聊天工具的聊天者加挂一个专属的知识系统”后,我们已经进行了了大量的讨论-持续了近三个月了。这些讨论整体淋漓尽致体现了…

Error [ERR_REQUIRE_ESM]: require() of ES Module

报错信息: 【报错】Message.js 导入方式不对,用的是 ES Moudle 的语法,提示使用 import 引入文件 项目开发没有用到 js-message 依赖,是 node-ipc 依赖中用到的 js-message 依赖, node-ipc 中限制 js-message 版本&a…

GStreamer源码安装1.24版本

从官网下载 1.24的源码包 https://gitlab.freedesktop.org/gstreamer/gstreamer/-/tree/1.24?ref_typeheads#getting-started ,尝试过使用git clone 的方式,但速度贼慢,就选择了下载源码包的方式安装依赖 sudo apt install libssl-dev g me…

从CNN到Transformer:遥感影像目标检测的未来趋势

文章目录 前言专题一、深度卷积网络知识专题二、PyTorch应用与实践(遥感图像场景分类)专题三、卷积神经网络实践与遥感影像目标检测专题四、卷积神经网络的遥感影像目标检测任务案例【FasterRCNN】专题五、Transformer与遥感影像目标检测专题六、Transfo…

从 x86 到 ARM64:CPU 架构的进化与未来

在计算机发展的历史长河中,x86、x64 和 ARM64 这三大主流 CPU 架构各自书写了辉煌的篇章。它们不仅代表了技术的进步,更承载着无数创新者的梦想与努力。 x86:从 16 位到 32 位的辉煌之路 诞生与崛起 1978 年,英特尔(…

Java数据结构第十二期:走进二叉树的奇妙世界(一)

专栏:数据结构(Java版) 个人主页:手握风云 目录 一、树型结构 1.1. 树的定义 1.2. 树的基本概念 1.3. 树的表示形式 二、二叉树 2.1. 概念 2.2. 两种特殊的二叉树 2.3. 二叉树的性质 2.4. 二叉树的存储 三、二叉树的基本操作 一、树型结构 1.…

【AI时代】基于AnythingLLM+ Ollama + DeepSeek 搭建本地知识库

一、本地安装Ollama及DeepSeek 参考教程: https://blog.csdn.net/Bjxhub/article/details/145536134 二、下载并安装AnythingLLM AnythingLLM下载地址: https://anythingllm.com/ 傻瓜式安装即可 可以自定义安装路径。三、配置AnythingLLM并使用 3.…

leetcode刷题记录(一百一十五)——64. 最小路径和

(一)问题描述 64. 最小路径和 - 力扣(LeetCode)64. 最小路径和 - 给定一个包含非负整数的 m x n 网格 grid ,请找出一条从左上角到右下角的路径,使得路径上的数字总和为最小。说明:每次只能向下…

UE5 编辑器辅助/加强 插件搜集

1. Actor Locker 地址:https://www.fab.com/listings/ec26ac5e-4720-467c-a3a6-b5103b6b74d0 使用说明:https://github.com/Gradess2019/ActorLocker 支持:5.0 – 5.5 简单的编辑器扩展。它允许你通过世界轮廓窗口/热键/上下文菜单在编辑器视…

怎么在Github上readme文件里面怎么插入图片?

环境: Github 问题描述: 怎么在Github上readme文件里面怎么插入图片? https://github.com/latiaoge/AI-Sphere-Butler/tree/master 解决方案: 1.相对路径引用 上传图片到仓库 将图片文件(如 .png/.jpg&#xff…

什么是矩阵账号?如何高效运营tiktok矩阵账号

‍‌​​‌‌​‌​‍‌​​​‌‌​​‍‌​​​‌​‌​‍‌​​‌​​‌​‍‌​‌‌​‌‌‌‍‌​‌​‌​​​‍‌​​‌​‌‌​‍‌​​​​‌‌​‍‌​‌​​‌‌‌‍‌​​‌‌​‌​‍‌​‌​​‌‌‌‍‌​‌‌‌​​‌‍‌‌​​‌‌‌​‍‌‌​​‌‌​​‍‌…

SpringSecurity初始化的本质

一、对SpringSecurity初始化的几个疑问 通过前面第一次请求访问的分析我们明白了一个请求就来后的具体处理流程 对于一个请求到来后会通过FilterChainProxy来匹配一个对应的过滤器链来处理该请求。那么这里我们就有几个疑惑。 FilterChainProxy什么时候创建的?过滤器链和对应的…

自注意力机制和CNN的区别

CNN:一种只能在固定感受野范围内进行关注的自注意力机制。​CNN是自注意力的简化版本。自注意力:具有可学习感受野的CNN。自注意力是CNN的复杂形态,是更灵活的CNN,经过某些设计就可以变为CNN。 越灵活、越大的模型,需要…