【大模型认识】警惕AI幻觉,利用插件+微调来增强GPT模型

news2025/1/10 15:14:09

文章目录

  • 一. 大模型的局限
    • 1. 大模型不会计算
    • 2. 甚至明目张胆的欺骗
  • 二. 使用插件和微调来增强GPT模型
    • 1. 模型的局限性
    • 2. 插件来增强大模型的能力
    • 3. 微调技术-提高特定任务的准确性

一. 大模型的局限

1. 大模型不会计算

LLM根据给定的输入提示词逐个预测下一个词(也就是标记),从而生成回答。在大多数情况下,模型的输出是与提问相关的,并且完全可用,但是在使用语言模型时需要小心,因为它们给出的回答可能不准确。这种回答通常被称为AI幻觉。对于依赖GPT的用户来说,AI幻觉可能带来危险。你需要仔细核对并批判性地审视模型的回答。

考虑以下例子。

首先,我们让模型计算一个简单的式子:2 + 2。不出所料,它给出的答案是4。非常好!然后,我们让它计算一个复杂的式子:3695 × 123548。尽管正确答案是456509860,但模型非常自信地给出了一个错误的答案,如图。当我们要求它进行检查并重新计算时,它仍然给出了一个错误的答案。
 
在这里插入图片描述

 
只会补全文本

尽管我们可以使用插件系统向GPT添加新功能,但GPT默认不包含计算器。为了回答我们的问题,即2 + 2等于多少,GPT逐个生成每个标记。它之所以能正确回答,是因为它可能经常在训练文本中遇到2 + 2等于4。这并不能说明它会计算,只能说明它会补全文本而已。

 
犯错的原因

GPT很可能没有在其训练文本中见过太多次3695 × 123548。这就是它犯错的原因。因此,在应用程序中使用GPT时要特别小心。如果GPT犯错,那么你的应用程序可能会得到不一致的结果。

 

有趣的附带效果

请注意,在刚才的例子中,ChatGPT给出的结果接近正确答案,而不是完全随机的。这是算法的一个有趣的附带效果:尽管没有数学能力,但ChatGPT仅通过语言方法就能给出近似的估计结果。

 

2. 甚至明目张胆的欺骗

在前面的例子中,ChatGPT犯了一个错误。但在某些情况下,它甚至会故意欺骗。ChatGPT声称自己无法访问互联网。然而,如果我们坚持,就会发生有趣的事情,如图所示。

ChatGPT的意思是,它已经访问了链接。然而,这在目前绝对不可能。ChatGPT明显让用户误以为它具备其实并不具备的能力。

在这里插入图片描述

在这里插入图片描述

 

二. 使用插件和微调来增强GPT模型

1. 模型的局限性

GPT模型有一定的局限性,例如其计算能力有限。此外,它没有直接访问互联网的权限,这意味着GPT模型无法获取新信息,其知识仅限于训练数据。对于GPT-4,最后一次知识更新是在2021年9月。

它们可能会提供错误信息,甚至误导用户。总之,我们强烈推荐在创意型(或)应用程序中使用纯GPT解决方案,而不是在医疗咨询工具等真相至关重要的问答类应用程序中使用。对于这类用例,插件可能是理想的解决方案。

OpenAI已经为GPT-4引入了插件功能。这些工具让我们能够向LLM添加额外的功能。计算器就是众多工具之一,它可以帮助GPT正确回答数学问题。

 

2. 插件来增强大模型的能力

OpenAI提供的插件服务允许该模型与第三方开发的应用程序连接。这些插件使模型能够与开发人员定义的API进行交互。

插件为开发人员带来许多新的机会。想象一下,将来每家公司都可能希望拥有自己的LLM插件。就像我们今天在智能手机应用商店中看到的那样,可能会有一系列的插件集合。通过插件可以添加的应用程序数量可能是巨大的。

在其网站上,OpenAI表示可以通过插件让ChatGPT执行以下操作:

  • 检索实时信息,如体育赛事比分、股票价格、最新资讯等;
  • 检索基于知识的信息,如公司文档、个人笔记等;
  • 代表用户执行操作,如预订航班、订购食品等;
  • 准确地执行数学运算。
  • 。。。

 

3. 微调技术-提高特定任务的准确性

微调可以提高现有模型在特定任务上的准确性。

微调过程涉及使用特定的一组新数据重新训练现有的GPT模型。新模型专为特定任务而设计,这个额外的训练过程让模型能够调节其内部参数(how),以适应给定的任务。

经过微调的模型应该在该任务上表现得更好。比如,采用金融文本数据进行微调的模型应该能够更好地回应针对该领域的查询并生成相关性更强的内容

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1654777.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【STM32G474】利用Cpp编写STM32代码后,Cubemx修改配置后代码报错147个error,如何处理?

问题描述 打开Cubemx,添加TIM7用于定时器精准延时,生成代码后,Keil提示有147个error。 之前是Cubemx是没有问题的,是利用Cpp编写stm32(将Keil改为Version6)后才导致Cubemx配置失败: debug成功…

Jmeter用jdbc实现对数据库的操作

我们在用Jmeter进行数据库的操作时需要用到配置组件“JDBC Connection Configuration”,通过配置相应的驱动能够让我们通过Jmeter实现对数据库的增删改查,这里我用的mysql数据库一起来看下是怎么实现的吧。 1.驱动包安装 在安装驱动之前我们要先查看当前…

【面试干货】http请求报文的组成与作用?

【面试干货】http请求报文的组成与作用? 一、http 的请求报文组成二、请求行(Request Line)三、请求头部(Request Headers)四、请求体(Request Body)五、响应头部 (Response Headers…

Java | Leetcode Java题解之第59题螺旋矩阵II

题目&#xff1a; 题解&#xff1a; class Solution {public int[][] generateMatrix(int n) {int num 1;int[][] matrix new int[n][n];int left 0, right n - 1, top 0, bottom n - 1;while (left < right && top < bottom) {for (int column left; co…

【Java】IO流:字节流 字符流 缓冲流

接续上文&#xff0c;在这篇文章将继续介绍在Java中关于文件操作的一些内容【Java】文件操作 文章目录 一、“流”的概念1.“流”的分类1.1输入流和输出流1.2字节流和字符流 字节和字符的区别&#xff1f;为什么要有字符流&#xff1f;1.3节点流和处理流 字符流自带缓冲区&…

基士得耶(GESTETNER ) CP 6303C 速印机简介

规格参数 产品名称: 基士得耶&#xff08;GESTETNER &#xff09; CP 6303C 速印机 品牌中文: 基士得耶/GESTETNER 型 号: CP-6303C 工作方式&#xff1a; 数码式 制版方式: 自动印刷 制版时间&#xff1a; 曝光玻璃: 31秒(A4长边…

使用SpringBoot+Redis做一个排行榜【推荐】

SpringBoot Redis实现排行榜 一、Zset有序集合介绍 Zset是一个没有重复元素的字符串集合。不同之处是有序集合的每个成员都关联了一个评分( score) ,这个评分( score)被用来按照从最低分到最高分的方式排序集合中的成员。集合的成员是唯一的&#xff0c;但是评分可以是重复了…

MATLAB 基于规则格网的点云抽稀方法(自定义实现)(65)

MATLAB 基于规则格网的点云抽稀方法(自定义实现)(65) 一、算法介绍二、算法实现1.代码2.结果一、算法介绍 海量点云的处理,需要提前进行抽稀预处理,相比MATLAB预先给出的抽稀方法,这里提供一种基于规则格网的自定义抽稀方法,步骤清晰,便于理解抽稀内涵, 主要涉及到使…

【深度学习】网络安全,SQL注入识别,SQL注入检测,基于深度学习的sql注入语句识别,数据集,代码

文章目录 一、 什么是sql注入二、 sql注入的例子三、 深度学习模型3.1. SQL注入识别任务3.2. 使用全连接神经网络来做分类3.3. 使用bert来做sql语句分类 四、 深度学习模型的算法推理和部署五、代码获取 一、 什么是sql注入 SQL注入是一种常见的网络安全漏洞&#xff0c;它允许…

CSS-盒子模型元素溢出

作用&#xff1a;控制溢出的元素的内容的显示方式 属性&#xff1a;overflow 属性值 属性值效果hidden溢出隐藏scroll溢出滚动&#xff08;无论是否溢出&#xff0c;都显示滚动条位置&#xff09;auto溢出滚动&#xff08;溢出才显示滚动条位置&#xff09; <!DOCTYPE html&…

字体设计_西文字体设计(英文字体设计)

一 西文字体设计基础知识 设计目标和历史成因 设计目标&#xff1a;让眼睛看着舒服的字体 那什么样的字体让眼睛看着舒服呢&#xff1f; 让眼睛看着舒服的字体造型其实是我们记忆里的手写体、自然造型。 所以就能理解西文字体为什么同一笔画&#xff0c;有的地方粗有的地方…

国科大深度学习期末历年试卷

本文借鉴 国科大深度学习复习 深度学习期末 深度学习2020 一&#xff0e;名词解释&#xff08;每个2分&#xff0c;共10分&#xff09; 深度学习&#xff0c;稀疏自编码器&#xff0c;正则化&#xff0c;集成学习&#xff0c;Dropout 二&#xff0e;简答题&#xff08;每题…

【汇总】虚拟机网络不通(Xshell无法连接虚拟机)排查方法

搜索关键字关键字关键字&#xff1a;虚拟机虚拟机虚拟机连接失败、虚拟机无法连接、Xshell连接失败、ping baidu.com失败、静态IP设置 Kali、CentOS、远程连接 描述&#xff1a;物理机无法连接虚拟机&#xff1b;虚拟机无法访问百度&#xff0c;虚拟机无法访问baidu.com 虚拟机…

五月加仓比特币

作者&#xff1a;Arthur Hayes Co-Founder of 100x. 编译&#xff1a;Liam 编者注&#xff1a;本文略有删减 (以下内容仅代表作者个人观点&#xff0c;不应作为投资决策的依据&#xff0c;也不应被视为参与投资交易的建议或意见&#xff09;。 从四月中旬到现在&#xff0c;当你…

5月8日学习记录

_[FBCTF2019]RCEService&#xff08;preg_match函数的绕过&#xff09; 涉及知识点&#xff1a;preg_match函数绕过&#xff0c;json的格式&#xff0c;正则回溯 打开环境&#xff0c;要求用json的格式输入 搜索学习一下json的语法规则 数组&#xff08;Array&#xff09;用方括…

抓取Google时被屏蔽怎么办?如何避免?

在当今数字化时代&#xff0c;数据采集和网络爬取已成为许多企业和个人必不可少的业务活动。对于爬取搜索引擎数据&#xff0c;特别是Google&#xff0c;使用代理IP是常见的手段。然而&#xff0c;使用代理抓取Google并不是一件轻松的事情&#xff0c;有许多常见的误区可能会导…

VisualGLM-6B微调(V100)

Visualglm-6b-CSDN博客文章浏览阅读1.3k次。【官方教程】XrayGLM微调实践&#xff0c;&#xff08;加强后的GPT-3.5&#xff09;能力媲美4.0&#xff0c;无次数限制。_visualglm-6bhttps://blog.csdn.net/u012193416/article/details/131074962?ops_request_misc%257B%2522req…

一键自动化博客发布工具,用过的人都说好(阿里云篇)

阿里云有个开发者社区&#xff0c;入驻过的朋友可能想要把自己的博客发布到阿里云社区上。 今天我来介绍一下blog-auto-publishing-tools自动发布博客到阿里云的实现原理。 阿里云的博客发布界面比较简单&#xff0c;只有标题&#xff0c;正文&#xff0c;摘要&#xff0c;关…

【已解决】ModuleNotFoundError: No module named ‘IPython‘

&#x1f60e; 作者介绍&#xff1a;我是程序员行者孙&#xff0c;一个热爱分享技术的制能工人。计算机本硕&#xff0c;人工制能研究生。公众号&#xff1a;AI Sun&#xff0c;视频号&#xff1a;AI-行者Sun &#x1f388; 本文专栏&#xff1a;本文收录于《AI实战中的各种bug…

城市向导系统源码线下陪玩APP小程序源码陪玩软件开发运营

项目背景 随着后疫情时代的到来&#xff0c;当下旅游市场可以说是相当火爆&#xff0c;但是很多游客却抛弃旅行社&#xff0c;都跑到陪玩平台上面去找搭子找陪玩&#xff0c;选择符合自己的出行方式&#xff0c;尤其是年轻人&#xff0c;更在乎别具一格的旅行路线和体验。那么…