轻松客观认识大模型系列:一

news2024/10/5 14:15:10

这是我关于《轻松客观认识大模型系列》第一篇

一、前言

这篇文章旨在为没有计算机科学背景的读者提供一些关于ChatGPT及其类似的人工智能系统(如GPT-3、GPT-4、Bing Chat、Bard等)如何工作的原理。ChatGPT是一种聊天机器人,建立在一个大型语言模型之上,用于对话交互。这些术语可能比较晦涩难懂,我将对其进行解释。同时,我们将讨论它们背后的核心概念,而且本文并不需要读者具备任何技术或数学方面的背景知识。我们将大量使用比喻来解释相关概念,以便更好地理解它们。我们还将讨论这些技术的意义,以及我们应该期待或不应该期待大型语言模型如ChatGPT所能做的事情。

接下来我们将以尽可能不使用专业术语的方式,从基础的“什么是人工智能”开始,逐步深入讨论与大型语言模型和ChatGPT相关的术语和概念,并将使用比喻来解释它们。同时,我们也将谈论这些技术的意义,以及我们应该期待它们能够做什么或不应该期待它们能够做什么。

二、什么是人工智能

首先,让我们从一些基本术语开始,这些术语你可能经常听到。那么什么是人工智能呢?

人工智能:指一种能够表现出类似于人类所认为的智能行为的实体。用“智能”来定义人工智能有些问题,因为“智能”本身并没有一个清晰的定义。但是,这个定义仍然比较恰当。它基本上意味着,如果我们看到一些人造的东西,它们能够进行有趣、有用、看起来有一定难度的行为,那么我们可能会说它们具有智能。例如,在电脑游戏中,我们通常称计算机控制的角色为“AI”。这些角色大多是基于if-then-else代码的简单程序(例如,“如果玩家在射程范围内,则开火,否则移动到最近的石头后躲藏”)。但是,如果这些角色可以保持我们的参与度和娱乐性,同时不做任何显然愚蠢的事情,那么我们可能会认为它们比实际上更为复杂。

一旦我们了解了某个东西的工作原理,我们可能就不会觉得它很神奇,而是期望在幕后有更为复杂的东西。这完全取决于我们对幕后发生的事情的了解程度。

重要的一点是,人工智能不是魔术。因为它不是魔术,所以它是可以被解释的。

三、 什么是机器学习

另一个与人工智能经常相关联的术语是机器学习。

机器学习:一种通过收集数据、形成模型,然后执行模型的方式来创建行为的方法。有时候,手动创建一堆if-then-else语句以捕捉某些复杂现象(比如语言)是很困难的。在这种情况下,我们尝试找到大量数据,并使用能够在数据中找到模式的算法进行建模。

那么什么是模型呢?模型是某种复杂现象的简化版本。例如,汽车模型是真实汽车的更小、更简单版本,它具有真实汽车许多属性,当然并不意味着要完全替代原始版本。模型汽车可能看起来很真实,在实验的时候很有用。

image-1683548234500

就像我们可以制造一个更小、更简单的汽车一样,我们也可以制造一个更小、更简单的人类语言模型。我们使用“大型语言模型”这个术语,因为这些模型从需要使用的内存(显存)量的角度来看是非常大的。目前生产中最大的模型,例如ChatGPT、GPT-3和GPT-4,非常庞大,需要运行在数据中心服务器上的超级计算机才能创建和运行。

四、什么是神经网络

有很多方法可以通过数据来学习一个模型,其中神经网络就是其中一种方法。这种技术大致基于人脑的结构,人脑由一系列互相连接的神经元组成,神经元之间传递电信号,使我们能够完成各种任务。神经网络的基本概念在20世纪40年代就已经被发明了,如何训练神经网络的基本概念则是在20世纪80年代发明的,当时神经网络非常低效,直到2017年左右计算机硬件升级,我们才可以大规模地使用它们。

但是,个人比较喜欢用电路的隐喻来模拟神经网络。通过电阻、电流经过电线的流动,我们可以模拟神经网络的工作。

想象一下我们想要制作一辆可以在高速公路上行驶的自动驾驶汽车。我们在车的前、后和两侧装上了距离传感器。当有物体接近时,距离传感器会报告一个值为1的数值,而当附近没有可检测的物体时,传感器会报告一个值为0的数值。

我们还安装了机器人操作方向盘,踩刹车和加速。当油门接收到1的数值时,它使用最大的加速度,而0的数值意味着没有加速。同样,发送给制动机构的数值为1意味着紧急刹车,而0则意味着没有制动。转向机构接受-1到+1之间的数值,负数表示向左转,正数表示向右转,而0表示保持直线行驶。

当然我们必须记录驾驶的数据。当前方的道路清晰时,你会加速。当前方有汽车时,你会减速。当一辆汽车从左侧靠得太近时,你会向右转向并变换车道,当然,前提是右侧没有车。这个过程非常复杂,需要根据不同的传感器信息组合进行不同的操作(向左或向右转,加速或减速,制动),因此需要将每个传感器都连接到每个机器人机构上。

image-1683548252771

当你开车上路时会发生什么?电流从所有传感器流向所有机器人执行器,车辆同时向左转、向右转、加速和刹车。会形成一团乱麻。

拿出电阻器并开始将它们放在电路的不同部分,以便电流可以在某些传感器和某些机械臂之间更自由地流动。例如,我们希望电流能够从前方接近传感器更自由地流向刹车而不是转向机构。我们还安装了称为门的元件,直到足够的电荷积累以触发开关之前,电流才会停止流动(只有在前方和后方的接近传感器都报告高数字时才允许电流流动),或者仅在输入电强度较低时向前发送电能(当前方接近传感器报告低值时向加速器发送更多电力)。

但是我们应该在哪里放置这些电阻器和门呢?我也不知道。随机地将它们放在各个位置。然后再试一次。也许这次汽车开得更好,这意味着它有时会在数据表明最好刹车和转向等时刹车和转向,但它并不是每次都正确。而有些事情它做得更糟糕(在数据表明有时需要刹车时它加速了)。因此,我们不断地随机尝试不同的电阻器和门的组合。最终,我们会偶然发现一个足够好的组合,那么我们宣布成功。比如下面这个组合:

image-1683548266697

(实际上,我们不会添加或删除门,但我们会修改门,使其可以以较低的能量从下方激活,或者需要更多的能量从下方输出,或者只有在下方有非常少的能量时才释放大量的能量。机器学习是纯粹主义者,可能会对这种描述感到不舒服。技术上,这是通过调整门上的偏置来完成的,这通常不会在此类图示中显示,但从电路隐喻的角度来看,它可以被认为是一个插入直接连到电源的线缆,可以像所有其他线缆一样进行修改。)

随意尝试并不好。一个名为反向传播的算法在改变电路配置方面具有相当不错的猜测能力。算法的细节并不重要,只需知道它会微调调整电路以使其行为更接近于数据所建议的行为,经过成千上万次的微调,最终可以得到与数据相符的结果。

我们称电阻器和门为参数,因为实际上它们无处不在,而反向传播算法所做的是宣布每个电阻器更强或更弱。因此,如果我们知道电路的布局和参数值,整个电路可以在其他汽车上复制。

敬请观看《轻松客观认识大模型系列》第二篇

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/516286.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

AI 自动补全的这句日志能正常打印吗?

最近用上了 GitHub Copilot,它的能力不时让我惊叹,于是越来越多地面向 tab 编程,机械键盘的损耗都小了许多:-p 这天,它给我自动生成了一句像这样的日志打印代码: try {// ... } catch (Exception e) {log.error("…

Vue列表过滤与数据原理

目录 列表过滤 使用计算属性 使用watch监视属性 列表排序 Vue中数据原理 练习数据原理 Vue中数据原理总结 列表过滤 可以进行模糊搜索 使用计算属性 <!DOCTYPE html> <html lang"en" xmlns:v-model"http://www.w3.org/1999/xhtml"> <…

YARN框架概述

Yarn 概述 Yarn概述对Yarn的需求简介变迁YARN于MRv1的区别MRv1YARN介绍 YARN集群安装部署集群角色介绍ResourceManager(RM)NodeManager(NM)集群部署规划 YARN RM重启机制概述**开启重启机制**RM状态数据的存储介质开启 后续正在学习&#xff1a;YARN HA高可用 YARN架构体系官方…

DNDC模型

由于全球变暖、大气中温室气体浓度逐年增加等问题的出现&#xff0c;“双碳”行动特别是碳中和已经在世界范围形成广泛影响。国家领导人在多次重要会议上讲到&#xff0c;要把“双碳”纳入经济社会发展和生态文明建设整体布局。同时&#xff0c;提到要把减污降碳协同增效作为促…

harbor(docker仓库)仓库部署

harbor仓库部署 1. harbor概述2. harbor主要功能3. harbor架构介绍4. Docker Compose4.1 compose简介4.2 docker-compose工具命令 5. harbor部署5.1 部署Docker Compose5.2 部署harbor5.3 部署harbor开机自启 6. harbor应用6.1 配置客户端访问harbor6.2 harbor的web管理界面 1.…

炸裂!Hugging Face 发布重磅更新,人手一个 AutoGPT!

公众号关注 “GitHubDaily” 设为 “星标”&#xff0c;每天带你逛 GitHub&#xff01; Hugging Face&#xff0c;作为 AI 开源圈最为知名的「网红」创业公司&#xff0c;成立仅几年&#xff0c;便在 GitHub 开源了诸多实用开源项目&#xff0c;受到了不少开发者的赞赏。 其中影…

中小学智慧校园平台电子班牌系统源码的应用

智慧校园云平台电子班牌系统源码 智慧班牌系统是专门为学校打造的智能信息展示平台&#xff0c;为学校、教师、学生、家长创造一个学习成长交流的共享平台。主要用于显示班级信息、 班级风采、校园文化、课程表、校园活动通知、家校互联等。以图片、音视频、文字、动画、文档等…

【ADS867x】14 位 500kSPS 4/8 通道 ADC 简介及驱动应用示例

器件特性 具有集成模拟前端的 14 位模数转换器 (ADC)具有自动和手动扫描功能的 4 通道、8 通道多路复用器通道独立可编程输入&#xff1a; 10.24V、5.12V、2.56V、1.28V、0.64V10.24V、5.12V、2.56V、1.28V 5V 模拟电源&#xff1a;1.65V 到 5V I/O 电源恒定的阻性输入阻抗&am…

Android 14 快速适配要点

随着 Google I/O 2023 发布的 Android beta2 &#xff0c;预计 Android 14 将在2023年第三季度发布&#xff0c;目前看整体需要适配的内容已经趋向稳定&#xff0c;那就根据官方文档简单做个适配要点总结吧。 如何做到最优雅的版本适配&#xff1f;那就是尽可能提高 minitSdkVe…

详细版易学版TypeScript - 类型声明:字符串数字null布尔undefined数组any对象void类型推断联合类型

根据官方 TypeScript 的注意事项&#xff0c;建议不要使用 Number、String、Boolean、Symbol 或 Object。 ts各类型声明的代码如下&#xff1a; 一、字符串类型 let str: string hello; str ts; 二、数字类型 let num: number 123; num 456; 三、布尔类型 let flag: boolea…

C语言实现队列--数据结构

&#x1f636;‍&#x1f32b;️Take your time ! &#x1f636;‍&#x1f32b;️ &#x1f4a5;个人主页&#xff1a;&#x1f525;&#x1f525;&#x1f525;大魔王&#x1f525;&#x1f525;&#x1f525; &#x1f4a5;代码仓库&#xff1a;&#x1f525;&#x1f525;魔…

No.065<软考>《(高项)备考大全》【专项3】《论文》

《论文》 1 论文部分相关1.1 考试相关1.2 考试核心相关1.3 历年考试分析1.4 复习建议1.5 评分标准1.5.1 评分的几个方面1.5.2 不及格的几种类型1.5.3 扣分项1.5.4 加分项 1.6 时间进度安排1.7 如何准备 2 必背核心知识 - 10大领域47个过程3 论文写作技巧3.1 论文架构3.2 论文题…

SpringBoot——引导类的简单介绍

简单介绍&#xff1a; 之前我们就说到过引导类&#xff0c;之不过当时就是简单的说了一下这个名字&#xff0c;让大家记住我们运行的程序的学名叫做引导类&#xff0c;但是我们并没有进入看过&#xff0c;介绍过它的作用&#xff0c;这次我们就来简单的介绍一下这个类的作用。…

[NLP] SentenceTransformers使用介绍

SentenceTransformers 是一个可以用于句子、文本和图像嵌入的Python库。 可以为 100 多种语言计算文本的嵌入并且可以轻松地将它们用于语义文本相似性、语义搜索和同义词挖掘等常见任务。 该框架基于 PyTorch 和 Transformers&#xff0c;并提供了大量针对各种任务的预训练模型…

STEP7-MicroWin SMART中修改变量注释的具体方法(绝对寻址+符号寻址)

STEP7-MicroWin SMART中修改变量注释的具体方法(绝对寻址+符号寻址) 如下图所示,我们可以在符号表中定义变量的符号名称以及注释信息, 使用时需注意以下事项: 1.在 STEP 7-Micro/WIN SMART 软件中,可以建立多个符号表,但不允许将相同的符号名多次用作全局符号赋值,在单…

1707_Python中的多成员处理

全部学习汇总&#xff1a; GreyZhang/python_basic: My learning notes about python. (github.com) 欢迎路过的YUAN类朋友们&#xff0c;希望我们能够相互交流共同成长。如有错误或者不足希望及时指点指出&#xff0c;不胜感激&#xff01;以下是我的联系方式&#xff1a; E…

Kali-linux识别活跃的主机

尝试渗透测试之前&#xff0c;必须先识别在这个目标网络内活跃的主机。在一个目标网络内&#xff0c;最简单的方法将是执行ping命令。当然&#xff0c;它可能被一个主机拒绝&#xff0c;也可能被接收。本节将介绍使用Nmap工具识别活跃的主机。 网络映射器工具Nmap Nmap是一个…

JavaScript经典教程(七)-- JavaScript中级

197&#xff1a;in、预解析、变量提升、对象引用、Date对象 1、预解析 即&#xff0c;把var的变量在&#xff0c;作用域下&#xff0c;提前&#xff1b; &#xff08;1&#xff09;JS代码运行原理 预先解析&#xff0c;JS第一次解析代码叫预解析。 JS本身会解析两次代码&a…

vue非单文件组件

非单文件组件指的是&#xff1a;一个文件中包含了多个组件。 Vue 中使用组件的三大步骤&#xff1a;1. 创建组件、2. 注册组件、3. 使用组件。 组件使用流程【第一步&#xff1a;创建组件】 利用 Vue.extend() 方法创建组件: // 第一步&#xff1a;创建 frameHead 组件 cons…

前端015_标签模块_删除功能

标签模块_删除功能 1、需求分析2、EasyMock 添加模拟接口3、Api 调用接口4、测试1、需求分析 当点击删除按钮后, 弹出提示框。点击确定后,执行删除并刷新列表数据 确认消息弹框参考:https://element.eleme.cn/#/zh-CN/component/message-box#que-ren-xiao-xi 2、EasyMock …