胤娲科技:揭秘AI记忆宫殿—LLM如何用动画玩转乔丹打篮球的秘密

news2024/11/19 10:30:09

4653eca9a43ef1c4da3cfddc396a4744.jpeg

当AI遇上“乔丹打篮球”,真相竟然藏在动画里?


想象一下,你向一位AI大模型轻声询问:“迈克尔・乔丹从事的体育运动是……”几乎在瞬间,它就自信满满地回答:“篮球!”


这一刻,你是否曾好奇,这看似无所不知的AI,是如何在它那浩瀚的“大脑”里存储并检索这些琐碎却精准的事实的?


c237ec82809365679203e74994558f44.jpeg


最近,科技界的热门话题再次被点燃,3Blue1Brown的《深度学习》课程第7课以一场生动的动画盛宴,为我们揭开了LLM(大型语言模型)存储事实的神秘面纱。


a00259523679fcf5f4e4f54857527f73.jpeg


这次,我们不仅要看懂AI的“记忆宫殿”,还要一起探索“乔丹打篮球”背后的秘密。


LLM的记忆迷宫:事实与向量的奇幻之旅


在AI的世界里,没有真正的书本和笔记本,但它却拥有一种不可思议的能力——将海量的知识编码成高维向量,存储于它那由亿万个参数构成的复杂网络中。


4c70d1d59e622b9cc4be1849befbccc0.jpeg


想象一下,当我们输入“迈克尔・乔丹”时,AI其实是在它的“记忆迷宫”里寻找与这个名字相关联的所有线索。


这些线索,就像是迷宫中的指路牌,指引着AI走向正确的答案——“篮球”。


fbd3c3b340334305c58e3322f06aa8f5.jpeg


3Blue1Brown的动画,就像一位耐心的导游,引领我们穿梭于这个由Transformer和MLP(多层感知器)构建的迷宫中。


95b941df6d92cc56139818a18e68b5d5.jpeg


特别是MLP,它就像是一个个精密的“知识过滤器”,通过一系列复杂的运算,将输入的文本向量转化为包含丰富信息的输出向量。


cbfef6aaaba2a74f666328ac4c18569d.jpeg


在这个过程中,“乔丹打篮球”这一事实,被巧妙地嵌入到了网络的某个角落,等待着被唤醒。


MLP的内部探秘:从“姓名”到“运动”的神奇转变


走进MLP的内部,我们仿佛进入了一个由数字和矩阵编织的奇幻世界。在这里,每一个向量都承载着特定的信息,


6e91a0280e83a68bf35ae668b6d3c8f2.jpeg


它们通过线性投射、ReLU激活等步骤,不断地变换着形态,最终汇聚成指向正确答案的“光束”。


以“乔丹打篮球”为例,当输入“Michael Jordan”时,MLP会先对这个文本向量进行一系列的线性变换,就像是给它穿上了一层又一层的“知识外衣”。


d8217b473341556b179bd41e31b7401a.jpeg


这些外衣上,布满了与“Michael”、“Jordan”以及可能与之相关的各种概念相连接的线索。接着,通过ReLU函数的筛选,


b7734838e8aa8e8d675a41f8939bf802.jpeg


那些与“全名”不匹配的线索被剔除,只剩下最纯净、最相关的信息。最后,在另一个线性变换的作用下,这些信息被整合成指向“Basketball”的明确指示。


GPT-3的参数盛宴:1750亿个数字的狂欢


提到GPT-3,不得不提的就是它那惊人的1750亿个参数。这些参数,就像是构成AI“记忆宫殿”的砖石,

.

491a27f6c13026aed67962fd180d2dd9.jpeg


每一块都承载着特定的信息或功能。那么,这些参数究竟是如何分布和工作的呢?


原来,在GPT-3的架构中,MLP占据了参数总量的三分之二以上。每个MLP都包含多个线性变换步骤,每个步骤都需要大量的参数来支持。


bb3cc0dc71330bb533bb07d509a7b8d9.jpeg


以嵌入空间为例,其大小决定了矩阵的维度,进而决定了参数的数量。而GPT-3中,嵌入空间的大小达到了惊人的12288维,这仅仅是开始。


4327ff213f8a7d8c7960020dc87d8409.jpeg


随着向量的不断传递和变换,参数的数量呈指数级增长,最终汇聚成了那个令人咋舌的1750亿。


从“乔丹打篮球”到AI的未来


通过3Blue1Brown的这场动画盛宴,我们不仅揭开了LLM存储事实的神秘面纱,还深入到了MLP的内部,见证了从“姓名”到“运动”的神奇转变。


937f24c71a8be61607e7bae9960eaea2.jpeg


更重要的是,我们意识到了AI背后那庞大而复杂的参数网络,正是这些看似冰冷的数字,构建了我们与AI之间沟通的桥梁。


然而,AI的旅程才刚刚开始。随着技术的不断进步,我们有理由相信,未来的AI将更加智能、更加人性化。


50719e850b670317477c2e421879b138.jpeg


它们将不仅仅能够回答“乔丹打篮球”这样的简单问题,更能在医疗、教育、科研等领域发挥巨大的作用,成为我们生活中不可或缺的一部分。


729c7c554d699f565a7b7f8398777956.jpeg


而这一切的起点,就藏在那一个个生动有趣的动画和复杂的参数之中。让我们共同期待AI带来的无限可能吧!


87880f2a0e091290ff5530ac757e4a32.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2177552.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ROS理论与实践学习笔记——2 ROS通信机制之服务通信

服务通信也是ROS中一种极其常用的通信模式,服务通信是基于请求响应模式的,是一种应答机制。也即: 一个节点A向另一个节点B发送请求,B接收处理请求并产生响应结果返回给A,用于偶然的、对时时性有要求、有一定逻辑处理需求的数据传输…

电脑usb接口控制软件有哪些?六款软件帮你轻松管控USB端口!

小明(疑惑地):“小李,我们公司最近对数据安全特别重视,我听说可以通过软件来控制电脑的USB接口,防止数据泄露。你知道有哪些好用的USB接口控制软件吗?” 小李(自信地)&a…

双十一买什么好?五大双十一好物推荐!

每年的双十一购物节都是消费者期待已久的盛事,届时各大电商平台纷纷推出优惠活动,吸引了无数购物爱好者的目光。双十一买什么好?为了帮助大家在双十一期间高效购物,我们精心挑选了五大双十一好物推荐!这些产品不仅在品…

C++之STL—函数对象谓词

函数对象(仿函数) 函数对象(仿函数)是一个**类**,不是一个函数 类名() 仿函数 直接调用: 、 谓词 定义:返回类型为bool 类型的仿函数 一元谓词:operator()接受一个参数 二元谓词&a…

智能家居新体验:Zigbee2MQTT与Tuya生态的完美结合

01 前言 本文章原文发表于我的微信公众号,请大家关注阅读,涉及的源代码等都在公众号,请搜索公众号: 智能家居NodeRed和HomeAssistant 即可关注。 02 概述 在智能家居领域,Zigbee2MQTT已经成为了许多爱好者和开发者的…

常见字符函数和字符串函数(下)

1. strncpy 函数的使用 将源的前 number 个字符复制到目标。如果在复制 num 个字符之前找到源 C 字符串的末尾(由 null 字符表示),则目标将填充零,直到写入总数 num 个字符为止。如果 source 长于 num,则不会在 destin…

目标检测 DETR(2020)

文章目录 前言backbone位置编码(二维)encoder、decoderprediction heads损失函数计算 前言 DETR全称是Detection Transformer,是首个基于Transformer的端到端目标检测网络,最大的特点就是不需要预定义的先验anchor,也…

项目没亮点?那就来学下pk功能设计吧

先赞后看,南哥助你Java进阶一大半 麻省理工学院开源的Redis adapter适配器,可以将事件广播到多个单独的 socket.io 服务器节点。这一点和下文精彩的内容相关。 我是南哥,一个Java学习与进阶的领路人。 相信对你通关面试、拿下Offer进入心心念…

湖州市自闭症寄宿学校:个性化教育培养孩子潜能

在湖州市,自闭症寄宿学校正积极探索个性化教育的道路,致力于为自闭症儿童提供最适合他们成长与发展的教育环境。这一理念不仅在当地得到了实践,更在全国范围内产生了深远的影响。今天,我们将目光投向广州,深入了解星贝…

头戴式蓝牙耳机哪个品牌比较好?西圣、声阔、QCY热款实测性能PK

头戴式蓝牙耳机凭借其卓越的音质表现、沉浸式的听音体验以及出色的降噪功能,成为了众多音乐爱好者和通勤人士的首选,随着技术的不断进步,西圣、声阔、QCY等知名品牌纷纷推出了各具魅力的头戴式蓝牙耳机产品,面对它们家的耳机&…

十进制与ip地址转换公式(EXCEL公式)

1、十进制转为ip地址公式 TEXT(INT(C2/16777216),“0”)&“.”&TEXT(INT((C2-INT(C2/16777216)*16777216)/65536),“0”)&“.”&TEXT(INT((C2-INT(C2/16777216)*16777216-INT((C2-INT(C2/16777216)*16777216)/65536)*65536)/256),“0”)&“.”&TEXT(MO…

城市空间设计对居民生活质量的影响:构建宜居城市的蓝图

在快节奏的现代生活中,城市不仅是经济活动的中心,更是人们生活、工作、休闲的综合载体。本文旨在深入探讨城市空间设计如何通过科学规划、人性化考量以及生态融合,为居民打造更加宜居、和谐的生活环境。 1. 促进社区互动与归属感 城市空间设…

揭秘FlashAttention:提升注意力计算的速度与内存效率

论文题目:FlashAttention: Fast and Memory-Efficient Exact Attention with IO-Awareness 论文地址:https://arxiv.org/pdf/2205.14135 今天分享一篇论文《FlashAttention: Fast and Memory-Efficient Exact Attention with IO-Awareness》,…

The First项目报告:解读跨链互操作性平台Wormhole

在加密领域,随着公链种类越来越丰富,彼此之间的相对独立,犹如一座座孤悬海外的孤岛,不利于自身生态的发展,因此从资产跨链开始,越来越多的跨链技术被研发出来,多链成为当前区块链的主流概念&…

2024.9.26C++作业

1. 什么是虚函数,什么是纯虚函数? 1.虚函数在基类中声明,使用virtual关键字修饰成员函数,并且允许在派生类中重写。 2.在运行时,允许基类指针或者引用调用这个函数时,根据实际对象类型调用派生类&#xff…

安卓主板_MTK4G/5G音视频记录仪整机及方案定制

音视频记录仪方案,采用联发科MT6877平台八核2* A78 6* A55主频高达2.4GHz, 具有高能低耗特性,搭载Android 12.0智能操作系统,可选4GB32GB/6GB128GB内存,运行流畅。主板集成NFC、双摄像头、防抖以及多种无线数据连接,支…

YOLOv8改进,YOLOv8改进损失函数采用Powerful-IoU(2024年最新IOU),助力涨点

摘要 边界框回归(BBR)是目标检测中的核心任务之一,BBR损失函数显著影响其性能。然而,观察到现有基于IoU的损失函数存在不合理的惩罚因子,导致回归过程中锚框扩展,并显著减缓收敛速度。为了解决这个问题,深入分析了锚框扩展的原因。针对这个问题,提出了一种新的Powerfu…

【C++】类和对象<上>(类的定义,类域,实例化,this指针)

目录 一. 类的定义 【对比c】结构体和类的区别 1. 称呼:变量 or 对象? 2. 类型: 3. 访问限定: 4. c和c结构体使用 5. 相同点: 二. 类域 三. 实例化 1. 1对N 2. 计算大小只考虑成员变量 3. 到此一游 四. …

【深度学习】04-Cnn卷积神经网络-01- 卷积神经网络概述/卷积层/池化层/分类案例精讲

卷积神经网络(CNN,Convolutional Neural Network)是专门用于处理图像数据的神经网络。 图像的基本概念 图像其实是数组: ndarray -> [高,宽,3通道] --> uint8 每个值取值范围0-255,那么…

高空抛物AI检测算法:精准防控,技术革新守护城市安全

近年来,随着城市化进程的加速,高楼大厦如雨后春笋般涌现,但随之而来的高空抛物问题却成为城市管理的一大难题。高空抛物不仅严重威胁行人的安全,还可能引发法律纠纷和社会问题。为了有效预防和减少高空抛物事件的发生,…