胤娲科技：揭秘AI记忆宫殿—LLM如何用动画玩转乔丹打篮球的秘密

胤娲科技：揭秘AI记忆宫殿—LLM如何用动画玩转乔丹打篮球的秘密

news2025/4/28 1:32:12

当AI遇上“乔丹打篮球”，真相竟然藏在动画里？

想象一下，你向一位AI大模型轻声询问：“迈克尔・乔丹从事的体育运动是……”几乎在瞬间，它就自信满满地回答：“篮球！”

这一刻，你是否曾好奇，这看似无所不知的AI，是如何在它那浩瀚的“大脑”里存储并检索这些琐碎却精准的事实的？

最近，科技界的热门话题再次被点燃，3Blue1Brown的《深度学习》课程第7课以一场生动的动画盛宴，为我们揭开了LLM（大型语言模型）存储事实的神秘面纱。

这次，我们不仅要看懂AI的“记忆宫殿”，还要一起探索“乔丹打篮球”背后的秘密。

LLM的记忆迷宫：事实与向量的奇幻之旅

在AI的世界里，没有真正的书本和笔记本，但它却拥有一种不可思议的能力——将海量的知识编码成高维向量，存储于它那由亿万个参数构成的复杂网络中。

想象一下，当我们输入“迈克尔・乔丹”时，AI其实是在它的“记忆迷宫”里寻找与这个名字相关联的所有线索。

这些线索，就像是迷宫中的指路牌，指引着AI走向正确的答案——“篮球”。

3Blue1Brown的动画，就像一位耐心的导游，引领我们穿梭于这个由Transformer和MLP（多层感知器）构建的迷宫中。

特别是MLP，它就像是一个个精密的“知识过滤器”，通过一系列复杂的运算，将输入的文本向量转化为包含丰富信息的输出向量。

在这个过程中，“乔丹打篮球”这一事实，被巧妙地嵌入到了网络的某个角落，等待着被唤醒。

MLP的内部探秘：从“姓名”到“运动”的神奇转变

走进MLP的内部，我们仿佛进入了一个由数字和矩阵编织的奇幻世界。在这里，每一个向量都承载着特定的信息，

它们通过线性投射、ReLU激活等步骤，不断地变换着形态，最终汇聚成指向正确答案的“光束”。

以“乔丹打篮球”为例，当输入“Michael Jordan”时，MLP会先对这个文本向量进行一系列的线性变换，就像是给它穿上了一层又一层的“知识外衣”。

这些外衣上，布满了与“Michael”、“Jordan”以及可能与之相关的各种概念相连接的线索。接着，通过ReLU函数的筛选，

那些与“全名”不匹配的线索被剔除，只剩下最纯净、最相关的信息。最后，在另一个线性变换的作用下，这些信息被整合成指向“Basketball”的明确指示。

GPT-3的参数盛宴：1750亿个数字的狂欢

提到GPT-3，不得不提的就是它那惊人的1750亿个参数。这些参数，就像是构成AI“记忆宫殿”的砖石，

.

每一块都承载着特定的信息或功能。那么，这些参数究竟是如何分布和工作的呢？

原来，在GPT-3的架构中，MLP占据了参数总量的三分之二以上。每个MLP都包含多个线性变换步骤，每个步骤都需要大量的参数来支持。

以嵌入空间为例，其大小决定了矩阵的维度，进而决定了参数的数量。而GPT-3中，嵌入空间的大小达到了惊人的12288维，这仅仅是开始。

随着向量的不断传递和变换，参数的数量呈指数级增长，最终汇聚成了那个令人咋舌的1750亿。

从“乔丹打篮球”到AI的未来

通过3Blue1Brown的这场动画盛宴，我们不仅揭开了LLM存储事实的神秘面纱，还深入到了MLP的内部，见证了从“姓名”到“运动”的神奇转变。

更重要的是，我们意识到了AI背后那庞大而复杂的参数网络，正是这些看似冰冷的数字，构建了我们与AI之间沟通的桥梁。

然而，AI的旅程才刚刚开始。随着技术的不断进步，我们有理由相信，未来的AI将更加智能、更加人性化。

它们将不仅仅能够回答“乔丹打篮球”这样的简单问题，更能在医疗、教育、科研等领域发挥巨大的作用，成为我们生活中不可或缺的一部分。

而这一切的起点，就藏在那一个个生动有趣的动画和复杂的参数之中。让我们共同期待AI带来的无限可能吧！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2177552.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

ROS理论与实践学习笔记——2 ROS通信机制之服务通信

ROS理论与实践学习笔记——2 ROS通信机制之服务通信

服务通信也是ROS中一种极其常用的通信模式，服务通信是基于请求响应模式的，是一种应答机制。也即: 一个节点A向另一个节点B发送请求，B接收处理请求并产生响应结果返回给A，用于偶然的、对时时性有要求、有一定逻辑处理需求的数据传输…

阅读更多...

电脑usb接口控制软件有哪些?六款软件帮你轻松管控USB端口！

电脑usb接口控制软件有哪些?六款软件帮你轻松管控USB端口！

小明（疑惑地）：“小李，我们公司最近对数据安全特别重视，我听说可以通过软件来控制电脑的USB接口，防止数据泄露。你知道有哪些好用的USB接口控制软件吗？” 小李（自信地）&a…

阅读更多...

双十一买什么好？五大双十一好物推荐！

双十一买什么好？五大双十一好物推荐！

每年的双十一购物节都是消费者期待已久的盛事，届时各大电商平台纷纷推出优惠活动，吸引了无数购物爱好者的目光。双十一买什么好？为了帮助大家在双十一期间高效购物，我们精心挑选了五大双十一好物推荐！这些产品不仅在品…

阅读更多...

C++之STL—函数对象谓词

C++之STL—函数对象谓词

函数对象（仿函数） 函数对象(仿函数)是一个**类**，不是一个函数类名（） 仿函数直接调用： 、谓词定义：返回类型为bool 类型的仿函数一元谓词：operator()接受一个参数二元谓词&a…

阅读更多...

智能家居新体验：Zigbee2MQTT与Tuya生态的完美结合

智能家居新体验：Zigbee2MQTT与Tuya生态的完美结合

01 前言本文章原文发表于我的微信公众号，请大家关注阅读，涉及的源代码等都在公众号，请搜索公众号： 智能家居NodeRed和HomeAssistant 即可关注。 02 概述在智能家居领域，Zigbee2MQTT已经成为了许多爱好者和开发者的…

阅读更多...

常见字符函数和字符串函数（下）

常见字符函数和字符串函数（下）

1. strncpy 函数的使用将源的前 number 个字符复制到目标。如果在复制 num 个字符之前找到源 C 字符串的末尾（由 null 字符表示），则目标将填充零，直到写入总数 num 个字符为止。如果 source 长于 num，则不会在 destin…

阅读更多...

目标检测 DETR（2020）

目标检测 DETR（2020）

文章目录前言backbone位置编码（二维）encoder、decoderprediction heads损失函数计算前言 DETR全称是Detection Transformer，是首个基于Transformer的端到端目标检测网络，最大的特点就是不需要预定义的先验anchor，也…

阅读更多...

项目没亮点？那就来学下pk功能设计吧

项目没亮点？那就来学下pk功能设计吧

先赞后看，南哥助你Java进阶一大半麻省理工学院开源的Redis adapter适配器，可以将事件广播到多个单独的 socket.io 服务器节点。这一点和下文精彩的内容相关。我是南哥，一个Java学习与进阶的领路人。相信对你通关面试、拿下Offer进入心心念…

阅读更多...

湖州市自闭症寄宿学校：个性化教育培养孩子潜能

湖州市自闭症寄宿学校：个性化教育培养孩子潜能

在湖州市，自闭症寄宿学校正积极探索个性化教育的道路，致力于为自闭症儿童提供最适合他们成长与发展的教育环境。这一理念不仅在当地得到了实践，更在全国范围内产生了深远的影响。今天，我们将目光投向广州，深入了解星贝…

阅读更多...

头戴式蓝牙耳机哪个品牌比较好？西圣、声阔、QCY热款实测性能PK

头戴式蓝牙耳机哪个品牌比较好？西圣、声阔、QCY热款实测性能PK

头戴式蓝牙耳机凭借其卓越的音质表现、沉浸式的听音体验以及出色的降噪功能，成为了众多音乐爱好者和通勤人士的首选，随着技术的不断进步，西圣、声阔、QCY等知名品牌纷纷推出了各具魅力的头戴式蓝牙耳机产品，面对它们家的耳机&…

阅读更多...

十进制与ip地址转换公式（EXCEL公式)

十进制与ip地址转换公式（EXCEL公式)

1、十进制转为ip地址公式 TEXT(INT(C2/16777216),“0”)&“.”&TEXT(INT((C2-INT(C2/16777216)*16777216)/65536),“0”)&“.”&TEXT(INT((C2-INT(C2/16777216)*16777216-INT((C2-INT(C2/16777216)*16777216)/65536)*65536)/256),“0”)&“.”&TEXT(MO…

阅读更多...

城市空间设计对居民生活质量的影响：构建宜居城市的蓝图

城市空间设计对居民生活质量的影响：构建宜居城市的蓝图

在快节奏的现代生活中，城市不仅是经济活动的中心，更是人们生活、工作、休闲的综合载体。本文旨在深入探讨城市空间设计如何通过科学规划、人性化考量以及生态融合，为居民打造更加宜居、和谐的生活环境。 1. 促进社区互动与归属感城市空间设…

阅读更多...

揭秘FlashAttention：提升注意力计算的速度与内存效率

揭秘FlashAttention：提升注意力计算的速度与内存效率

论文题目：FlashAttention: Fast and Memory-Efficient Exact Attention with IO-Awareness 论文地址：https://arxiv.org/pdf/2205.14135 今天分享一篇论文《FlashAttention: Fast and Memory-Efficient Exact Attention with IO-Awareness》，…

阅读更多...

The First项目报告：解读跨链互操作性平台Wormhole

The First项目报告：解读跨链互操作性平台Wormhole

在加密领域，随着公链种类越来越丰富，彼此之间的相对独立，犹如一座座孤悬海外的孤岛，不利于自身生态的发展，因此从资产跨链开始，越来越多的跨链技术被研发出来，多链成为当前区块链的主流概念&…

阅读更多...

2024.9.26C++作业

2024.9.26C++作业

1. 什么是虚函数，什么是纯虚函数？ 1.虚函数在基类中声明，使用virtual关键字修饰成员函数，并且允许在派生类中重写。 2.在运行时，允许基类指针或者引用调用这个函数时，根据实际对象类型调用派生类&#xff…

阅读更多...

安卓主板_MTK4G/5G音视频记录仪整机及方案定制

安卓主板_MTK4G/5G音视频记录仪整机及方案定制

音视频记录仪方案，采用联发科MT6877平台八核2* A78 6* A55主频高达2.4GHz, 具有高能低耗特性，搭载Android 12.0智能操作系统，可选4GB32GB/6GB128GB内存，运行流畅。主板集成NFC、双摄像头、防抖以及多种无线数据连接，支…

阅读更多...

YOLOv8改进，YOLOv8改进损失函数采用Powerful-IoU（2024年最新IOU），助力涨点

YOLOv8改进，YOLOv8改进损失函数采用Powerful-IoU（2024年最新IOU），助力涨点

摘要边界框回归（BBR）是目标检测中的核心任务之一，BBR损失函数显著影响其性能。然而，观察到现有基于IoU的损失函数存在不合理的惩罚因子，导致回归过程中锚框扩展，并显著减缓收敛速度。为了解决这个问题，深入分析了锚框扩展的原因。针对这个问题，提出了一种新的Powerfu…

阅读更多...

【C++】类和对象＜上＞（类的定义，类域，实例化，this指针）

【C++】类和对象＜上＞（类的定义，类域，实例化，this指针）

目录一. 类的定义【对比c】结构体和类的区别 1. 称呼：变量 or 对象？ 2. 类型： 3. 访问限定： 4. c和c结构体使用 5. 相同点： 二. 类域三. 实例化 1. 1对N 2. 计算大小只考虑成员变量 3. 到此一游四. …

阅读更多...

【深度学习】04-Cnn卷积神经网络-01- 卷积神经网络概述/卷积层/池化层/分类案例精讲

【深度学习】04-Cnn卷积神经网络-01- 卷积神经网络概述/卷积层/池化层/分类案例精讲

卷积神经网络（CNN，Convolutional Neural Network）是专门用于处理图像数据的神经网络。图像的基本概念图像其实是数组： ndarray -> [高，宽，3通道] --> uint8 每个值取值范围0-255，那么…

阅读更多...

高空抛物AI检测算法：精准防控，技术革新守护城市安全

高空抛物AI检测算法：精准防控，技术革新守护城市安全

近年来，随着城市化进程的加速，高楼大厦如雨后春笋般涌现，但随之而来的高空抛物问题却成为城市管理的一大难题。高空抛物不仅严重威胁行人的安全，还可能引发法律纠纷和社会问题。为了有效预防和减少高空抛物事件的发生，…

阅读更多...

推荐文章

最新文章