旷野之间15 – Groq 和 AI 硬件

news2024/9/23 7:26:12

文讨论了 Groq,一种新的计算机硬件方法,它彻底改变了 AI 解决现实世界问题的方式。

在讨论 Groq 之前,我们将分析 AI 的根本含义,并探讨用于运行 AI 模型的计算机硬件的一些关键组件。即 CPU、GPU 和 TPU。我们将从 1975 年的 Z80 CPU 开始探索这些关键硬件,然后通过探索计算机硬件的一些关键演变来加深对现代系统的理解。

在了解了计算机硬件的一些基本概念和权衡之后,我们将利用这些理解来探索 Groq 是什么、它如何彻底改变 AI 计算的方式以及为什么它很重要。

当然,从早期的 CPU 到价值数十亿美元的尖端 AI 初创公司,还有很多内容需要介绍。因此,这是一篇相当长的文章。系好安全带,这是值得的。

定义人工智能

很多人认为人工智能就像一个黑匣子。你把数据输入进去,人工智能会做一些晦涩难懂的数学运算,然后你就可以得到数据。

旷野之间15 - Groq 和 AI 硬件

人工智能的常见直觉是,它本质上是一个接收东西并输出东西的魔盒。

这种直觉很受欢迎,因为人类有时很难理解模型的思维过程。

旷野之间15 - Groq 和 AI 硬件

仅仅因为人工智能模型擅长某项任务并不意味着人类能够轻易理解模型的决策。

尽管从整体上理解模型决策背后的原理可能很困难,但人工智能模型实际上采用非常简单的数学运算来得出结论。

旷野之间15 - Groq 和 AI 硬件

人工智能思考方式的概念图。该模型通过查看大量数据来学习参数(以蓝色突出显示并加下划线),从而做出正确的决策。

换句话说,人工智能模型之所以复杂,不是因为它们做复杂的事情,而是因为它们同时做大量简单的事情

有很多硬件选项可用于运行 AI。让我们从描述最基本的一个开始。

中央处理器

大多数现代计算机的主要部件是 CPU,即“中央处理器”。CPU 几乎是每台现代计算机的心脏。

旷野之间15 - Groq 和 AI 硬件

从最根本的角度来说,CPU 是基于“冯·诺依曼架构”的。

旷野之间15 - Groq 和 AI 硬件

本质上,冯·诺依曼装置可以接受一些输入,并使用控制单元来控制某些算术单元中的计算方式。然后,这些计算会产生一些有意义的输出。来源。

冯·诺依曼架构相当抽象;在将其付诸实践方面有很大的余地。本文中我们将讨论的几乎所有硬件都可以看作是冯·诺依曼设备的特定版本,包括 CPU。

早期流行的计算机 ZX Spectrum 使用 Z80 CPU 来完成工作。从概念上讲,现代 CPU 与 Z80 并无太大区别,因此我们可以使用 Z80 作为简化示例来开始了解 CPU 的工作原理。

旷野之间15 - Groq 和 AI 硬件

采用 Z80 CPU(右)的 ZX Spectrum 计算机(左)。来源。

即使是这个不起眼的 CPU 的图表也相当复杂,但我们可以将其拆开,了解一些核心组件,这些组件在现代 CPU 中基本仍然存在。

旷野之间15 - Groq 和 AI 硬件

Z80 CPU 的近似框图。来源。

Z80 具有一个控制电路,它将低级指令转换为芯片内的实际动作,并跟踪记录事项,例如 CPU 应该执行哪些命令。

旷野之间15 - Groq 和 AI 硬件

Z80 CPU 内的控制电路。来源。

Z80 配备了一个“算术逻辑单元”(简称 ALU),能够执行各种基本算术运算。这才是 Z80 CPU 中真正进行大量实际计算的部件。Z80 会将一些数据输入到 ALU 的输入端,然后 ALU 会根据 CPU 当前正在运行的指令对这些数据进行加法、乘法、除法或执行其他运算。

旷野之间15 - Groq 和 AI 硬件

Z80 内的算术逻辑单元(或 ALU)。来源。

几乎任何复杂的数学函数都可以分解成简单的步骤。ALU 旨在执行最基本的数学运算,这意味着 CPU 能够通过使用 ALU 执行许多简单的运算来进行非常复杂的数学运算。

旷野之间15 - Groq 和 AI 硬件

即使是最复杂的数学运算通常也可以分解为许多简单的计算。这种积分(来自微积分)只是乘法、除法和加法。

Z80 还包含一组寄存器。寄存器是 CPU 中微小的超快内存,用于存储某些关键信息,例如 CPU 当前正在运行的指令、数字数据、CPU 外部数据的地址等。

旷野之间15 - Groq 和 AI 硬件

Z80 内的寄存器。来源。

当人们想到计算机时,很容易将注意力集中在进行数学运算的电路上,但实际上,需要进行大量的设计工作来研究数据存储的位置。数据如何存储和移动的问题是本文的核心主题,也是现代计算为何依赖如此多不同的专用硬件组件的重要原因。

CPU 需要与计算机中的其他组件通信,这是总线的工作。Z80 CPU 有三条总线:

  • 地址总线传达 Z80 感兴趣的数据位置
  • 控制总线传达了 CPU 想要做什么
  • 数据总线传送来自 CPU 的实际数据

旷野之间15 - Groq 和 AI 硬件

Z80 的三条总线。来源。

因此,例如,如果 Z80 想要从 RAM 读取一些数据并将该信息放入本地寄存器进行计算,它将使用地址总线来传达它感兴趣的数据,然后它将使用控制总线来传达它想要读取数据,然后它将通过数据总线接收该数据。

这整套程序的重点是让 CPU 执行“获取、解码、执行”循环。CPU“获取”某条指令,然后将该指令“解码”为 CPU 中特定组件要执行的实际操作,然后 CPU“执行”这些操作。然后 CPU 获取一条新指令,重新开始循环。

旷野之间15 - Groq 和 AI 硬件

获取、解码、执行循环,这基本上就是 CPU 所做的全部工作。

此循环与程序协同工作。人们通常认为程序是用 Java 或 Python 等编程语言编写的,但在编译器将程序文本解释为机器代码,并将该机器代码传输到 CPU 后,程序最终看起来会大不相同。本质上,编译器将人类编写的程序转换为 CPU 可以根据其预定义的控制逻辑执行的指令列表。

旷野之间15 - Groq 和 AI 硬件

编译器的概念图,它将人类编写的程序转换为 CPU 可以理解的指令列表。这些指令执行简单的操作,例如将两个数字相加、将数据从 RAM 加载到寄存器等。

代码编译完成后,CPU 只需获取一条指令,将其解码为 CPU 内的操作,然后执行这些操作。CPU 使用程序计数器跟踪其所在位置,该计数器通常会在每次调用指令时递增,但它也可能根据某些逻辑(如 if 语句)在程序中跳转。

基本上就是这样。事实证明,即使是一个简单的 CPU 也能够通过遵循一系列简单的指令来执行几乎任何可以想象到的计算。真正的诀窍是让 CPU 快速执行这些指令。

CPU 的设计约束

Z80 是一款相当简单的 CPU。首先,它只有一个“核心”。核心的实际细节可能有点复杂,但核心本质上是 CPU 上工作的东西。想象一下,我们不是只有一个 Z80,而是在单个芯片上封装了几个 Z80,它们各自做自己的事情。这基本上就是现代多核 CPU 的本质。

旷野之间15 - Groq 和 AI 硬件<

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1924922.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ubuntu服务器安装labelimg报错记录

文章目录 报错提示查看报错原因安装报错 报错提示 按照步骤安装完labelimg后&#xff0c;在终端输入labelImg后&#xff0c;报错&#xff1a; (labelimg) rootinteractive59753:~# labelImg ………………Got keys from plugin meta data ("xcb") QFactoryLoader::Q…

游戏三倍补帧工具 Lossless Scaling v2.9.0

运行时请将游戏窗口化或全屏 比如你的显示器是144hz 把游戏限制帧率到48帧后开启三倍补帧 允许撕裂和垂直同步一起来延迟更低 72,48,36&#xff0c;分别对应1/2&#xff0c;1/3&#xff0c;1/4&#xff0c;性能够的话&#xff08;补帧后满144fps&#xff09;就优先锁72fps&a…

【C++】 List 基本使用

C List 基本使用 基本概念 list 是一个序列容器&#xff0c;它内部维护了一个双向链表结构。与 vector 或 deque 等基于数组的容器不同&#xff0c;list 在插入和删除元素时不需要移动大量数据&#xff0c;因此在这些操作上具有较高的效率。然而&#xff0c;访问列表中的特定…

公共资源管理服务中心智能化方案PPT(97页)

公共资源管理服务中心智能化方案摘要 1. 建设背景及需求 公共资源管理服务中心的建设以便民、高效、廉洁、规范为宗旨&#xff0c;推行“一站式办公、一条龙服务、并联式审批、阳光下作业、规范化管理”的运行模式。目标是提高行政效率和社会效益&#xff0c;预防流程漏洞&am…

硬盘HDD:AI时代的战略金矿?

在这个AI如火如荼的时代&#xff0c;你可能以为硬盘HDD已经像那些过时的诺基亚手机一样&#xff0c;被闪存和云存储淘汰到历史的尘埃里。但&#xff0c;别急着给HDD们举行退休派对&#xff0c;因为根据Finis Conner这位硬盘界的传奇人物的说法&#xff0c;它们非但没退场&#…

旋转电连接器抗干扰性有哪几个方面?

旋转电连接器作为一种精密的电气传输装置&#xff0c;它实现了两个相对旋转部件间的功率和信号传输。通过旋转电连接器可以传输高频的交流电、高电压的交流电、大电流的交流电、弱小的直流小信号等多种电信号&#xff0c;但是由仪器之间的距离有限&#xff0c;在如此短的距离内…

C 语言结构体

本博客涉及的结构体知识有&#xff1a; 1.0&#xff1a;结构体的创建和使用 2.0: typedef 关键字与#define 关键字的区别 3.0: 结构体成员的访问【地址访问与成员访问】 4.0: 结构体嵌套调用 5.0 数组访问赋值结构体成员 ...... 1.0&#xff1a;结构体的创建和使用 结…

33.异步FIFO IP核的配置、调用与仿真

&#xff08;1&#xff09;异步FIFO的配置过程&#xff1a; ps&#xff1a;异步fifo相比较同步fifo少一个实际深度 &#xff08;2&#xff09;异步FIFO的调用: module dcfifo (input wr_clk ,input rd_clk ,input [7:0] …

LT_0001_两数之和

一、题目描述 二、代码实现 2.1 暴力枚举 时间复杂度O(N^2) public static int[] towSum(int[] nums, int target) {for (int i 0; i < nums.length; i) {for (int j i 1; j < nums.length; j) {if (nums[i] nums[j] target) {return new int[]{i,j};}}}return n…

github actions方式拉取docker镜像

参考&#xff1a; https://wkdaily.cpolar.cn/archives/gc 注意github actions提供的免费虚拟机空间有限&#xff0c;空间不足会报错&#xff0c;查看大概语句有10来G 我在workflow file里加了df -h 运行查看磁盘情况&#xff1a; 通过pwd命令&#xff0c;可以知道运行目录/ho…

护网HW面试——redis利用方式即复现

参考&#xff1a;https://xz.aliyun.com/t/13071 面试中经常会问到ssrf的打法&#xff0c;讲到ssrf那么就会讲到配合打内网的redis&#xff0c;本篇就介绍redis的打法。 未授权 原理&#xff1a; Redis默认情况下&#xff0c;会绑定在0.0.0.0:6379&#xff0c;如果没有采用相关…

自然语言处理(NLP)——法国工程师IMT联盟 期末考试题

1. 问题1 &#xff08;法语&#xff09;En langue arabe lcrasante majorit des mots sont forms par des combinaisons de racines et de schmes. Dans ce mcanisme... &#xff08;英语&#xff09;In Arabic language the vast majority&#xff08;十之八九&#xff09; of…

JAVA自定义注释

interface 声明 package test; public interface InProgress { } InProgress public void calculateInterest(float amount, float rate) { } 带成员 public interface TODO {String value(); } InProgress //只有成员变量名有value时&#xff0c;值有给value赋值时可以这…

水的几个科学问题及引发的思考

水的几个科学问题及引发的思考 1、两个相同的容器A和B&#xff0c;分别装有同质量的水&#xff0c;然后&#xff0c;在A容器中加入水&#xff0c;在B容器中加入冰&#xff0c;如果加入水和冰的质量相同。问&#xff0c;容器B的水位将与容器A的水位相同吗&#xff08;假设冰未融…

Web 性能入门指南-1.5 创建 Web 性能优化文化的最佳实践

最成功的网站都有什么共同点&#xff1f;那就是他们都有很强的网站性能和可用性文化。以下是一些经过验证的有效技巧和最佳实践&#xff0c;可帮助您建立健康、快乐、值得庆祝的性能文化。 创建强大的性能优化文化意味着在你的公司或团队中创建一个如下所示的反馈循环&#xff…

永磁同步电机控制算法--基于 SVM 的无磁链环 DTC

永磁同步电机无磁链环 DTC 通过控制定子磁链交轴分量来直接控制转矩&#xff0c;不再要求控制磁链幅值恒定&#xff0c;省去了传统 DTC 中的磁链环&#xff0c;不仅转矩响应更快&#xff0c;有效抑制了转矩脉动&#xff0c;而且提高了电机功率因数。但无磁链环 DTC 方案仍采用传…

探索4D毫米波雷达和摄像头在自动驾驶中的潜力

随着自动驾驶技术的快速发展&#xff0c;关于各种传感器的必要性&#xff0c;尤其是LiDAR&#xff08;激光雷达&#xff09;与毫米波雷达结合摄像头的作用&#xff0c;激发了激烈的讨论。在这篇博客中&#xff0c;我们将探讨4D毫米波雷达和摄像头的组合是否可能成为自动驾驶车辆…

python爬虫网页解析模块及测试案例详解

xpath模块 xpath模块基本使用方法 测试网页 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"/><title>Title</title> </head> <body><ul><li id"l1" class"c1&q…

R语言安装devtools包失败过程总结

R语言安装devtools包时&#xff0c;遇到usethis包总是安装失败&#xff0c;现总结如下方法&#xff0c;亲测可有效 一、usethis包及cli包安装问题 首先&#xff0c;Install.packages("usethis")出现如下错误&#xff0c;定位到是这个cli包出现问题 载入需要的程辑包…

GESP CCF C++ 四级认证真题 2024年6月

第 1 题 下列代码中&#xff0c;输出结果是&#xff08; &#xff09; A. 12 24 24 12 B. 24 12 12 24 C. 12 12 24 24 D. 24 24 12 12 第 2 题 下面函数不能正常执行的是&#xff08;&#xff09; A. B. C. D. 第 3 题 下面程序…