一文搞懂GPU的概念、工作原理,以及与CPU的区别

news2024/11/30 8:39:25

中午好,我的网工朋友。

最近GPTs热度很高啊,你们都用上了吗?

ChatGPT到现在热度仍不减,人工智能还在快速发展,这都离不开高性能、高算力的硬件支持。

如果以英伟达A100GPU的处理能力计算,运行ChatGPT将需要使用到30000块英伟达GPU,这些都将用做AI推理和图形计算。

那GPU到底是啥?跟CPU又有什么不一样?今天就给你来篇技术科普文。

今日文章阅读福利:《全国网络工程师交流群(进群名额限时开放)》

想学习更多技术?又或是和大佬交流讨论吗,俱乐部的全国网工交流群限时开放。私信发送暗号“进群”,前30名朋友可获得进群资格。

01 GPU是什么?

图形处理器(Graphics Processing Unit,缩写:GPU),又称显示核心、视觉处理器、显示芯片;

是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上图像运算工作的微处理,是显卡或GPU卡的“心脏”。

01 GPU的工作原理

GPU的工作通俗的来说就是完成3D图形的生成,将图形映射到相应的像素点上,对每个像素进行计算确定最终颜色并完成输出。

GPU的工作原理流程如下:

1. GPU包含多个核心,每个核心都可以独立执行命令。

2. 每个核心具有自己的存储器,用于存储指令和数据。

3. GPU会接收来自CPU的指令,并把它们分发到多个核心中进行处理。

4. GPU会把处理后的数据传输回 CPU,以便CPU可以使用它。

5. GPU的性能取决于其内部的核心数量、时钟频率以及RAM容量。

02 GPU和CPU之间的区别

理解 GPU 和 CPU 之间区别的一种简单方式是比较它们如何处理任务。

CPU 由专为顺序串行处理而优化的几个核心组成,而 GPU 则拥有一个由数以千计的更小、更高效的核心(专为同时处理多重任务而设计)组成的大规模并行计算架构。

CPU是一个有多种功能的优秀领导者。它的优点在于调度、管理、协调能力强,计算能力则位于其次。

而GPU相当于一个接受CPU调度的“拥有大量计算能力”的员工。

GPU可以利用多个CUDA核心来做并行计算,而CPU只能按照顺序进行串行计算,同样运行3000次的简单运算,CPU需要3000个时钟周期,而配有3000个CUDA核心的GPU运行只需要1个时钟周期。

简而言之,CPU擅长统领全局等复杂操作,GPU擅长对大数据进行简单重复操作。CPU是从事复杂脑力劳动的教援,而GPU是进行大量并行计算的体力劳动者。

那么,GPU和CPU的具体区别有哪些呢?网络工程师俱乐部分享

01 计算量比较

CPU:

计算量小,原理:只有4个运算单元;

GPU:

计算量大,原理:有1000个运算单元。

02 计算复杂度比较

CPU:

可计算复杂的运算,比如积分微分,4个运算单元都属于专家级别;

GPU:

只可以计算简单的1+1算术题,不能计算复杂的微分积分,1000个运算单元属于小学生水平。

03 对于单个积分微分的计算速度比较

CPU:

较快。原理:单线程计算(比如机器人运动控制),单个芯片性能强劲,计算能力强,能计算出来。

GPU:

较慢,甚至可能计算不了;原理:单个芯片性能弱,计算能力弱,可能算不出来,或速度很慢。

04 对于多个1+1算术题的计算速度比较

CPU:

速度较慢。因为计算原理是:先算第1题, 再算第2题,总时间为【T1+T2+T3>>>+T1000(也就是1000个算术题消耗时间的累加])】

GPU:

速度很快。因为计算原理是:可同时计算1000道算术题,总时间为【max(T1,T2,T3...T1000)(也就是1000个算术题消耗时间中的最大值)】

05 形象比喻

CPU:

像老教授,积分微分都会算,就是工资高,一个老教授资顶二十个小学生,你要是富士康你雇哪个?GPU就是这样,用很多简单的计算单元去完成大量的计算任务,纯粹的人海战术。

GPU:

计算量大,但没什么技术含量,而且要重复很多很多次。就像你有个工作需要算几亿次一百以内加减乘除一样,最好的办法就是雇上几十个小学生一起算,一人算一部分,反正这些计算也没什么技术含量,纯粹体力活而已。

06 适用场景

GPU:

适合前后计算步骤无依赖性,相互独立的计算场景。很多涉及到大量计算的问题基本都有这种特性,比如你说的破解密码,挖矿和很多图形学的计算。

这些计算可以分解为多个相同的简单小任务,每个任务就可以分给一个小学生去做。网络工程师俱乐部分享

CPU:

适合需要前后计算步骤严密关联的计算场景。这些任务涉及到“流”的问题,必须先计算完第一步,再去计算第二步;

比如你去相亲,双方看着顺眼才能继续发展。总不能你这边还没见面呢,那边找人把证都给领了。

这种比较复杂的问题都是CPU来做的,生活中大部分用的都是CPU,例如武器装备运动控制、个人电脑使用等。

03 全球GPU厂商 Top 30

整理:老杨丨10年资深网络工程师,更多网工提升干货,请关注公众号:网络工程师俱乐部

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1215570.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

时间序列数据集——可用于预测和分类

文章目录 一.UCI数据集 一.UCI数据集 UCI官方网站 UCI数据集是由加州大学欧文分校维护的用于机器学习的数据库。官方网站收集了622个数据集,可用于时间序列预测、数据分类回归等多种任务,包含交通流量、电力、生物、空气质量、互联网等等各个方面的数据…

git宝藏干货

git命令 怎样删除gitee仓库 Gitee上传代码 在Gitee上创建该项目的远程仓库 进入你想要上传的文件目录下,右键单击空白处,点击Git Bash Here 命令行输入下列命令,初始化本地仓库 git init 添加项目目录下所有文件至本地仓库 git add . …

ATE测试设备功能、原理、特点详解

ATE(Automatic Test Equipment)自动测试设备是用于检测电子产品、电气设备的自动化测试系统,是电测行业首选的一种测试方式,被广泛应用于通信、消费电子、汽车电子、智能家居、半导体、电源模块、医疗电子、航天航空等领域。ATE测试设备在电子设计、研发…

【excel技巧】Excel表格里的图片如何批量调整大小?

Excel表格里面插入了很多图片,但是每张图片大小不一,如何做到每张图片都完美的与单元格大小相同?并且能够根据单元格来改变大小?今天分享,excel表格里的图片如何批量调整大小。 方法如下: 点击表格中的一…

c语言:解决判断两个字符串是不是互为旋转字符的问题

题目: 思路:先判断两个字符长度是否相等,如果不相等,肯定不是互为旋转字符串。 方法一:将第一份字符串右旋0-n(字符个数)次,判断是否有一次右旋完的字符串等于第二个字符串。如果有&…

MySQL分页查询的工作原理

前言 MySQL 的分页查询在我们的开发过程中还是很常见的,比如一些后台管理系统,我们一般会有查询订单列表页、商品列表页等。 示例: SELECT * FROM goods order by create_time limit 0,10; 在了解order by和limit的工作原理之前&#xff0c…

HarmonyOS开发:动态共享包的依赖问题

一、共享包的依赖方式 在需要依赖的模块包目录下oh-package.json5文件中添加依赖: "dependencies": {"ohos/srpaasUI": "file:../../srpaasUI","ohos/srbusiness": "file:../../feature/srbusiness"} 引入之后…

掌握接口自动化测试,看这篇文章就够了,真滴简单

前言: 接口测试在我们测试工作当中,经常会遇到,对于接口自动化操作,也越来越多的公司进行实践起来了,市面上有很多工具可以做接口自动化比如:Postman、JMeter、SoapUI等。这一篇安静主要介绍通过代码的形式…

阿尔法狗的算法解析-增强学习和蒙特卡洛树搜索算法

阿尔法狗(AlphaGo)是谷歌旗下DeepMind开发的一个著名的增强学习算法,它在围棋领域取得了显著的成就。本文主要探讨其中两个重要的算法:增强学习算法和蒙特卡洛树搜索算法。 AlphaGo涉及的算法 AlphaGo是DeepMind团队开发的一个由多种算法和技术组合而成的系统,其包括以下…

基于单片机C51全自动洗衣机仿真设计

**单片机设计介绍, 基于单片机C51全自动洗衣机仿真设计 文章目录 一 概要二、功能设计设计思路 三、 软件设计原理图 五、 程序六、 文章目录 一 概要 基于单片机C51的全自动洗衣机仿真设计是一个复杂的项目,它涉及到硬件和软件的设计和实现。以下是对这…

uniapp 微信小程序分享功能 onShareAppMessage(options)

一、背景 在微信小程序中需要完成转发分享功能,接收人未登录小程序情况下,在微信上打开不用强制登录,可以查看部分分享的内容;如果用户要查看更多内容,可以点击【查看全部】按钮,触发登录逻辑,…

【2023云栖】郭瑞杰:阿里云搜索产品智能化升级

本文根据 2023 云栖大会演讲实录整理而成,演讲信息如下: 演讲人:郭瑞杰 | 阿里云资深技术专家、搜索负责人 演讲主题:阿里云搜索产品智能化升级发布 近日在2023云栖大会上,阿里云搜索负责人郭瑞杰对阿里云搜索产品智…

轻松实现文件改名:让新文件名与目录名称一致

在日常工作中,我们经常需要处理文件改名的问题。有时候,我们需要将新文件名设置为与目录名称相同,以方便管理和查找。然而,这个过程可能很繁琐,尤其是当你有大量的文件需要改名时。幸运的是,现在有一种简单…

【Mquant】7:构建价差套利(三) ——空间误差校正模型

文章目录 1. 上节回顾2. 纯碱价差套利3. 什么是协整性分析4. 通过协整性检验5. 空间误差校正模型(VECM)6. 构建交易策略7 总结 1. 上节回顾 【Mquant】6:构建价差套利(二)上节带领大家编写了统计套利均值回归的程序,通过历史回测…

服务器数据恢复—服务器raid5离线磁盘上线同步失败的数据恢复案例

服务器数据恢复环境&故障: 某品牌DL380服务器中有一组由三块SAS硬盘组建的RAID5阵列。数据库存放在D分区,数据库备份存放在E分区。 服务器上有一块硬盘的状态灯显示红色,D分区无法识别,E分区可识别,但是拷贝文件报…

如何通过 wireshark 捕获 C# 上传的图片

一:背景 1. 讲故事 这些天计划好好研究下tcp/ip,以及socket套接字,毕竟工控中设计到各种交互协议,如果只是模模糊糊的了解,对分析此类dump还是非常不利的,而研究协议最好的入手点就是用抓包工具 wireshar…

从哪里下载 Oracle database 11g 软件

登入My Oracle Support,选择Patches & Updates 标签页,点击下方的Latest Patchsets链接: 然后单击Oracle Database,就可以下载11g软件了: 安装单实例数据库需要1和2两个zip文件,安装GI需要第3个zip文…

01.智慧商城——项目介绍与初始化

智慧商城 - 授课大纲 接口文档:https://apifox.com/apidoc/shared-12ab6b18-adc2-444c-ad11-0e60f5693f66/doc-2221080 演示地址:http://cba.itlike.com/public/mweb/#/ 01. 项目功能演示 1.明确功能模块 启动准备好的代码,演示移动端面…

关于smartforms 文本乱码问题

运行程序 RSCPSETEDITOR 取消默认的MS word 编辑器后,如出现合同文本、PO文本以及S010文本中文乱码问题的话,需要恢复MS word 编辑器 ,使用MS word 维护长文本即可 MS word 使用,弹出MS word 文本编辑器框,贴入需要输…

linux版:TensorRT安装教程

首先安装cuda和cudnn 查看安装的cuda版本 nvidia-smi查看cuda电脑的版本,我的是11.8版本的 nvcc -V查看cudnn版本,在cuda/cuda118/include路径下 cat cudnn_version.h | grep CUDNN_MAJOR -A 2下载TensorRT8.5 GA 下载地址:https://deve…