【动手学深度学习】(十三)深度学习硬件

【动手学深度学习】(十三)深度学习硬件

news2025/7/3 21:27:01

文章目录

一、CPU和GPU
二、更多的芯片
- 1.DSP:数字信号处理
- 2.可编程阵列(FPGA)
- 3.AI ASIC
三、单机多卡并行

一、CPU和GPU

在这里插入图片描述
提升CPU利用率

在计算a+b之前，需要准备数据
- 主内存->L3->L2->L1->寄存器(数据只有进入寄存器才可以参与运算)
提升空间和时间的内存本地性
- 时间：重要数据使得保持它们在缓存里
- 空间：按序读写数据使得可以预读取

GPU
在这里插入图片描述
CPU vs GPU

提升GPU利用率

并行
- 使用数千个线程
内存本地性
- 缓存更小，构建更加简单
少用控制语句
[总结]：
CPU:用于处理通用计算。性能优化考虑数据读写效率和多线程。
GPU：使用更小的核核更多的内存带宽，适合能大规模并行的计算任务。

二、更多的芯片

1.DSP:数字信号处理

在这里插入图片描述

2.可编程阵列(FPGA)

在这里插入图片描述

3.AI ASIC

在这里插入图片描述

三、单机多卡并行

一台机器可以安装多个GPU（1-16）
在训练和预测时，我们将一个小批量计算切分到多个GPU上来达到加速目的
常用切分方案有：
- 数据并行
- 模型并行
- 通道并行（数据+模型并行）

数据并行vs模型并行

数据并行：将小批量分成n块，每个GPU拿到完整参数计算一块数据的梯度
- 通常性能比更好
模型并行：将模型分成n块，每个GPU拿到一块模型计算它的前向和方向结果
- 通常用于模型大到单GPU放不下

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1310939.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

USB2.0 Spec 中文篇

USB2.0 Spec 中文篇

体系简介线缆 USB 是一种支持热拔插的高速串行传输总线，使用一对（两根）差分信号来传输数据，半双工。要求使用屏蔽双绞线。供电 USB 支持 “总线供电” 和 “自供电” 两种供电模式。在总线供电方式下，设备最多可…

阅读更多...

C++学习笔记—— C++内存管理方式：new和delete操作符进行动态内存管理

C++学习笔记—— C++内存管理方式：new和delete操作符进行动态内存管理

系列文章目录 http://t.csdnimg.cn/d0MZH 目录系列文章目录http://t.csdnimg.cn/d0MZH 比喻和理解a.比喻C语言开空间C开空间 b.理解a、C语言的内存管理的缺点1、开发效率低（信息传递繁琐）2、可读性低（信息展示混乱）3、稳定性差&…

阅读更多...

【MATLAB】基于VMD分解的信号去噪算法（基础版）

【MATLAB】基于VMD分解的信号去噪算法（基础版）

代码的使用说明基于VMD分解的信号去噪算法（基础版） 代码流程图代码效果图本文代码：阿里云盘分享获取代码请关注MATLAB科研小白的个人公众号（即文章下方二维码），并回复VMD去噪本公众号致力于解决找代…

阅读更多...

铭飞CMS list 接口 SQL注入漏洞复现

铭飞CMS list 接口 SQL注入漏洞复现

0x01 产品简介铭飞CMS是一款基于java开发的一套轻量级开源内容管理系统,铭飞CMS简洁、安全、开源、免费,可运行在Linux、Windows、MacOSX、Solaris等各种平台上,专注为公司企业、个人站长快速建站提供解决方案 0x02 漏洞概述铭飞CMS在5.2.10版本以前list 接口处存在sql注入…

阅读更多...

AI抽烟识别系统研发关键

AI抽烟识别系统研发关键

为了设计一个有效的AI抽烟识别系统，我们需要考虑几个关键组成部分：图像捕捉、数据处理、模型训练、以及实际应用场景。下面是这个方案的详细阐述： 1. 图像捕捉与数据收集摄像头部署：首先，在需要监控的区域安装高分辨…

阅读更多...

社交网络分析1：起源发展、不同领域的应用、核心概念

社交网络分析1：起源发展、不同领域的应用、核心概念

社交网络分析1：社交网络相关定义和概念写在最前面关于课程社交网络、社交网络分析社交网络发展阶段（自己感兴趣）1. 社交网络的起源2. 社交网络的演变3. 社交网络的成熟4. 发展阶段补充和展望 2023社交大变革（自己感兴趣的点&…

阅读更多...

带你手把手解读firejail沙盒源码(0.9.72版本) (三) fcopy

带你手把手解读firejail沙盒源码(0.9.72版本) (三) fcopy

文章目录 main.c该模块的各个函数功能详解selinux_relabel_pathcopy_filemkdir_attrcopy_linkproc_pid_to_selffs_copydircheckduplicate_dirduplicate_fileduplicate_linkmain Makefile main.c 文件总结 ├── fcopy │ ├── Makefile │ └── main.cmain.c #include…

阅读更多...

深度学习中的高斯分布

深度学习中的高斯分布

1 高斯分布数学表达 1.1 什么是高斯分布高斯分布(Gaussian Distribution)又称正态分布(Normal Distribution)。高斯分布是一种重要的模型，其广泛应用与连续型随机变量的分布中，在数据分析领域中高斯分布占有重要地位。高斯分布是一个非常常见的连续概…

阅读更多...

【Spring】03 容器

【Spring】03 容器

文章目录 1. 定义2. BeanFactory1）惰性加载2）基本的容器功能3）XML配置 3. ApplicationContext1）主动加载2）AOP支持3）事件发布与监听4）国际化支持5）注解支持 4. Spring容器的生命周期…

阅读更多...

正则表达式（6）：分组与后向引用

正则表达式（6）：分组与后向引用

正则表达式（6）：分组与后向引用总结本博文转载自在本博客中，”正则表达式”为一系列文章，如果你想要从头学习怎样在Linux中使用正则，可以参考此系列文章，直达链接如下： 在Linux中…

阅读更多...

ThinkPHP连接ORACLE数据库教程

ThinkPHP连接ORACLE数据库教程

目录概念基本步骤详细操作问题排除参考概念要连接Oracle数据库，必须有两个东西，一个PHP官方写的扩展，一个Oracle官方写的客户端PHP是通过扩展去操作oralce客户端连接的服务端数据库，所以两个都不能少，而且版本必须…

阅读更多...

arthas统计大循环方法时的注意事项

arthas统计大循环方法时的注意事项

背景 arthas是我们日常查找各种问题的利器，不过我们也需要意识到arthas本身也是有性能损耗的，所以当老板对你提问为什么使用arthas分析时这个方法比生产上正常运行时这个方法的耗时要长很多，你可以向他进行解释，进而由于arthas的…

阅读更多...

边缘检测@获取labelme标注的json黑白图掩码mask

边缘检测@获取labelme标注的json黑白图掩码mask

import cv2 as cv import numpy as np import json import os from PIL import Imagedef convertPolygonToMask(jsonfilePath):

阅读更多...

MySQL——数据类型

MySQL——数据类型

目录一.数据类型分类二. 数值类型 1.tinyint类型 2.bit类型 3.float类型 4.decimal 三.字符串类型 1.char 2.varchar 四.日期和时间类型五.enum和set 一.数据类型分类关于数据库的数据类型有非常多，但是并非所有的数据类型都是我们常用的&#xff…

阅读更多...

《信息技术时代》期刊杂志论文发表投稿

《信息技术时代》期刊杂志论文发表投稿

《信息技术时代》期刊收稿方向：通信工程、大数据、计算机、办公自动化、信息或计算机教育、电子技术、系统设计、移动信息、图情信息研究、人工智能、智能技术、信息技术与网络安全等。刊名：信息技术时代主管主办单位：深圳湾科技发展有限…

阅读更多...

vs2019比较两个代码的区别方法

vs2019比较两个代码的区别方法

vs2019比较两个代码的区别方法效果代码效果代码 Tools.DiffFiles 3d_mig(1).c 3d_mig_xin0.c

阅读更多...

UDP内网穿透和打洞原理与代码实现

UDP内网穿透和打洞原理与代码实现

1、众所周知，现在主流网络用的还是IPV4协议，理论上一共有2^3243亿个地址，除去私有网段、网络ID、广播ID、保留网段、本地环回127.0.0.0网段、组播224.0.0.0网段、实际可用就是36.47亿个；全球的服务器、PC机、手机、物联网设备等需…

阅读更多...

08.CSS盒模型

08.CSS盒模型

CSS盒模型 1.介绍 CSS 会把所有的 HTML 元素都看成一个盒子，所有的样式也都是基于这个盒子 2.盒模型构成介绍 margin（外边距）：盒子与外界的距离border（边框）：盒子的边框padding&#xff0…

阅读更多...

美国如果把根域名服务器封了，中国不会从网络上消失

美国如果把根域名服务器封了，中国不会从网络上消失

目录美国如果把根域名服务器封了，中国不会从网络上消失为什么根服务器最多13个输入URL后发生了什么参考 https://www.yuque.com/fcant/network/vhyvik#AuOqk 美国如果把根域名服务器封了，中国不会从网络上消失来源： https://segmentfau…

阅读更多...

TwinCAT3 Modbus-TCP Client/Server使用

TwinCAT3 Modbus-TCP Client/Server使用

目录一、环境配置和准备 1、PLC中安装TF6250-Modbus-TCP库 2、勾选TF6250的license 3、PLC工程中添加Tc2_ModbusSrv库文件 4、分别创建测试ModbusTCP测试的Server和Client程序二、PLC作为Client端 1、设置测试电脑IP地址 2、运行MobusTCP测试工具 3、PLC端程序编写 …

阅读更多...

推荐文章

最新文章