新书速览|PyTorch 2.0深度学习从零开始学

news2024/10/6 19:21:16

实战中文情感分类、拼音汉字转化、中文文本分类、拼音汉字翻译、强化学习、语音唤醒、人脸识别

图片

01

本书简介

本书以通俗易懂的方式介绍PyTorch深度学习基础理论,并以项目实战的形式详细介绍PyTorch框架的使用。为读者揭示PyTorch 2.0进行深度学习项目实战的核心技术,实战案例丰富而富有启发。

02

本书内容

本书共分15章,内容包括PyTorch概述、开发环境搭建、基于PyTorch的MNIST分类实战、深度学习理论基础、MNIST分类实战、数据处理与模型可视化、基于PyTorch卷积层的分类实战、PyTorch数据处理与模型可视化、实战ResNet卷积网络模型、有趣的Word Embedding、基于循环神经网络的中文情感分类实战、自然语言处理的编码器、站在巨人肩膀上的预训练模型BERT、自然语言处理的解码器、基于PyTorch的强化学习实战、基于MFCC的语音唤醒实战、基于PyTorch的人脸识别实战

03

本书读者

 本书适合深度学习初学者、PyTorch初学者、PyTorch深度学习项目开发人员学习,也可作为高等院校或高职高专计算机技术、人工智能、智能科学与技术、数据科学与大数据技术等相关专业的教材

04

 本书作者

王晓华,高校计算机专业讲师,研究方向为云计算、大数据与人工智能。著有《Python机器学习与可视化分析实战》《谷歌JAX深度学习从零开始学》《Spark 3.0大数据分析与挖掘:基于机器学习》《TensorFlow深度学习应用实践》《OpenCV+TensorFlow深度学习与计算机视觉实战》《TensorFlow知识图谱实战》《TensorFlow人脸识别实战》《TensorFlow语音识别实战》《TensorFlow+Keras自然语言处理实战》《TensorFlow 2.0卷积神经网络实战》《Keras实战:基于TensorFlow2.2的深度学习实践》《TensorFlow 2.0深度学习从零开始学》《深度学习的数学原理与实现》。

05

本书目录

第1章  PyTorch 2.0—一个新的开始 1

1.1  燎原之势的人工智能 1

1.1.1  从无到有的人工智能 1

1.1.2  深度学习与人工智能 2

1.1.3  应用深度学习解决实际问题 2

1.1.4  深度学习技术的优势和挑战 3

1.2  为什么选择PyTorch 2.0 4

1.2.1  PyTorch的前世今生 4

1.2.2  更快、更优、更具编译支持—PyTorch 2.0更好的未来 4

1.2.3  PyTorch 2.0学习路径—从零基础到项目实战 5

1.3  本章小结 6

第2章  Hello PyTorch 2.0—深度学习环境搭建 7

2.1  安装Python 7

2.1.1  Miniconda的下载与安装 7

2.1.2  PyCharm的下载与安装 10

2.1.3  Python代码小练习:计算Softmax函数 13

2.2  安装PyTorch 2.0 14

2.2.1  Nvidia 10/20/30/40系列显卡选择的GPU版本 15

2.2.2  PyTorch 2.0 GPU Nvidia运行库的安装—以CUDA 11.7+cuDNN 8.2.0为例 15

2.2.3  PyTorch 2.0小练习:Hello PyTorch 18

2.3  实战:基于PyTorch 2.0的图像去噪 18

2.3.1  MNIST数据集的准备 18

2.3.2  MNIST数据集的特征和标签介绍 20

2.3.3  模型的准备和介绍 21

2.3.4  模型的损失函数与优化函数 24

2.3.5  基于深度学习的模型训练 24

2.4  本章小结 26

第3章  基于PyTorch的MNIST分类实战 27

3.1  实战:基于PyTorch的MNIST手写体分类 27

3.1.1  数据图像的获取与标签的说明 27

3.1.2  模型的准备(多层感知机) 29

3.1.3  损失函数的表示与计算 30

3.1.4  基于PyTorch的手写体识别的实现 31

3.2  PyTorch 2.0模型结构输出与可视化 33

3.2.1  查看模型结构和参数信息 33

3.2.2  基于netron库的PyTorch 2.0模型可视化 34

3.2.3  更多的PyTorch 2.0模型可视化工具 37

3.3  本章小结 38

第4章  深度学习的理论基础 39

4.1  反向传播神经网络的历史 39

4.2  反向传播神经网络两个基础算法详解 43

4.2.1  最小二乘法详解 43

4.2.2  道士下山的故事—梯度下降算法 45

4.2.3  最小二乘法的梯度下降算法以及Python实现 48

4.3  反馈神经网络反向传播算法介绍 54

4.3.1  深度学习基础 54

4.3.2  链式求导法则 55

4.3.3  反馈神经网络的原理与公式推导 56

4.3.4  反馈神经网络原理的激活函数 61

4.3.5  反馈神经网络原理的Python实现 62

4.4  本章小结 66

第5章  基于PyTorch卷积层的MNIST分类实战 67

5.1  卷积运算的基本概念 68

5.1.1  基本卷积运算示例 68

5.1.2  PyTorch 2.0中卷积函数实现详解 70

5.1.3  池化运算 72

5.1.4  Softmax激活函数 73

5.1.5  卷积神经网络的原理 74

5.2  实战:基于卷积的MNIST手写体分类 76

5.2.1  数据准备 77

5.2.2  模型设计 77

5.2.3  基于卷积的MNIST分类模型 78

5.3  PyTorch 2.0的深度可分离膨胀卷积详解 80

5.3.1  深度可分离卷积的定义 81

5.3.2  深度的定义以及不同计算层待训练参数的比较 82

5.3.3  膨胀卷积详解 83

5.4  实战:基于深度可分离膨胀卷积的MNIST手写体识别 84

5.5  本章小结 86

第6章  PyTorch数据处理与模型可视化 87

6.1  用于自定义数据集的torch.utils.data工具箱使用详解 88

6.1.1  使用torch.utils.data.Dataset封装自定义数据集 88

6.1.2  改变数据类型的Dataset类中transform的使用 90

6.1.3  批量输出数据的DataLoader类详解 94

6.2  基于tensorboardX的训练可视化展示 97

6.2.1  tensorboardX的安装与简介 97

6.2.2  tensorboardX可视化组件的使用 97

6.2.3  tensorboardX对模型训练过程的展示 99

6.3  本章小结 102

第7章  从冠军开始—实战ResNet 103

7.1  ResNet基础原理与程序设计基础 103

7.1.1  ResNet诞生的背景 104

7.1.2  不要重复造轮子—PyTorch 2.0中的模块工具 106

7.1.3  ResNet残差模块的实现 107

7.1.4  ResNet网络的实现 109

7.2  实战ResNet:CIFAR-10数据集分类 112

7.2.1  CIFAR-10数据集简介 112

7.2.2  基于ResNet的CIFAR-10数据集分类 115

7.3  本章小结 117

第8章  梅西-阿根廷+巴西=?—有趣的Word Embedding 118

8.1  文本数据处理 119

8.1.1  数据集介绍和数据清洗 119

8.1.2  停用词的使用 121

8.1.3  词向量训练模型Word2Vec使用介绍 124

8.1.4  文本主题的提取:基于TF-IDF 127

8.1.5  文本主题的提取:基于TextRank 131

8.2  更多的Word Embedding方法—FastText和预训练词向量 133

8.2.1  FastText的原理与基础算法 134

8.2.2  FastText训练以及与PyTorch 2.0的协同使用 135

8.2.3  使用其他预训练参数生成PyTorch 2.0词嵌入矩阵(中文) 140

8.3  针对文本的卷积神经网络模型简介—字符卷积 141

8.3.1  字符(非单词)文本的处理 141

8.3.2  卷积神经网络文本分类模型的实现—Conv1d(一维卷积) 149

8.4  针对文本的卷积神经网络模型简介—词卷积 151

8.4.1  单词的文本处理 152

8.4.2  卷积神经网络文本分类模型的实现—Conv2d(二维卷积) 153

8.5  使用卷积实现文本分类的补充内容 156

8.6  本章小结 159

第9章  基于循环神经网络的中文情感分类实战 160

9.1  实战:循环神经网络与情感分类 160

9.1.1  基于循环神经网络的中文情感分类准备 161

9.1.2  基于循环神经网络的中文情感分类实现 163

9.2  循环神经网络理论讲解 165

9.2.1  什么是GRU 166

9.2.2  单向不行,那就双向 167

9.3  本章小结 168

第10章  从0起步—自然语言处理的编码器 169

10.1  编码器的核心—注意力模型 170

10.1.1  输入层—初始词向量层和位置编码器层 170

10.1.2  自注意力层(重点) 172

10.1.3  ticks和LayerNormalization 177

10.1.4  多头自注意力 178

10.2  编码器的实现 181

10.2.1  前馈层的实现 182

10.2.2  编码器的实现 183

10.3  实战编码器:汉字拼音转换模型 186

10.3.1  汉字拼音数据集处理 186

10.3.2  汉字拼音转换模型的确定 188

10.3.3  模型训练部分的编写 191

10.4  本章小结 193

第11章  站在巨人肩膀上的预训练模型BERT 194

11.1  预训练模型BERT 194

11.1.1  BERT的基本架构与应用 195

11.1.2  BERT预训练任务与Fine-Tuning 195

11.2  实战BERT:中文文本分类 198

11.2.1  使用Hugging Face获取BERT预训练模型 198

11.2.2  BERT实战文本分类 200

11.3  更多的预训练模型 204

11.4  本章小结 206

 第12章  从1起步—自然语言处理的解码器 207

12.1  解码器的核心—注意力模型 207

12.1.1  解码器的输入和交互注意力层的掩码 208

12.1.2  为什么通过掩码操作能够减少干扰 213

12.1.3  解码器的输出(移位训练方法) 214

12.1.4  解码器的实现 215

12.2  实战解码器:汉字拼音翻译模型 217

12.2.1  数据集的获取与处理 218

12.2.2  翻译模型 220

12.2.3  汉字拼音模型的训练 230

12.2.4  汉字拼音模型的使用 231

12.3  本章小结 232

第13章  我也可以成为马斯克—无痛的基于PyTorch的强化学习实战 233

13.1  实战:基于强化学习的火箭回收 233

13.1.1  火箭回收技术基本运行环境介绍 234

13.1.2  火箭回收参数介绍 235

13.1.3  基于强化学习的火箭回收实战 236

13.1.4  强化学习的基本内容 241

13.2  强化学习的基本算法—PPO算法 246

13.2.1  PPO算法简介 246

13.2.2  函数使用说明 246

13.2.3  一学就会的TD-Error理论介绍 248

13.2.4  基于TD-Error的结果修正 250

13.2.5  对于奖励的倒序构成的说明 251

13.3  本章小结 252

第14章  创建你自己的小精灵—基于MFCC的语音唤醒实战 253

14.1  语音识别的理论基础—MFCC 253

14.2  语音识别的数据获取与准备 255

14.2.1  Speech Commands简介与数据说明 255

14.2.2  语音识别编码器模块与代码实现 258

14.3  实战:PyTorch 2.0语音识别 260

14.3.1  基于PyTorch 2.0的语音识别模型 260

14.3.2  基于PyTorch 2.0的语音识别实现 261

14.4  本章小结 262

第15章  基于PyTorch的人脸识别实战 263

15.1  人脸识别数据集的建立 263

15.1.1  LFW数据集简介 264

15.1.2  Dlib库简介 264

15.1.3  OpenCV简介 265

15.1.4  使用Dlib检测人脸位置 265

15.1.5  使用Dlib和OpenCV建立自己的人脸检测数据集 268

15.1.6  基于人脸定位制作适配深度学习的人脸识别数据集 270

15.2  实战:基于深度学习的人脸识别模型 274

15.2.1  人脸识别的基本模型Siamese Model 274

15.2.2  基于PyTorch 2.0的Siamese Model的实现 276

15.2.3  人脸识别的Contrastive Loss详解与实现 277

15.2.4  基于PyTorch 2.0的人脸识别模型 278

15.3  本章小结 280

本文摘自《PyTorch 2.0深度学习从零开始学》,获出版社和作者授权发布。

链接PyTorch 2.0深度学习从零开始学——京东

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1434189.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

PPYOLE

1:参考GitHub - PaddlePaddle/PaddleDetection: Object Detection toolkit based on PaddlePaddle. It supports object detection, instance segmentation, multiple object tracking and real-time multi-person keypoint detection. 2:开源项目 - 飞…

CPU vs GPU:不仅仅是一字之差

当今科学技术的飞速发展,社会已经迈入了信息时代的智能化阶段。人脸识别、智能客服、个性化推荐等应用已经深入到日常生活的各个方面。这些看得见的应用背后,是看不见的算力在默默地支撑着。在满足这些高算力需求的过程中,CPU 和 GPU 作为计算…

【Leetcode】第 383 场周赛

文章目录 100214. 边界上的蚂蚁题目思路代码结果 100204. 将单词恢复初始状态所需的最短时间 I题目思路代码结果 100189. 找出网格的区域平均强度题目思路代码结果 100203. 将单词恢复初始状态所需的最短时间 II题目思路代码结果 100214. 边界上的蚂蚁 题目 题目链接 给你一个…

Java21 + SpringBoot3集成七牛云对象存储OSS,实现文件上传

文章目录 前言实现步骤引入maven依赖修改配置文件创建七牛云配置类创建文件操作服务类创建文件操作控制器前端实现运行效果 总结 前言 近日心血来潮想做一个开源项目,目标是做一款可以适配多端、功能完备的模板工程,包含后台管理系统和前台系统&#xf…

Unity3D实现项目限制功能(使用次数限制和时间限制)

系列文章目录 unity工具 文章目录 系列文章目录前言一、时间限制1-1、代码如下: 二、次数限制2-1、 在Unity项目中需要对注册表进行操作,还需要设置一下API兼容级别设置成 .NET Framework2-2、设置如下图 Player里面2-3、代码如下: 三、同时…

不负书香,传承有我

随着科技的飞速发展,电子书、网络资源日益丰富,但实体书仍以其独特的魅力和不可替代性在每个人的生活中占据一席之地。为确保每一本书都能被正确、有序地摆放,为每一个读者提供便利,在2024年1月24日,曲阜师范大学计算机…

光隔离探头

一、前言。 光隔离探头的CMRR比高压差分探头要高很多,在一些共模电压较高的测量领域用的比较多,如:开关电源、逆变器等。但是市面上介绍光隔离探头的方案比较少,这里简要说明一下我的个人想法。 二、数字光和模拟光。 数字光就是通信上常用的光模块,传的是数字信号,带…

BZOJ0481. 树的重心之砍树Link Cut Centroids

题目 思路 分类讨论。 首先当树只有一个重心的时候,我们删掉最小的边再加上原边即可. 再看有两个重心的情况. 显然这棵树必定是类似这样的: 即删掉 A 后,以B 为根的子树是剩下的最大连通块,反之亦然. 那就可以得到一个结论: 删掉边 (A,B) 后,两棵树的大小相等. 那我们只…

BrainAGE作为大脑老化的神经影像标志物的十年

随着人口老龄化,神经退行性疾病的发病率越来越高,给个人和整个社会带来越来越大的负担。然而,个体的衰老速度是由环境、基因和表观遗传等各种因素以及各因素间的相互作用决定的。建立神经解剖学衰老过程的生物标志物,是神经科学的…

15:矩阵按键

矩阵按键 1、 矩阵按键的原理图分析2、 矩阵键盘的工作过程3、编程实战3.1、先通过LED灯进行按键测试3.2、通过静态数码管显示键值 1、 矩阵按键的原理图分析 (1)横向和纵向分割 (2)按键两端分别接不同的IO引脚 (3)按键的物理作用不变:按下接通电路,弹起…

ONLYOFFICE:一站式办公,探索高效办公新境界

写在前面ONLYOFFICE 介绍ONLYOFFICE 有哪些优势ONLYOFFICE 文档 8.0 发布如何体验 ONLYOFFICEONLYOFFICE 文档部分页面截图 写在前面 在当今这样一个数字化时代,办公软件已经成为我们日常工作中不可或缺的一部分,熟练使用 Office、WPS、腾讯文档、金山文…

openGauss学习笔记-215 openGauss性能调优-确定性能调优范围-性能日志

文章目录 openGauss学习笔记-215 openGauss性能调优-确定性能调优范围-性能日志215.1 性能日志概述215.2 性能日志收集的配置参数 openGauss学习笔记-215 openGauss性能调优-确定性能调优范围-性能日志 215.1 性能日志概述 性能日志主要关注外部资源的访问性能问题。 性能日…

户用光伏电站设计优化方案:为行业打造示范标杆

不可再生能源的日益消耗促使了大家对新能源的使用和推广,光伏发电已经成为国家和企业大力推崇的技术。其中,户用光伏发电是重要组成部分,有非常大的市场发展空间。然而,如何优化设计,提高效率,降低成本&…

牛客——中位数图(连续子数组和二维前缀和)

链接:登录—专业IT笔试面试备考平台_牛客网 来源:牛客网 题目描述 给出1~n的一个排列,统计该排列有多少个长度为奇数的连续子序列的中位数是b。中位数是指把所有元素从小到大排列后,位于中间的数。 输入描述: 第一行为两个正…

Java统计GitLab代码量

1、生成密钥 2、添加依赖 <dependency><groupId>org.gitlab4j</groupId><artifactId>gitlab4j-api</artifactId><version>5.3.0</version></dependency> Java代码实现 统计所有项目的代码行数&#xff1a; private Stri…

C++函数分文件编写之VScode版

VScode实现函数的分文件编写 1.下载插件创建项目2.分文件编写内容3.修改主函数文件名 我在分享内容时经常用的软件是VScode&#xff0c;相信有些内存敏感或需要VScode便利性的小伙伴也是更愿意使用VScode。那么接下来我们就盘一盘怎样使用VScode实现分文件编写。 1.下载插件创建…

2023年06月CCF-GESP编程能力等级认证Python编程二级真题解析

Python等级认证GESP(1~6级)全部真题・点这里 一、单选题(共15题,共30分) 第1题 高级语言编写的程序需要经过以下()操作,可以生成在计算机上运行的可执行代码。 A:编辑 B:保存 C:调试 D:编译 答案:D 第2题 能够实现下面流程图功能的伪代码是( )。 A:if …

动力电池智能工厂数字孪生可视化,助力新能源汽车产业数字化转型

动力电池智能工厂数字孪生可视化&#xff0c;助力新能源汽车产业数字化转型。随着新能源汽车产业的快速发展&#xff0c;动力电池作为新能源汽车的核心组成部分&#xff0c;其生产制造的数字化转型也成为了行业关注的焦点。动力电池智能工厂数字孪生可视化平台作为一种新型的技…

【PyQt5】一些基本操作

文章目录 前言一、查看自己的PyQt版本代码运行结果 二、查看PyQt5 的类或者对象的属性代码运行结果demo_pulsresult 三、帮助文档代码结果 前言 包括以下 查看自己的PyQt版本、查看某个类的使用方法 一、查看自己的PyQt版本 代码 import PyQt5.QtCore print(PyQt5.QtCore.P…

Web html和css

目录 1 前言2 HTML2.1 元素(Element)2.1.1 块级元素和内联(行级)元素2.1.2 空元素 2.2 html页面的文档结构2.3 常见标签使用2.3.1 注释2.3.2 标题2.3.3 段落2.3.4 列表2.3.5 超链接2.3.6 图片2.3.7 内联(行级)标签2.3.8 换行 2.4 属性2.4.1 布尔属性 2.5 实体引用2.6 空格2.7 D…