一篇文章搞定《动手学深度学习》-（李沐）PyTorch版本的所有内容

news2026/2/14 12:36:35

简介

阅读指南

1. 深度学习简介

2. 预备知识

3. 深度学习基础

4. 深度学习计算

5. 卷积神经网络

6. 循环神经网络

7. 优化算法

8. 计算性能

9. 计算机视觉

10. 自然语言处理

环境

参考（大家可以在这里下载代码）

原书地址（大家可以在这里阅读电子版PDF内容）

引用

阅读指南

3.1 线性回归
3.2 线性回归的从零开始实现
3.3 线性回归的简洁实现
3.4 softmax回归
3.5 图像分类数据集（Fashion-MNIST）
3.6 softmax回归的从零开始实现
3.7 softmax回归的简洁实现
3.8 多层感知机
3.9 多层感知机的从零开始实现
3.10 多层感知机的简洁实现
3.11 模型选择、欠拟合和过拟合
3.12 权重衰减
3.13 丢弃法
3.14 正向传播、反向传播和计算图
3.15 数值稳定性和模型初始化
3.16 实战Kaggle比赛：房价预测

4. 深度学习计算

4.1 模型构造
4.2 模型参数的访问、初始化和共享
4.3 模型参数的延后初始化
4.4 自定义层
4.5 读取和存储
4.6 GPU计算

5. 卷积神经网络

5.1 二维卷积层
5.2 填充和步幅
5.3 多输入通道和多输出通道
5.4 池化层
5.5 卷积神经网络（LeNet）
5.6 深度卷积神经网络（AlexNet）
5.7 使用重复元素的网络（VGG）
5.8 网络中的网络（NiN）
5.9 含并行连结的网络（GoogLeNet）
5.10 批量归一化
5.11 残差网络（ResNet）
5.12 稠密连接网络（DenseNet）

6. 循环神经网络

6.1 语言模型
6.2 循环神经网络
6.3 语言模型数据集（周杰伦专辑歌词）
6.4 循环神经网络的从零开始实现
6.5 循环神经网络的简洁实现
6.6 通过时间反向传播
6.7 门控循环单元（GRU）
6.8 长短期记忆（LSTM）
6.9 深度循环神经网络
6.10 双向循环神经网络

7. 优化算法

7.1 优化与深度学习
7.2 梯度下降和随机梯度下降
7.3 小批量随机梯度下降
7.4 动量法
7.5 AdaGrad算法
7.6 RMSProp算法
7.7 AdaDelta算法
7.8 Adam算法

8. 计算性能

8.1 命令式和符号式混合编程
8.2 异步计算
8.3 自动并行计算
8.4 多GPU计算

9. 计算机视觉

9.1 图像增广
9.2 微调
9.3 目标检测和边界框
9.4 锚框
9.5 多尺度目标检测
9.6 目标检测数据集（皮卡丘）
9.7 单发多框检测（SSD）
9.8 区域卷积神经网络（R-CNN）系列
9.9 语义分割和数据集
9.10 全卷积网络（FCN）
9.11 样式迁移
9.12 实战Kaggle比赛：图像分类（CIFAR-10）
9.13 实战Kaggle比赛：狗的品种识别（ImageNet Dogs）

10. 自然语言处理

10.1 词嵌入（word2vec）
10.2 近似训练
10.3 word2vec的实现
10.4 子词嵌入（fastText）
10.5 全局向量的词嵌入（GloVe）
10.6 求近义词和类比词
10.7 文本情感分类：使用循环神经网络
10.8 文本情感分类：使用卷积神经网络（textCNN）
10.9 编码器—解码器（seq2seq）
10.10 束搜索
10.11 注意力机制
10.12 机器翻译

环境

matplotlib==3.3.2
torch==1.1.0
torchvision==0.3.0
torchtext==0.4.0
CUDA Version==11.0

参考（大家可以在这里下载代码）

本书PyTorch实现：Dive-into-DL-PyTorch
本书TendorFlow2.0实现：Dive-into-DL-TensorFlow2.0

原书地址（大家可以在这里阅读电子版PDF内容）

中文版：动手学深度学习 | Github仓库
English Version: Dive into Deep Learning | Github Repo

引用

如果您在研究中使用了这个项目请引用原书:

@book{zhang2019dive,
title={Dive into Deep Learning},
author={Aston Zhang and Zachary C. Lipton and Mu Li and Alexander J. Smola},
note={\url{http://www.d2l.ai}},
year={2020}
}

阅读指南

和原书一样，docs内容大体可以分为3个部分：

第一部分（第1章至第3章）涵盖预备工作和基础知识。第1章介绍深度学习的背景。第2章提供动手学深度学习所需要的预备知识。第3章包括深度学习最基础的概念和技术，如多层感知机和模型正则化。如果读者时间有限，并且只想了解深度学习最基础的概念和技术，那么只需阅读第一部分。
第二部分（第4章至第6章）关注现代深度学习技术。第4章描述深度学习计算的各个重要组成部分，并为实现后续更复杂的模型打下基础。第5章解释近年来令深度学习在计算机视觉领域大获成功的卷积神经网络。第6章阐述近年来常用于处理序列数据的循环神经网络。阅读第二部分有助于掌握现代深度学习技术。
第三部分（第7章至第10章）讨论计算性能和应用。第7章评价各种用来训练深度学习模型的优化算法。第8章检验影响深度学习计算性能的几个重要因素。第9章和第10章分别列举深度学习在计算机视觉和自然语言处理中的重要应用。这部分内容读者可根据兴趣选择阅读。
下图描绘了《动手学深度学习》的结构。

在这里插入图片描述