关注微信公众号:人工智能大讲堂,后台回复udl获取pdf文档。
今天要分享的书是Understanding Deep Learning,作者是西蒙·普林斯,英国巴斯大学的荣誉教授,其个人学术能力相当强大,在AI领域有着深厚的学术造诣。
通过谷歌学术数据可知,其发表的论文被引用次数高达6988次。
本书2023年5月份才出版,但其电子书下载量已达150k之多,可见其受欢迎程度。
官方网址:
https://udlbook.github.io/udlbook/
https://github.com/udlbook/udlbook/tree/main
目录:
Chapter 1 - Introduction
Chapter 2 - Supervised learning
Chapter 3 - Shallow neural networks
Chapter 4 - Deep neural networks
Chapter 5 - Loss functions
Chapter 6 - Training models
Chapter 7 - Gradients and initialization
Chapter 8 - Measuring performance
Chapter 9 - Regularization
Chapter 10 - Convolutional networks
Chapter 11 - Residual networks
Chapter 12 - Transformers
Chapter 13 - Graph neural networks
Chapter 14 - Unsupervised learning
Chapter 15 - Generative adversarial networks
Chapter 16 - Normalizing flows
Chapter 17 - Variational autoencoders
Chapter 18 - Diffusion models
Chapter 19 - Deep reinforcement learning
Chapter 20 - Why does deep learning work?
Chapter 21 - Deep learning and ethics
本书包含了深度学习所涉及的方方面面,模型,损失函数,训练方法,初始化,评估模型等基础内容。
有了基础,就可以构建上层建筑了,作者开始介绍一些在深度学习领域中一些重要的模型,例如,ResNet中提出的残差连接,编码解码器架构。
最后,作者介绍了深度学习的各个分支,包括处理表格数据的前馈神经网络,CV领域的卷积神经网络,用于生成图像的生成对抗网络,用于处理图数据的图神经网络,多模态领域中用于图像生成的扩散模型,自主学习方法强化学习,NLP领域的循环神经网络。
由于本书今年5月才出版,所以内容与时俱进,例如,NLP领域中的Transformer,目前热度最高的大模型都是基于Transformer开发的,而且大有跨域发展的趋势,例如,视觉Transformer。
每个章节都有大量的可视化图表,这对理解理论知识有很大的帮助,并且作者很暖心地将这些图表提取成了图片供大家在其它地方使用。
另外,最重要的是在作者提供了读者精选问题的答案以及每一章所涉及到的代码。
图表,问答,代码下载链接在前面的官方网址或Github中。
这里,再介绍作者的另一本书:计算机视觉:模型、学习和推理(Computer Vision: Models, Learning and Inference)。
由于我没有读过,所以不过多介绍了,感兴趣的可以自行下载阅读。
www.computervisionmodels.com