【兔子王赠书第6期】Python机器学习实战：基于Scikit-learn与PyTorch的神经网络解决方案

文章目录

前言
推荐图书
- 写给读者
- 内容简介
- 本书目录
- 本书特色
- 推荐理由
粉丝福利
结语

前言

粉丝福利又双叒叕来喽，小伙伴们快来看看吧！

推荐图书

《Python机器学习实战：基于Scikit-learn与PyTorch的神经网络解决方案》

京东直购链接：https://item.jd.com/13901033.html
当当官方旗舰店：https://item.jd.com/10089652823385.html

Python机器学习实战

写给读者

我们一直想要合作写一本以机器学习为主题的书。十年前，我们刚开始接触AI。如今，这个领域已经有了突飞猛进的发展和扩张。作为终身学习者，我们意识到，在最开始接触任何领域时，都需要一份更明晰的资料来清楚地指明前方的道路。在通过阅读、学习和利用所学的知识来加强学习体验的过程中，也需要有一系列明确的解释和偶尔的灵感。我们在软件开发、数据科学和机器学习的学术经历与职业生涯中经常使用Python。通过这本书，我们做了一次非常谦卑的尝试，为绝对零基础的初学者写一本以机器学习为主题的分步骤指南。本书的每一章都包含对概念的解释、代码示例、对代码示例的解释以及代码输出截图。

内容简介

第Ⅰ部分包含4章的内容。第1章讲解不同平台上如何设置Python环境。第2章涉及NumPy和Ndarray。第3章探讨如何用Matplotlib进行可视化。第4章介绍Pandas数据科学库。最开始的这几章都旨在建立编程和基本的数据处理基础，这是学习机器学习的先决条件之一。

第Ⅱ部分探讨传统的机器学习方法。在第5章中，我们先对机器学习领域进行概览，然后讲解如何安装Scikit-learn，并介绍一个简短而快速的使用Scikit-learn的机器学习解决方案示例。第6章详细说明一些方法，以帮助大家理解结构化数据、文本数据和图像数据，并将这些数据转化为机器学习库所能接受的格式。第7章介绍监督学习式，讲解了针对回归问题的线性回归和针对分类问题的逻辑回归和决策树。在每个实验中，我们还展示了如何利用决策边界图（decision boundary plot）来绘制算法所学到的可视化内容。第8章深入研究如何进一步微调机器学习模型。我们解释了一些评估模型性能的想法，过拟合和欠拟合的问题，以及处理这些问题和提升模型性能的方法。第9章继续探讨监督式学习方法并重点介绍朴素贝叶斯和支持向量机。第10章讲解集成学习，这种解决方案将多个较简单的模型结合起来，以获得比单独这些模型更好的性能。在第11章中，我们讨论了无监督学习，并重点关注降维、聚类和频繁模式挖掘方法。每个部分都包含一个使用Scikit-learn实现所讨论方法的完整例子。

最后，第Ⅲ部分中的第12章介绍神经网络和深度学习的基本思想。我们介绍了一个非常流行的开源机器学习框架PyTorch，后续章节的例子都会用到它。第13章讲解人工神经网络，并深入论述了前馈（feedforward）和反向传播（backpropagation）的理论基础，然后要地介绍损失函数（loss function）和一个简单神经网络的例子。在后半部分中，我们解释了如何创建一个能够识别手写数字的多层神经网络。在第14章中，我们讨论卷积神经网络并讲述了一个图像分类案例。第15章探讨递归神经网络，并指导您解决一个序列建模问题。在最后的第16章中，我们论述规划、管理和设计机器学习和数据科学项目的策略。我们还讲解了一个端到端的案例，它很简短，使用了深度学习来进行情感分析。

如果是初次接触这个主题，那么我们强烈建议您按照章节顺序阅读本书，因为其中概念是相互关联的。仔细阅读所有代码，可以随意地尝试修改和调整代码结构、数据集和超参数。

如果对一些主题已经有所了解，请随意跳到自己感兴趣的章节并深入研究相关内容。祝大家学习顺利。

本书目录

第Ⅰ部分 PYTHON机器学习

第1章 Python 3和Jupyter Notebook入门 3

1.1 Python概述 4
1.1.1 Python编程语言的历史 4
1.1.2 Python编程语言的哲学 4
1.1.3 Python的使用范围 5
1.2 安装Python 6
1.2.1 在Linux 发行版上安装 Python 7
1.2.2 在macOS 上安装Python 7
1.3 Python模式 7
1.3.1 交互模式 7
1.3.2 脚本模式 11
1.4 Pip3工具 13
1.5 科学Python生态系统 14
1.6 Python的实现和发行版 14
1.7 Anaconda发行版 15
1.8 小结 16

第2章 NumPy入门 17

2.1 开始使用NumPy 18
2.2 Ndarray的索引 20
2.3 Ndarray的属性 22
2.4 NumPy常量 23
2.5 小结 24

第3章数据可视化入门 25

3.1 用于创建Ndarray的NumPy例程 26
3.2 Matplotlib数据可视化 28
3.3 小结 34

第4章 Pandas入门 35

4.1 Pandas基础知识 36
4.2 Pandas中的Series 36
4.3 Pandas中的数据框架 38
4.4 在数据框架中实现数据的可视化 40
4.5 小结 46

第Ⅱ部分机器学习方法

第5章 Scikit-learn机器学习概述 49

5.1 从数据中学习 50
5.1.1 监督式学习 50
5.1.2 无监督学习 51
5.2 机器学习系统的结构 52
5.2.1 问题理解 53
5.2.2 数据收集 53
5.2.3 数据标注和数据准备 53
5.2.4 数据整理 53
5.2.5 模型的开发、训练和评估 54
5.2.6 模型的部署 54
5.3 Scikit-Learn 55
5.4 安装Scikit-Learn 55
5.5 了解API 56
5.6 第一个Scikit-learn实验 57
5.7 小结 60

第6章为机器学习准备数据 61

6.1 数据变量的类型 62
6.1.1 名目数据 62
6.1.2 次序数据 62
6.1.3 等距数据 63
6.1.4 等比数据 63
6.2 转换 63
6.2.1 转换名目属性 64
6.2.2 转换有序属性 66
6.3 归一化 67
6.3.1 线性函数归一化 68
6.3.2 标准缩放 69
6.4 预处理文本 70
6.4.1 准备NLTK 70
6.4.2 NLP流水线的5个步骤 71
6.4.3 词干提取和词形还原 72
6.4.4 移除停用词 73
6.4.5 准备词向量 73
6.5 预处理图像 75
6.6 小结 77

第7章初探监督式学习方法 79

7.1 线性回归 80
7.2 逻辑回归 86
7.2.1 表达式概率的线与曲线的比较 87
7.2.1 学习参数 87
7.2.2 可视化决策边界 90
7.3 决策树 91
7.3.1 构建决策树 92
7.3.2 Python中的决策树 93
7.4 小结 96

第8章对监督式学习进行调试 97

8.1 训练和测试过程 98
8.2 性能的衡量标准 98
8.2.1 混淆矩阵 99
8.2.2 精确率 100
8.2.3 准确率 100
8.2.3 F值 100
8.2.4 Python中的性能指标 101
8.3 交叉验证 103
8.3.1 为什么要进行交叉验证 104
8.3.2 使用Python进行交叉验证 105
8.4 ROC曲线 106
8.5 过拟合和正则化 109
8.5.1 偏差和方差 112
8.5.2 正则化 113
8.6 超参数调优 116
8.7 小结 120

第9章再谈监督学习方法 121

9.1 朴素贝叶斯 122
9.1.1 贝叶斯定理 122
9.1.2 条件概率 123
9.1.3 朴素贝叶斯的运作方式 123
9.1.4 多项朴素贝叶斯 124
9.1.5 Python中的朴素贝叶斯 124
9.2 支持向量机 126
9.2.1 SVM的运作方式 127
9.2.2 非线性分类 128
9.2.3 SVM中的核技巧 129
9.2.4 Python中的支持向量机 130
9.3 小结 134

第10章集成学习方法 135

10.1 Bagging算法和随机森林 136
10.2 Boosting算法 140
10.3 Stacking集成 146
10.4 小结 150

第11章无监督学习方法 151

11.1 降维 152
11.1.1 了解维数灾难 152
11.1.2 主成分分析 153
11.1.3 Python中的主成分分析 154
11.2 聚类 157
11.2.1 使用k-均值进行聚类 158
11.2.2 Python中的k-均值 158
11.2.3 什么是正确的k 161
11.2.4 聚类之图像分割 162
11.2.5 使用DBSCAN进行聚类 165
11.3 频繁模式挖掘 168
11.3.1 购物篮分析 168
11.3.2 Python中的频繁模式挖掘 169
11.4 小结 172

第Ⅲ部分神经网络和深度学习

第12章神经网络和PyTorch基础 175

12.1 安装PyTorch 177
12.2 PyTorch的基础知识 177
12.2.1 创建张量 177
12.2.2 张量操作 179
12.3 感知器 181
12.4 人工神经网络 185
12.5 小结 186

第13章前馈神经网络 187

13.1 前馈神经网络 188
13.1.1 训练神经网络 189
13.1.2 损失函数 193
13.2 使用人工神经网络进行回归 195
13.3 激活函数 198
13.3.1 ReLU 激活函数 198
13.3.2 Sigmoid 激活函数 199
13.3.3 tanh激活函数 200
13.4 多层人工神经网络 200
13.4.1 PyTorch中的神经网络（NN）类 206
13.4.2 过拟合和Dropout 208
13.5 分类手写数字 209
13.6 小结 214

第14章卷积神经网络 215

14.1 卷积运算 216
14.2 CNN的结构 219
14.3 在PyTorch中使用卷积神经网络 221
14.4 使用CNN进行图像分类 223
14.5 卷积神经网络的深度网络 233
14.5 小结 234

第15章循环神经网络 235

15.1 循环单元 236
15.2 RNN的类型 238
15.2.1 一对一 238
15.2.2 一对多 238
15.2.3 多对一 238
15.2.4 多对多 239
15.3 Python中的RNN 239
15.4 长短期记忆 240
15.4.1 LSTM单元 241
15.4.2 时间序列预测 242
15.5 门控循环单元 252
15.6 小结 252

第16章项目实战 253

16.1 数据科学生命周期 254
16.2 如何提供ML应用 257
16.3 通过实践学习 258
16.3.1 定义问题 258
16.3.2 数据 259
16.3.3 准备模型 263
16.3.4 序列化模型，以便未来用于预测 268
16.3.5 托管模型 270
16.4 未来可期 271