1. 使用MNIST数据集进行图像分类
1.1 MNIST数据集
在深度学习的历史当中,对 MNIST 数据集里的70000张手写体数字的图像进行0到9的正确分类是一个重大的进展。如今,这个问题被认为是微不足道的,但是使用 MNIST 进行图像分类已经成为深度学习的一个 Hello World 练习。
以下是 MNIST 数据集中包含的40张图像:
1.2 训练和测试数据及其标签
在处理用于深度学习的图像时,我们既需要图像本身(通常表示为 X
),也需要这些图像对应的正确的标签(通常表示为 Y
)。 此外,我们都需要一组 X
和 Y
以训练模型,然后需要单独的一组 X
和 Y
值以测试模型的性能。因此,我们需要将 MNIST 数据集分为4个部分:
x_train
:用于训练神经网络的图像。y_train
:正确的x_train
图片标签,用于在训练期间评估模型的预测。x_test
:单独留出来的图像,用来在训练模型后测试模型的性能。y_test
:正确的x_test
图像标签,