本讲来聊聊深度学习的数学基础。
深度学习听起来很厉害,其实它背后是一些很有趣的数学原理。本讲会用简单的方式解释这些原理,还会用一些具体的例子来帮助你理解。
2.1 初识神经网络
先从一个简单的任务开始:识别手写数字。
想象一下,你有一堆手写数字的图片,你想让计算机识别出这些数字。这听起来是不是有点像魔法?其实,这就是深度学习能做的事情。我们用一个简单的神经网络来解决这个问题。
我们用的是MNIST数据集,这是一个很经典的数据集,包含60,000张训练图片和10,000张测试图片,每张图片都是一个28×28的灰度图像。我们的目标是训练一个神经网络,让它能够识别这些数字。
from keras.datasets import mnist
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()
我们来看看这些数据。
train_