前期我们分享tensorflow以及pytorch时,分享过tensorflow以及pytorch的分类神经网络的搭建步骤,在哪里我们使用的训练集是mnist,同样Keras分类神经网络的搭建,我们同样使用mnist数据集来进行分类神经网络的搭建(有关mnist数据集,大家可以参考往期文章)
数据预处理
Keras 以及集成MNIST 数据包,再分成训练集和测试集。x 是一张图片,y 是每张图片对应的标签,即它对应的数字(0---9)。
输入的 x 变成 60,000*784 的数据,然后除以 255 进行标准化,因为每个像素都是在 0 到 255 之间的,标准化之后就变成了 0 到 1 之间。(为何是这样的数据,大家也可以参考往期文章特意介绍过MNIST数据集)
对于 y,要用到 Keras 改造的 numpy 的一个函数 np_utils.to_categorical,把 y 变成了 one-hot 的形式,即之前 y 是一个数值, 在 0-9 之间,现在是一个大小为 10 的向量,它属于哪个数字,就在哪个位置为 1,其他位置都是 0。
import numpy as np
np.random.seed(1337)
from keras.datasets import mnist
from keras.utils import np_utils
from keras.models import Sequential
from keras.layers import Dense, Activation #激励函数
from keras.optimizers import RMSprop # 优化器
#import matplotlib.pyplot as plt # 可视化模块
# 分类
# 若是首次运行,keras会自动下载MNIST数据集(X_train, y_train), (X_test, y_test) = mnist.load_data()X_train = X_train.reshape(X_train.shape[0], -1) / 255. #标准化数据
X_test = X_test.reshape(X_test.shape[0], -1) / 255. #标准化数据
y_train = np_utils.to_categorical(y_train, num_classes=10)
y_test = np_utils.to_categorical(y_test, num_classes=10)
# 打印一下数据的形状print(X_train[1].shape)
print(y_train[:3]) # one-hot 的形式
"""
(784,)
[[0. 0. 0. 0. 0. 1. 0. 0. 0. 0.]
[1. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
[0. 0. 0. 0. 1. 0. 0. 0. 0. 0.]]
"""
搭建神经网络
models.Sequential,用来一层一层的去建立神经网络
Dense 神经层,32 是输出的维度,784 是输入的维度
使用relu激励函数, 经过激励函数之后,变成了非线性的数据。 然后再把这个数据传给下一个神经层 Dense 定义它有 10 个输出的 feature。此处不需要再定义输入的维度,因为它接收的是上一层的输出
然后使用 softmax 函数,用来分类
再使用RMSprop优化器对神经网络进行优化
最后使用model.compile来对神经网络进行激励
model = Sequential([
Dense(32, input_dim=784),
Activation('relu'),
Dense(10),
Activation('softmax'),
])rmsprop = RMSprop(lr=0.001, rho=0.9, epsilon=1e-08, decay=0.0)
model.compile(optimizer=rmsprop, loss='categorical_crossentropy',metrics=['accuracy'])
训练神经网络
神经网络搭建完成后,就可以对神经网络进行训练,训练使用到的是 fit 函数,传入 x 与y,epochs 表示把整个数据训练多少次,batch_size 每批处理多少个数据,训练完成后,可以看到训练的结果
model.fit(X_train, y_train, epochs=2, batch_size=32)
测试神经网络
使用model.evaluate函数,把测试数据集放入函数中,便可以得到测试数据的loss以及accuracy
打印一下loss以及accuracy,查看训练结果
loss, accuracy = model.evaluate(X_test, y_test)
print('test loss: ', loss)
print('test accuracy: ', accuracy)
以上便是keras分类神经网络的搭建过程了,下期我们介绍一下如何使用keras CNN卷积神经网络来对图片进行分类,下期的数据集是小编收集的小雪人的照片,我们使用此小雪人的照片来让神经网络认识雪人或者非雪人
动画详解transformer
更多transformer,VIT,swin tranformer
参考头条号:人工智能研究所
v号:启示AI科技
微信中复制如下链接,打开,免费体验chatgpt
https://wx2.expostar.cn/qz/pages/manor/index?id=1137&share_from_id=79482&sid=24