大家好,本文从0到1详细讲解两种基于Keras
的建模方法:
-
基于
Sequential
的建模;快速方便,易上手 -
基于函数式
API
的建模;易于扩展,灵活性强
文章目录
- 你会学到什么?
- 技术提升
- 导入内置数据集
- 数据缩放和标签编码
- 搭建Sequential网络模型
- 查看网络信息
- 总层数
- 每层网络名
- 每层形状
- 显示各层权重形状
- 显示模型信息
- 编译模型
- 回调函数
- 训练模型
- 指标可视化
- tensorboard使用
- 构建函数式模型
- 网络可视化
你会学到什么?
通过本文你将学到下面10个实用的知识点,快速掌握基于Kera搭建神经网络模型的流程:
-
如何导入keras的内置数据集
-
keras如何实现one-hot编码
-
如何定义keras的Sequential模型,包含卷积层、池化层、Dropout层等
-
如何查看各个层基本信息,比如层的名称、权重、形状等
-
模型的编译、训练
-
如何创建回调函数并使用它
-
如何将模型的精度和准确率指标进行可视化
-
如何使用TensorFlow的Tensorboard进行可视化
-
如何搭建基于函数式API的keras模型
-
如何将神经网络结构图进行可视化
技术提升
本文由技术群粉丝分享,项目源码、数据、技术交流提升,均可加交流群获取,群友已超过2000人,添加时最好的备注方式为:来源+兴趣方向,方便找到志同道合的朋友
方式①、添加微信号:dkl88191,备注:来自CSDN +研究方向
方式②、微信搜索公众号:Python学习与数据挖掘,后台回复:加群
导入内置数据集
# 导入数据集
from keras.datasets import cifar10
(train_images, train_labels), (test_images, test_labels) = cifar10.load_data()
train_images.shape, test_images.shape, train_labels.shape, test_labels.shape
Out[1]:
((50000, 32, 32, 3), (10000, 32, 32, 3), (50000, 1), (10000, 1))
可以看到cifar服装图片数据集存在50000个训练样本,10000个测试样本;数据集是四维的。
数据缩放和标签编码
神经网络中一般输入较小的数值,需要对数据进行缩放:
# 将像素的值标准化至0到1
train_images, test_images = train_images / 255.0, test_images / 255.0
同时对标签labels进行one-hot编码:
# 标签编码
from keras.utils.np_utils import to_categorical
one_hot_train_labels = to_categorical(train_labels)
one_hot_test_labels = to_categorical(test_labels)
搭建Sequential网络模型
搭建基于Sequential的网络模型:
import tensorflow as tf
from keras.models import Sequential
from keras.layers import Dense,Flatten,Conv2D,MaxPooling2D,Dropout,Activation,ZeroPadding2D
from tensorflow.keras import datasets, layers, models
# Sequential模型实例化
model = Sequential()
# 卷积层1
model.add(Conv2D(filters = 32, # filters个数
kernel_size = (3,3), # 卷积核大小
padding="same", # 边界填充方式
input_shape=(32,32,3), # 输入数据shape
activation="relu" # 激活函数
))
# Dropout层1
model.add(Dropout(0.25)) # dropout比例
# 最大池化层1
model.add(MaxPooling2D(pool_size=(2,2)))
# 卷积层2
model.add(Conv2D(64, kernel_size=(3,3), padding="same",activation="relu"))
# 最大池化层2
model.add(MaxPooling2D(pool_size=(2,2)))
# Dropout层2
model.add(Dropout(0.2)) # dropout比例
# 拉直层
model.add(Flatten())
# 密集连接层
model.add(Dense(128,activation="relu"))
# Dropout层3
model.add(Dropout(0.25))
# 输出层:10表示的最终数据的分类数目
model.add(Dense(10, activation="softmax")) # 多分类使用softmax激活函数
在多分类问题的最后全连接层中,激活函数使用softmax函数;它输出的是每个分类的概率值,且它们的概率之和为;取最大的概率所在的类。
查看网络信息
查看所搭建的网络层的基本信息:
总层数
In [5]:
len(model.layers) # 总层数
Out[5]:
10
每层网络名
In [6]:
for i in range(len(model.layers)):
print(f'第 {i + 1} 层网络名称:{model.layers[i].name}')
第 1 层网络名称:conv2d
第 2 层网络名称:dropout
第 3 层网络名称:max_pooling2d
第 4 层网络名称:conv2d_1
第 5 层网络名称:max_pooling2d_1
第 6 层网络名称:dropout_1
第 7 层网络名称:flatten
第 8 层网络名称:dense
第 9 层网络名称:dropout_2
第 10 层网络名称:dense_1
每层形状
In [7]:
for i in range(len(model.layers)):
print(f'第 {i + 1} 层网络shape:{model.layers[i].input.shape}')
第 1 层网络shape:(None, 32, 32, 3)
第 2 层网络shape:(None, 32, 32, 32)
第 3 层网络shape:(None, 32, 32, 32)
第 4 层网络shape:(None, 16, 16, 32)
第 5 层网络shape:(None, 16, 16, 64)
第 6 层网络shape:(None, 8, 8, 64)
第 7 层网络shape:(None, 8, 8, 64)
第 8 层网络shape:(None, 4096)
第 9 层网络shape:(None, 128)
第 10 层网络shape:(None, 128)
显示各层权重形状
In [8]:
for i in range(len(model.layers)):
print(i, model.layers[i].name, ":") # 每层的名称
weights = model.layers[i].get_weights() # 获取每层的权重
print(f'第{i}的权重层数: {len(weights)}')
for j in range(len(weights)): # 每个网络的每层权重数
print("====>",j, weights[j].shape)
0 conv2d :
第0的权重层数: 2
====> 0 (3, 3, 3, 32)
====> 1 (32,)
1 dropout :
第1的权重层数: 0
2 max_pooling2d :
第2的权重层数: 0
3 conv2d_1 :
第3的权重层数: 2
====> 0 (3, 3, 32, 64)
====> 1 (64,)
4 max_pooling2d_1 :
第4的权重层数: 0
5 dropout_1 :
第5的权重层数: 0
6 flatten :
第6的权重层数: 0
7 dense :
第7的权重层数: 2
====> 0 (4096, 128)
====> 1 (128,)
8 dropout_2 :
第8的权重层数: 0
9 dense_1 :
第9的权重层数: 2
====> 0 (128, 10)
====> 1 (10,)
In [9]:
# 同时显示网络层名称、input和output
for i in range(len(model.layers)):
print(i, model.layers[i].name)
print(i, model.layers[i].input)
print(i, model.layers[i].output)
print("\n")
显示模型信息
In [10]:
model.summary() # 显示模型信息
Model: "sequential"
_________________________________________________________________
Layer (type) Output Shape Param #
=================================================================
conv2d (Conv2D) (None, 32, 32, 32) 896
dropout (Dropout) (None, 32, 32, 32) 0
max_pooling2d (MaxPooling2D (None, 16, 16, 32) 0
)
conv2d_1 (Conv2D) (None, 16, 16, 64) 18496
max_pooling2d_1 (MaxPooling (None, 8, 8, 64) 0
2D)
dropout_1 (Dropout) (None, 8, 8, 64) 0
flatten (Flatten) (None, 4096) 0
dense (Dense) (None, 128) 524416
dropout_2 (Dropout) (None, 128) 0
dense_1 (Dense) (None, 10) 1290
=================================================================
Total params: 545,098
Trainable params: 545,098
Non-trainable params: 0
_________________________________________________________________
编译模型
网络编译的时候通常需要指定3个参数:
-
优化器optimizer
-
损失函数loss
-
评价指标metrics
In [11]:
model.compile(optimizer='rmsprop', # 优化器
loss='categorical_crossentropy', # 多分类交叉熵categorical_crossentropy
metrics=['accuracy'] # 评价指标
)
回调函数
在使用TensorBoard的时候需要
In [12]:
# 后面tensorborad使用需要
tf_callback = tf.keras.callbacks.TensorBoard(log_dir="./logs") # 指定log_dir路径
存放路径为当前路径下的logs文件夹下
训练模型
history = model.fit(train_images, # x
one_hot_train_labels, # y
epochs=20, # 训练轮次
batch_size=1024, # 每次训练使用样本小批量
validation_split=0.2, # 验证集比例
callbacks=[tf_callback], # 回调函数
verbose=1 # 是否显示训练详细信息,1-显示 0-不显示
# validation_data=[x_val,y_val] # 验证集的数据
)
当verbose=1的时候会显示每轮训练的具体信息:
指标可视化
主要是针对精度和损失值的可视化
In [14]:
history_data = history.history # 字典形式
for keys in history_data:
print(keys)
loss
accuracy
val_loss
val_accuracy
In [15]:
loss = history_data["loss"]
val_loss = history_data["val_loss"]
# 原文 acc = history_data["acc]
acc = history_data["accuracy"] # 改动:精度acc使用全称accuracy
val_acc = history_data["val_accuracy"]
In [16]:
# 1、损失loss
import matplotlib.pyplot as plt
%matplotlib inline
epochs = range(1, len(loss) + 1) # 作为横轴
plt.plot(epochs, loss, "bo", label="Training Loss")
plt.plot(epochs, val_loss, "b", label="Validation Loss")
plt.xlabel("Epochs")
plt.ylabel("Loss")
plt.legend()
plt.title("Training and Validation Loss")
plt.show()
# 2、精度acc
plt.plot(epochs, acc, "bo", label="Training Acc")
plt.plot(epochs, val_acc, "b", label="Validation Acc")
plt.xlabel("Epochs")
plt.ylabel("Acc")
plt.legend()
plt.title("Training and Validation Acc")
plt.show()
tensorboard使用
首次使用的时候需要先加载两个环境:
In [18]:
%load_ext tensorboard
In [19]:
%tensorboard --logdir logs
然后在notebook页面中会直接显示Tensorboard:
除此之外,你也可以通过localhost:6006
到本地网页查看:
显示的内容就是每轮的loss和acc
构建函数式模型
上面的网络模型是基于Sequential;下面对比构建出基于函数式API
的等效模型:
from keras.models import Model
from keras.layers import Input
from keras.layers import Dense
from keras.layers import Flatten
from keras.layers import Conv2D
from keras.layers import MaxPooling2D
from keras.layers import Dropout
from keras.layers import Activation
from keras.layers import ZeroPadding1D
# 第一步:实例化输入层
cifar_input = Input(shape=(32,32,3),
name="input")
# 第二步:中间层的不断传递
conv1 = Conv2D(32,
kernel_size=(3,3),
padding="same",
activation="relu",
name="conv1")(cifar_input)
drop1 = Dropout(0.25, name="drop1")(conv1)
maxpool1 = MaxPooling2D(pool_size=(2,2), name="maxpool1")(drop1)
conv2 = Conv2D(64,
kernel_size=(3,3),
padding="same",
activation="relu",
name="conv2")(maxpool1)
maxpool2 = MaxPooling2D(pool_size=(2,2), name="maxpool2")(conv2)
drop2 = Dropout(0.25, name="drop2")(maxpool2)
flatten = Flatten(name="flatten")(drop2)
dense1 = Dense(128, activation="relu")(flatten)
drop3 = Dropout(0.25, name="drop3")(dense1)
# 第三步:输出层
output = Dense(10, activation="softmax")(drop3)
# 第四步:实例化Model类:传入输入和输出信息
model = Model(inputs=cifar_input, outputs=output)
model.summary()
打印出来的效果:
Model: "model"
_________________________________________________________________
Layer (type) Output Shape Param #
=================================================================
input (InputLayer) [(None, 32, 32, 3)] 0
conv1 (Conv2D) (None, 32, 32, 32) 896
drop1 (Dropout) (None, 32, 32, 32) 0
maxpool1 (MaxPooling2D) (None, 16, 16, 32) 0
conv2 (Conv2D) (None, 16, 16, 64) 18496
maxpool2 (MaxPooling2D) (None, 8, 8, 64) 0
drop2 (Dropout) (None, 8, 8, 64) 0
flatten (Flatten) (None, 4096) 0
dense_2 (Dense) (None, 128) 524416
drop3 (Dropout) (None, 128) 0
dense_3 (Dense) (None, 10) 1290
=================================================================
Total params: 545,098
Trainable params: 545,098
Non-trainable params: 0
_________________________________________________________________
网络可视化
通过keras自带的plot_model能够绘制出当前模型的框架。
首先需要安装两个库:pydot 和 graphviz
。其中graphviz
的安装可能你会遇到些困难;特别是在windows系统下,希望你有耐心解决。
pip install pydot
pip install graphviz
安装完成之后在命令行输入dot -version
出现下面的界面则表示安装成功:
然后就可以绘图了:
from keras.utils.vis_utils import plot_model
plot_model(model, to_file="model_graph.png", show_shapes=True)