知识提要
数据集使用VOC2012
CNN 卷积神经网络Convolutional Neural Network
GPU图像处理单元=Graphic Processing Unit)图形处理器
convolution 卷积
ReLU全名Rectified Linear Unit,意思是修正线性单元
bn全称Batch Normalization批标准化
FC全连接神经网络是一种最基本的神经网络结构,英文为Full Connection
语义分割和实例分割
语义分割就是把人和动物分开,实例分割就是在此基础上把人也区分开
损失函数
预测概率为95%,说明挺好了,权值要设的比较低,比较简单
若概率为0.5,比较难,权值比较高,平方以后权值差异较大
iou计算
绿框的数值和黄框的数值加起来-801
Miou计算
IOU计算结果为左图交集的结果除以右图并集的结果
MIOU即求计算所有类别的平均值
卷积神经网络CNN
传统网络一共特征值,卷积网络三维
卷积的作用
图像颜色通道
将三个通道的结果叠加在一起
在已有卷积的基础上继续做卷积
卷积层的重要参数
步长
卷积核尺寸
一般取3X3
边缘填充
+pad1
在边界上加上一圈0,可以让边界上的数字利用率变高,且不会对最终数据产生影响
卷积核个数
卷积结果计算
卷积参数共享
每个区域用相同的核处理
池化的作用
压缩作用
整体网络架构
两次卷积一次池化
只有带参数计算的才能算一层神经网络
下图为7层
感受野的作用
Unet网络
Unet++版本
实例
预处理
此算法将一张图片中每个细胞都单独拎出来作为一个标签,预处理就是将众多的标签进行合并
开始讲解视频 https://www.bilibili.com/video/BV1zb411R7vU/?p=21&spm_id_from=pageDriver&vd_source=f991aae54cfa30efc5899b3ae41bbbed第21集开始
debug视频第23集:特征融合方法演示
train文件数据增强
使用 Albumentations 库进行数据加强
操作步骤
dataset文件
第一部通过opencv将图片读入
archs文件
查看train函数流程
在forward()函数前面打断点,是入口地址
val文件画图
保存原始数据,分割数据,标签数据
文件运行的参数即模型的名字在哪个文件夹中
其实和训练的流程一样
model.eval()模式即验证模式,参数不发生更新
文件保存内容解读
E:\大学文件\Unet(没跑过)\unet++\models\dsb2018_96_NestedUNet_woDS\model.pth保留 模型文件
log文件记录
lr 学习率
数据集存放位置
E:\大学文件\Unet(成功)\unet++\inputs\dsb2018_96\images 存放原始图片
E:\大学文件\Unet(成功)\unet++\inputs\dsb2018_96\masks 存放标签图片