回顾 — SFA:简化快速 AlexNet(模糊分类)

news2025/1/11 11:37:15
模糊图像的样本

一、说明

        在本文回顾了基于深度学习的模糊图像分类(SFA)。在本文中:Simplified-Fast-AlexNet (SFA)旨在对图像是否因散焦模糊高斯模糊雾霾模糊运动模糊而模糊进行分类。

二、大纲

  1. 图像模糊建模简要概述
  2. 简化快速 AlexNet (SFA):网络架构
  3. 数据集
  4. 实验结果

三、图像模糊建模概述

  • 图像模糊问题可以看作是从高质量图像到低质量模糊图像的图像退化过程:

  • 其中F表示退化图像,f是无损图像,h 表示模糊核,又名点扩散函数(PSF),*表示卷积算子,n表示附加噪声,这里,n是高斯白噪声。

3.1. 高斯模糊

  • 在许多实际应用中,例如遥感和卫星成像,高斯核函数被视为大气湍流的核函数:

  • 其中,σ为核半径,R为支撑区域,通常满足3σ标准

3.2. 运动模糊

  • 运动模糊是另一种需要考虑的模糊,它是由目标和相机之间的相对线性运动引起的:

  • 其中M表示运动长度(以像素为单位),ω表示运动方向与x轴之间的角度。

3.3. 散焦模糊

  • 散焦模糊是日常生活中最常见的,可以通过柱面函数来建模:

  • 其中r表示 模糊半径,与散焦程度成正比。

3.4. 雾霾模糊

  • 雾霾模糊是由自然雾的干扰造成的。在本文中,雾霾模糊没有通过任何PSF来模拟,因为现实生活中存在大量样本并且易于收集用于实验应用。

四、简化快速AlexNet(SFA):网络架构

简化快速 AlexNet (SFA):网络架构

  • 5个卷积层1个全连接层
  • AlexNet每个卷积层的输出数按0.5的比例进行比例压缩。这样做的原因是,与 2012 年 ImageNet 分类竞赛中数千个图像类别相比,四种模糊类型分类是一个相对简单的任务。
  • 另一方面,由于80%以上的参数存储在FC中,因此从AlexNet的原始模型中删除了前两个FC,以提高速度和实时性。
  • 在第 1、2 和 5 层使用批量标准化,而不是原始的局部响应标准化。
  • 输入:输入图像的大小为227×227×3。
  • 第一层:Conv_1:48 个大小为 11×11 的核,步长为 4 像素,pad 为 0;MaxPool_1:大小为 3×3 的内核,2 个像素的步长和 0 的填充。获得 48×27×27 的特征图作为输出。
  • 第二层:Conv_2 使用大小为 5×5 的内核、1 像素的步长和 2 像素的垫;MaxPool_2:大小为 3×3 的内核,步长为 1 像素,填充为 0。
  • 第三层:Conv_3:尺寸为 5×5 的内核,1 像素的步长和 2 像素的填充。
  • 第 4 层:Conv_4 为:尺寸为 3×3 的内核,2 像素的步长和 0 的填充。
  • 第5层:Conv_5:尺寸为3×3的内核,1像素的步长和1的垫;MaxPool_5:内核大小为 3×3,步长为 2 像素,pad 为 0。
  • 第 6 层:全连接层和 ReLU。
  • 因此,SFA不同隐藏层的数据流如下: 227×227×3 > 27×27×48 > 13×13×128 > 13×13×192 > 13×13×192 > 6×6× 128 > 1×1×4。
  • 使用咖啡。

五、数据集

5.1. 训练数据集

  • 使用200,000 个 128×128×3 全局模糊块进行训练。
  • 简而言之,这些补丁是从牛津建筑数据集和加州理工学院 101 数据集应用的合成高斯模糊、运动模糊和散焦模糊中裁剪出来的,以及从在线网站收集的真实雾霾模糊图像中裁剪出来的。

5.2. 测试数据集1

  • 选择 Berkeley 数据集 200 张图像和 Pascal VOC 2007 数据集作为测试数据集。
  • 总共获得了22,240 个全局模糊测试样本块,其中 5560 个雾霾模糊图像块与训练样本具有相同的来源。

5.3. 测试数据集2

  • 构建了由10,080 个自然全局模糊图像块组成的数据集。这些样本都是从与训练数据集中的雾霾模糊样本相同的网站收集的。

六、实验结果

6.1. 损耗曲线和精度曲线

AlexNet和SFA的损失曲线和准确率曲线

  • 尽管AlexNet和SFA这两个模型的细节有所不同,但损失和准确率都达到了相似的值,这表明两个模型在分类准确率标准方面的性能相当。

6.2. 与AlexNet的比较

与AlexNet的比较

  • P_N:模型参数编号。
  • L_N:模型深度。
  • F_T:单幅图像的前向传播时间。
  • B_T:单幅图像的误差后向传播时间。
  • CLF_T:识别单张图像的时间。
  • Tr_T:模型训练时间。
  • 错误:测试数据集1的分类错误率。

AlexNet的P_N大约是SFA的1000倍。

SFA的CLF_T比AlexNet经济0.5s ,这表明SFA更适合实际应用。

SFA的总训练时间不到一天,而AlexNet则需要大约两天。

SFA的分类错误率仅比AlexNet大0.0105 。

6.3. SOTA比较

  • 两步法[4]、单层神经网络[8]和DNN[9]的分类精度来自原始文章。(这很奇怪,因为数据集不同。但可以理解的是,可能无法重新实现。)
  • Accuracy1 是在测试数据集 1 上进行测试,Accuracy2 是在测试数据集 2 上进行测试。
  • 基于学习特征的方法的预测精度(>90%)通常优于手工制作特征的方法(<90%)。
  • SFA在模拟测试数据集上的分类准确率为96.99%,略低于AlexNet的97.74%,但仍然优于DNN模型的95.2%。
  • 此外,SFA在自然模糊数据集上的最佳性能为93.75%,略低于94.10%,但SFA的速度和实时性明显优于AlexNet

七、参考

[2017 ISA] [SFA]
基于深度学习的模糊图像分类 
曾锡豪

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1202391.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

正点原子嵌入式linux驱动开发——Linux IIO驱动

工业场合里面也有大量的模拟量和数字量之间的转换&#xff0c;也就是常说的ADC和DAC。而且随着手机、物联网、工业物联网和可穿戴设备的爆发&#xff0c;传感器的需求只持续增强。比如手机或者手环里面的加速度计、光传感器、陀螺仪、气压计、磁力计等&#xff0c;这些传感器本…

卡尔曼滤波器第 1 部分 - 简介

一、说明 这是卡尔曼滤波器系列的第一部分。但这并不是另一本定义繁重的读物&#xff0c;它会给你带来一堆行话和方程式&#xff01;在本文中&#xff0c;我们首先关注需要解决方案的问题&#xff08;当然是卡尔曼滤波器&#xff09;&#xff0c;然后直观地了解卡尔曼滤波器。只…

企业app软件定制开发的特点

企业app软件定制开发的特点 随着移动互联网时代的到来&#xff0c;企业越来越意识到拥有自己的企业app对于提升企业形象、增强市场竞争力的重要性。然而&#xff0c;面对市面上众多的app软件&#xff0c;企业往往需要根据自身的需求和特点进行定制开发。 首先&#xff0c;企业a…

培养财务团队协作,冲破市场经济逆境

在过去&#xff0c;企业财务发展道路上往往只有分析师&#xff0c;财务分析也十分简单&#xff0c;只需要业务上挖掘部分有用数据或做一些简单的“数学题”。这些内容都是由财务分析师来完成的。但随着科技发展、大数据时代的到来&#xff0c;越来越多的企业发现还有许多其他未…

生产企业都期望的制造成本核算总平台(ODOO16)

产品制造成本决定了企业的销售策略以及市场竞争力&#xff0c;因此生产企业财务核心的任务就是准确、及时的核算产品制造成本&#xff0c;面对复杂的业务环节、经营数据&#xff0c;欧易创ODOO业财一体系统到底如何全面核算制造成本的呢&#xff1f;接下来我们详细介绍制造成本…

基于Python+Django的酒店管理系统网站平台开发

一、介绍 酒店管理系统。基于Python开发&#xff0c;前端使用HTML、CSS、BootStrap等技术搭建页面&#xff0c;后端使用Django框架处理用户响应请求&#xff0c;主要功能如下&#xff1a; 分为普通用户和管理员两个角色普通用户&#xff1a;登录、注册、查看房间详情、收藏、…

图像实时采集系统

本方案主要在于解决图像实时采集系统对算法校正的仿真实验&#xff0c;以及采集卡接收电路的验证。 由于图像实时跟踪处理系统需要大量的外场景实验&#xff0c;大部分时候只能通过采集的现场图像以在电脑软件中读取图片的形式来进行验证算法&#xff0c;而无法通过采集卡对接…

企业计算机中了eking勒索病毒如何解毒,eking勒索病毒文件恢复

网络技术的不断发展&#xff0c;为企业的生产生活提供了极大便利&#xff0c;但随之而来的网络安全威胁也不断增加&#xff0c;近期&#xff0c;很多企业的计算机服务器遭到了eking勒索病毒攻击&#xff0c;导致企业的计算机服务器所有数据被加密&#xff0c;无法正常使用&…

thinkPHP8 调试

方法一&#xff1a; config/app.php 把‘config/app.php’ 里面的 ‘show_error_msg’ > false, 改成true; 这样如果网页找不到内容就会显示出具体原因 方法二&#xff1a;.example.env 重命名 为 .env 修改成.env&#xff0c;修改后如果没有找到方法&#xff0c;则会提示…

【深度学习】pytorch——常用工具模块

笔记为自我总结整理的学习笔记&#xff0c;若有错误欢迎指出哟~ 深度学习专栏链接&#xff1a; http://t.csdnimg.cn/dscW7 pytorch——常用工具模块 数据处理 torch.utils.data模块DatasetDataLoadersamplertorch.utils.data的使用 计算机视觉工具包 torchvisiontorchvision.d…

RabbitMQ实战

文章目录 1、简介2、MQ优点缺点MQ的应用场景AMQP工作原理市面上常见的MQ 3、Linux安装RabbitMQ3.1 版本对应3.2 安装socat3.3 下载 Erlang/OTP、安装、验证 erlang方法一&#xff1a;1. 下载2. 将下载的Erlang服务上传到服务器上面3. 解压4. 编译erlang的依赖环境5. 安装Erlang…

【stack题解】逆波兰表达式求值 | 用队列实现栈

逆波兰表达式求值 力扣&#xff08;LeetCode&#xff09;官网 - 全球极客挚爱的技术成长平台 给你一个字符串数组 tokens &#xff0c;表示一个根据 逆波兰表示法 表示的算术表达式。 请你计算该表达式。返回一个表示表达式值的整数。 注意&#xff1a; 有效的算符为 、-、…

ROS1 学习11 坐标系tf 管理系统 简介及demo示例

坐标系是我们非常熟悉的一个概念&#xff0c;也是机器人学中的重要基础&#xff0c;在一个完整的机器人系统中&#xff0c;会存在很多坐标系&#xff0c;这些坐标系之间的位置关系该如何管理&#xff1f; ROS给我们提供了一个坐标系的管理神器——TF。 比如在机械臂形态的机器…

热敏电阻B值含义

1.B值&#xff08;材料常数&#xff09; 也称为β值&#xff0c;该热敏电阻规格是NTC热敏电阻的电阻与温度之间关系的特定曲线。它是一个描述热敏电阻材料物理特性的参数&#xff0c;也是热灵敏度指标&#xff0c;B值越大&#xff0c;表示热敏电阻器的灵敏度越高。应注意的是&a…

Python标准库中隐藏的利器

Python安装之后&#xff0c;其标准库中有的模块&#xff0c;不一定要通过代码来引用&#xff0c;还可以直接在命令行中使用的。 在命令行中直接使用Python标准库的模块&#xff0c;最大的好处就是就是不用写代码&#xff0c;就能使用其中的功能&#xff0c;当临时需要一些某些…

基于SpringBoot+Redis的前后端分离外卖项目-苍穹外卖(四)

编辑员工和分类模块功能开发 1. 编辑员工1.1 需求分析与设计1.1.1 产品原型1.1.2 接口设计 1.2 代码开发1.2.1 回显员工信息功能1.2.2 修改员工信息功能 1.3 功能测试 2. 分类模块功能开发2.1 需求分析与设计2.1.1 产品原型2.1.2 接口设计2.1.3 表设计 2.2 代码实现2.2.1 Mappe…

CSP模拟

1.3n -1 题目描述 给定一个整数n&#xff0c;只能对n进行以下这几种操作&#xff1a; 1.若n是3的倍数除以3 2.加1 3.减1 求最少多少次操作才能使n变为1&#xff1f; 输入 一行一个整数n 输出 一行一个整数表示答案 样例输入 4 样例输出 2 提示 对于样例1:4-…

亚马逊鲲鹏系统强大的指纹系统可有效防止账号关联

亚马逊鲲鹏系统最新的防指纹技术支持绑定不同的代理IP&#xff0c;可以根据ip创建不同的指纹环境&#xff0c;让账号伪装成来自不同地点、不同设备的流量&#xff0c;每个账号环境隔离开来&#xff0c;实现了完全独立的操作任务&#xff0c;避免了账户指纹关联和操作轨迹关联。…

搜集的升压芯片资料

DC-DC升压芯片,输入电压0.65v/1.5v/1.8v/2v/2.5v/2.7v/3v/3.3v/3.6v/5v/12v/24v航誉微 HUB628是一款超小封装高效率、直流升压稳压电路。输入电压范围可由低2V伏特到24伏特&#xff0c;升压可达28V可调&#xff0c;且内部集成极低RDS内阻100豪欧金属氧化物半导体场效应晶体管的…

桌面云架构讲解(VDI、IDV、VOI/TCI、RDS)

目录 云桌面架构 VDI 虚拟桌面基础架构 IDV 智能桌面虚拟化 VOI/TCI VOI 虚拟系统架构 TCI 透明计算机架构 RDS 远程桌面服务 不同厂商云桌面架构 桌面传输协议 什么是云桌面 桌面云是虚拟化技术成熟后发展起来的一种应用&#xff0c;桌面云通常也称为云桌面、VDI等 …