[C#]winform基于C2PNet算法实现室内和室外图像去雾

news2025/1/17 4:11:58

【CP2Net框架】

 https://github.com/YuZheng9/C2PNet 

【CP2Net介绍】

Abstract
考虑到不适定的性质,发展了单图像去模糊的对比正则化,引入了来自负图像的信息作为下界。然而,对比样本是非一致的,因为阴性通常距离清晰(即正)图像很远,使解空间仍然不足。此外,深度脱雾模型的可解释性对脱雾过程的物理研究还没有得到充分的探索。在本文中,我们提出了一种新的课程对比正则化,目标是一个自愿对比空间,而非非自愿对比空间。我们的负片提供了更好的下界约束,可以从1)模糊图像和2)通过其他现有方法进行相应的修复。此外,由于清晰图像和负图像嵌入的相似性不同,多个成分的学习难度本质上是不平衡的。为了解决这个问题,我们定制了一个课程学习策略来重新衡量不同负面因素的重要性。此外,为了提高特征空间的可解释性,我们根据大气散射模型建立了一个具有物理感知能力的双分支单元。通过该单元,以及课程对比正则化,我们建立了我们的脱雾网络,命名为C2PNet。大量的实验表明,我们的C2PNet显著优于最先进的方法,在SOTSindoor和户外数据集上,极端PSNR提升分别为3.94 dB和1.50 dB。
1. Introduction
        雾霾作为一种常见的大气现象,明显降低了拍摄图像的质量,严重限制了后续的高级视觉任务的表现,如车辆再识别[7]和场景理解[35].与其他图像恢复任务求解器[12,13,39,43]的出现类似,需要有效的图像脱模糊技术来处理基于视觉的应用程序。
        基于深度学习的方法在单图像脱模糊方面取得了巨大的成功,可以大致可以分为两类:无物理方法[5,10,17,24]和物理感知方法[4,8,11,34]。对于前者,它们通常使用预测恢复的地面真实图像来加强基于L1/L2距离的一致性,还涉及各种正则化[29,42]作为附加约束来应对不适定特性。请注意,所有这些正则化都忽略了来自负图像的信息作为下界,我们提出了对比正则化(CR)[40]来引入不同的模糊性图像为负,地真图像为正,并进一步使用对比学习[19,20]来保证一个封闭的解空间。此外,研究表明,由于不同的退化模式作为线索,使用更多的负片可以获得更好的性能。然而,问题是这些负内容的内容与正的内容是不同的,它们的嵌入可能太遥远,使得解决方案的空间仍然没有受到限制。
        为了解决这个问题,一个自然的想法是使用共识对比空间1中的负项(见图1中的下面板)作为更好的下限约束,它可以很容易地从模糊的输入和相应的修复中组装起来。在这种情况下,消极可能比非共识空间的“更接近”积极,因为这些消极的多样性更与雾(或雾残留)有关,而不是任何其他语义。然而,当负的嵌入太接近正的嵌入时,就会出现一个内在的困境,因为它对锚点的推力(即预测)可能会抵消正的的拉力。这样的学习困难可能会混淆锚,以向积极的方向移动,特别是在早期的训练阶段。


图1.上面板:基于共识对比空间中阴性的三个难度级别的对比正则化检查。下面板:自愿和非自愿空间的对比样本说明。 Upper panel: Examination for contrastive regularization based on three difficulty levels of the negatives in the consensual contrastive space. Lower panel: Illustration of contrastive samples in the consensual and non-consensual spaces.
        这种直觉在图1的上面板中被进一步检验。我们使用FFA-Net [33]作为基线(第(a)行),sot-室内[28]作为测试数据集,以探索共识空间中负面因素的影响。具体来说,我们将负项的难度定义为三个级别:简单(E)、硬(H)和超硬(U)。我们采用模糊的输入作为容易产生的负值,并使用粗糙的策略来区分后两种类型,即负值的PSNR是否大于30。首先,在单负情况下(第(b)-(d)行),一个有趣的发现是,使用硬样本相比,作为负获得了最好的性能,使用超硬负甚至比基线更差。这表明,一个“接近”的负值有可能促进去雾模型的有效性,但并不是由于学习困难而越接近越好。而在多负情况2(行(e)-(g))中,我们观察到全面覆盖不同程度的负值,包括超硬样本,可以导致最好的性能。这意味着在不同的差异水平上的负面影响都可能有助于训练阶段。这些观察结果激励我们探索如何在训练过程中明智地将共识空间中的多个负对纳入CR。
        继续进入具有物理意识的深度模型领域,它们大多在原始空间中利用大气散射模型[31,32],而没有充分探索有益特征级信息。PFDN [11]是唯一一个试图将物理模型表示为网络中的一个基本单元的工作。该单元被设计为一个共享结构,以预测与大气光和透射图对应的潜在特征。然而,前者通常被认为是均匀的,而后者是非均匀的,因此它们的特征不能以同样的方式来近似。因此,如何利用物理模型准确地实现深度网络特征空间的可解释性仍然是一个有待解决的问题,这是我们感兴趣的另一个方面。
        在本文中,我们提出了一种课程对比正则化,使用模糊或恢复的图像作为负片在共识空间中的图像去模糊来解决第一个问题。根据我们的分析表明,共识否定的困难会影响正则化的有效性,我们提出了一个课程学习策略来安排这些否定,以减少学习的模糊性。具体来说,我们将负对分为三种类型(即简单、硬和超硬),并为CR中相应的负对分配不同的权重。同时,在训练过程中,随着锚点向表示空间中的正值方向移动,负值的差异水平被动态调整。这样,所提出的正则化方法可以使脱雾模型在更紧凑的解空间中得到稳定的优化。
        关于第二个问题,我们提出了一个具有物理意识的双分支单元(PDU)。PDU分别逼近大气光对应的特征和双分支的透射图,并考虑各因素的物理特征。因此,可以根据物理模型更精确地合成潜在的清晰图像的特征。最后,我们建立了C2PNet,这是我们的脱雾网络,它将pdu部署到一个具有课程对比正则化的级联骨干中。
        综上所述,我们的主要贡献如下:
我们提出了一种新的C2PNet去除阴霾,采用课程对比正则化,并在特征空间中加强基于物理的先验。我们的方法在合成场景和真实场景中都优于sota。特别是,我们在sots-室内和sots-室外数据集上分别实现了3.94 dB和1.50 dB的显著PSNR提升。
提出的正则化采用了一种独特的基于共识的负化方法,并包含了一种独立的课程学习策略,该策略动态校准负的优先级和难度水平。作为一种广义正则化技术,它可以提高sota的性能,超过了以往的相关策略。
仔细考虑所涉及因素的特点,我们基于一个前所未有的物理模型表达式建立了PDU。这种创新的设计在物理先验的指导下,促进了特征空间中的特征传输和提取。

【效果展示】

室内去雾效果

室外去雾效果:

【视频演示】

C# winform基于C2PNet算法实现室内和室外图像去雾_哔哩哔哩_bilibili测试环境:vs2019netfrmamework4.7.2opencvsharp==4.8.0onnxruntime==1.16.2, 视频播放量 45、弹幕量 0、点赞数 2、投硬币枚数 0、收藏人数 0、转发人数 0, 视频作者 未来自主研究中心, 作者简介 未来自主研究中心,相关视频:将yolov8封装成一个类几行代码完成语义分割任务,用C#部署yolov8的tensorrt模型进行目标检测winform最快检测速度,YOLOv8检测界面-PyQt5实现,使用C++部署yolov8的onnx和bytetrack实现目标追踪,YOLOv9杀疯了!最新的实时目标检测模型!代码已开源!,OpenAI将于3.8号变更GPT API账单号付费机制,各位AI网站站长做好准备,使用C#部署openvino-yolov5s模型,C#调用yolov7进行目标检测winform开发,C#在国内毫无市场可言!,基于faster whisper实现实时语音识别项目语音转文本python编程实现icon-default.png?t=N7T8https://www.bilibili.com/video/BV1b2421K7JK/?vd_source=989ae2b903ea1b5acebbe2c4c4a635ee

【代码部分实现】

using System;
using System.Collections.Generic;
using System.ComponentModel;
using System.Data;
using System.Diagnostics;
using System.Drawing;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
using System.Windows.Forms;
using OpenCvSharp;

namespace FIRC
{

    public partial class Form1 : Form
    {
        Mat src = null;
        C2PNet detector = new C2PNet();

        public Form1()
        {
            InitializeComponent();
        }

        private void button1_Click(object sender, EventArgs e)
        {
            OpenFileDialog openFileDialog = new OpenFileDialog();
            openFileDialog.Filter = "图文件(*.*)|*.jpg;*.png;*.jpeg;*.bmp";
            openFileDialog.RestoreDirectory = true;
            openFileDialog.Multiselect = false;
            if (openFileDialog.ShowDialog() == DialogResult.OK)
            {
              
                src = Cv2.ImRead(openFileDialog.FileName);
                pictureBox1.Image = OpenCvSharp.Extensions.BitmapConverter.ToBitmap(src);


            }


        }

        private void button2_Click(object sender, EventArgs e)
        {
            if(pictureBox1.Image==null)
            {
                return;
            }
            Stopwatch sw = new Stopwatch();
            sw.Start();
            var result = detector.Inference(src);
            sw.Stop();
            this.Text="耗时:"+sw.Elapsed.TotalSeconds+"秒";
            pictureBox2.Image = OpenCvSharp.Extensions.BitmapConverter.ToBitmap(result);
        }

        private void Form1_Load(object sender, EventArgs e)
        {
            detector.LoadWeights(Application.StartupPath+ "\\weights\\c2pnet_outdoor_320x320.onnx", 320,320);
        }

        private void button3_Click(object sender, EventArgs e)
        {
            VideoCapture capture = new VideoCapture(0);
            if (!capture.IsOpened())
            {
                Console.WriteLine("video not open!");
                return;
            }
            Mat frame = new Mat();
            var sw = new Stopwatch();
            int fps = 0;
            while (true)
            {

                capture.Read(frame);
                if (frame.Empty())
                {
                    Console.WriteLine("data is empty!");
                    break;
                }
                sw.Start();
                var result = detector.Inference(frame);
                sw.Stop();
                fps = Convert.ToInt32(1 / sw.Elapsed.TotalSeconds);
                sw.Reset();
                Cv2.PutText(result, "FPS=" + fps, new OpenCvSharp.Point(30, 30), HersheyFonts.HersheyComplex, 1.0, new Scalar(255, 0, 0), 3);
                //显示结果
                Cv2.ImShow("Result", result);
                int key = Cv2.WaitKey(10);
                if (key == 27)
                    break;
            }

            capture.Release();
        }
    }
}

【代码下载】

https://download.csdn.net/download/FL1623863129/88901662

【测试环境】

vs2019,netframework4.7.2,opencvsharp4.8.0,onnxruntime==1.16.2

【参考文献】

[1] https://blog.csdn.net/zhouaho2010/article/details/134740646

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1496673.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

二维码门楼牌管理系统应用场景:赋能市场研究与城市决策的新动力

文章目录 前言一、市场研究的新视角:门牌数据揭示市场趋势二、城市规划的得力助手:门牌数据指导资源分配三、决策制定的科学依据:门牌数据提升决策准确性四、未来展望:二维码门楼牌管理系统的更多可能性 前言 随着信息技术的飞速…

国创证券|存钱有窍门,掌握这五个窍门利息高出不少?

大部分居民会把手中闲置的资金存入银行,享用安稳的收益,其间存在以下五个诀窍: 1、比照不同银行的利率 储户在去银行存钱时,能够比照不同银行的利率,尽量地挑选利率较高的银行存,来获取较多的收益&#x…

UML类图详解

目录 概述1 什么是UMLUML模型和图形UML2.2中一共定义了14种图示。 2 UML类图作用3 类图格式4类与类之间的关系表达 概述 我们在阅读开源项目时,总是希望能比较高效的整理清楚项目中的各个类之间的关系,那么有没有相应的工具能高效、简洁的表示清楚类关系…

CMake:开始

文章目录 在计算机上获取和安装 CMake目录结构基本 CMake 用法CMakeLists文件适用于 CMake 的 Hello World配置和生成运行 CMake GUI运行 ccmake Curses 接口从命令行运行 CMake将编译器指定为 CMake构建配置构建项目 在计算机上获取和安装 CMake 在使用 CMake 之前&#xff0…

Sharding-JDBC源码解析与vivo的定制开发

作者:vivo IT 平台团队 - Xiong Huanxin Sharding-JDBC是在JDBC层提供服务的数据库中间件,在分库分表场景具有广泛应用。本文对Sharding-JDBC的解析、路由、改写、执行、归并五大核心引擎进行了源码解析,并结合业务实践经验,总结…

Unity 轮转图, 惯性, 自动回正, 点击选择

简单的实现 2D 以及 3D 的轮转图, 类似于 Web 中无限循环的轮播图那样. 文中所有代码均已同步至 github.com/SlimeNull/UnityTests 3D 轮转图: Assets/Scripts/Scenes/CarouselTestScene/Carousel.cs2D 轮转图: Assets/Scripts/Scenes/CarouselTestScene/UICarousel.cs 主要逻…

Nodejs web服务器之GET、POST请求初次体验

一、认识http请求 步骤 1.DNS解析域名,找到ip地址,建立TCP连接,发起http请求 2.服务器接收到http请求,进行处理,返回数据 3.客户端接收到返回的数据,处理数据(比如渲染页面) 二、no…

新生儿睡眠抖动:温馨抚慰宝宝的安稳梦乡

引言 新生儿的睡眠过程常常伴随着轻微的抖动,对于许多父母来说,这可能会引起一些担忧。在这篇文章中,我们将探讨新生儿睡眠抖动的原因和注意事项,帮助父母更好地理解和处理宝宝的这种行为,为宝宝提供安心的睡眠环境。…

基于FPGA的HyeperRam接口设计与实现

一 HyperRAM 针对一些低功耗、低带宽应用(物联网、消费产品、汽车和工业应用等),涉及到外部存储,HyperRAM提供了更简洁的内存解决方案。 HyperRAM具有以下特性: 1、超低功耗:200MHz工作频率下读写不到50mW…

UE5数字孪生系列笔记(一)

智慧城市数字孪生系统 虚幻引擎连接数据库 将自己的mysql版本的libmysql.dll替换掉插件里面的libmysql.dll 然后将这个插件目录复制到虚幻项目目录下 然后添加这个插件即可 新建一个UMG,添加一个按钮试试,数据库是否连接 将UI添加到视口 打印是否连接…

自研在线CAD系统介绍

去年调研了已有的在线的CAD系统(悟空CAD、维杰地图、梦想控件),基本上都是按年收费,还相当的贵,基于此,就萌生了自己研发CAD系统的想法,从技术选型、框架设计、代码实现基本为都是自研实现。已经有了初步的成果。 10M…

chatGPT的耳朵!OpenAI的开源语音识别AI:Whisper !

语音识别是通用人工智能的重要一环!可以说是AI的耳朵! 它可以让机器理解人类的语音,并将其转换为文本或其他形式的输出。 语音识别的应用场景非常广泛,比如智能助理、语音搜索、语音翻译、语音输入等等。 然而,语音…

如何选择乐歌升降台,一张图带你了解全型号参数功能

在现代办公环境中,久坐已成为一种常态,而这种生活方式带来的不良影响日益凸显。乐歌办公升降电脑台应运而生,不仅是一种办公家具,更是健康办公的有力助手。让我们从多个角度深入了解这款产品的功能意义。 1. 台面层数 乐歌办公升…

mysql bug( InnoDB: Error number 22),表突然不能读取

mysql bug( InnoDB: Error number 22),表突然不能读取 bug最开始的bug:表突然不能读取关闭mysql容器,再次重启失败 解决方案不重建容器的几种可能措施重建容器重建如果懒得打命令或者忘记命令可能的run bug&#xff1a…

MATLAB中设置输出格式

目录 设置输出中行间距的格式 设置浮点数格式 使代码换行以适应窗口宽度 隐藏输出 按页查看输出 清空命令行窗口 MATLAB 同时在命令行窗口和实时编辑器中显示输出。可以使用提供的多个选项为输出显示设置格式。 设置输出中行间距的格式 默认情况下,MATLAB 会…

【Qt学习】QProgressBar的使用(进度条的实现)

文章目录 1. 介绍2. 实例2.1 按钮启动进度条2.2 更改进度条样式2.3 资源文件 1. 介绍 详细的 QProgressBar 内容可以通过 查阅Qt官方文档 ,这里进行简要的总结: QProgressBar 是Qt框架中的一个控件,用于显示进度条: QProgressBar…

huggingface.datasets使用说明

诸神缄默不语-个人CSDN博文目录 datasets包的官方GitHub项目:huggingface/datasets: 🤗 The largest hub of ready-to-use datasets for ML models with fast, easy-to-use and efficient data manipulation tools datasets包可以加载很多公开数据集&a…

免费SSL证书和付费SSL证书的区别

免费证书和付费证书区别还是比较大的,相对来说免费证书适用的环境会单一一些,一般使用免费证书的环境都是个人门户网站或者是小微企业的门户官网(无隐私信息)。 受免费证书安全等级以及安全性的限制影响,如果是为了自…

Python 语法高亮显示和格式化库之pygments使用详解

概要 在软件开发和编程领域,代码是我们的主要表达方式。因此,对于代码的可读性和可理解性至关重要。为了提高代码的可读性,代码语法高亮和格式化工具变得至关重要。在Python世界中,Pygments是一个强大的工具,它可以帮助开发人员高亮显示和格式化他们的代码。本文将深入探…

selenium4的相对定位

selenium4相对定位 Selenium 4新增了相对定位器,能帮助用户查找元素附近的其他元素。可用的相对定位器有above、below、toLeftOf、toRightOf、near。在Selenium 4中,find_element方法能够接受一个新方法withTagName,它将返回一个RelativeLoca…