【论文速看】DL最新进展20241109-图像超分、物理信息神经网络、扩散模型

news2024/11/24 8:47:26

目录

    • 【图像超分】
    • 【物理信息神经网络】
    • 【扩散模型】

【图像超分】

[2024 红外图像超分] Infrared Image Super-Resolution via Lightweight Information
Split Network

论文链接:https://arxiv.org/pdf/2405.10561v2

代码链接:无

单图像超分辨率(SR)是一个成熟的像素级视觉任务,旨在从其退化的低分辨率对应图像重建高分辨率图像。尽管利用深度神经网络进行SR取得了显著进展,但大多数现有的深度学习架构包含大量层,导致计算复杂度高和内存需求大。这些问题在红外图像SR的背景下尤为突出,因为红外设备通常具有严格的存储和计算限制。为了缓解这些挑战,文中引入了一种新颖、高效且精确的单红外图像SR模型,称为轻量级信息分割网络(LISN)。LISN由四个主要组件组成:浅层特征提取深层特征提取密集特征融合高分辨率红外图像重建。该模型的一个关键创新是引入了用于深层特征提取的轻量级信息分割块(LISB)。LISB采用顺序过程提取层次特征,然后根据所考虑特征的相关性进行聚合。通过整合通道分割和移位操作,LISB成功地在增强SR性能和轻量级框架之间实现了最佳平衡。全面的实验评估表明,与当代最先进的方法相比,所提出的LISN在SR质量和模型复杂性方面均表现出优越的性能,证实了其在资源受限的红外成像应用中的实际部署有效性。

在这里插入图片描述

在这里插入图片描述

实验结果
在这里插入图片描述
在这里插入图片描述


【物理信息神经网络】

[2024] RoPINN: Region Optimized Physics-Informed Neural Networks

机构:清华大学

论文链接:https://arxiv.org/pdf/2405.14369

代码链接:https://github.com/thuml/RoPINN

物理信息神经网络(PINNs)通过强制深度模型的输出和梯度满足目标方程,已被广泛应用于解决偏微分方程(PDEs)。由于数值计算的限制,PINNs通常在有限选择点上进行优化。然而,由于PDEs通常定义在连续域上,仅在离散点上优化模型可能不足以在整个域中获取准确的解。为了缓解默认散点优化的这种固有缺陷,本文提出并从理论上研究了一种新的训练范式,即区域优化。具体来说,文中提出将PINNs的优化过程从孤立点扩展到它们的连续邻域,这在理论上可以减少泛化误差,尤其是对于PDEs的隐藏高阶约束。一种实用的训练算法——区域优化PINN(RoPINN),无缝地从这种新范式中推导出来,通过一种简单但有效的蒙特卡罗采样方法实现。通过将采样过程调整到可信区域,RoPINN精细平衡了优化和泛化误差。实验表明,RoPINN在广泛的PDEs上一致提升了各种PINNs的性能,无需额外的反向传播或梯度计算

在这里插入图片描述

伪代码
在这里插入图片描述

实验结果
在这里插入图片描述


【扩散模型】

[NeurIPS 2024] Motion Consistency Model: Accelerating Video Diffusion with Disentangled Motion-Appearance Distillation

机构:微软

论文链接:https://arxiv.org/pdf/2406.06890

代码链接:https://yhzhai.github.io/mcm/

图像扩散蒸馏在很少的采样步骤下实现了高保真生成。然而,将这些技术直接应用于视频扩散时,由于公共视频数据集中的视觉质量有限,通常会导致帧质量不理想。这影响了教师和学生视频扩散模型的表现。该研究旨在通过使用丰富的高质量图像数据来提高视频扩散蒸馏效果的同时改善帧外观。文中提出了运动一致性模型(MCM),一种单阶段视频扩散蒸馏方法,它分离了运动和外观学习。具体来说,MCM包括一个从视频教师模型中提取运动的视频一致性模型,以及一个增强帧外观以匹配高质量图像数据的图像鉴别器。这种组合带来了两个挑战:(1)帧学习目标冲突,因为视频蒸馏从低质量视频帧中学习,而图像鉴别器则针对高质量图像;(2)训练-推理差异,由于训练和推理过程中使用的视频样本质量不同。为了应对这些挑战,作者引入了分离的运动蒸馏和混合轨迹蒸馏。前者仅对运动表示应用蒸馏目标,而后者通过混合来自低质量和高质量视频域的蒸馏轨迹来缓解训练-推理差异。大量实验表明,MCM达到了最先进的视频扩散蒸馏性能。此外,我们的方法可以增强视频扩散模型中的帧质量,产生具有高美学评分或特定风格的帧,而无需相应的视频数据。

在这里插入图片描述

在这里插入图片描述
实验结果

在这里插入图片描述


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2237066.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Python学习从0到1 day26 第三阶段 Spark ① 数据输入

要学会 剥落旧痂 然后 循此新生 —— 24.11.8 一、Spark是什么 定义: Apache Spark 是用于大规模数据处理的统一分析引擎 简单来说,Spark是一款分布式的计算框架,用于调度成百上千的服务器集群,计算TB、PB乃至EB级别的海量数据…

[Python学习日记-63] 继承与派生

[Python学习日记-63] 继承与派生 简介 继承 派生 简介 上一篇文章我们学习了类如何使用,以及相关特性,也做了相关的练习,在练习当中发现类与类之间有时也会存在重复代码,其实在类中我们还有一个继承和派生的概念没有说&#xf…

基于 Encoder-only 架构的大语言模型

基于 Encoder-only 架构的大语言模型 Encoder-only 架构 Encoder-only 架构凭借着其独特的双向编码模型在自然语言处理任务中表现出色,尤其是在各类需要深入理解输入文本的任务中。 核心特点:双向编码模型,能够捕捉全面的上下文信息。 En…

Python学习------第四天

Python的判断语句 一、布尔类型和比较运算符 二、 if语句的基本格式 if语句注意空格缩进!!! if else python判断语句的嵌套用法:

uniapp实现H5和微信小程序获取当前位置(腾讯地图)

之前的一个老项目,使用 uniapp 的 uni.getLocation 发现H5端定位不准确,比如余杭区会定位到临平区,根据官方文档初步判断是项目的uniapp的版本太低。 我选择的方式不是区更新uniapp的版本,是直接使用高德地图的api获取定位。 1.首…

测试网空投进行中 — 全面了解 DePIN 赛道潜力项目 ICN Protocol 及其不可错过的早期红利

随着云计算技术的飞速发展,越来越多的企业和个人对云服务的需求变得多样化且复杂化。然而,传统的中心化云服务平台(如AWS、微软Azure等)往往存在着高成本、数据隐私保护不足以及灵活性差等问题。 为了解决这些挑战,Imp…

IntelliJ IDEA 使用心得与常用快捷键

刚开始学习写Java的时候,用的eclipse,正式工作后,主要用的myeclipse,去年初在前辈的推荐下,在2折的时候买了正版的 IntelliJ IDEA 和 Pycharm,12.0版终生使用,一年更新。 使用前早就久闻其名&am…

【rust】rust基础代码案例

文章目录 代码篇HelloWorld斐波那契数列计算表达式(加减乘除)web接口 优化篇target/目录占用一个g,仅仅一个actix的helloWorld demo升级rust版本, 通过rustupcargo换源windows下放弃吧,需要额外安装1g的toolchain并且要…

施工企业为什么要用工程项目管理软件?工程项目管理软件的用处是什么?

施工企业一定会遇到哪些问题?工人怠工、材料浪费、数据造假、工期拖延、质量问题、安全隐患等。这些问题正在悄然侵蚀建施工业的经济效益。每一个环节的失控都可能导致巨大的经济损失,还可能损害企业的声誉。面对日益复杂的工程管理环境,如何…

【C++】详解RAII思想与智能指针

🌈 个人主页:谁在夜里看海. 🔥 个人专栏:《C系列》《Linux系列》 ⛰️ 丢掉幻想,准备斗争 目录 引言 内存泄漏 内存泄漏的危害 内存泄漏的处理 一、RAII思想 二、智能指针 1.auto_ptr 实现原理 模拟实现 弊端…

所谓的情商高,其实就是会说话!

所谓的情商高,其实就是会说话! 1.当遇到不知道的事情时,不要直截了当地说“不知道”。而应委婉地表达为“我想听听你的看法”。 如此既能避免尴尬,又能展现出对对方见解的尊重和期待。 2.不要简单地说“我迟到了”,…

ALB搭建

ALB: 多级分发、消除单点故障提升应用系统的可用性(健康检查)。 海量微服务间的高效API通信。 自带DDoS防护,集成Web应用防火墙 配置: 1.创建ECS实例 2.搭建应用 此处安装的LNMP 3.创建应用型负载均衡ALB实例 需要创建服务关联角…

【spark面试】spark的shuffle过程

概述 所有的shuffle的过程本质上就是一个task将内存中的数据写入磁盘,然后另一个task将磁盘中的数据读入内存的过程。 对于mapreduce来说,我们将内存中的数据写入磁盘成为maptask,将磁盘中的数据读入内存称为reducetask。 而对于spark来说&…

Android 实现一个系统级的悬浮秒表

前言 由于项目需要将手机录屏和时间日志对应起来,一般的手机录屏只能看到分钟,但是APP的日志输出通常都是秒级别的,于是决定自己手撸一个悬浮秒表(有拖拽效果)。 效果如下 具体实现 大致的实现思路: 创…

【科普小白】LLM大语言模型的基本原理

一、要了解LLM大模型的基本原理就要先来了解一下自然语言处理(NLP)。 NLP 是 AI 的一个子领域,专注于使计算机能够处理、解释和生成人类语言,主要任务包括:文本分类、自动翻译、问题回答、生成文本等。到底是NLP促生了…

Go语言开发商城管理后台-GoFly框架商城插件已发布 需要Go开发商城的朋友可以来看看哦!

温馨提示:我们分享的文章是给需要的人,不需要的人请绕过,文明浏览,误恶语伤人! 前言 虽然现在做商城的需求不多,但有很多项目中带有商城功能,如社区医院系统有上服务套餐、理疗产品需求、宠物…

ts 如何配置引入 json 文件

ts 如何配置引入 json 文件 参考文档: https://maxgadget.dev/article/how-to-import-a-json-file-in-typescript-a-comprehensive-guide 项目中有一个 .json 的文件是配置文件,如何引入到 ts 项目中 配置 tsconfig.json 文件,添加这两个 {…

如何让ffmpeg运行时从当前目录加载库,而不是从/lib64

程序在linux下运行时,一般从 /lib64 目录下加载依赖的库文件,如xxx.so. 有时候,系统里没有这些库,也不想从系统目录下加载,怎么办呢? 看下面的调整过程。 使用的源代码是 ffmpeg-6.1.tar.xz 解压后&…

【基于轻量型架构的WEB开发】课程 12.4 页面跳转 Java EE企业级应用开发教程 Spring+SpringMVC+MyBatis

12.4 页面跳转 12.4.1 返回值为void类型的页面跳转 返回值为void类型的页面跳转到默认页面 当Spring MVC方法的返回值为void类型,方法执行后会跳转到默认的页面。默认页面的路径由方法映射路径和视图解析器中的前缀、后缀拼接成,拼接格式为“前缀方法…

订单日记助力“实峰科技”提升业务效率

感谢北京实峰科技有限公司选择使用订单日记! 北京实峰科技有限公司,成立于2022年,位于北京市石景区,是一家以从事生产、销售微特电机、输配电及控制设备等业务为主的企业。 在业务不断壮大的过程中,想使用一种既能提…