视频超分辨率重建——AnimeSR网络测试教程(详细图文教程)

news2025/1/22 13:13:42

在这里插入图片描述

💪 专业从事且热爱图像处理,图像处理专栏更新如下👇:
📝《图像去噪》
📝《超分辨率重建》
📝《语义分割》
📝《风格迁移》
📝《目标检测》
📝《暗光增强》
📝《模型优化》
📝《模型实战部署》


在这里插入图片描述

目录

  • 一、AnimeSR
  • 二、源码包准备
  • 三、测试环境准备
  • 四、测试
    • 4.1 单帧图像测试
      • 4.1.1 测试集准备
      • 4.1.2 启动测试
      • 4.1.3 测试结果
    • 4.2 视频测试
      • 4.2.1 视频准备
      • 4.2.2 启动测试
      • 4.2.3 测试结果
  • 五、超分效果
    • 5.1 单帧图像测试效果
    • 5.2 视频测试效果
  • 六、总结

一、AnimeSR

论文AnimeSR: Learning Real-World Super-Resolution Models for Animation Videos,一种专门为动画视频设计的超分辨率(SR)方法。AnimeSR通过专注于保留艺术风格和处理真实世界退化,成功解决了动画视频超分辨率中的独特挑战。该方法为动漫SR设定了新的标准,提供了一个能够在提升动画内容质量的同时保持其原始艺术意图的强大工具。

二、源码包准备

官网源码地址:AnimeSR

论文地址:paper

教程配套源码包,提供了部分测试集图像、视频和预训练模型权重文件,获取方法文章末扫码到公众号「视觉研坊」中回复关键字:视频超分辨率重建AnimeSR。获取下载链接。

下载解压后的源码包见下:

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

三、测试环境准备

在测试之前需要安装animeSR源码包,安装方法为在工程文件路径中输入cmd直接调转到终端,输入下面命令安装:

python setup.py develop

在这里插入图片描述

在这里插入图片描述

其它缺的包根据提示自行安装,下面是我测试环境中各个包及对应版本,仅供参考,其它版本也行。

在这里插入图片描述

四、测试

4.1 单帧图像测试

4.1.1 测试集准备

先准备好测试图像,放到根目录下的inputs文件夹中,如下:

注:测试集中所有单帧图像的尺寸必须一致。

在这里插入图片描述

4.1.2 启动测试

在终端输入下面命令测试:

python scripts/inference_animesr_frames.py -i inputs/tom_and_jerry -n AnimeSR_v2 --expname animesr_v2 --save_video_too --fps 20

下面是上面命令中各个参数解析:

-i --input           输入帧文件夹路径。支持一级目录(即input/*.png)和二级目录(即input/*/*.png)  
-n --model_name      AnimeSR模型名称。默认值:AnimeSR_v2,也可以是AnimeSR_v1-PaperModel
-s --outscale        网络超分倍数是x4,但你可以通过参数outscale实现任意的超分倍数(例如,x2或x1)。该程序将在AnimeSR输出后进一步执行廉价的调整大小操作。默认值:4
-o --output          测试结果保存路径。
-expname             测试结果保存的文件夹名称。输出将保存在$output/$expname中
-save_video_too      将输出帧保存为视频。默认值:True
-fps                 保存的视频的fps。默认值:24

在这里插入图片描述

4.1.3 测试结果

测试结果将输出保存到根目录下的results文件夹中,见下:

在这里插入图片描述

4.2 视频测试

4.2.1 视频准备

待测试视频同样放到根目录下的inputs文件夹中,见下:

在这里插入图片描述

4.2.2 启动测试

在终端中输入下面命令进行视频超分测试:

python scripts/inference_animesr_video.py -i inputs/Video/TheMonkeyKing1965.mp4 -n AnimeSR_v2 -s 4 --expname animesr_v2 --num_process_per_gpu 1 --suffix 1gpu1process

参数解析:

-i --input: 输入视频路径或提取的帧文件夹。
-n --model_name: AnimeSR模型名称。默认值为AnimeSR_v2,也可以是AnimeSR_v1-PaperModel。
-s --outscale: 网络的放大倍数为4x,可以通过参数outscale实现任意的输出缩放比例(例如,2x或1x)。默认值为4。
-o --output: 输出根目录。默认值为results。
-expname: 测试结果保存的文件夹名称。输出将保存在$output/$expname中。
-fps: 保存视频的帧率。默认值为None。
-extract_frame_first: 如果输入是视频,仍然可以先提取帧,否则AnimeSR将直接从流中读取。
-num_process_per_gpu: 由于较慢的I/O速度会导致GPU利用率不够高,只要显存足够,建议在一块GPU上运行多个进程以提高每块GPU的利用率。总进程数将为number_process_per_gpu * num_gpu。
-suffix: 可以为超分辨率生成的视频名称添加一个后缀字符串,例如1gpu3processx2,表示该超分辨率视频是使用一个GPU和三个进程生成的,输出缩放比例为2x。
-half: 使用半精度进行推理,对视觉效果不会有太大影响。

在这里插入图片描述

4.2.3 测试结果

测试结果输出保存到根目录下的results文件夹中:

在这里插入图片描述

五、超分效果

5.1 单帧图像测试效果

下面挑选视频中某几帧,左图为原图,右图为超分4倍结果,模型为AnimeSR_v2。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

下面挑选了几张可见光中常用的超分测试集,左侧为原图基础上bicubic;中间图为模型AnimeSR_v1-PaperModel超分4倍结果;右侧图为原图。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

5.2 视频测试效果

视频测试效果我会放到其它平台,等待后续更新!

六、总结

从我自己的测试效果来看,对于动漫图像效果挺好的,可见光图像效果不理想,是因为该网络模型时针对动漫动画设计的,模型的训练样本都是矢量图,而可见光图像一般都为像素值图像。

此网络的训练方法参考官网文档:AnimeSR训练

感谢您阅读到最后!😊总结不易,多多支持呀🌹 点赞👍收藏⭐评论✍️,您的三连是我持续更新的动力💖

关注公众号「视觉研坊」,获取干货教程、实战案例、技术解答、行业资讯!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2085872.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2021CCPC网络赛:G - Function HDU - 7106

题意 定义g(x)为x的各数位之和 求该方程: 在给定x范围内的最小值 思路: 一个x对应一个g(x),一个g(x)对应多个x 由于g(x)最多取到54,所以可以枚举所有的g(x)所以想到当取到g(x)的时候,只取能使原方程f(x)最小的那几个x 当枚举g(x)的时候,g(x)看作一个常数,此时方程…

干货分享:精选四大Win10录屏工具推荐!

无论你是制作教程视频、游戏实况分享还是日常办公中的演示记录,一款好的录屏软件都能让你事半功倍。Windows 10作为当下最流行的桌面操作系统之一,本文推荐几款优秀的win10录屏工具 福昕录屏大师 链接:www.foxitsoftware.cn/REC/ 福昕录屏…

石油钻杆对直线度测量的需求

关键字:石油钻杆直线度测量仪,钻杆测量仪,钻杆直线度 石油钻杆对直线度测量的需求主要源于其在石油勘探和开发过程中的关键作用以及严苛的工作环境。以下是对这一需求的详细分析: 一、石油钻杆的功能与重要性 石油钻杆是石油钻探…

十五分钟速通Vue

绑值语法( {{}} ) <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>Document</title> </head…

热失控传感器在换电站消防安全解决方案中的应用

随着新能源技术的飞速发展&#xff0c;工程车辆行业正逐步向绿色化、电动化转型&#xff0c;作为这一转型过程中的关键设施&#xff0c;换电站的数量日益增多。作为电池集中储存与交换的核心区域&#xff0c;换电站的消防安全问题成为了不容忽视的重大挑战。特别是电池仓&#…

骑行适合戴的耳机?开放式耳机测评

当我们在享受骑行的乐趣时&#xff0c;音乐往往是不可或缺的伴侣。但选择耳机却是一门学问&#xff0c;尤其是在安全和听觉享受之间找到平衡。今天&#xff0c;我就来和大家探讨一下&#xff0c;在骑行时究竟是选择开放式耳机还是封闭式耳机。 骑行时选择耳机的考量因素 1.安全…

二手电脑配置给你不一样的成就感之三

近期和着了魔一样&#xff0c;一直在搜罗二手乐色&#xff0c;之前说过的推荐配置基本都试了一遍&#xff0c;今天来说下APU系列和E3系列&#xff0c;还是那个选择&#xff0c;主板30以下&#xff0c;cpu二十以下&#xff0c;这次有增加了二手风扇&#xff0c;二手固态&#xf…

vue part 5

生命周期 <!DOCTYPE html> <html><head><meta charset"UTF-8" /><title>引出生命周期</title><!-- 引入Vue --><script type"text/javascript" src"https://cdn.jsdelivr.net/npm/vue/dist/vue.js&quo…

filezilla使用教程(window下filezilla使用教程)

filezilla使用教程&#xff08;window下filezilla使用教程&#xff09; 一、安装与配置 首先&#xff0c;你需要从FileZilla的官方网站下载并安装适合你操作系统的版本。安装完成后&#xff0c;打开FileZilla&#xff0c;你将看到一个简洁的用户界面。 在FileZilla中&#x…

day-43 Z 字形变换

思路 只需要依次按照行进行遍历即可 解题过程 第一行位置&#xff1a;0 2*(numRows-1) 4*(numRows-1) 第二行位置&#xff1a;1 2*(numRows-1)-1 2*(numRows-1)1 。。。。。。 注意&#xff1a;当numRows为1时&#xff0c;直接返回s Code class Solution {public String con…

Android 获取安装包的签名,获取签名文件的MD5值

一般情况下通过下面的语句就开业获取MD5值; keytool -list -v -keystore 签名文件.jks -alias 别名也可以直接:keytool -list -v -keystore 签名文件.jks但结果只有SHA1和SHA256,没有MD5值; 是因为升级java JDK以后 keytool 不支持MD5,所以就需要像其他的办法; 解决办…

西门子PLC、倍福PLC如何接入ThingsKit物联网平台?

随着工业4.0的推进&#xff0c;物联网(IoT)技术在智能制造领域的应用日益广泛。本文将探讨如何将西门子PLC和倍福PLC接入ThingsKit物联网平台&#xff0c;实现工业设备的远程监控与管理。 引言 在智能制造和工业自动化中&#xff0c;PLC&#xff08;可编程逻辑控制器&#xf…

[000-01-001].第06节:Shell环境变量深入学习

1、Shell环境变量深入&#xff1a;加载流程原理介绍 本节目标 1.能够说出交互式Shell与非交互式Shell2.能够说出登录Shell与非登录Shell环境 1.1.Shell工作环境介绍 用户进入linux系统就会初始化Shell环境, 这个环境会加载全局配置文件和用户个人配置文件中环境变量.每个脚本文…

【项目篇】WS2812 炫彩LED灯驱动笔记(C51/STM32)

优信电子:51系列驱动WS2812 3528 幻彩雾状 贴片式发光二极管 XL-3528RGBW-WS2812B C51 驱动 使用 C51 单片机&#xff08;如 8051 系列&#xff09;驱动 WS2812 全彩 LED 需要仔细考虑 WS2812 的时序要求&#xff0c;因为 WS2812 使用的是单线通信协议&#xff0c;而 8051 系…

JavaEE(2):前后端项目之间的交互

现在&#xff0c;在网页中通过超链接&#xff0c;表单就可以向后端发送请求&#xff0c;后端也可以正常响应内容。 以前通过表单访问后端的请求方式称为同步请求 同步请求 当网页与后端交互时&#xff0c;前端不能再进行其他操作 服务器端响应回来的内容&#xff0c;会把整个浏…

1895. 二分查找右侧边界

代码 #include<bits/stdc.h> using namespace std; int a[100010],n,q; int yc(int x) {int l1,rn,mid;while(l<r){mid(lr)/2;if(x<a[mid]) rmid-1;else if(x>a[mid]) lmid1;}if(a[l-1]x) return l-1;else return -1; } int main() {int i,x;cin>>n;for(…

迷雾大陆游戏辅助:VMOS云手机强势辅助宠物推荐!

在《迷雾大陆》游戏中&#xff0c;选择合适的宠物是提升战斗力的关键。通过使用VMOS云手机&#xff0c;你可以体验到更为顺畅的游戏过程。VMOS云手机为《迷雾大陆》专门定制了专属的云手机版本&#xff0c;内置游戏安装包&#xff0c;不需要重新下载安装。此外&#xff0c;VMOS…

第一次使用Visual Studio社区版

由于C代码的需要&#xff0c;我开始尝试使用VS。 下载 下载地址&#xff1a;https://visualstudio.microsoft.com/zh-hans/downloads/ 网上关于专业版的教程较少&#xff0c;所以我猜测需求不大&#xff0c;于是我也下载社区版。 安装地址&#xff1a; &#xff08;工作负荷…

从 7000 余项目脱颖而出,飞轮科技《新一代实时分析数据仓库解决方案》荣获 HICOOL 2024 全球创业大赛二等奖

HICOOL 2024 全球创业者峰会于 2024 年 8 月 23 日 -25 日 在中国国际展览中心&#xff08;顺义馆&#xff09;成功举行&#xff0c;峰会以“新质引领 创新共融”为主题&#xff0c;聚焦技术创新、产业融合、新质共享与国际合作四大要素。 在 8 月 23 日晚的峰会开幕式上&…

一文速学-零成本与数据沟通NL2SQL的概念和实现技术

前言 关于NL2SQL的技术&#xff0c;如果大家最近有关注AI圈的话&#xff0c;或多或少都有所了解。其实很多业务场景下&#xff0c;于用户而言更多的是想要获取到最终数据的呈现效果&#xff0c;关于数据是如何获取得到的学习成本&#xff0c;是尽可能越少越好。众所周知当学习…