【论文+代码】ZS-N2N实现小样本零网络图像去噪

news2025/1/11 7:09:20

01、引言

本文方法源于Youssef Mansour和Reinhard Heckel撰写的论文《Zero-Shot Noise2Noise: Efficient Image Denoising without any Data》,该文作者探索了一种不需要任何数据且高效的高效图像去噪方法。

该方法使用两个固定的内核对噪声图像进行卷积,以创建一对降采样的图像。然后用一致性损失训练一个简单的2层CNN,将一个下采样的图像映射到另一个。

本文涵盖主题:方法介绍、代码复现两个主题。

本文主要结果汇总仪表板:

本期内容『数据+代码』已上传百度网盘。

有需要的朋友可以关注公众号【小Z的科研日常】,后台回复关键词[图像去噪]获取

02、简要介绍

ZS-N2N使用简单的2层网络,在没有任何训练数据或噪声分布知识的情况下,可以以低计算成本实现高质量的图像去噪,对像素独立噪声的去噪效果良好。适合于数据稀缺和计算资源有限的情况下使用。

该方法只对噪声统计进行了最小的假设(像素级的独立性),并且不需要训练数据。不需要明确的噪声模型,因此适用于各种噪声类型,并且可以在噪声分布或水平未知的情况下使用。

对噪声的唯一假设是,它是无结构的,而且平均值为零。

该论文提出的方法是无需数据集和噪声模型,与现有的方法相比,在泛化、去噪质量和计算资源之间实现了更好的权衡。

如上图所示。我们与标准的零拍基线,包括BM3D,以及最近的基于神经网络的算法DIP [UVL18]和S2S [Qua+20]进行比较。

只有BM3D比我们的方法快,但在非高斯噪声上取得的效果很差。

只有S2S有时优于我们的方法,但速度要慢几个数量级,在低噪声水平上经常失败[KLS22],并且需要集合才能达到可接受的性能。

03、代码复现

首先,我们加载一张测试图像并展示:

img_path = "C:/Users/asus/Desktop/Z/Kodak24/kodim07.png"
clean_img = Image.open(img_path)
clean_img = clean_img.convert("RGB")
clean_img = torch.from_numpy(np.array(clean_img)).permute(2, 0, 1).unsqueeze(0).float() / 255.0

#展示加载的测试图像
show_img = clean_img.squeeze(0).permute((1, 2, 0)).numpy()
plt.imshow(show_img)
plt.axis('off')
plt.title('Original Picture')
plt.show()

原图如下:

可以看到原图是一张清晰的彩色图像。接下来,我们添加噪声:

noise_type = 'gauss'  # 可选择'gauss' 或 'poiss'
noise_level = 50  # 高斯的像素范围是0-255,裂变的像素范围是0-1。

def add_noise(x, noise_level):
    if noise_type == 'gauss':
        noisy = x + torch.normal(0, noise_level / 255, x.shape)
        noisy = torch.clamp(noisy, 0, 1)

    elif noise_type == 'poiss':
        noisy = torch.poisson(noise_level * x) / noise_level

    return noisy

noisy_img = add_noise(clean_img, noise_level)

# 展示添加噪声后的图像
show_noisy_img = noisy_img.squeeze(0).permute((1, 2, 0)).numpy()
plt.imshow(show_noisy_img)
plt.axis('off')
plt.title(f'{noise_type.capitalize()} Noise ({noise_level})')
plt.show()

可以看到,我们成功地为图像添加了高斯噪声。接下来,我们将图像张量PyTorch 变量 device 指定的设备中,并定义一个2层的CNN网络,用于降噪:

device = 'cuda'
clean_img = clean_img.to(device)
noisy_img = noisy_img.to(device)

class network(nn.Module):
    def __init__(self, n_chan, chan_embed=48):
        super(network, self).__init__()

        self.act = nn.LeakyReLU(negative_slope=0.2, inplace=True)
        self.conv1 = nn.Conv2d(n_chan, chan_embed, 3, padding=1)
        self.conv2 = nn.Conv2d(chan_embed, chan_embed, 3, padding=1)
        self.conv3 = nn.Conv2d(chan_embed, n_chan, 1)

    def forward(self, x):
        x = self.act(self.conv1(x))
        x = self.act(self.conv2(x))
        x = self.conv3(x)

        return x

n_chan = clean_img.shape[1]
model = network(n_chan)
model = model.to(device)

这是该方法的神经网络模型,其中 chan_embed 是嵌入通道数,默认为48。该网络采用了 LeakyReLU 激活函数和卷积操作。

接下来介绍图像对下采样器,它通过对非重叠斑块中的对角线像素进行平均,输出两个空间分辨率为一半的下采样图像,如下图所示。它是通过将图像与两个固定的内核进行卷积实现。其中卷积的跨度为2,并分别应用于每个图像通道。

接下来,我们定义一个能够对输入图像进行下采样的函数:

def pair_downsampler(img):
    # img has shape B C H W
    c = img.shape[1]

    filter1 = torch.FloatTensor([[[[0, 0.5], [0.5, 0]]]]).to(img.device)
    filter1 = filter1.repeat(c, 1, 1, 1)

    filter2 = torch.FloatTensor([[[[0.5, 0], [0, 0.5]]]]).to(img.device)
    filter2 = filter2.repeat(c, 1, 1, 1)

    output1 = F.conv2d(img, filter1, stride=2, groups=c)
    output2 = F.conv2d(img, filter2, stride=2, groups=c)

    return output1, output2
    

显示噪声图像和其相应的降采样对,请注意降采样的图像的空间分辨率是一半:

img1, img2 = pair_downsampler(noisy_img)

img0 = noisy_img.cpu().squeeze(0).permute(1,2,0)
img1 = img1.cpu().squeeze(0).permute(1,2,0)
img2 = img2.cpu().squeeze(0).permute(1,2,0)

fig, ax = plt.subplots(1, 3,figsize=(15, 15))

ax[0].imshow(img0)
ax[0].set_title('Noisy Img')

ax[1].imshow(img1)
ax[1].set_title('First downsampled')

ax[2].imshow(img2)
ax[2].set_title('Second downsampled')

接下来,定义一个损失函数,它对输入图像和网络输出进行比较,并计算它们之间的均方误差。这个均方误差表示了噪声被降低的程度:

def mse(gt: torch.Tensor, pred: torch.Tensor) -> torch.Tensor:
    loss = torch.nn.MSELoss()
    return loss(gt, pred)


def loss_func(noisy_img):
    noisy1, noisy2 = pair_downsampler(noisy_img)

    pred1 = noisy1 - model(noisy1)
    pred2 = noisy2 - model(noisy2)

    loss_res = 1 / 2 * (mse(noisy1, pred2) + mse(noisy2, pred1))

    noisy_denoised = noisy_img - model(noisy_img)
    denoised1, denoised2 = pair_downsampler(noisy_denoised)

    loss_cons = 1 / 2 * (mse(pred1, denoised1) + mse(pred2, denoised2))

    loss = loss_res + loss_cons

    return loss

现在,开始训练神经网络,使用Adam优化器并迭代2000次:

def train(model, optimizer, noisy_img):
    loss = loss_func(noisy_img)

    optimizer.zero_grad()
    loss.backward()
    optimizer.step()

    return loss.item()


def test(model, noisy_img, clean_img):
    with torch.no_grad():
        pred = torch.clamp(noisy_img - model(noisy_img), 0, 1)
        MSE = mse(clean_img, pred).item()
        PSNR = 10 * np.log10(1 / MSE)

    return PSNR


def denoise(model, noisy_img):
    with torch.no_grad():
        pred = torch.clamp(noisy_img - model(noisy_img), 0, 1)

    return pred

max_epoch = 2000     # training epochs
lr = 0.001           # learning rate
step_size = 1500     # number of epochs at which learning rate decays
gamma = 0.5          # factor by which learning rate decays

optimizer = optim.Adam(model.parameters(), lr=lr)
scheduler = optim.lr_scheduler.StepLR(optimizer, step_size=step_size, gamma=gamma)

#开始去噪
for epoch in range(max_epoch):
    # 初始化进度条
    progress_bar = "[" + "-" * 20 + "]"

    # 训练
    train(model, optimizer, noisy_img)

    # 更新进度条
    progress_bar = list(progress_bar)
    progress_bar[(epoch * 20) // max_epoch] = "#"
    progress_bar = "".join(progress_bar)

    # 打印进度条和当前时间点
    print(f"\r{progress_bar} Epoch: {epoch + 1}/{max_epoch}", end="")

训练完成后,我们可以将网络应用于原始噪声图像并显示输出结果:

# 去噪后图像的PSNR
PSNR = test(model, noisy_img, clean_img)
print(PSNR)

#显示原图、加入噪音和去噪的图像
denoised_img = denoise(model, noisy_img)

denoised = denoised_img.cpu().squeeze(0).permute(1,2,0)
clean = clean_img.cpu().squeeze(0).permute(1,2,0)
noisy = noisy_img.cpu().squeeze(0).permute(1,2,0)
fig, ax = plt.subplots(1, 3,figsize=(15, 15))

ax[0].imshow(clean)
ax[0].set_xticks([])
ax[0].set_yticks([])
ax[0].set_title('Ground Truth')

ax[1].imshow(noisy)
ax[1].set_xticks([])
ax[1].set_yticks([])
ax[1].set_title('Noisy Img')
noisy_psnr = 10*np.log10(1/mse(noisy_img,clean_img).item())
ax[1].set(xlabel= str(round(noisy_psnr,2)) + ' dB')

ax[2].imshow(denoised)
ax[2].set_xticks([])
ax[2].set_yticks([])
ax[2].set_title('Denoised Img')
ax[2].set(xlabel= str(round(PSNR,2)) + ' dB')
fig.savefig('output.png', dpi=300, bbox_inches='tight')

可以看到,神经网络成功地降低了图像中的噪声。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1436868.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【开源】基于JAVA+Vue+SpringBoot的快乐贩卖馆管理系统

目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块2.1 数据中心模块2.2 搞笑视频模块2.3 视频收藏模块2.4 视频评分模块2.5 视频交易模块2.6 视频好友模块 三、系统设计3.1 用例设计3.2 数据库设计3.2.1 搞笑视频表3.2.2 视频收藏表3.2.3 视频评分表3.2.4 视频交易表 四、系…

c语言--指针运算

目录 一、指针-整数二、指针-指针2.1条件2.2两个指针指向同一块空间代码2.2.1运行结果 2.3两个指针指向不同块空间代码2.3.1运行结果 2.4总结 三、指针的关系运算3.1代码3.1.1运行结果3.1.2分析 一、指针整数 用数组举例: 因为数组在内存中是连续存放的&#xff0c…

C++:第十五讲高精度算法

每日C知识 system("color xx);是改变字体及背景颜色,前一个x代表一个数字,可以改变背景颜色,后一个x代表一个数字,可以改变字体颜色 ,但都是根据颜色表来的。 记住:要加头文件:#include&l…

详细关于如何解决mfc140.dll丢失的步骤,有效修复mfc140.dll文件丢失的问题。

mfc140.dll文件是Microsoft Visual Studio 2015程序集之一,它包含用于支持多种功能的代码和库。当这个mfc140.dll文件丢失时,可能会导致相关程序运行出错甚至无法运行。很多用户可能会遇到mfc140.dll丢失的问题,但是这并不是不可解决的困难。…

【自然语言处理-工具篇】spaCy<1>--介绍及安装指南

目录 前言 安装指南 pip conda spaCy升级 总结 前言 spaCy是一个开源的自然语言处理库,用于处理和分析文本数据。它提供了许多功能,包括分词、词性标注

cs50x 2024 -Lecture 0

cs50x 2024 -Lecture 0 01:43 哈佛大学CS50课程介绍 01:43CS50是哈佛大学的计算机科学和编程入门课程。 05:17计算机科学是一种通用的问题解决方式,适用于各个领域。 06:32课程将教授C、Python、SQL和JavaScript等编程语言。 08:18 计算机科学的重要性和二进制表…

【CSS】css如何实现字体大小小于12px?

【CSS】css如何实现字体大小小于12px? 问题解决方案transform: scale(0.5)(常用)SVG 矢量图设置text 问题 文字需要显示为12px,但是小于12px的,浏览器是显示不来的 解决方案 transform: scale(0.5)(常用&#xff0…

Bert下载和使用(以bert-base-uncased为例)

Bert官方github地址:https://github.com/google-research/bert?tabreadme-ov-file 【hugging face无法加载预训练模型】OSError:Can‘t load config for ‘./bert-base-uncased‘. If you‘re trying 如何下载和在本地使用Bert预训练模型 以bert-base-u…

should be also和should also be

will also be 是正确的 但老师和新概念的两个说法都没有错. will also be 是固定搭配.就好像will not be一样, 限定词加在be前.老师说的是陈述之类的句型 Nbe动词alson/adj/动词短语.例:He is also good at physic. should be also还是should also be also应该插在…

期权定价模型系列【14】期权复制—Delta动态复制误差计算

动态复制 直接使用期权进行对冲存在的问题之一是成本较高。假设我们多头一个看涨期权进行对冲,除本 身的交易费用之外,更多的隐性成本来自于期权的时间价值——期权价值等于内在价值与时间价值之 和,但在时间逐渐临近到期日的过程中,时间价值不断损耗,直至到期日为 0,如…

C++泛编程(4)

类模板高级(1) 1.类模板具体化部分具体化完全具体化 2.类模板与继承2.1模板类继承普通类2.2普通类继承模板类的实例化版本2.3普通类继承类模板2.4模板类继承模板类2.5模板类继承模板参数给出的类 1.类模板具体化 有了函数模板具体化的基础,学…

STL算法(中)

常用排序算法 sort 功能描述: 对容器内元素进行排序 函数原型: sort(iterator beg, iterator end, _Pred) ; // 按值查找元素,找到返回指定位置迭代器,找不到返回结束迭代器位置 // beg 开始迭代器 // end 结束迭代器 …

1-3 mininet中使用python API直接拓扑定义以及启动方式对比

作为SDN网络中搭建拓扑非常重要的仿真平台,我们可以使用mininet默认的库内拓扑文件,也可以使用python语言进行自定义拓扑。使用python进行拓扑定义时,不同的定义方式将导致其启动的方式由所不同。 一、采用最原始的命令启动方式: …

Redis——事件

Redis服务器是一个事件驱动程序,服务器需要处理以下两种事件: 文件事件(file event):Redis服务器通过套接字与客户端(或者其他Redis服务器)进行连接,而文件事件就是服务器对套接字操作的抽象(linux下一切皆文件,返回的…

TP框架 之think-auth权限认证

一、安装think-auth composer require 5ini99/think-auth二、数据表 -- ---------------------------- -- think_auth_rule,规则表, -- id:主键,name:规则唯一标识, title:规则中文名称 status 状态:为1正常…

【日志记录】——单片机可执行文件合并

一:需求场景 现在有一片单片机,执行程序包括自定义boot和应用程序app, 在将打包好的固件给到生产时有以下问题,由于要通过jlink烧录boot,然后上电启动boot,通过boot烧录初始化程序,过程过于复杂&#xff0…

基于ESP-WROOM-32的双串口通信并显示到OLED显示屏上

目录 开发板引脚图 Arduino环境配置1.ESP32开发版下载2.Arduino开发板选择 -> ESP32 Dev Module3.安装驱动库 接线图Arduino代码现象演示 开发板 ESP-WROOM-32 引脚图 Arduino环境配置 1.ESP32开发版下载 选择 esp32 by Espressif Systems 2.Arduino开发板选择 -> E…

一文读懂「四大主流计算芯片 CPU、GPU、ASIC、FPGA」特点和场景

纵观人类历史,从结绳计数、木制计数到巴比伦的粘土板上的刻痕,再到中国古代的算盘,社会生产力的提高与当时所采用的计算工具密切相关。计算工具能力越强,就能大幅缩短人类解决复杂问题的时间,社会生产力水平自然就会越…

微信小程序解决华为手机保存图片到相册失败

1.新增隐私设置 2.优化代码 新增uni.authorize判断 _saveCode() {let that this;console.log(点击了保存图片)console.log(this.result)uni.authorize({scope: scope.writePhotosAlbum,success(e) {console.log(e)if (this.result ! "") {uni.saveImageToPhotosAlb…

RCS系统之:界面设计

RCS Floor Manager设计的主要目的: 实时监控机器人状态实时查看货架状态查看机器人任务状态查看捡货站的任务状态地图的状态信息其他元素,如打包机,机械臂的状态动态的编辑地图元素信息等等 有兴趣的可以留言一起交流下