SLBR通过自校准的定位和背景细化来去除可见的水印

news2024/11/28 8:36:49

一、简要介绍

本文简要介绍了论文“Visible Watermark Removal via Self-calibrated Localization and Background Refinement ”的相关工作。在图像上叠加可见的水印,为解决版权问题提供了一种强大的武器。现代的水印去除方法可以同时进行水印定位和背景恢复,这可以看作是一个多任务学习问题。然而,现有的方法存在水印检测不完整和恢复背景的纹理质量下降的问题。因此,作者设计了一个双阶段多任务网络来解决上述问题。粗度阶段由水印分支和背景分支组成,其中水印分支对粗略估算的掩膜进行自校准,并将校准后的掩膜传递给背景分支,重建水印区域。在细化阶段,作者整合了多层次的特征来提高水印区域的纹理质量。在两个数据集上的大量实验证明了作者所提出的方法的有效性。

二、研究背景

随着社交媒体的激增,图像成为最流行的记录和传递信息的载体。为了保护版权或主张所有权,各种类型的可见水印被设计并通过alpha混合叠加在背景图像上。叠加可见水印被认为是对抗攻击者的一种有效的方法。然而,利用现代水印去除技术,水印图像很可能被转换为无水印图像。

水印去除基于水印图像的背景图像,是一个开放且具有挑战性的问题。水印可以覆盖在具有不同大小、形状、颜色和透明度的背景图像的任何位置。此外,水印通常包含复杂的图案,如扭曲的符号、细线、阴影效果等。上述原因使得在没有提供先验知识的情况下,水印去除任务非常困难。图1显示了带水印、无水标记图像和带水印图像的一个示例。在本文的其余部分中,作者交替使用两个术语“背景图像”和“无水印图像”。

在一些前沿工作中,需要定位水印区域的位置。在水印掩膜的指导下,水印去除类似于图像inpainting或特征匹配问题。然而,手动注释每个图像的水印掩膜是非常耗时和成本昂贵的。最近,研究人员尝试通过深度学习方法以端到端方式解决盲水印去除问题。一些工作人员将水印去除问题表述为一个不定位水印的image-to-image的转换任务。相反,其他一些工作认为水印应该局部化,依次或同时去除。尽管这些新兴的方法取得了巨大的成功,但它们仍在努力精确和完全地定位水印,特别是当水印具有复杂的图案、不同的颜色或孤立的片段时。不准确的水印掩膜会干扰背景图像的重建。此外,重建后的图像还存在模糊、伪影、结构扭曲等质量问题,有待进一步改进。

本文提出了一种新的基于自校准定位和背景细化的水印去除网络(SLBR),该网络包括一个粗度阶段和一个细化阶段。在粗度阶段,作者将水印定位和水印去除作为多任务学习框架中的两个任务。具体来说,作者采用了一个U-Net结构,其中两个任务共享相同的编码器,但有两个独立的解码器。掩膜解码器分支预测多尺度水印掩膜,通过掩膜引导的背景增强(MBE)模块为背景解码器分支提供指导,以更好地重建无水印图像。考虑到不同图像中的水印在许多方面存在很大的差异,作者设计了一个自校准掩膜细化(SMR)模块,将水印特征传播到整个特征图中,以更好地处理特定于图像的水印。在细化阶段,作者以预测的水印掩膜和粗度阶段的无水印图像作为输入,生成一个细化的无水印图像。为了充分利用粗度阶段的有用信息,作者在粗度阶段的后台解码器分支和细化阶段的编码器之间添加了跳级连接。考虑到不同层次的特征捕获了结构信息或纹理细节,作者在细化阶段反复使用跨层次特征融合(CFF)模块来聚合多层次编码器特征。从细化阶段得到的输出图像是最终恢复的背景图像。本文的主要贡献可以总结如下:

(1)提出了一种新的跨阶段多任务网络SLBR,其跨任务信息传播技术用于水印去除任务。

(2)在粗度阶段,作者设计了一个新的自校准掩膜细化(SMR)模块来校准水印掩膜,以及一个新的掩膜引导背景增强(MBE)模块来增强背景表示。

(3)在细化阶段,作者提出了一种新的跨层次特征融合(CFF)模块,该模块反复得到细化的无水印图像。在两个数据集上的

(4)实验证明了作者所提方法的有效性。

三、方法介绍

给定在背景图像I上叠加水印得到的水印图像J,去除水印的目标是基于水印图像J恢复无水印图像I。由于水印掩膜M通常未知,本文的方法需要同时执行水印定位和水印去除两个任务,可以在多任务学习框架下适应。如图2所示,整个网络以从粗到细的方式设计,包括粗度阶段和细化阶段。在粗度阶段,与以往的多任务学习方法类似,作者采用了一个共享编码器和两个分割解码器,其中两个解码器分别负责定位水印(掩膜解码器分支)和恢复背景图像(背景解码器分支)。在掩膜解码器分支中,作者设计了一个自校准的掩膜细化(SMR)模块,以提高预测的水印掩膜的质量。为了简化从掩膜解码器分支到背景解码器分支的信息流,作者采用了一个掩膜引导的背景增强(MBE)模块来增强背景解码器的特性。在细化阶段,作者在粗度阶段的解码器特征与细化阶段的编码器特征之间建立跳跃阶段连接,以促进信息从粗度阶段到细化阶段的传播。为了更好地恢复背景图像的结构和纹理,作者还设计了一个跨层次特征融合(CFF)模块,在细化阶段迭代聚合多层次编码器特征。

3.1粗度阶段

在粗度阶段,作者采用U-Net 架构,通过跳路连接编码器和解码器特征,如图2所示。具体地说,作者采用了《Blind visual motif removal from a single image.》的编码器块和解码器块的结构。水印定位和水印去除作为两个任务,它们共享所有五个编码器块和第一个解码器块。但它们有三个独立的解码器块,它们分别组成掩膜解码器分支和背景解码器分支。在掩膜解码器分支中,它配备了作者设计的自校准掩膜细化(SMR)模块,并被分配来指示水印的位置。除了从最后一个解码器块中预测的掩膜外,作者还基于其他两个解码器块的特征来预测侧输出掩膜。在后台解码器分支中,它由掩膜引导的背景增强(MBE)模块组成,并被分配来恢复覆盖有水印的损坏的背景区域。接下来将详细介绍SMR和MBE模块。

五、总结与讨论

本文研究了水印去除任务,开发了一种具有新的MBE、SMR和CFF模块的两阶段多任务网络,该网络可以对水印进行定位,同时恢复无水印图像。在两个数据集上的大量实验验证了作者所提出的网络的优越性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/423317.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C++ 实现 Matlab 的 lp2lp 函数

文章目录1. matlab 的 lp2lp 函数的作用2. matlab 的 lp2lp 函数的使用方法3. C 实现3.1 complex.h 文件3.2 lp2lp.h 文件4. 测试结果4.1 测试文件4.2 测试3阶的情况4.3 测试9阶的情况1. matlab 的 lp2lp 函数的作用 去归一化 H(s) 的分母 2. matlab 的 lp2lp 函数的使用方法…

人脸识别经典网络-MTCNN(含Python源码实现)

人脸检测-mtcnn 本文参加新星计划人工智能赛道:https://bbs.csdn.net/topics/613989052 文章目录人脸检测-mtcnn1. 人脸检测1.1 人脸检测概述1.2 人脸检测的难点1.3 人脸检测的应用场景2. mtcnn2.1 mtcnn概述2.2 mtcnn的网络结构2.3 图像金字塔2.4 P-Net2.5 R-Net2…

为什么说过早优化是万恶之源?

Donald Knuth(高德纳)是一位计算机科学界的著名学者和计算机程序设计的先驱之一。他被誉为计算机科学的“圣经”《计算机程序设计艺术》的作者,提出了著名的“大O符号”来描述算法的时间复杂度和空间复杂度,开发了TeX系统用于排版…

开启数字新时代,5G-Advanced加速带入现实!

在过去的这些年里,我们亲眼见证了5G的崛起。据GSMA&GSA统计,截至2022年12月,全球共部署了超过240张5G商用网络,5G用户超过10亿。在韩国、瑞士、芬兰等地,5G用户渗透率已超过30%。中国的5G网络建设更是独领风骚。截…

形式语言与自动机总结---上下文无关文法(CFG)

第5章上下文无关文法: 设计文法: 做题的时候发现了一个正则表达式到文法的算法 R规则 根据正则式推导右线性文法_右线性文法表达ab*_Pluto 的博客-CSDN博客 举例 设计文法的关键在于理解递归性,文法是一个迭代器 1.The set {| i ≠ j or j ≠ k}, that is, the set of st…

AIGC时代,分享11款超实用AI生成内容检测工具

前往未来百科查看全部AI内容检测工具箱 一、AI 内容检测器 在数字内容创作的世界中,高质量的内容对至关重要。但随着创建的内容量不断增加,确保内容是原创的、高质量的非常具有挑战性。 AI 内容检测器指的是一种利用人工智能技术来自动化审核和识别不当…

进程优先级

目录: 1.进程优先级的概念 2.查看进程优先级的方案 3.linux当中进程的优先级共有40个级别 4.对于进程的其它概念 ---------------------------------------------------------------------------------------------------------------------- 1.进程优先级的概念 为…

Talk预告 | ICLR‘23 斯坦福大学计算机系博士后吴泰霖:学习可控的自适应多分辨率物理仿真

本期为TechBeat人工智能社区第478期线上Talk! 北京时间3月8日(周三)20:00,斯坦福大学计算机系博士后——吴泰霖的Talk将准时在TechBeat人工智能社区开播! 他与大家分享的主题是: “学习可控的自适应多分辨率物理仿真”,届时将分…

灌区泵站及闸门控制自动化系统

根据灌区泵站及闸门控制现状,利用智能终端与互联网相结合方法,实施取水、输水、供水、灌溉、排水、防洪和水资源管理等自动控制系统,实现骨干渠道灌排闸门现场及远程自动控制和远程监测监视,达到计划配水、精准灌溉,高…

AJAX起步入门——介绍和使用

Ajax起步入门——介绍和使用基本用例场景复现核心干货AJAX简介ajax是什么?ajax工作原理ajax是基于现有的Internet标准AJAX实例实例演示实例代码ajax实例解析场景复现 最近学习与前端相关的小程序时,接触了异步请求api的封装和实现,涉及到了很…

多线程并发编程笔记07(小滴课堂)容器

同步容器 我们写这样一段代码。 我们想对vector容器在遍历时,去根据条件删除: 会出现异常。 那正确的方式应该如何去写呢,这里就涉及到了迭代器: 单线程中我们是这么做的。 那么多线程中呢? 有的时候它会报这个错误…

ChatGPT最强对手Claude使用教程

Cladue最近很火,作为ChatGPT4的平替版,它无需付费,使用方便,很多网友通过效果对比,发现它的性能要好于ChatGPT3.5,可以媲美ChatGPT4。最主要是使用很方便,十分钟就可以轻松部署,下面…

MongoDB初认识

MongoDB初认识 文章目录MongoDB初认识0. 写在前面1. MongoDB是什么2. MongoDB的优缺点3. 基础概念解析4. 安装4.1 下载地址4.2 安装MongoDB4.3 pgrep使用4.4 进入 shell 交互页面0. 写在前面 Linux版本:CentOS7.5 MongoDB版本:MongoDB-5.0.2&#xff08…

asp.net博客管理系统统VS开发sqlserver数据库web结构c#编程Microsoft Visual Studio

一、源码特点 asp.net博客管理系统 是一套完善的web设计管理系统,系统具有完整的源代码和数据库,系统主要采用B/S模式开发。开发环境为vs2010,数据库为sqlserver2008,使用c#语言开发 。 二、功能介绍 普通的用户是 123 密…

国产化ChatGPT来袭,景联文科技提供专业数据采集标注服务,人手一个专属ChatGPT或成为可能

ChatGPT作为一个颠覆性的创新,现已成为火爆全球的智能应用。 自ChatGPT爆火以来,国内科技圈开始频频发力,多家科技和互联网公司纷纷表示将开发出中国本土化的ChatGPT。 以百度为例,3月16日,百度推出新一代知识增强大语…

Doris数据模型

Doris支持三种数据模型,分别是: Aggregate Model(聚合模型) Unique Model(唯一模型) Duplicate Model(冗余模型) Aggregate Model(聚合模型) key相同的数…

影子账户——权限维持

文章目录定义创建定义 拥有管理员权限,但除了注册表外均查不到的账户。 创建 1、以管理员身份打开命令提示符 2、创建隐藏用户 3、将隐藏用户添加到管理员组 查看一下,没有显示匿名用户 4、查看《本地用户和组》,我是家庭版Windows&#x…

MySQL的学习

文章目录一、MySQL 插入数据二、MySQL 查询数据三、MySQL WHERE 子句四、MySQL UPDATE 更新五、MySQL DELETE 语句总结一、MySQL 插入数据 MySQL 表中使用 INSERT INTO SQL语句来插入数据。 你可以通过 mysql> 命令提示窗口中向数据表中插入数据,或者通过PHP脚…

Linux学习笔记——网络基础一

文章目录计算机网络发展过程独立模式网络互联局域网LAN广域网WAN计算机网络协议的概念网络协议协议分层OSI七层模型TCP/IP五层(或四层)模型网络传输基本流程数据包封装和分用各层间通信IP地址MAC地址计算机网络发展过程 独立模式 计算机之间相互独立; 网络互联 多台计算机连…

rc.local脚本延时启动

rc.local脚本延时启动1、问题描述2、解决方法3、rc.local脚本依赖关系的处理3.1、对脚本进行分类,分别设置延时启动策略4、测试重启rc-local.service5、rc.local脚本执行特点5.1、rc.local脚本在操作系统启动时只执行一次。5.2、在rc.local脚本中执行程序时是没有环…