Learning Rich Features for Image Manipulation Detection阅读笔记

news2024/11/24 9:35:16

文章目录

  • Abstract
    • 3.3. 双线性池

Abstract

图像篡改检测与传统的语义目标检测(semantic object detection)不同,因为它更关注篡改伪影(tampering artifacts)而不是图像内容,这表明需要学习更丰富的特征。我们提出了一个两流 Faster R-CNN network,并对其进行端到端训练,以检测给定被操纵图像的篡改区域。其中一个流是 RGB 流,其目的是从RGB图像输入中提取特征,以查找 tampering artifacts,如强烈的对比度差异、不自然的篡改边界等。另一个是噪声流,利用从隐写分析富模型滤波层(steganalysis rich model filter layer)提取的噪声特征来发现真实区域和篡改区域之间的噪声不一致。然后,我们通过双线性池化层融合来自两个流的特征,以进一步合并这两种模态的空间共现(incorporate spatial co-occurrence of these two modalities)。在四个标准的图像处理数据集上的实验表明,所提出的双流框架优于每个单独的流,并且与对缩放和压缩具有鲁棒性,也实现了最先进的性能。


在这里插入图片描述

3.3. 双线性池

最后,我们将RGB流与噪声流结合起来进行操作检测。在各种融合方法中,我们对来自两个流的特征应用了双线性池化(bilinear pooling)。双线性池化[23],首次提出用于细粒度分类,在保留空间信息(spatial information)的同时,结合双流CNN网络,以提高检测置信度。我们的双线性池化层的输出为 x = f R G B T f N x=f_{R G B}^{T} f_{N} x=fRGBTfN,其中 f R G B f_{R G B} fRGB 为RGB流的 Rol 特征, f N f_{N} fN 为噪声流的 Rol 特征。和池化在分类之前对空间特征进行挤压。然后我们在前向全连接层之前应用有符号平方根 ( x ← sign ⁡ ( x ) ∣ x ∣ ) (x \leftarrow \operatorname{sign}(x) \sqrt{|x|}) (xsign(x)x ) L 2 L_2 L2 归一化。


为了在不降低性能的情况下节省内存和加速训练,我们使用[17]中提出的紧凑双线性池化(compact bilinear pooling)。

在完全连接层和softmax层之后,我们得到了 RoI 区域的预测类,如图2所示。我们使用交叉熵损失进行操纵分类,使用平滑 L 1 L_1 L1 损失进行边界框回归。总损失函数为:

L total  = L R P N + L tamper  ( f R G B , f N ) + L b b o x ( f R G B ) , (2) L_{\text {total }}=L_{R P N}+L_{\text {tamper }}\left(f_{R G B}, f_{N}\right)+L_{b b o x}\left(f_{R G B}\right),\tag{2} Ltotal =LRPN+Ltamper (fRGB,fN)+Lbbox(fRGB),(2)

其中Ltotal表示总损失。LRPN为RPN网络中的RPN损耗。Ltamper表示最终的交叉熵分类损失,它基于RGB和噪声流的双线性池化特征。Lbbox表示最终的边界框回归损失。fRGB和fN是来自RGB和噪声流的RoI特征。所有项的总和产生总损失函数。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/850082.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Java】异常处理 之 Java的异常

Java的异常 在计算机程序运行的过程中,总是会出现各种各样的错误。 有一些错误是用户造成的,比如,希望用户输入一个int类型的年龄,但是用户的输入是abc: // 假设用户输入了abc: String s "abc&quo…

UNIX网络编程卷一 学习笔记 第二十七章 IP选项

IPv4允许在20字节的首部固定部分后跟最多共40字节的选项。尽管已经定义了10种IPv4选项,但最常用的是源路径选项。我们可通过存取IP_OPTIONS套接字选项访问这些选项,我们存取该套接字选项时,所用的缓冲区中的值就是它们置于IP数据报中的格式。…

南京https证书中的通配符https证书

随着互联网的快速发展,越来越多的网站开始使用HTTPS协议来保证用户的信息安全和隐私。而HTTPS协议的实现离不开HTTPS证书的支持。HTTPS证书是一种数字证书,用于验证网站的身份并加密数据传输。它通过使用公钥加密技术,确保用户与网站之间的通…

Spotfire相关

文章目录 基础架构服务器基础状态管理服务状态查看overviewserver diagnostic:instance 服务器启停 server配置资源池配置 基础架构 SPF DB 存储:用户权限信息、schedule信息、配置信息、建立的dxp文件 服务器基础状态管理 服务状态查看 overview serv…

C++ 指针函数和函数指针

除了void类型的函数之外,函数在调用结束之后都要有返回值,指针也可以是函数的返回值。当一个函数的返回值是指针类型时,这个函数就是指针型函数。 使用指针型函数的最主要目的就是要在函数结束时把大量的数据从被调函数返回到主调函数中。而通…

判断是否在当前页面事件方法

页面可见性 页面可见性介绍 长期以来我们一直缺少一个判断用户是否正在浏览某个指定标签页的方法。用户是否去看别的网站了?他们切换回来了吗?现在html5里页面可见性接口就提供给了程序员一个方法,让他们使用visibilitychange页面事件来判断…

【肌电图信号分析】通道肌电图并查找收缩周期的数量、振幅、最大值和持续时间(Matlab代码实现)

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…

财报解读:上半年仍在亏损,百济神州烧钱狂飙还能坚持多久?

2023年上半年对于创新药新秀百济神州而言,显然是喜忧参半的。 年初1月份,凭借在与美国本土巨头药品PK中的优秀表现,百济神州拳头产品获得了美国药监局批准,得以覆盖更多的适应症,由此引爆销售增长;而年中6…

【MATLAB第67期】# 源码分享 | 基于MATLAB的morris全局敏感性分析

【MATLAB第67期】# 源码分享 | 基于MATLAB的morris全局敏感性分析 一、代码展示 clear all npoint100;%在分位数超空间中要采样的点数(计算次数iternpoint*(nfac1) nfac20;%研究函数的不确定因素数量 [mu, order] morris_sa1((x)test_function(x), nfac, npoint)for t1:size…

剑指offer56-I.数组中数字出现的次数

这道题我知道要用位运算,想了一下没头绪就直接看题解了,就是所有元素进行异或操作,对于两个操作数的每一位,相同结果为0,不同结果为1,在计算过程中,成对出现的数字的所有位会凉凉抵消为0&#x…

备份容灾哪家好怎么样

数字化时代,数据安全是我们不容忽视的问题。云呐容灾备份系统不仅提供了强大的数据保护功能,而且操作简单,使用方便。无论你是企业管理员,还是个人用户,都可以轻松上手。它还提供了丰富的报告和监控功能,让…

尚品汇总结九:RabbitMQ在项目的应用(面试专用)

项目中的问题 1.搜索与商品服务的问题 商品服务修改了 商品的上架状态,商品就可以被搜索到.采用消息通知,商品服务修改完商品上架状态,发送消息 给 搜索服务,搜索服务消费消息,进行商品数据ES保存.下架也是一样. 2.订单服务取消订单问题 延迟队里 保存订单之后 开始计时,…

每日一题——最小花费爬楼梯

题目 给定一个整数数组 cost ,其中 cost[i] 是从楼梯第i 个台阶向上爬需要支付的费用,下标从0开始。一旦你支付此费用,即可选择向上爬一个或者两个台阶。 你可以选择从下标为 0 或下标为 1 的台阶开始爬楼梯。 请你计算并返回达到楼梯顶部的…

【Matlab】RBF神经网络遗传算法(RBF-GA)函数极值寻优——非线性函数求极值

上一篇博客介绍了GRNN-GA:GRNN神经网络遗传算法(GRNN-GA)函数极值寻优——非线性函数求极值,神经网络用的是RBF神经网络,RBF神经网络和GRNN神经网络有相似之处。本篇博客将GRNN神经网络替换成RBF神经网络,希望能帮助大家快速入门R…

推荐5本软件测试人员必读经典书籍

学会选择对的学习方法 俗话说:“选择大于努力”。 初学软件测试也如此。很多刚入行测试的同学最容易陷入一个误区,那就是优先买一堆视频来学习。结果时间过去了,视频仅以形式主义存在电脑的硬盘里,从此走上了入门到放弃之路。 …

第1章:绪论

科学、技术、工程、应用 科学:是什么、为什么技术:怎么做工程:怎样做的多快好省应用:怎么使用 定义 机器学习:利用经验改善系统自身的性能。 研究 智能数据分析(数据分析算法) 典型的机器…

Q-Tester 3.8:适用于开发、生产和售后的诊断测试软件

Q-Tester是一款简易使用的诊断测试软件,同时也是一款基于ODX(ASAM MCD-2D/ISO 22901-1)国际标准的工程诊断仪,通过该诊断仪可实现与ECU控制之间的数据交互。这一方案的优势是,在功能方面确定并完成相关开发工作后&…

【MATLAB第65期】基于LSTM长短期记忆网络的多输入单输出数据预测未来思路介绍(短期预测)

【MATLAB第65期】基于LSTM长短期记忆网络的多输入单输出数据预测未来思路介绍(短期预测) 往期第13期已实现多输入单输出滑动窗口回归预测 多输入单输出滑动窗口回归预测 往期第54期已实现多输入多输出滑动窗口回归预测 多输入多输出滑动窗口回归预测 一…

基于gpt4all的企业内部知识问答服务应用搭建

文章目录 痛点项目缘起技术选型fine-tuningfew shot prompt engineering选定方案的特征描述 模型赛马gpt4all调优部署时踩坑python3.9 header缺失 -- 安装下缺失的就行运行时参数调优 代码分析项目代码库代码 效果展示例子1例子2 附录:所用的公司内部API文档例子&am…

【SpringBoot】日志是什么+基于lombok的日志输出

博主简介:想进大厂的打工人博主主页:xyk:所属专栏: JavaEE进阶 在我们日常的程序开发中,日志是程序的重要组成部分,想象⼀下,如果程序报错了,不让你打开控制台看⽇志,那么你能找到报错的原因吗…