基于解压缩模块的JPEG同步重压缩检测论文学习

news2024/12/22 19:37:18

一、论文基本信息:

论文题目:基于解压缩模块的JPEG同步重压缩检测

作者:王金伟1 ,胡冰涛1 ,张家伟1 ,马 宾2 ,罗向阳3

(1.南京信息工程大学计算机学院、网络空间安全学院,江苏南京 210044;2.齐鲁工业大学山东省计算机网络重点实验室,山东济 南 250353;3.数学工程与高级计算国家重点实验室,河南郑州 450001)

来源刊物:电子学报

时间:2023年4月第四期

二、论文背景

        JPEG(Joint Photographic Experts Group)作为一种广泛应用的图像压缩标准,因其高效性与普适性而受到广泛的关注。然而,连续对同一图像进行多次JPEG压缩可能会导致可检测的重压缩痕迹,在数字图像取证等敏感领域具有重要的实际意义,可以判断图像是否被篡改。

        传统的方法过于依赖于人工提取的截断和舍入误差,无法实现端到端,这种方式存在一定的信息损失的风险,会导致JPEG图像的特征不能被充分挖掘,可能会对后续的图像分析和取证造成一定的困扰。在此背景下,本文章提出了一种基于解压缩模块的JPEG同步重压缩检测方法,通过卷积操作模拟JPEG的解压缩过程,利用卷积网络的自动优化去寻找解压缩过程的最优解,同时解除对JPEG同步重压缩问题的性能限制,充分挖掘出JPEG图像的特征,提高对同步重压缩问题的检测性能。

三、论文研究方法

基于解压缩模块的JPEG同步重压缩检测模型如下图所示:

a81f67986bb1453e97a24fd4ded83d50.png

解压缩模块:利用IDCT变换矩阵实现 IDCT

        本文利用矩阵乘法实现了IDCT,将反量化后得到的每个8*8图像块拉伸成长度为64的一维列向量,从而得到一个64*256大小的新矩阵。新矩阵左乘一个IDCT变换矩阵,实现对原图的IDCT变换。变换过程如图1所示。

 73a6848cdcd1445892d6cef84c4d688d.png

图 1 利用IDCT变换矩阵实现IDCT的方式

特征提取模块:

        文章的特征提取模块设计为双流的结构,分为亮度通道和色度通道两种,对亮度和色度先进行提取,然后将提取到的特征信息进行聚合。如下图所示:

27c714ceb76847b7968c48f41e4ba6d8.png

 

        亮度通道流由一个BN层,四个卷积层和一个池化层组成。其中,BN层进行数据归一化操作,防止过拟合。池化窗口的大小为2*2,步长为2*2。卷积层的卷积核大小为3*3,并且卷积核数量依次递增,分别为16,32,64,128。

        色度通道较亮度通道,BN层和池化层的设计相同而卷积层少一层。卷积层的卷积核大小为5*5,卷积核个数也依次增加,分别为16,32,64,128。这样的结构设计是因为压缩过程对色度信息损失严重,使用多的卷积层可能会导致特征冗余,但使用太少的卷积层有可能会导致不能提取到有效信息,使精度下降。

统计层

        选择传统的均值和方差作为分类依据,通过将提取到的特征转换为统计特征,引导模型关注图像像素值的变化,从而更好地提取重压缩特征。

消融实验验证了解压缩模块和统计层的有效性。

        通过实验,探究解压缩模块的影响。分别测试包含解压缩模块和去除解压缩模块的方法在JPEG重压缩检测问题上的性能,对比两个测试的结果,与去除解压缩模块的模型相比,含有解压缩模块的检测模型整体精度平均提升了3.01%。最终证明出解压缩模块能有效提取出特征,减少信息损失。

        通过实验,探究统计层的影响。分别测试包含统计层的模型和去除统计层模型的方法在 JPEG 重压缩检测问题上的性能,对比测试结果,得出包含统计层的检测模型相比去除统计层的模型,整体精度平均提升了1.53%。同时也验证了统计特征中的均值和方差在JPEG重压缩检测问题中具有重要作用。

对比实验

        在多个数据集上,与其他两种最新的基于深度学习的 JPEG 同步重压缩检测方法进行的对比实验显示,所提出的方法在大多数实验组中表现出优势。这充分说明了本文章提出的基于解压缩模块的JPEG重压缩检测方法在解决JPEG同步重压缩问题上的有效性。

四、论文研究结果

  1. 完成解压缩模块的设计与实现,利用卷积操作模拟JPEG的解压缩过程,并通过对比实验得出该方法较两种。
  2. 提出一个端到端的基于解压缩模块的JPEG同步重压缩检测模型,并通过实验验证压缩模块和统计层的有效性。
  3. 贡献了一个数据集。现有的JPEG公开的数据库时间都比较长远,实验团队自行拍摄、收集、制作了新的数据集Nuist-v1,方便验证实验的有效性。

五、总结与展望

         通过学习这篇论文,我学到在JPEG解压缩的过程中会产生截断和舍入误差,特征过于依赖于此,造成只能通过人工的方法在预处理阶段提取特征,这同时也导致无法实现端到端。并且现有的解压缩是根据经验设计的,模型的精度方面还有很大的进步空间。而本文章提出的基于解压缩模块的JPEG重压缩检测方法可以利用卷积操作模拟JPEG的解压缩过程,成功实现端到端,省去了预处理步骤,并且利用深度学习自动调整参数,找到最优解问题,减少因为人工操作而造成的信息损失。该方法不仅在实验中表现出色,而且为数字图像取证和图像完整性验证等领域提供了一种更为有效的解决方案。其次,本文章的实验方法中还使用了卷积操作,利用深度学习的特性进行研究,这也启示我,深度学习可以涉及的领域很广泛,它的优势也是非常鲜明的,未来也要加深这方面的学习。同时,我也注意到对比实验中在质量因子为60和70时性能略有下降的情况,可能是因为空域特征的提升有限,还在一定程度上造成了一定的冗余,这可能需要进一步的改进,才能得到更好的结果。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2182283.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Linux-L11-查看本机ip地址

linux查看ip地址 查看自己的IP地址使用 ip 命令:使用 ifconfig 命令使用 hostname 命令:使用 nmcli 命令 查看某个特定接口的IP查看公网IP地址 在Linux系统中,查看自己的IP地址可以通过多种方式实现,这里提供几种常用的方法&#…

Stable Diffusion绘画 | LCM模型:实现秒出图

在过往,不管使用 SD 还是 MJ,生成一张图片起码要等上10秒。 而现在,有了 LCM 技术的加持,已经能做到秒出图,甚至是实时出图。 LCM(潜空间一致性模型) 是由 清华大学信息科学技术研究院 研发的大模型,它最…

鸿蒙 如何退出 APP

terminateSelf() 停止Ability自身 在EntryAbility中这么使用 this.context.terminateSelf()在Pages页面中这么使用 import { common } from kit.AbilityKit (getContext(this) as common.UIAbilityContext)?.terminateSelf() 也可以直接封装: import common f…

【GreenHills】GHS的Run-Time检查功能

【更多软件使用问题请点击亿道电子官方网站】 一、文档背景 在编写代码时,内存检查的重要性不容忽视。内存是程序运行的核心资源之一,负责存储程序运行所需的数据。由于内存资源的有限性和操作的复杂性,内存错误常常会直接导致程序崩溃、性…

华为开源自研AI框架昇思MindSpore应用案例:基于MindSpore框架的Swin Transformer

如果你对MindSpore感兴趣,可以关注昇思MindSpore社区 模型简介 模型背景 Swin Transfromer在2021年首次发表于论文《Swin Transformer: Hierarchical Vision Transformer using Shifted Windows》,目前已用于图像分割、分类等计算机视觉领域的各项任务…

如何搭建医疗陪诊平台?基于互联网医院系统源码的开发技术详解

本篇文章,小编将深入探讨医疗陪诊平台的搭建过程,尤其是基于互联网医院系统源码的开发技术,以期为有志于此领域的开发者提供参考。 一、选择合适的互联网医院系统源码 在搭建医疗陪诊平台时,选择合适的互联网医院系统源码至关重…

【前端开发入门】前端开发环境配置

目录 引言一、Vscode编辑器安装1. 软件下载2. 软件安装3. 插件安装 二、Nodejs环境安装及版本控制1. 安装内容2. 使用nvm安装2.1 软件下载并安装2.2 nvm基本指令2.3 nvm下载过慢导致超时解决 三、git安装及配置1. 软件下载2. 软件安装3. 基础配置 四、总结 引言 本系列教程旨在…

SRC漏洞挖掘 | 针对Spring-Boot 框架漏洞的初探

💗想加内部圈子,请联系我! 💗文章交流,请联系我!🍬 博主介绍 👨‍🎓 博主介绍:大家好,我是 一个想当文人的黑客 ,很高兴认识大家~ ✨主…

fmt:C++ 格式化库

fmt 是一个现代化、快速且安全的 C 格式化库,专注于高效地格式化文本。它提供了类似 Python 的 format 功能,但具有更高的性能和类型安全特性。fmt 库在处理字符串格式化、日志输出以及构建用户友好的输出时尤为强大。自从 C20 标准引入 std::format 后&…

文章解读与仿真程序复现思路——电网技术EI\CSCD\北大核心《故障扰动下的风火储送端系统频率动态特性与储能容量优化配置》

本专栏栏目提供文章与程序复现思路,具体已有的论文与论文源程序可翻阅本博主免费的专栏栏目《论文与完整程序》 论文与完整源程序_电网论文源程序的博客-CSDN博客https://blog.csdn.net/liang674027206/category_12531414.html 电网论文源程序-CSDN博客电网论文源…

婚前协议模版(琴生生物机械科技工业研究所)

婚前协议示例 本协议由甲方(全名),身份证号码( _________ ),与乙方(全名),身份证号码( _________ ),在平等、自愿、相互尊重及充分沟…

DataEase v2 开源代码 Windows 从0到1环境搭建

一、环境准备 功能名称 描述 其它 操作系统 Windows 数据库 Mysql8.0 开发环境 JDK17以上 本项基于的21版本开发 Maven 3.9版本 开发工具 idea2024.2版本 前端 VSCode TIPS:如果你本地有jdk8版本,需要切换21版本,请看…

[python] 基于PyOD库实现数据异常检测

PyOD是一个全面且易于使用的Python库,专门用于检测多变量数据中的异常点或离群点。异常点是指那些与大多数数据点显著不同的数据,它们可能表示错误、噪声或潜在的有趣现象。无论是处理小规模项目还是大型数据集,PyOD提供了50多种算法以满足用…

解决银河麒麟fcitx进程资源占用高的问题

解决银河麒麟fcitx进程资源占用高的问题 1、问题描述2、解决方法 💐The Begin💐点点关注,收藏不迷路💐 1、问题描述 银河麒麟桌面系统中,fcitx进程占用CPU和内存过高,导致系统卡顿。 2、解决方法 卸载并清…

OPENCV判断图像中目标物位置及多目标物聚类

文章目录 在最近的项目中,又碰到一个有意思的问题需要通过图像算法来解决。就是显微拍摄的到的医疗图像中,有时候目标物比较偏,也就是在图像的比较偏的位置,需要通过移动样本,将目标物置于视野正中央,然后再…

IP协议讲解

IP协议 IP协议的本质:提供一种能力,将数据跨网络从A主机传输到B主机 4位版本号(version): 指定IP协议的版本, 对于IPv4来说, 就是4. 4位头部长度(header length): IP头部的长度是多少个32bit, 也就是 length * 4 的字节数. 4bit表示最大 的数字是15, 因…

Linux(三)文件管理、复杂操作与实用工具详解

Linux学习笔记(三)文件管理、复杂操作与实用工具详解 Linux 学习笔记(二):深入理解用户管理、运行级别与命令行操作 1.文件操作的基本操作 1.1 创建 创建目录 mkdir:创建目录 mkdir /home/dog # 创建单级…

【顺序表使用练习】发牌游戏

【顺序表使用练习】发牌游戏 1. 介绍游戏2. 实现52张牌3. 实现洗牌4. 实现发牌5. 效果展示 1. 介绍游戏 首先先为大家介绍一下设计要求 实现52张牌(这里排除大小王)洗牌——打乱牌的顺序发牌——3个人,1人5张牌 2. 实现52张牌 创建Code对象创…

NVIDIA G-Assist 项目:您的游戏和应用程序AI助手

NVIDIA G-Assist 是一个革命性的人工智能助手项目,旨在通过先进的AI技术提升玩家的游戏体验和系统性能。这个项目在2024年Computex上首次亮相,展示了其在游戏和应用程序中的潜在应用。 喜好儿网 G-Assist 的核心功能是提供上下文感知的帮助。它能够接收…

OLED移植

一、在D盘中找到OLED文件包 二、新建一个HAL库工程 只需要配好RCC和SYS以及时钟树就可以,不开启任何引脚 三、移植文件 把文件放在Core->Src里面 四、在Kile5中添加文件 五、注意 (1)下载的时候要开启Rsset and Run 不然下载不进程序 &a…