AI时代带来的图片造假危机,该如何解决

news2024/11/23 19:50:48

一、前言

当今,图片造假问题非常泛滥,已经成为现代社会中一个严峻的问题。随着AI技术不断的发展,人们可以轻松地通过图像编辑和AI智能生成来篡改和伪造图片,使其看起来真实而难以辨别,之前就看到过一对硕士夫妻为了骗保竟篡改结婚证、离婚证等信息:

甚至诺贝尔奖获奖者发表的论文中也疑似进行了图像篡改的行为:

这给社会带来了许多负面影响,尤其是在保险、金融、银行等领域,如果将虚假篡改过的信息资料审核通过更是会带来巨大的影响甚至是经济上的损失。

而且在当今AI快速发展的背景下,图像篡改的技术门槛越来越低,效果也越来越逼真。

所以,研究和开发图像篡改和伪造检测技术变得至关重要,推出一种能高效准确的检测出图像造假的方法或工具是迫在眉睫的!

刚好在最近的WAIC2023大会上,合合信息在图像篡改检测、AI图像安全领域上分享了他们的三种策略:图像篡改检测、AIGC判别、OCR对抗攻击技术:

让我们来看看他们是如何解决这些问题的。

二、会议分享

1)图像篡改检测

早在去年的世界人工智能大会上,合合信息”PS篡改检测”技术首次亮相,“像素级”起底修改痕迹,覆盖身份证、护照等多种证照识别类目,吸引了社会各界关注。我也使用过他们提供的PS检测服务来检测身份证伪造的情况,效果也是非常不错的,能够准确的识别出被篡改的部分:

今年合合信息团队对图像篡改检测“黑科技”持续优化升级,应用面也拓展至“截图篡改检测”,此前,图像篡改检测的技术研究对象主要集中于自然场景图像,然而,真正为人们的生活带来风险的通常是被篡改的资质证书、文档、截图等。现在合合信息的AI篡改检测技术还能够对包括转账记录、交易记录、聊天记录等多种截图,无论是从原图中“抠下”关键要素后移动“粘贴”至另一处的“复制移动”图片篡改手段,还是“擦除”、“重打印”等方式,图像篡改检测技术均可“慧眼”识假:

截图防伪检测对于证照检测来讲是更困难的,因为截图的背景没有纹路和底色,整个截图没有光照差异。证件篡改识别尚可通过拍照时产生的成像差异进行篡改痕迹判断,而截图则没有这些“信息”。现有的视觉模型通常难以充分发掘原始图像和篡改图像的细粒度差异特征,因此难以实现令人满意的准确率。为此,合合信息提出了一种基于HRNet的编码器-解码器结构的图像真实性鉴别模型,结合图像本身的信息包括但不限于噪声、频谱等, 从而捕捉到细粒度的视觉差异,达到高精度鉴别目的:

2)生成式图像鉴别

除此之外,合合信息在生成式图像鉴别方面也有所建树

在去年底的时候,我就体验过AIGC的强大,给予AI一段描述,短短几十秒就能生成出与之匹配的画作出来,下图为我使用某平台的AIGC产品生成的画作(描述文字内容为:森林里的蘑菇房子,梦幻仙境、蘑菇花草):

可以看到效果还是非常不错的,符合描述内容。

可是,随着AIGC的爆火后,不少人将它用于灰色或者违法产业,通过AI去生成不符合版权、违规的图片非法获利、混淆视听。严重危害了广大群众的财产,甚至是社会稳定:

庆幸的是,合合信息研发了AI生成图片鉴别技术,用于帮助个人及机构识别判断AI图片是否为生成的,防止“虚拟人”欺诈,通过解决生成式AI面临的部分伦理问题,助力生成式AI的健康发展:

合合信息基于空域与频域关系建模,输入图片后,模型通过多个空间注意力头来关注空间特征,并使用纹理增强模块放大浅层特征中的细微伪影,增强模型对真实人脸和伪造人脸的感知与判断准确度。能够在不用穷举图片的情况下,利用多维度特征来分辨真实图片和生成式图片的细微差异,解决了生成出来的图像场景繁多,不能穷举、有些生成图和真实图片的相似度过高,难以判别的两大难点。

该项技术的出现,在反诈骗、版权保护等领域的应用空间十分广泛。例如在金融行业,不法分子可利用AI合成技术对线上资金进行盗刷,威胁公民财产安全。本项技术可通过对支付环节的干预,降低资金盗刷概率;在传媒行业,某些图片供给方使用软件自动生成海报等图片,故意隐瞒其来源并售卖给第三方,第三方在不知情的情况下进行商用,导致了侵权问题,相关检测技术可在一定程度上解决这些问题。

3)OCR对抗攻击技术

相信大家在日常生活中,出于工作或其他业务的需要几乎都会遇到拍摄自己的证件照发送给第三方的情况,这些图片上承载的个人信息通常都是个人隐私,除了第三方和自己外不希望被别人获取。一但被别有用心的不法分子使用OCR技术识别提取并泄露,那会造成比较大的损失,比如新闻上经常看到的,身份信息被拿来搞电信诈骗,后面追责下来把自己送进监狱了,简直是无妄之灾!

市面上也有此类的对抗攻击技术来避免这样情况的出现,比如通过下面四种方式对图像进行加密,避免OCR的识别:

  1. 图像干扰:攻击者通过添加噪声、模糊化、旋转、变形等操作来干扰OCR系统对图像的识别。为了对抗这种攻击,OCR系统需要通过图像增强、边缘检测等技术来提高对图像的处理能力。

  2. 文字扰乱:攻击者通过在文本中插入其他字符、修改字符间距、改变字体等方式来扰乱OCR系统对文字的识别。为了对抗这种攻击,OCR系统需要通过设计更加鲁棒的字体和字符匹配算法。

  3. 对抗生成网络(GAN):对抗生成网络是一种通过训练生成器和判别器来同时提高生成样本的质量和判别样本真伪的技术。攻击者可以使用GAN生成看似真实但对OCR系统产生干扰的图像。为了对抗这种攻击,OCR系统需要通过对抗性训练、加入额外的鉴别器等方法提高对伪造图像的检测能力。

  4. 对抗样本生成:攻击者可以通过添加特定的噪声或干扰来改变图像,使得OCR系统产生错误的识别结果。为了对抗这种攻击,OCR系统需要采用强大的对抗样本检测算法,以便及时识别并拒绝对抗样本。

合合信息在此基础上也做了进行了创新技术探索,研发了OCR对抗攻击技术来进行文档图片“加密”,以防止不法分子使用OCR技术识别和提取其中的个人信息,该技术可在不影响肉眼观看与判断的情况下,对场景文本或者文档内文本进行扰动,对包含中文、英文、数字等关键信息的内容进行“攻击”,防止第三方通过OCR系统读取并保存图像中所有的文字内容,降低数据泄露的风险,以此达到保护信息的目的:

三、总结

通过AI,可以制作虚假的图片和新闻报道、以此破坏媒体的可信度和新闻的真实性。这可能导致公众对媒体和新闻的信任度下降,影响舆论和社会稳定。毫不夸张的说,AI造假技术对媒体、法律、政治、娱乐、社交媒体和个人安全等多个行业都会带来巨大的影响。

所以,检测这些造假信息的研究和开发对于保护社会安全和维护公正正义具有重要意义。合合信息AI图像内容检测产品的出现,在保护图像真实性和识别文本方面发挥了重要的作用。 通过自动化、高准确性和多样化的检测功能,这些技术能够帮助用户检测和防御图像篡改、生成式图像欺骗和OCR对抗攻击等问题。然而,我们仍然需要不断努力和创新,以应对不断变化和复杂化的篡改和伪造手段。只有这样,我们才能够更好地应对图像篡改和伪造问题,维护社会的稳定和公正。

值得高兴的是,中国信通院已牵头启动了《文档图像篡改检测标准》制定工作,该项标准由中国信通院牵头,上海合合信息科技股份有限公司、中国图象图形学学会、中国科学技术大学等科技创新企业及知名学术机构联合编制。以期为文档图像内容安全提供可靠保障,助力新时代AI安全体系建设。基于产业现状,围绕“细粒度”视觉差异伪造图像鉴别、生成式图像判别、文档图像完整性保护等行业焦点议题,凝聚行业共识,以期为行业提供有效指引,挖掘文档图像篡改检测技术趋势,助力图像产业健康成长。

相信随着该项标准的制定以及这么多顶尖企业的努力,将会为该行业注入更多的安全感和稳定性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/777571.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Linux】进程信号 -- 信号保存与递达 | 信号捕捉 | 僵尸进程的信号处理方法

阻塞信号信号相关概念内核中的表示sigset_t信号集操作函数sigprocmasksigpending 小实验 - 观察pending表 信号的捕捉流程sigaction1.小实验:如果进程在处理2号信号,那我们继续发送2号信号会怎么样?2.如何正在处理这个信号,同时屏…

js - 关于防抖和节流函数的使用和细节

文章目录 一、什么是防抖二、应用场景三、实现原理1,第一个问题:为什么使用了闭包(也就是说timer为什么定义到了外面)2,第二个问题:防抖函数中this的指向问题: 四、节流函数 一、什么是防抖 事…

【【51单片机的I2C总线】】

51单片机的I2C总线 学会总线,掌控芯片。了解串口,真理全有。 I2C时序 1.起始条件:  SCL在高电平期间,SDA从高电平切换到低电平 终止条件: SCL在高电平期间,SDA从低电平切换为高电…

【go语言学习笔记】01 Go语言快速入门

文章目录 一、基础入门1. 示例程序2. 安装与环境变量设置3. 项目构建和编译发布3.1 go build和go install对比3.2 跨平台编译 二、数据类型1. 基础类型1.1 整型1.2 浮点数1.3 布尔型1.4 字符串1.5 零值 2. 变量2.1 变量声明2.1.1 指定变量类型2.1.2 根据值自行判定变量类型2.1.…

深入学习 Redis - 深挖经典数据类型之 list

目录 前言 一、list 类型 1.1、操作命令 lpush / rpush(插入元素) lrange(查看范围元素) lpushx / rpushx (有约束的插入) lpop / rpop(头删尾删) lindex(获取下…

2023年第三届能源、电力与电气工程国际会议 (CoEEPE 2023)

会议简介 Brief Introduction 2023年第三届能源、电力与电气工程国际会议(CoEEPE 2023) 会议时间:2023年11月22日-24日 召开地点:澳大利亚墨尔本 大会官网:www.coeepe.org 2023年第三届能源、电力与电气工程国际会议(CoEEPE 2023)由安徽大学、…

使用GGML和LangChain在CPU上运行量化的llama2

Meta AI 在本周二发布了最新一代开源大模型 Llama 2。对比于今年 2 月发布的 Llama 1,训练所用的 token 翻了一倍,已经达到了 2 万亿,对于使用大模型最重要的上下文长度限制,Llama 2 也翻了一倍。 在本文,我们将紧跟趋…

JavaScript基础语法及小案例

目录 JavaScript基础语法1. 变量声明和赋值2. 数据类型1) 基本数据类型2) 复合数据类型(引用类型)3) 特殊数据类型 3. 运算符1) 算术运算符2) 赋值运算符3) 比较运算符4) 逻辑运算符5) 三元运算符 4. 控制流程1) 条件语句2) 循环语句 5. 函数1) 函数的基本使用① 什么是函数② …

DXFReader.NET 2023 Crack

DXFReader.NET 是一个 .NET 组件,允许直接从 AutoCAD 图形文件格式 DXF(也称为图形交换格式)查看、操作和打印。 DXFReader.NET 之 DXF 是 Drawing eXchange Format 的首字母缩写。DXF 是图形文件内容的复制,支持将文件从一个 CA…

机器学习深度学习——预备知识(上)

深大的夏令营已经结束,筛选入营的保研er就筛选了1/3,280多的入营总人数里面双非只有30左右。 最终虽然凭借机试拿到offer了,但是我感受到了自己的明显短板,比如夏令营的舍友就都有一篇核心论文,甚至还有SCI一区一作的。…

Mac应用程序因“来自身份不明的开发者”无法打开如何解决

相信不少mac电脑用户在安装应用程序时经常会遇到“xxx.app已损坏,打不开。这是mac系统的新的安全机制,安装 App 时提示: 常见的几种报错提示 xxx 已损坏,无法打开。您应该将它移到废纸篓打不开 xxx,因为它来自身份不明…

旋翼式水表安装注意事项

旋翼式水表是一种常用的水流计量设备,适用于小口径管道的单向水流总量的计量。如果你正在考虑安装旋翼式水表,以下是一些需要注意的事项: 1.安装位置的选择:旋翼式水表应该安装在管道的垂直方向上,并且水流方向必须与水…

探秘ArrayList源码:Java动态数组的背后实现

探秘ArrayList源码:Java动态数组的背后实现 一、成员变量二、构造器1、默认构造器2、带初始容量参数构造器3、指定collection元素参数构造器 三、add()方法扩容机制四、场景分析1、对于ensureExplicitCapacity()方法1.1 add 进第 1 个元素到 …

MQTT的理解和使用

MQTT是一种基于发布/订阅模式的轻量协议,该协议基于TCP/IP协议上,由IBM在1999年发布。 流程理解:订阅者在订阅时会选择主题(Topic)和服务质量(QoS),然后发布者发布消息&#xff0c…

matlab超前-滞后校正

1控制系统的校正 系统性能 稳定性、准确性、快速性 动态性能-超前校正 阶跃曲线、频域(bode图)、根轨迹(增加零点-根轨迹左移稳定性提高)、PID控制(PD) 静态性能-滞后校正 阶跃曲线、频域&#xff08…

Flink CDC MongoDB 联合实时数仓的探索实践

摘要:本文整理自 XTransfer 技术专家, Flink CDC Maintainer 孙家宝,在 Flink Forward Asia 2022 数据集成专场的分享。本篇内容主要分为四个部分: MongoDB 在实时数仓的探索 MongoDB CDC Connector 的实现原理和使用实践 FLIP-262 MongoDB…

Spring MVC拦截器和跨域请求

一、拦截器简介 SpringMVC的拦截器(Interceptor)也是AOP思想的一种实现方式。它与Servlet的过滤器(Filter)功能类似,主要用于拦截用户的请求并做相应的处理,通常应用在权限验证、记录请求信息的日志、判断用…

多肽试剂1801415-23-5,Satoreotide,UNII-S58172SSTS,应用在多肽标记及修饰上

资料编辑|陕西新研博美生物科技有限公司小编MISSwu​ Satoreotide,UNII-S58172SSTS Product structure Product specifications 1.CAS No:1801415-23-5 2.Molecular formula:C58H72ClN15O14S2 3.Molecular weight:1302.9 4.Packa…

【C++详解】——C++11

目录 C简介 统一的列表初始化 {}的初始化 initializer_list容器 声明 auto decltype nullptr 范围for C简介 在2003年C标准委员会曾经提交了一份技术勘误表(简称TC1),使得C03这个名字已经取代了 C98称为C11之前的最新C标准名称。 不过由于C03(TC1)主…

STM32 串口 DMA 接收任意长度数据

DMA 局限性 DMA 传输完成会产生中断告知 CPU,这对于固定长度的数据是没什么问题的。但是对于不定长的数据就不行了,DMA 一定要接收到足够多(设定的长度)的数据时才产生完成中断,如果接收到的数据量小于设定的长度&…