WAIC2023丨AI图像内容安全“黑科技”如何助力科技发展?

news2024/9/23 5:17:02

〇、前言

7月7日下午,2023世界人工智能大会(WAIC)“聚焦·大模型时代AIGC新浪潮—可信AI”论坛在上海世博中心红厅举行。人工智能等技术前沿领域的著名专家与学者、投资人和领军创业者汇聚一堂,共同探索中国科技创新的驱动力量。

在本届世界人工智能大会上,中国信息通信研究院围绕 “多模态基础大模型的可信AI”主题 举办了专项论坛。AIGC安全成为当前人工智能研究发展的重要议题。

在这里插入图片描述

文章目录

  • 〇、前言
  • 一、可信人工智能
  • 二、AI图像安全
    • 1️⃣AI图像篡改检测技术
    • 2️⃣生成式图像鉴别
    • 3️⃣OCR对抗攻击技术
  • 三、总结

一、可信人工智能

可信人工智能(Trusted AI)是指在人工智能应用中注重可信度和可靠性的概念。

中国科学院院士何积丰认为,“不能再将人工智能视为简单的技术工作,而是成为整个组织的变革引擎。可信人工智能要致力于保障数据安全可信、系统行为可追责、算法模型可解释、网络环境可信、法律伦理可信等问题。”

在这里插入图片描述

随着人工智能技术的不断发展,越来越多的人们对于人工智能系统的透明性、公正性和可控性提出了要求。 可信人工智能需要满足以下几个方面的要求:

  • 透明性:人工智能系统的决策过程和算法应该是可解释的和可理解的,用户应该能够了解系统是怎样做出判断和决策的。

  • 公正性:人工智能系统应该避免对不同群体或个体存在歧视性的待遇,不应该根据种族、性别、年龄等个人属性做出不公正的决策。

  • 隐私保护:人工智能系统在处理个人数据时,应该保护用户的隐私权,确保个人信息不被滥用或泄露。

  • 安全性:人工智能系统应该具备防范恶意攻击和滥用的能力,保障系统的安全性和可靠性。

  • 可控性:人工智能系统应该具备一定的可控性,用户应该能够对系统进行监督和管理,确保系统行为符合用户的期望并满足法律和伦理的要求。


二、AI图像安全

中国科学技术大学电子工程与信息科学系教授谢洪涛教授曾提到,“在AIGC爆发的时代,普通民众都可以利用AI算法生成高质量的文本,图像,音频内容。其中,由Midjourney, Stable Diffusion等图像生成方法制作的图像,其逼真程度让人赞叹,人眼已经难以对其真假进行区分。这不禁唤起了人们的隐忧:大量虚假图片将会在互联网上广泛传播。虚假图片的泛滥会引发多种社会安全问题”

在这里插入图片描述

利用AI进行图像造假的行为,是AI可信化发展需要应对的重点问题。

目前,人工智能的深度学习和算法越来越先进,深度合成应用呈指数级增长,滥用该技术的行为正带来肉眼可见的伦理问题。除了用AI换脸诈骗,还有人用它制作他人不雅视频、冒充明星带货等。在支付场景日益丰富的今天,人类的面部、声音、指纹、虹膜等生物信息的使用越来越广泛,隐私泄露等风险隐患也随之增多。

在这里插入图片描述

恰如那句网络流行语:你永远不知道网络的对面是一个人还是一条狗。如果不对此类技术加以限制,AI技术不仅容易威胁到人身财产安全、伤害个人尊严和隐私,还可能构成更大社会危害。

图像是承载信息的重要媒介,同时也是信息安全的重要关注对象。 随着图像编辑软件的发展和普及,制作虚假图像的门槛逐渐降低,导致大量基于虚假图片的诈骗案件和网络暴力事件在全球范围内造成了严重的影响。

随着生成式造假技术的兴起,人们对图像内容的安全性和可信性也越来越关注。然而,在图像内容领域中,“可信AI”才刚刚起步。

在论坛上,合合信息AI图像内容安全技术方案获得了业界人士的广泛关注。 该方案可精准定位截图篡改痕迹,对生成式图片进行智能判别,防止不法分子利用技术手段非法爬取图片上的信息。

合合信息智能创新事业部总经理唐琪现场介绍合合信息AI图像安全技术应用

合合信息一直致力于在文档智能领域中探索前沿技术,特别关注"AI+OCR"技术的应用。研究了视觉差异伪造图像的鉴别技术,致力于提供能够加密证件文档图片信息的解决方案。此外,他们还关注生成式图像判别和文档图像完整性保护等行业焦点的议题。通过技术输出和产品服务,帮助个人和企业增强图像内容的安全性。

在本次世界人工智能大会可信AI论坛上,合合信息展示了 “三大技术,一项标准”,探索AI在图像内容安全领域可信化发展的多重可能。

在这里插入图片描述

合合信息AI图像安全技术方案主要包括三项重点技术:AI图像篡改检测生成式图像鉴别OCR对抗攻击技术,以应对日益高发的恶意P图、生成式造假和个人信息非法提取现象。

1️⃣AI图像篡改检测技术

合合信息智能创新事业部总经理唐琪介绍,去年的世界人工智能大会上,合合信息首次展示了“PS篡改检测”技术,在识别证件、票据等各类重要商业材料中的PS痕迹方面具有了“火眼金睛”。
合合信息图像篡改检测技术应用效果展示

该技术基于深度学习,提供图像篡改检测技术及相关系统。该技术通过学习图像被篡改后的统计特征变化,智能地捕捉图像在篡改过程中留下的微小痕迹。使用热力图的形式展示图像中篡改的区域,这项技术已经成功应用在银行、保险等领域。

今年,图像篡改检测技术持续优化升级,并拓展到了"截图篡改检测"领域。过去,图像篡改检测技术主要应用于自然场景图像,但实际上,资质证书、文档、截图等被篡改的图像更容易对人们的生活造成风险。合合信息的人工智能图像篡改检测技术可以检测多种截图,例如转账记录、交易记录、聊天记录等。无论是通过从原始图像中"抠取"关键要素并将其移动至其他地方的"复制移动"图像篡改手段,还是采用"擦除"、"重打印"等方式,图像篡改检测技术都能准确识别假图像。

“重打印”篡改图片检测示例:给定一张图片,输入到合合信息篡改检测模型中,便能够判别这张图像是否被篡改,并且定位出篡改图像的篡改区域。
该技术的主要难点在于,能否从没有明显视觉差异的图片中找出被篡改的截图,以及找出的图片中是误检率是否可控。与证照篡改检测相比,截图检测难度更大。 因此,合合信息提出了一种基于HRNet的编码器-解码器结构的模型。该模型结合了图像自身的信息,包括但不限于噪声、频谱等,以捕捉到细粒度的视觉差异,充分利用HRNet的优势,从而实现高精度的图像真实性鉴别效果。


2️⃣生成式图像鉴别

近年来,以语言生成和视觉生成为代表的人工智能生成内容引发了社会对于图文内容的可信度问题的讨论。不法分子利用生成的图片规避版权、身份验证等手段,非法获取利益并给人们带来财产损失。

在这样的背景下,合合信息开发了AI生成式图片鉴别技术,旨在帮助个人和机构识别判断生成的图片是否来自AI生成,防止虚假的虚拟人诈骗行为,并解决生成式AI所面临的伦理问题,推动生成式AI的健康发展。

该项目的难点主要有两个方面:一是生成的图像场景非常多样,无法通过穷举的方式来解决,也无法通过特定领域细分来一一训练;二是有些生成的图像和真实图片相似度非常高,很难以区别。合合信息通过建立空域和频域之间的关系模型,能够在不需要穷举图像的情况下,利用多维度特征来区分真实图片和生成式图片之间的微小差异。

模型结构如下图所示:在这里插入图片描述
该模型使用多个空间注意力头关注输入图片的空间特征,并通过纹理增强模块来突出浅层特征中的细微伪影,从而提高对真实人脸和伪造人脸的感知和判断准确性。

生成式图像检测技术在反诈骗、版权保护等领域有着广泛的应用。例如,在金融行业中,不法分子可能使用人工智能合成技术来盗刷线上资金,威胁公民的财产安全。这项技术可以通过对支付环节进行干预,降低资金盗刷的风险。在传媒行业中,某些图片供应商使用软件自动生成海报等图片,故意隐瞒来源并出售给第三方,第三方在不知情的情况下商用这些图片导致侵权问题。相关的检测技术可以在一定程度上解决这些问题。

3️⃣OCR对抗攻击技术

人们会出于生活、工作需要,拍摄自己的相关证件、文件并发送给第三方,这些图片上承载的个人信息可能被不法分子使用OCR技术识别提取并泄露。

为了满足个人和企业对于文件资料保密的需求,合合信息进行了创新技术的探索,开发了OCR对抗攻击技术,用于对文档图片进行"加密"。为了防止上述情况发生,OCR对抗攻击技术被用来对场景文本或文档内的文本进行干扰,将个人或企业的重要文件 “上锁”,从而防止第三方通过OCR系统读取和保存图片中的所有文字内容,降低数据泄露的风险,并实现隐私信息的保护。

该技术可以在不影响肉眼观看和判断的情况下,对场景文本或文档内的文字进行扰动,对包含中文、英文、数字等关键信息的内容进行"攻击"。 这样做可以防止第三方通过OCR系统读取并保存图像中的所有文字内容,从而降低数据泄露的风险,保护信息的安全。同时,这种技术不会对人眼的观看和判断造成影响,使得文档的可读性不受影响。


三、总结

人工智能的发展面临着正面和负面两种可能性,不法分子和守护者们之间的争斗每天都在无形中进行。关键在于,哪一方拥有更强大的技术实力,决定了是道高一尺还是魔高一丈。

AI图像安全新技术的实现,得益于合合信息在文档图像领域十余年的深耕攒下的底蕴。作为一家人工智能公司,过硬的科技实力是合合信息突破行业难题,培育创新技术的底气。正是这种科技实力使得合合信息能够在这个不断变化的领域中保持竞争优势,并为社会提供更安全的图像解决方案。

在这里插入图片描述

现阶段,合合信息已获得超百项自主知识产权发明专利,为全球超过200个国家和地区的上亿用户提供智能文字识别产品及AI服务。未来,合合信息将持续关注图像领域新需求、新动态,用“过硬”的AI为行业发展注入安全感。


在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/759045.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

latex3【排版】

多行公式排版:(gather、align、split、cases) \section{多行公式}%gather环境\begin{gather} abba \\ abcbaccbacab\end{gather}\begin{gather*} abba \\ abcbaccbacab\end{gather*}​\begin{gather} abba \\ 123 \notag …

贪吃蛇游戏制作

目录 前言 游戏设计 游戏三部曲 函数说明 优化设计 1 前言 终极目标:打造酷炫贪吃蛇游戏 制作环境: VS2015(支持VC2010,VS各个版本) easyx图形库(稍微改下VC6.0也可以实现) 2 游戏设计 贪吃蛇的制作思路就是蛇头带动蛇尾移动,主要…

记一次linux服务器k8s服务失败,重新安装centos系统并部署k8s以及服务【2023年7月15日】

周五,突然收到微信消息说:兄嘚~ 网站无法访问了! 我以为就是普通的小问题,连上服务器看报错呢,执行kubectl get nodes [rootnode101 ~]# kubectl get nodes The connection to the server 127.0.0.1:6443 was refused…

FL Studio 21具有哪些功能?flstudio21会有什么新功能

FL Studio 21 是一个功能完备的音乐制作环境,能够进行多轨道音频录制、音序处理和混音,可以帮助用户创作专业质量的音乐轨道。 借助 VST 托管、灵活的混音器、高级 MIDI 和 ReWire 支持,您将轻松驾驭各种音乐风格。 歌曲或循环可以导出为 .wa…

[QT编程系列-15]: 基础框架 - 信号与槽,connect函数详解

目录 一、线程内不同对象的通信 1.1 connect函数介绍 1.2 connect的用法 1.3 代码示例 二、不同线程间不同对象的通信 2.1 概述 2.2 代码案例 一、线程内不同对象的通信 1.1 connect函数介绍 在使用 Qt 框架进行开发时,connect 函数是用于建立信号与槽机…

hadoop -- Hbase

HBase是一个分布式、可扩展、面向列的数据存储(百万级别列)、可伸缩、高可靠性、实时读写的NoSQL 数据库。 HBase利用 Hadoop的 HDFS作为其文件存储系统, 利用MapReduce 来处理HBase中的海量数据, 利用Zookeeper作为分布式协同服…

AIGC之文本内容生成概述(下)——Transformer

在上一篇文章中,我们一口气介绍了LSTM、Word2Vec、GloVe、ELMo等四种模型的技术发展,以及每种模型的优缺点与应用场景,全文超过一万字,显得冗长且繁杂,在下文部分我们将分开介绍Transformer、BERT、GPT1/GPT2/GPT3/Cha…

electron+vue3全家桶+vite项目搭建【23】url唤醒应用,并传递参数

文章目录 引入实现效果实现步骤测试代码 引入 demo项目地址 很多场景下我们都希望通过url快速唤醒应用,例如百度网盘,在网页中唤醒应用,并传递下载链接,在electron中要实现这样的效果,就需要针对不同的平台做对应的处…

SpringMVC【SpringMVC拦截器、 SpringMVC跨域请求、SSM整合】(七)-全面详解(学习总结---从入门到深化)

目录 SpringMVC拦截器_拦截器过滤敏感词案例 SpringMVC跨域请求_同源策略 SpringMVC跨域请求_跨域请求 SpringMVC跨域请求_控制器接收跨域请求 SSM整合_需求分析 SSM整合_创建父工程 SSM整合_创建dao子工程 SSM整合_创建service子工程 SSM整合_创建controller子工程 …

Gradle和Aritifactory,实现上传Apk并发送消息到钉钉

Gradle和Aritifactory 本文链接:https://blog.csdn.net/feather_wch/article/details/131746580 文章目录 Gradle和AritifactoryGradle基本介绍Gradle插件开发流程本地仓库artifactory搭建添加仓库使用本地仓库gradle插件仓库引入 插件buildSrc开发步骤xxxPluginPg…

【力扣周赛】第 354 场周赛

文章目录 Q1:6889. 特殊元素平方和思路——简单模拟题竞赛时代码 Q2:6929. 数组的最大美丽值思路——差分数组,计算每个数字可能出现的次数竞赛时代码 Q3:6927. 合法分割的最小下标思路——投票法求出现次数超过半数的元素 模拟竞…

dede tag彩色随机大小的样式修改方法

dede tag彩色随机大小的样式修改方法,打开include/common.func.php 在最下面添加以下代码: //TAG彩色 jinmengqiang.cn function getTagStyle() { $minFontSize8; //最小字体大小,可根据需要自行更改 $maxFontSize18; //最大字体大小,可根据需要自行更改…

(中等)剑指Offer II 062.实现前缀树 Java

Trie,又称前缀树或字典树,是一棵有根树,其每个节点包含以下字段: 指向子节点的指针数组children,对于本题而言,数组长度为26,即小写英文字母的数量。此时children[0]对应着小写字母a&#xff0…

数据结构(王道)——队列

一、队列的定义 三个重要名词:队头、队尾、空队列。 二、队列的基本操作 队列总结: 三、队列的顺序表实现 基本操作: 静态创建队列顺序表 队列顺序表的初始化操作: 入队操作: 入队操作优化: 最优版入队操作…

Navicat-Cracker NavicatCrackerDlg.cpp:332 -3已解决Navicat 162版本注册问题的详细分析与解决方案

博主 默语带您 Go to New World. ✍ 个人主页—— 默语 的博客👦🏻 《java 面试题大全》 🍩惟余辈才疏学浅,临摹之作或有不妥之处,还请读者海涵指正。☕🍭 《MYSQL从入门到精通》数据库是开发者必会基础之…

一零六五、零基础入门数据挖掘-心跳信号分类预测(阿里云天池赛)

目录 赛制官方链接 赛题简介 赛制说明 长期赛(2021年7月~) 正式赛(3月12日 - 5月12日) 大赛组织 赛题背景 赛题数据 评测标准 结果提交 代码实现 赛制官方链接 零基础入门数据挖掘-心跳信号分类预测_学习赛_…

哈希表以及用js封装一个哈希表

最近在学数据结构和算法,正好将学习的东西记录下来,我是跟着一个b站博主学习的,是使用js来进行讲解的,待会也会在文章后面附上视频链接地址,大家想学习的可以去看看 本文主要讲解哈希表,其他数据结构后续学…

轻松入门Python量化交易(三)

大家好,我们接第二部分继续分析金融数据。 配对图和相关矩阵 证券中的相关性分析为我们提供了有趣的投资策略。市场中一个广为人知的策略叫做“Long-Short”,即买入一家公司的证券,同时卖出另一家公司的证券,相信这两个资产在市…

《微服务架构设计模式》第八章 外部API模式

内容总结自《微服务架构设计模式》 外部API模式 一、API设计难题二、API Gateway 模式1、简介2、所有者模式3、好处和弊端4、设计问题5、实现一个API Gateway 三、使用GraphQL 实现API Gateway四、总结 一、API设计难题 1、移动客户端的API设计难题 在此设计中,移动…

动态规划(二) —— 打家劫舍系列问题总结

前言 除了背包系列问题,打家劫舍系列问题同样也是动态规划的经典题目。在这篇文章中荔枝将会把打家劫舍系列问题做一下总结,再仔细体会动态规划的思想,希望能帮到有需要的小伙伴~~~ 文章目录 前言 一、Leecode198.打家劫舍 1.1 分析 1.2 …