PRCV 2023:语言模型与视觉生态如何协同?合合信息瞄准“多模态”技术

news2025/1/16 18:05:03

近期,2023年中国模式识别与计算机视觉大会(PRCV)在厦门成功举行。大会由中国计算机学会(CCF)、中国自动化学会(CAA)、中国图象图形学学会(CSIG)和中国人工智能学会(CAAI)联合主办,多媒体可信感知与高效计算教育部重点实验室、厦门大学人工智能研究院、厦门大学信息学院承办,是国内模式识别和计算机视觉领域的学术盛会。

本次大会通过聚焦中国模式识别与计算机视觉领域的最新理论和技术成果解读、分享,进一步加强产学研领域的学术交流和技术碰撞,促进模式识别与计算机视觉领域的协同合作与融合创新。大会邀请了徐宗本院士、张艳宁教授、李树涛教授、黄铁军教授、胡事民教授作主旨报告;参会人员包括来自清华大学、厦门大学、浙江大学、华中科技大学等高校的科研工作者,以及腾讯、美团、合合信息等科技企业的技术专家。

智能文档处理技术是学术界重点关注的领域,而随着信息渠道的多样化发展,异构化、跨模态的数据层出不穷。文档图像是文字与图片领域的交集点,天然具备多模态属性。在《视言碰撞:语言模型与视觉生态协同论坛》上,合合信息图像算法研发总监郭丰俊博士就文档图像前沿技术热点话题进行了分享。郭丰俊表示,多模态技术可充分利用文档图像的视觉和语言属性,并借助语言大模型已取得的优异性能和技术积累,正逐渐成为文档图像处理领域的热门研究方向。

合合信息图像算法研发总监郭丰俊博士进行《文档图像前沿技术探索——多模态及图像安全》主题分享

“从目前评测的情况来看,已知的多模态预训练系统在文档图像识别准确率上还逊于最先进的OCR识别系统。”郭丰俊提到,合合信息-华南理工大学文档图像分析识别与理解联合实验室对该方向展开了研究,并在数据高效利用及垂直领域识别项目中取得了阶段性成果。

大模型技术的突破让生成式AI拥有了更广泛的落地空间,也让图片伪造的门槛变得更低,给了不法分子可乘之机。大会现场,郭丰俊对合合信息在AI图像安全方面的工作进行了分享。据介绍,合合信息智能文档处理技术覆盖了图像预处理、解析识别到AI安全等文档图像处理全生命周期,图像篡改检测技术不仅能够应用于自然场景,还能应用于资质证书、文档合同、银行保单等截图的鉴别上。针对图片生成式造假,合合信息基于空域与频域关系建模,利用多维度特征来分辨真实图片和生成式图片的细微差异,判断图片是否由AI生成。

今年8月,合合信息获得了文档分析与识别国际会议(ICDAR 2023)“文本篡改检测”赛道冠军。合合信息技术团队提出的方案能够在保持低误检率的同时,准确识别并定位图片中文本的篡改行为,从而有效保障文本信息的真实性。相关方案已在银行、证券、保险多个场景中应用。

“目前,图像篡改检测技术的应用也面临着篡改手段不断变化、场景复杂等系列挑战,不断提升检测系统的鲁棒性和泛化能力,是学术界与企业界需要深入合作的重要方向。”郭丰俊表示,合合信息已联合中国信通院,发起了《文本图像篡改检测系统技术规范》标准制定,希望持续推动AI技术在图像安全领域的广泛应用,带给用户更加安全、高效的工作和生活体验。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1104491.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

最新GMS地下水数值模拟教程

详情点击公众号链接:最新GMS地下水数值模拟教程 前言 GMS三维地质结构建模 GMS地下水流数值模拟 GMS溶质运移数值模拟与反应性溶质运移模 目标 1.GMS的建模数据的收集、数据预处理以及格式等; 2.GMS的建模流程,包括三维地质结构建模、直接…

双硬盘安装双系统失败,grub-install to /dev/sd* failed, fatal error

一个机械硬盘一个固态硬盘,如果只装双系统推荐各自的系统的引导都放在各自的硬盘上,除非一个硬盘上想装两个系统。 安装失败,在写引导程序时提示grub-install /dev/sd* failed, fatal error,这种问题有各种各样的原因&#xff0…

脉冲信号485信号翻斗式雨量传感器的区别

本产品是一种水文、气象仪器,用于测量自然界降雨量,同时将降雨量转换为以开关量形式表示的数字信息量输出,以满足信息传输、处理、记录和显示等的需要。 本仪器由承雨器部件和计量部件等组成。承雨口采用口径Φ200mm。计量组件是一个翻斗式机…

选择适合自己的ERP系统

ERP系统是企业管理的核心工具之一,它能够整合各个业务部门的数据和流程,提供一个全面的管理平台。然而,在众多ERP系统中选择适合自己的一款并非易事。本文将全方位介绍选择适合自己的ERP系统的关键因素、评估步骤和注意事项,帮助企…

Linux常用命令——comm命令

在线Linux命令查询工具 comm 两个文件之间的比较 补充说明 comm命令可以用于两个文件之间的比较,它有一些选项可以用来调整输出,以便执行交集、求差、以及差集操作。 交集:打印出两个文件所共有的行。求差:打印出指定文件所包…

Django REST Framework完整教程-认证与权限-JWT的使用

文章目录 1.认证(Authentication)与权限(Permission)1.1.视图添加权限1.2.登录验证1.3.常用DRF自带权限类1.4.自定义权限类1.5.全局权限1.6.函数视图权限 2.认证详解2.1.认证方案2.2.如何使用TokenAuthentication? 3.JSON Web Token(JWT)认证3.1.工作原理3.2.安装3.…

【MySQL】分析SQL的几种方式

文章目录 一、查看SQL执行频率二、定位低效率执行SQL1. show processlist2. 慢查询日志 三、explain分析执行计划1. id2. select_type3. type4. key5. extra 四、show profile 一、查看SQL执行频率 show session status:显示 session 级的统计结果(不写…

分享261个Python源码源代码总有一个是你想要的

链接:https://pan.baidu.com/s/14t-pmuphJQ-ouqQlOuwtiA?pwd8888 提取码:8888 项目名称 AI悦创Python小项目代码 AI视频创作ffmpegopenai-whispertts Apache Superset数据探查与可视化平台 v2.0.1 API Star工具箱 v0.7.2 Archery SQL审核查询平台 …

星型灯/南瓜灯/饰品灯/圣诞灯,各国检测标准有哪些?

星型灯/南瓜灯/饰品灯/圣诞灯,各国检测标准有哪些? 圣诞装饰灯作为热销产品,出于库存考虑,美国80%进口灯饰的采购在8-10月完成,而中国产品占这些进口灯饰的85%左右,并且几乎所有LED灯都来自中国…

无法访问 github ,解决办法

一、使用代理(首选) 这种办法只需要更改github.com为代理的域名即可,使用方式与GitHub除了域名不同其他都一样,速度挺快,可登陆,可提交。 1、查看当前的代理: git config --global --get htt…

分享135个游戏Python源代码总有一个是你想要的

分享135个游戏Python源代码总有一个是你想要的 链接:https://pan.baidu.com/s/1rQuDok6XRWp-7RzFAfew8w?pwd8888 提取码:8888 游戏项目名称 100%基于Python的,模仿元气骑士的游戏 Chinese Chess Xiangqi 中国象棋 Python Firefly是…

c语言-消息队列

一、消息队列的介绍 消息队列的实现原理是将消息存储在一个队列中,生产者将消息放入队列的尾部,消费者从队列的头部取出消息进行处理。消息队列通常采用先进先出(FIFO)的方式进行消息的存储和处理。消息队列可以实现异步通信&…

软件安全性测试包含哪些类型?2023年专业软件安全测试报告获取

在现今信息化时代,软件安全性问题愈加引起人们的重视。为了确保软件的安全性,软件安全性测试成为不可或缺的一环。   软件安全性测试是指对软件系统进行全面、系统、综合的安全性评估和控制,旨在发现和证明软件系统存在的漏洞和安全隐患&am…

linux 下的java gate服务断掉的原因及解决思路

一.查询断掉的原因 1.查看gate日志,发现没有报错信息,突然就断了 2.查看是不是OOM导致 dmesg | grep java 发现确实Out of Memory了 3.发生问题的原因: 默认情况下, Linux kernels(内核)允许进程申请的量超过系统可用内存. 这是因为,在大多数…

成都瀚网科技有限公司:开抖音店铺有哪些注意事项?

成功经营一个小店不仅仅是发布产品视频那么简单,还需要注意一些重要的事情。开抖音店铺需要注意以下几点: 1、开抖音店铺有哪些注意事项? 合规管理:在抖音开店,首先要确保自己的运营合规。遵守相关法律法规及平台规定&…

【Linux进行时】进程控制

1.进程创建&#xff1a; 1.1fork函数 在linux中fork函数时非常重要的函数&#xff0c;它从已存在进程中创建一个新进程。新进程为子进程&#xff0c;而原进程为父进程。 \#include <unistd.h> pid_t fork(void); 返回值&#xff1a;子进程中返回0&#xff0c;父进程返…

coreldraw2023永久免费版安装包下载

有小伙伴在用电脑查找软件程序的时候&#xff0c;看到了一款叫cdr软件的应用&#xff0c;自己之前没接触过&#xff0c;不知道cdr是什么软件&#xff1f;cdr软件是干什么的&#xff1f;十分好奇。其实它是一款平面设计软件&#xff0c;下面就给大家介绍下相关的cdr软件的知识。…

Spanner: Google’s Globally Distributed Database

1. INTRODUCTION Spanner可以扩展到跨数百个数据中心的数百万台机器与数万亿个数据库行。 Spanner是一个可伸缩、全球化分布的数据库&#xff0c;其由Google设计、构建、并部署。在抽象的最高层&#xff0c;Spanner是一个将数据分片&#xff08;shard&#xff09;到分布在全世…

C语言实现输入一个整数,输出该整数的所有素数因子。例如,输入 120, 输出 2、3 、5

完整代码&#xff1a; //输入一个整数&#xff0c;输出该整数的所有素数因子。例如&#xff0c;输入 120, 输出 2、3 、5 #include<stdio.h>//判断一个数n是否为素数 int isPrimeNumber(int n){//1不是素数if (n1){return 0;}for (int i 2; i <(n/2); i){//当有n能被…

E048-论坛漏洞分析及利用-针对Wordpress论坛插件实现远程代码执行的探索

课程名称&#xff1a; E048-论坛漏洞分析及利用-针对Wordpress论坛插件实现远程代码执行的探索 课程分类&#xff1a; 论坛漏洞分析及利用 实验等级: 中级 任务场景: 【任务场景】 小王接到磐石公司的邀请&#xff0c;对该公司旗下论坛进行渗透测试&#xff0c;已经发现…