CVPR首个大模型研讨会顺利召开,吸引超1000支队伍参与文心大模型国际比赛

news2024/11/15 10:40:21

065fece6d34e7118b744ee50cce4eb57.gif

CVPR 作为计算机视觉和模式识别领域的世界级学术顶会,不仅是学者们展示前沿科技成果的学术会议,也是企业界探索前沿应用的一大平台。近年来,随着大模型技术的爆发式发展,基于大模型技术的创新应用正逐步在产业界释放出巨大价值空间。作为人工智能技术领域的领军者与深耕者,百度在大模型技术领域拥有强大的技术优势和深厚技术积累,百度自主研发的产业级知识增强大模型体系文心大模型已经建设了完整的大模型体系涵盖基础大模型、任务大模型、行业大模型等,全面满足产业应用需求。作为文心大模型的核心之一,文心 · CV 大模型 VIMER 已广泛应用在自动驾驶、云智一体、移动生态等核心业务。

41a6acf70b2a216de5d7c5b18acb2210.png百度召开CVPR首届大模型研讨会

共探大模型技术现状和未来

为了进一步推动视觉大模型技术的发展,百度联合浙江大学、香港大学、中科院空天院在 CVPR 2023 上共同举办了首届大模型 Workshop,大模型领域内的顶级学者和精英们共同探讨了大模型技术的最新进展和未来动向,并收录了来自百度、剑桥大学等企业/高校的论文。

874e9b90257699dcb94d2a5a3af539fb.png

在6月19日举行的 CVPR 2023 Foundation Model Workshop 上,来自百度的资深工程师、中科院空天院客座研究员希滕教授和百度主任架构师张刚分别进行了开幕式和闭幕式致辞。希滕教授还重点介绍了百度文心 CV 大模型及文心交通大模型。

685f63a7ed1d4e4f7c63ba44c458a951.png

来自华为的资深研究员谢凌曦介绍了 NLP 大模型与 CV 大模型的区别并提出了 CV 大模型未来的机遇与挑战。

54faed91634ea876f1b413049362328d.png

1137a85c9aa2c51450a0013b32759033.png

千支队伍逐鹿产业级大模型盛赛

产学共探技术革新之道

智能交通领域首个多任务大模型国际比赛的举办是今年CVPR 2023大模型研讨会的一大亮点,竞赛从Foundation Model领域的关键问题出发,设置了多任务大模型赛道及跨模态大模型赛道,吸引了全球35个国家和地区、超过1500人参赛,征集到来自美团、网易、大华等公司以及清华大学、香港科技大学、华中科技大学、中科院等高校的众多解决方案。

近年来,智慧汽车、人工智能等产业发展,为智能交通发展创造了良好的发展机遇。智能交通相关技术已经渗透到我们的日常生活中,但是现有大模型的多任务处理模式以及传统的感知方法(如分类、检测、分割等)无法满足我们对更广交通场景以及更高自动驾驶水平的追逐。百度从当前实际技术研究中的关键问题出发,设置了两大赛道

a4c6815fa8753b74dea4ac9e7014272e.png

赛道一:统一多任务大模型赛道 

本赛道旨在解决多任务、多数据的合并冲突问题。对于设计精良的网络结构和损失函数,多个任务共同训练能大幅提升模型的泛化性。由于特定任务的数据存在noise,仅使用单一任务的数据进行训练,存在过拟合的风险。统一多任务大模型通过将多个任务的数据整合进行统一训练,能够对不同任务的noise做一个平均,进而使模型学到更好的特征。为了进一步探索统一多任务大模型的能力上限,本赛道以交通场景典型任务为题,覆盖了分类、检测、分割三大类CV任务至单一大模型中,使得单一大模型具备能力的同时获得领先于特定单任务模型的性能。最终Allin one大模型在分类、检测、分割任务上的加权指标会作为获奖标准。

5015645062ab6ca8a94cb75d21bec8f6.png

赛道二:跨模态图像检索赛道 

本赛道旨在提升文本图像检索的精度。在交通场景中高性能的图像检索能力对于交通执法、治安治理具有十分重要的作用,传统的图像检索方式通常使用先对图像进行属性识别再通过与期望属性的对比实现检索能力。随着多模态大模型技术的发展,文本与图像的表征统一和模态转换已有广泛应用,使用该能力可以进一步提升图像检索的准确性和灵活性。

研讨会上,希滕教授宣布了今年Foundation Model国际比赛的胜出队伍,最终CTRL队、njust队分别获得了多任务大模型赛道及跨模态大模型赛道的冠军,并现场进行了技术方案的分享。

e27007cbc8a37f2147a40de60878ff1b.png

e7681c7374427a740eb7fa86108ad7aa.png

随着CVPR 2023 大模型研讨会的正式落幕,会议中探讨的应用场景正在陆续走向行业落地。百度作为人工智能技术领域的领军者与深耕者,在修炼好AI技术“内功”的同时,也将不断向各行业场景输出技术能力与解决方案,进一步推动产业智能化升级发展。

 文心·CV大模型地址

https://github.com/PaddlePaddle/VIMER

822b97f4a8ff54ceaffeb000878b06a5.gif

关注【飞桨PaddlePaddle】公众号

获取更多技术内容~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/673842.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

网易云信陈丽:做泛娱乐出海新浪潮中的坚实助力者

6 月 16 日下午,在 PAGC 2023 泛娱乐出海论坛上,网易智企副总经理、网易云信总经理陈丽分享了对全球化出海的趋势洞察和未来展望,并介绍了网易云信在帮助泛娱乐出海业务增长方面的探索和实践。 陈丽表示,网易云信志在成为中国开发…

STM32开发——非标协议(DH11+LCD1602)

1.STM32分文件实现代码 编译的总文件夹dh11andlcd,C文件不能跨文件夹查找,新增的分文件,需要都放调用的文件夹下 C文件和H文件理解:H文件是门脸,放在前面给别人的,别人一看就知道有什么东西。C是给内部人用…

记录--新的HTML标签 :search

这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 本文介绍了一种新的HTML元素搜索方法,并提供了一个实用的工具来帮助开发者快速找到所需的元素。这对于那些需要处理大量HTML元素的开发者来说是非常有用的。文章还通过提供一些常见元素的用…

AutoSAR系列讲解(入门篇)1.1-AutoSAR的发展史

一、AutoSAR成员 大体可以分为核心成员、高级成员和发展成员,可以打开AutoSAR官网的成员的介绍界面 所以有兴趣的小伙伴可以稍微了解一下,仅作了解就行,不是什么重要的知识 还有一张大家经常能看见的成员图,如下 二、AutoSAR历史…

国潮之美丨土家族西兰姑娘续写千年非遗传奇

光脚丫,童年时期的行为艺术 还记得儿时的夏夜,姥爷总说:“娃儿呀,光着脚在地上跑,接地气些”。那时只觉得脱掉鞋袜顿时轻松自在,从坡上冲到坡下,几个伙伴乐此不疲。后来长大了,穿着…

盘点一个Python网络爬虫过验证码的问题(方法一)

点击上方“Python爬虫与数据挖掘”,进行关注 回复“书籍”即可获赠Python从入门到进阶共10本电子书 今 日 鸡 汤 低眉信手续续弹,说尽心中无限事。 大家好,我是皮皮。 一、前言 前几天在Python最强王者群【鶏啊鶏。】问了一个Python网络爬虫的…

SSH连接异常:从迷茫到石破天惊的解决之道

文章目录 零:前言一:SSH1.1 SSH的连接类型、方式和端口1.2 常见端口及其类型 二:解决SSH连接异常第一步:欣赏报错,顺藤摸瓜第二步:异常窥探,摸石过河第三步:问题确定,斩首…

测试技术体系

目录: 软件测试分类分层测试体系 1.软件测试分类 软件测试的分类_安全性测试属于功能测试吗_阿瞒有我良计15的博客-CSDN博客 1.单元测试(Unit Testing):单元测试是指对软件的最小可测试单元进行测试,例如一个函数、一…

Cell — 新“出芽”方法为疫苗开发带来优势

在疫苗学中,基于mRNA向体内递送抗原编码基因同基于纳米颗粒向体内递送抗原在应对具有挑战性的病原体方面都显示出巨大的前景。本期的《Cell》中,Hoffmann等人将两种方法相结合,通过调节被许多病毒劫持的相同细胞代谢通路来增强SARS-CoV-2疫苗…

【UCOS-III】自我学习笔记→第27讲→优先级翻转

文章目录 前言实验步骤1.复制二值信号量工程,添加task2和task3,修改任务服务函数名称2.修改开始任务,任务1以及任务2、3的内容3.查看串口现象![在这里插入图片描述](https://img-blog.csdnimg.cn/efa5ee2d92b54fe8be5a419adcf92ead.png) 测试…

STM32速成笔记—DMA

文章目录 一、什么是DMA二、DMA有什么作用三、STM32的DMA3.1 DMA请求3.2 DMA通道3.3 仲裁器 四、DMA配置4.1 DMA配置步骤4.2 DMA结构体成员 五、DMA配置程序5.1 ADC1初始化程序5.2 DMA初始化程序 一、什么是DMA DMA全程Direct Memory Access,即直接存储器访问。简单…

如何保护阿里云服务器免受DDoS攻击和恶意访问?有哪些防护措施?

如何保护阿里云服务器免受DDoS攻击和恶意访问?有哪些防护措施?   [本文由阿里云代理商[聚搜云]撰写]   随着互联网技术的不断发展,网络安全问题日益严峻,保护服务器免受DDoS攻击和恶意访问成为了每个企业和网站建设者的关注重…

W3B x Sui Hacker House|深入了解Sui和Move语言

Web3 Builders(W3B)作为Hacker House的践行者,将于6月23日(周五)早上8点(GMT8)举办首期 W3B x Sui Hacker House 系列活动分享会。本期活动邀请到Sui联合创始人Sam Blackshear(Move语…

【机器学习】机器学习的基本概念

机器学习是我们现在接触人工智能领域首先要去掌握的知识,下面是我学习记录的一些关于机器学习的基础、常见的概念和定义。 目录 机器学习定义 机器学习过程 假设关系 训练数据 损失函数(正向传播) 优化(反向传播&#xff0…

PC市场:寒冬敲响警钟,蓄势待发的复兴之路

近年来,PC市场的增长确实放缓,但这并不意味着它已经进入了寒冬。相反,PC市场正在蓄势待发,寻找复兴之路。 首先,PC市场仍然是一个巨大的市场。尽管移动设备的普及使得一些用户更多地使用手机和平板电脑,但…

C++:虚函数

C面向对象的三个特性,封装继承多态。在继承的关系中,所有的东西都可以被继承下来,如数据可以被继承下来在内存,而函数的继承则是继承调用权。 虚函数主要是通过虚函数表来实现,每个类都有自己的虚表,当你创…

RevCol:大模型架构设计新范式,给神经网络架构增加了一个维度!

点击蓝字 关注我们 关注并星标 从此不迷路 计算机视觉研究院 公众号ID|计算机视觉研究院 学习群|扫码在主页获取加入方式 论文地址:https://arxiv.org/pdf/2212.11696.pdf 项目代码:https://github.com/megvii-research/RevCol 计…

把金融航母开进智能峡湾,总共分几步?

试想一下,有这么一家街头小店。夫妻两个勤奋经营,诚信待客,广受街里街坊的欢迎。他们流水稳定,蒸蒸日上,商业信誉很好,甚至是非物质文化遗产的传承者。这样一家店,在扩大经营,拓展业…

SpringBoot集成WebSocket实现消息实时推送(提供Gitee源码)

前言:在最近的工作当中,客户反应需要实时接收消息提醒,这个功能虽然不大,但不过也用到了一些新的技术,于是我这边写一个关于我如何实现这个功能、编写、测试到部署服务器,归纳到这篇博客中进行总结。 目录 …

C语言代码函数栈帧的创建与销毁(修炼内功)

目录 在前期的学习中我们可能有很多困惑 例如:局部变量是怎么创建的 为什么局部变量的值是随机值 函数是怎么样传参的 传参的顺序是什么 形参和实参的关系是什么 函数调用是怎么做的 函数掉调用结束后怎么返回的 这篇博客我们来修炼自己的内功,掌握好这篇…