Talk | 北卡罗来纳州立大学唐圣坤浙江大学张磊: 数据为中心的高效视觉语言学习—动态退出与数据蒸馏

news2025/4/8 8:40:57

本期为TechBeat人工智能社区第504期线上Talk！

北京时间6月8日(周四)20:00，北卡罗来纳州立大学在读博士生—唐圣坤与浙江大学硕士生—张磊的Talk将准时在TechBeat人工智能社区开播！

他们与大家分享的主题是: “数据为中心的高效视觉语言学习—动态退出与数据蒸馏”，届时将介绍和探讨统一视觉语言模型及其应用与结果。

Talk·信息

▼

主题：数据为中心的高效视觉语言学习—动态退出与数据蒸馏

嘉宾：北卡罗来纳州立大学在读博士生唐圣坤

浙江大学硕士生张磊

时间：北京时间 6月8日 (周四) 20:00

地点：TechBeat人工智能社区

http://www.techbeat.net/

长按识别二维码，一键预约TALK！

Talk·介绍

▼

（上）

目前，对于视觉语言模型的研究，业界趋向于应用统一的模型架构到不同的视觉语言任务。这些统一的模型表现出比单模态和单任务的优越性，在很多的公开数据集上面取得了SOTA的结果。但是这些统一的视觉语言模型在推理的时候需要消耗很多的计算资源，导致推理的速度变慢。我们的方法提出使用提前退出的方案，在尽量保证了模型在不同数据集和不同任务上面表现的同时，最大程度上降低了模型对计算资源的消耗，提升模型对推理速度。

Talk大纲

1.总体介绍统一视觉语言模型

2.介绍我们工作的出发点

3.介绍我们工作的具体方法

4.展示我们对实验结果和分析

（下）

有关深度学习的研究和应用从过去几年到现在正如火如荼地进行，深度学习的成果无一不归功于在大规模数据集进行训练。然后，如此大量的数据不仅给存储带来巨大压力，还给模型训练带来极大开销。关注于这一问题，数据集蒸馏在近年来得到关注。通过对原始大数据集的蒸馏，得到浓缩的小型数据集，使得在这一小数据集上训练出的模型，和在原数据集上训练得到的模型表现相似。但是数据集蒸馏本身也需要耗费大量时间，减少了这一方法本身的高效性。

Talk大纲

1. 数据集蒸馏的效率分析

2. 通过模型增强提升数据集蒸馏速率

3. 高效蒸馏CIFAR，ImageNet数据集

Talk·预习资料

▼

paper链接：

https://arxiv.org/pdf/2211.11152.pdf

Talk·提问交流

▼

在Talk界面下的【交流区】参与互动！留下你的打call🤟和问题🙋，和更多小伙伴们共同讨论，被讲者直接翻牌解答！

你的每一次贡献，我们都会给予你相应的i豆积分，还会有惊喜奖励哦！

Talk·嘉宾介绍

▼

唐圣坤

北卡罗来纳州立大学在读博士生

本科毕业于武汉大学遥感科学与技术。在本科期间，从事三维重建和遥感图像建筑提取的研究。在2023年秋季加入北卡州立大学胥栋宽教授研究组攻读博士学位，从事高效与可靠人工智能方面的研究。目前的研究主要集中在多模态学习领域。

Github：

https://tangshengku.github.io/

张磊

浙江大学硕士生

浙江大学硕士。主要研究方向，数据集蒸馏，模型蒸馏，高效训练。

长按识别二维码，一键预约TALK！

-The End-

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/627322.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

基于jsp+mysql+mybatis的SpringBoot美容院后台管理系统

基于jsp+mysql+mybatis的SpringBoot美容院后台管理系统

运行环境: 最好是java jdk 1.8，我在这个平台上运行的。其他版本理论上也可以。 IDE环境： Eclipse,Myeclipse,IDEA或者Spring Tool Suite都可以，如果编译器的版本太低，需要升级下编译器，不要弄太低的版本 tomcat服务器环…

阅读更多...

【嵌入式环境下linux内核及驱动学习笔记-（15）linux总线、设备、驱动模型之I2C总线】

【嵌入式环境下linux内核及驱动学习笔记-（15）linux总线、设备、驱动模型之I2C总线】

目录 1、 I2C总线机制1.1 导入1.2 时序1.3 地址格式 2、华清fs4412上I2C的实现2.1 寄存器2.2 寄存器位具体含义2.3 fs4412上针对具本设备的I2C工作逻辑2.3.1 主机读写工作流程**2.3.1.1 主机发送时序及操作流程2.3.1.2 主机接收的时序及流程 2.3.2 从机读写工作流程 3、LINUX内…

阅读更多...

Redis-认识NoSQl和Redis常见的通用命令

Redis-认识NoSQl和Redis常见的通用命令

1. 认识NoSQL 非关系型数据库 NoSQL是指一类非关系型数据库，它们采用的数据模型不同于传统的关系模型，它通常使用键值对、文档、图形等非传统的数据结构进行数据存储，不遵循预定义的模式和模型。NoSQL数据库通常分布式、高可扩展性&#xff0…

阅读更多...

【项目一】GCC（gcc，g++）、静态库、动态库、MakeFile、GDB调试

【项目一】GCC（gcc，g++）、静态库、动态库、MakeFile、GDB调试

GCC、静态库 1.2 GCC(1）gcc（1）常用命令（2） C程序编译过程（3）GCC工作流程 1.3 GCC(2）g1.3静态库的制作1.5静态库的使用1.6动态库的制作1.7动态库加载失败的原因1.8解决动态库加载失败…

阅读更多...

秋招必看，Java后端高频面试题1000题、拒绝简单背诵，深入浅出近30个技术栈

秋招必看，Java后端高频面试题1000题、拒绝简单背诵，深入浅出近30个技术栈

Java 面试随着时间的改变而改变。在过去的日子里，当你知道 String 和 StringBuilder 的区别就能让你直接进入第二轮面试，但是现在问题变得越来越高级，面试官问的问题也更深入。在我初入职场的时候，类似于 Vector 与 Array 的区别…

阅读更多...

面试专题：计算机网络常见面试点总结

面试专题：计算机网络常见面试点总结

socket、tcp、udp、http 的认识及区别 socket、tcp、udp、http 的认识及区别一、先来一个讲TCP、UDP和HTTP关系的 1、TCP/IP是个协议组，可分为三个层次：网络层、传输层和应用层。在网络层有IP协议、ICMP协议、ARP协议、RARP协议和BOOTP协议。在传…

阅读更多...

10分钟让你彻底了解Loadrunner性能测试工具

10分钟让你彻底了解Loadrunner性能测试工具

目录 Loadrunner简介 Loadrunner原理 Loadrunner工具组件 1、VUGen（虚拟用户生成器） 2、Controller（控制器） 3、Load Generator（负载生成器） 4、Analysis分析器性能测试工具，从广义上讲…

阅读更多...

Shell脚本攻略：Linux防火墙

Shell脚本攻略：Linux防火墙

目录一、理论 1.安全技术 2.防火墙 3.通信五元素和四元素二、实验 1.iptables基本操作 2.扩展匹配一、理论 1.安全技术 （1）安全技术 ①入侵检测系统（Intrusion Detection Systems）：特点是不阻断任何网络访…

阅读更多...

游戏外包开发技术难点分析

游戏外包开发技术难点分析

游戏开发涉及多个领域的技术，因此在开发过程中可能会遇到很多技术难点。今天和大家分享一些常见的游戏开发技术难点，希望对大家开发游戏有一定帮助。北京木奇移动技术有限公司，专业的软件外包开发公司，欢迎交流合作。 1. 图形渲染…

阅读更多...

「料见」vol25.回顾 | PKU-Beaver开源项目团队：一起来聊首个可复现的RLHF基准

「料见」vol25.回顾 | PKU-Beaver开源项目团队：一起来聊首个可复现的RLHF基准

为了解决复现RLHF技术和基于RLHF技术的大预言模型的不安全问题，北京大学团队开源了名为PKU-Beaver（海狸）开源项目。第25期料见闭门分享会，我“门”非常开心邀请到PKU-Beaver开源项目团队成员——北京大学人工智能研究院助理教授…

阅读更多...

欧美同学会第三届“双创”大赛——空天装备产业赛区（浙江诸暨）正式启动，开启报名通道

欧美同学会第三届“双创”大赛——空天装备产业赛区（浙江诸暨）正式启动，开启报名通道

6月8日，欧美同学会第三届“双创”大赛——空天装备产业赛区（浙江诸暨）启动仪式暨北京推介会圆满举行。活动由欧美同学会（中国留学人员联谊会）主办，中共浙江省委统战部支持，浙江省欧美同学会、中…

阅读更多...

国内比较火的报表工具测评——Smartbi电子表格软件和Finereport

国内比较火的报表工具测评——Smartbi电子表格软件和Finereport

最近在学习BI软件，因为最近工作中需要开发报表，因此选用了国内市场比较热门的报表工具——Finereport和Spreadsheet进行学习。 BI软件经常会定期发布新的版本，增加新的功能模块，或者对现有功能进行增强，提升运行效率。…

阅读更多...

解决pip install -r requirements.txt 超时

解决pip install -r requirements.txt 超时

解决方案： pip install -r requirements.txt -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com测试验证

阅读更多...

让你的AndroidUI更亮眼：Jetpack Compose中的可视状态

让你的AndroidUI更亮眼：Jetpack Compose中的可视状态

让你的Android UI更亮眼：Jetpack Compose中的可视状态任何设计系统的重要责任是清晰地表明哪些组件可以与之交互，哪些不行，并让用户知道交互已发生。本博客文章将解释如何监听Jetpack Compose中的用户交互，并创建可重用的视觉指…

阅读更多...

关于接口的安全性测试，这几点你必须掌握！

关于接口的安全性测试，这几点你必须掌握！

01、接口防刷 1.为什么会有人要刷接口？ 牟利：黄牛在 12306 网上抢票再倒卖。恶意攻击竞争对手：如短信接口被请求一次，会触发几分钱的运营商费用，当量级大了也很可观。压测：用apache bench 做压力测试。…

阅读更多...

高性能计算与AI融合成为刚需|什么是高性能计算？应用领域有哪些？与人工智能的关系梳理

高性能计算与AI融合成为刚需|什么是高性能计算？应用领域有哪些？与人工智能的关系梳理

本文一部分转载自杨净整理自 MEET2023量子位算力的需求，远比以往来得更为猛烈。甚至有人直呼：得算力者得未来。元宇宙、AIGC、AI for Science的涌现，又给高性能计算（HPC）平添了好几把火。在诸多挑战与机遇共存交…

阅读更多...

大数据治理入门系列：数据管理

大数据治理入门系列：数据管理

在如今的大数据时代，每天都会产生大量的新数据，已有数据可能也会频繁更新或转换。因此，需要对数据进行治理和管理，以便高效地开展数据分析、获取数据洞见、挖掘数据价值。否则，杂乱无章的数据只会白白浪费存储空间&…

阅读更多...

python基础----10-----python操作mysql

python基础----10-----python操作mysql

一前言对于SQL章节前言->SQL_DQL_排序分页的课程，这里不做记录，因为都是讲MYSQL本身的内容，与python无关。当然，接下来的课需要用到mysql，所以大家需要自行下载，这并不难。二 python操作MYSQL基础…

阅读更多...

当BPM遇上低代码 “自定义”提升业务管理效率

当BPM遇上低代码 “自定义”提升业务管理效率

业务流程管理（BPM）的历史可以追溯到科学管理和质量管理的发展，并逐步演变为一个更加系统化和综合的管理方法。它在现代组织中起到了优化业务流程、提高效率和质量、增强灵活性和创新能力的重要作用。从20世纪初的科学管理理论中&#xff0c…

阅读更多...

【Linux】什么是进程(process)？

【Linux】什么是进程(process)？

目录进程与程序概念描述进程-PCBWindows进程与Linux进程Linux进程操作子进程父进程创建进程(初识-fork) 进程与程序概念在Linux系统中，触发任何一个事件时，系统都会将它定义成为一个进程，并且给予这个进程一个ID，成为PID&#x…

阅读更多...

推荐文章

最新文章