VALSE 2023 无锡线下参会个人总结 6月10日-1

news2025/2/11 8:55:23

VALSE2023无锡线下参会个人总结6月10日-1

  • 会场照片
  • 6月10日会议日程安排
  • 大会主旨报告:
    • 高文:特征编码与数字视网膜
    • 焦李成:下一代深度学习的思考与若干问题
    • 陈熙霖:计算机视觉-从孤立到系统性方法
  • 企业宣讲环节(一)
  • 年度进展评述(一)
    • 吴建鑫:神经网络模型轻量化设计
    • 刘烨斌:基于 NeRF 的三维视觉
    • 张兆翔:类脑智能
    • 夏勇:医学影像检测与分割
  • 大会特邀报告
    • 朱军:扩散概率模型的前沿进展
    • 王井东:CV 大模型 VIMER
    • 章国锋:基于隐式神经表示的三维重建、渲染与定位
    • 刘偲:开放视觉感知
  • 企业宣讲
    • OPPO:罗俊:OPPO影像主张及技术创新的机遇与挑战
    • AutoDL:余佳:破解用卡难复现难新方案
  • 年度进展评述(二)
    • 侯淇彬:开放域目标检测/识别
    • 王利民:视频动作分析与识别
    • 胡瀚:视觉自监督学习
    • 程塨:遥感目标检测
    • 邓伟洪:人脸感知计算
    • 邓成:多模态融合感知
    • 魏哲巍:图表示学习
    • 刘成林:文档智能

写在前面

  今年 VALSE 2023 的举办地刚好在博主目前就读学校的所在地,江苏无锡,欢迎各方学者前来参会。先预告下,今年的确是大模型的主场了,ChatGPTA、AGI 等等百花齐放。

  会议持续3天(6月10-12日),7个特邀报告,12个APR报告,20场Workshop,186篇左右的顶会顶刊Poster。报告对比去年更多了,论文少了10几篇。

每篇博文的内容太多消化不了,请移步以下链接分别浏览:

  • [VALSE2023无锡线下参会个人总结6月10日-1]
  • [VALSE2023无锡线下参会个人总结6月11日-2]
  • [VALSE2023无锡线下参会个人总结6月12日-3]

  PS:2023 年每周一篇博文阅读笔记,主页更多干货,欢迎关注。有问题私信或者留言都可,笔者看到后第一时间回复,期待 5 千粉丝有你呦 ~

会场照片

步入会场
会场中前方
会场前方
Poster展区
赞助商展区
赞助商展区

6月10日会议日程安排


  第一天没有 Workshop 的,所以大家都是同时看的一场报告。

大会主旨报告:

高文:特征编码与数字视网膜

高老师的报告主要围绕人眼中的视网膜如何与计算机视觉联系、编码等进行讲解,具体的可以搜索下卢老师相关文章,下面是一些现场的PPT照片。

请添加图片描述

请添加图片描述
整个报告就是 PPT 做的很深,但是高老师讲的内容还是容易理解的。PS:高老师并未来到现场,采用提前录屏的方式进行。

焦李成:下一代深度学习的思考与若干问题

请添加图片描述
在这里插入图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
从焦老师的报告开始就精彩起来了,分别从深度学习的起源和理论方面讲解现在、之后深度学习还有哪些亟待解决的问题。如果是在读博士,应该能读懂一些东西。其中模型的可解释性部分可以看下区间我的博客 VALSE2022天津线下参会个人总结8月22日-1,特邀报告2和3都涉及到模型的可解释性问题,需要了解相关知识的欢迎查看。

陈熙霖:计算机视觉-从孤立到系统性方法

请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
陈老师一眼看上去就是位和蔼可亲的老师,PPT 所讲的内容也是切合实际。从一开始的计算机视觉引入,到目前计算机视觉的发展趋势:合久必分,分久必合(合的阶段:直接利用GPV模型去做下游任务)。未来一定是大模型的天下,也能够催生更多的产业应用。另一个重要的点是模型算法复杂度的思考:通用模型倾向于简单化,而专用模型可能进一步复杂化。最后两页的PPT非常重要,更多的是提问与回答,很多启示。

企业宣讲环节(一)

  图森未来和华为,其中图森做自动驾驶的,方向不是太符合,所以没咋拍 PPT,于是接下来华为的:

请添加图片描述
请添加图片描述
捅破天!

请添加图片描述
请添加图片描述
这次上台演讲的是华为诺亚方舟实验的成员,前面几张PPT都是实验室的产出成果,看的出来非常厉害,接下来两张PPT是华为目前所面临的一些难点问题,感兴趣的朋友可以关注下。

年度进展评述(一)

吴建鑫:神经网络模型轻量化设计

请添加图片描述
吴老师的主页:https://cs.nju.edu.cn/wujx/index.htm,有模型轻量化方向的强烈建议关注下!
这次会议的进展回顾提纲和所涉及的论文:https://cs.nju.edu.cn/wujx/paper/RefinedFileInfo.html,能看出来是位非常严谨的老师。

请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述

刘烨斌:基于 NeRF 的三维视觉

这个不懂,欢迎关注我的一位小伙伴:杀生丸学AI,他的方向是 NeRF。我这里就只放出一些PPT,感兴趣的可以关注 杀生丸学AI。

请添加图片描述
请添加图片描述

张兆翔:类脑智能

  这个当时应该是去干饭了,没拍到,[!尴尬]。

夏勇:医学影像检测与分割

  夏老师有点事情没到现场,由他的博士后学生报告。
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述

大会特邀报告

朱军:扩散概率模型的前沿进展

  这是下午的报告,不懂,拍了两张PPT。

请添加图片描述
请添加图片描述

王井东:CV 大模型 VIMER

请添加图片描述
请添加图片描述

章国锋:基于隐式神经表示的三维重建、渲染与定位

请添加图片描述
请添加图片描述

刘偲:开放视觉感知

请添加图片描述
刘偲老师在2020年的时候就听过她的报告,当时做的指代分割。去年在天津上作了人工智能+艺术 的 workshop 报告以及优秀学生论坛的主席,基本上相当于 21-22 年发表论文的一个总结了。今年给我们讲的是开放视觉感知,很有意思。
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述

企业宣讲

OPPO:罗俊:OPPO影像主张及技术创新的机遇与挑战

请添加图片描述

AutoDL:余佳:破解用卡难复现难新方案

  和去年一样的标题,换人了,上新了新机器,确实牛批,价格学生都可以承受。官网指路:AutoDL。

年度进展评述(二)

侯淇彬:开放域目标检测/识别

请添加图片描述
开放域的问题是在之前目标检测与识别基础上衍生而来的,因为目前的这些基础任务很难再去设计新的模型结构了,只能在之前的方向上加限定条件。

请添加图片描述
请添加图片描述
请添加图片描述
今年没怎么大谈预训练了,这个坑估计被占满了。

王利民:视频动作分析与识别

请添加图片描述

请添加图片描述

请添加图片描述
请添加图片描述
最后一页PPT是论文链接,放不出来,手打下:

  • VideoMAE code & mode
    https://github.com/MCG-NJU/VideoMAE
    https://github.com/OpenGVLab/VideoMAEv2
    https://github.com/OpenGVLab/InternVideo
    https://github.com/OpenGVLab/Ask-Anything
  • Temporal and spatial action detection code
    https://github.com/MCG-NJU/AdaMixer
    https://github.com/MCG-NJU/STMixer
    https://github.com/MCG-NJU/PointTAD
    https://github.com/MCG-NJU/BasicTAD
  • 实验室主页:
    Multimedia Computing Group, Nanjing University
    OpenGVLab

胡瀚:视觉自监督学习

请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
基本上能发现一些自监督后续的趋势(也快卷不动了,😅)。

程塨:遥感目标检测

  程老师的主页:https://gcheng-nwpu.github.io/

请添加图片描述
请添加图片描述

邓伟洪:人脸感知计算

  邓老师开玩笑说,这年头怎么还有人在研究人脸的?答案就在汇报里面,具体可查看邓老师主页。

请添加图片描述

邓成:多模态融合感知

  由其学生代为报告。

请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
涉及到的论文篇数很多,四个多模态方向:融合、预训练、感知(具体任务)、生成。时间有限,理解起来也比较深奥,需要花时间读读这些论文。

魏哲巍:图表示学习

请添加图片描述

请添加图片描述
请添加图片描述
请添加图片描述
图神经网络方向,不懂。

刘成林:文档智能

请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
文档智能也是涉及到多模态,刘老师的演讲报告内容很丰富,需要的建议关注下刘老师组。

写在后面

  第一天的任务量很多,确实大部分没太听懂。短时间内输出大量内容,只得讲个大致提纲,具体还得落实到论文上。

请添加图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/645987.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

邓铎:书中自有天地人

邓铎,一个优秀的艺术家,他的书法作品、理论文章自成一派,从书法中咀嚼出人生百味,大千世界,写下了他生命中“六十余载,书中天地人”的执着与坚持。 作为一名优秀的书法家,邓铎的艺术表达具有独…

网安笔记14 firewall

防火墙概述 由软件和硬件组成的系统,它处于安全的网络和不安全的网络之间,根据由系统管理员设置的访问控制规则,对数据流进行过滤 对于内部攻击以及绕过防火墙的连接却无能为力 对数据流如何处理 允许数据流通过拒绝数据流通过&#xff0…

构建工具 Vite、Webpack、Rollup对比

Webpack介绍 热更新方面:webpack支持HMR,但是webpack需要全部重新编译并更新,效率较低 tree-shaking:webpack2开始支持且消除效果不好,但是webpack5有更好的tree-shaking(去除未使用代码) 分包…

0基础学习VR全景平台篇第43篇:编辑器底部菜单-隐藏场景

大家好,欢迎观看蛙色VR官方系列——后台使用课程! 本期为大家带来蛙色VR平台,底部菜单—隐藏场景功能操作。 功能位置示意 一、本功能将用在哪里? 隐藏场景功能,指将选中的场景隐藏,浏览页将不显示隐藏的…

最详细,从0-1性能测试步骤详细,测试老鸟经验总结...

目录:导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜) 前言 性能测试流程 性…

sandfly-entropyscan:一款功能强大的恶意程序熵扫描工具

关于sandfly-entropyscan sandfly-entropyscan是一款功能强大的熵扫描工具,该工具可以用于检测与恶意软件相关的打包文件或加密二进制文件。除此之外,该工具还支持查找恶意文件和Linux进程相关的安全信息,并提供带有加密哈希的输出结果。 s…

cesium学习(下载,官方案例)

下载cesium源码 可以从官网直接下载,官网下载的是编译好的。链接: https://www.cesium.com/downloads/从github下载源码,方便我们本地调试学习(本文采用这种方式)。链接: https://github.com/CesiumGS/cesium 运行项目 安装依赖 npm i运行 npm run …

八股|ThreadLocal的内存泄露

ThreadLocal是个好用的工具类,但是使用不好是会导致内存泄露的。 内存泄露:之前开辟使用的内存空间,在使用完毕后未释放,结果导致一直占据该内存单元,无法被gc回收,导致该内存单元后续无法被使用&#xff0…

优思学院|质量管理六大思维陷阱【四】:抽样检查是最经济又能保证质量的方法吗?

在质量控制的过程中,一个常见的误解是认为抽样检查是最经济又能保证质量的方法。许多人认为进行百分之百的全数检查既浪费人力又时间不够。因此,他们倾向于采用抽样检查的方法,认为这样既符合经济成本,又能确保产品质量的水准。 …

Java中的死锁和Lock锁

6.死锁 1.死锁的理解: 不同的线程分别占用对方需要的同步资源不放弃,都在等待对方放弃自己需要的同步资源,就形成了线程的死锁 2.说明: 1出现死锁后,不会出现异常,不会出现提示,只是锁的线程…

【小白入门】Verilog实现异步FIFO

之前也在CSDN上面写过两个FIFO相关的文章,不过代码看起来比较复杂,且注释也比较少,不利于新手入门。很多时候都没有耐心继续看下去。 http://t.csdn.cn/0dPX6 http://t.csdn.cn/lYvoY 因为自己本身是一个初学者,就从初学者的视…

交换排序——冒泡排序和快速排序

一、交换排序的基本思想 1、两两比较&#xff0c;如果发生逆序则交换&#xff0c;直到所有记录都排好序为止。 2、常见的交换排序方法&#xff1a;冒泡排序和快速排序 3、最简单的交换排序——简单选择排序算法描述 void SelectSort(SqList &K) {for (i1; i<L.lengt…

浅谈C++和Java中对象的等号赋值

随着对C学习的深入&#xff0c;发现了一些和Java在设计思想上有所不同的地方。其一就是对象的拷贝赋值。 在Java中&#xff0c;如果定义了两个对象s1和s2&#xff0c;在堆内存中将会创建两个对象实体。那么s1 s2;表示s1指向的对象发生改变&#xff0c;即指向了s2所指向的对象…

8分钟让你完全掌握代理IP基础知识和实际应用

概念 代理IP可以理解为一个中转服务器&#xff0c;将用户和目标服务器之间的请求和响应进行转发和代理。使用代理IP的主要目的是隐藏用户的真实IP地址、访问被限制的内容、提高网络连接速度和保护用户隐私。 目录 概念 一、代理IP的工作原理 二、代理IP的类型 三、为什么…

总结的太到位:python 多线程系列详解

前言&#xff1a; 上vip课的时候每次讲到框架的执行&#xff0c;就会有好学的同学问用多线程怎么执行&#xff0c;然后我每次都会说在测开课程会详细讲解&#xff0c;这并不是套路&#xff0c;因为如果你不理解多线程&#xff0c;不清楚什么时候该用什么时候不该用&#xff0c;…

Clean架构与MVVM:助你打造优质Android应用

Android应用程序开发可能具有挑战性&#xff0c;特别是在创建可扩展和可维护的代码以适应不断变化的需求和用户需求方面。为了解决这个挑战&#xff0c;开发者通常依赖于软件架构模式&#xff0c;为代码组织和关注点分离提供了坚实的基础。在Android开发中&#xff0c;两种流行…

7-基于51单片机的金属探测器检测金属报警器设计(源程序+原理图+PCB+论文)全套资料

编号: 0007 本系统采用单片机1602液晶按键比较器蜂鸣器发光二极管组合而成。 按键说明: 加键、减键。单独一个按键为复位按键 1.单片机型号: STC89C52/51、AT89C52/51、AT89S52/51 可任选&#xff0c;程序通用2.产品自带单片机上电复位电路、手动复位电路(复位按键)、晶振电路(…

Unity入门8——音效系统

一、音频文件参数面板 Force To Mono&#xff1a;多声道转单声道 Normalize&#xff1a;强制为单声道时&#xff0c;混合过程中被标准化 Load In Background&#xff1a;后台加载&#xff0c;不阻塞主线程&#xff0c;适合大音效 Ambisonic&#xff1a;立体混响声 非常适合 36…

Java数据结构之第十六章、并查集

一、并查集原理 在一些应用问题中&#xff0c;需要将n个不同的元素划分成一些不相交的集合。开始时&#xff0c;每个元素自成一个单元素集合&#xff0c;然后按一定的规律将归于同一组元素的集合合并。在此过程中要反复用到查询某一个元素归属于那个集合的运算。适合于描述这类…

【CSDN铁粉】(获取铁粉的终极秘诀)

目录 铁粉和普通粉丝有什么区别什么是CSDN中的铁粉CSDN铁粉的用处如何获得更多的铁粉如何吸引更多的铁粉总结 目录) 铁粉和普通粉丝有什么区别 在CSDN社区中&#xff0c;铁粉和普通粉丝是两个不同的等级。铁粉是指对某个特定领域或某个专业人士非常崇拜和追随的用户&#xff0…