ICCV 2023 获奖论文公布,扩散模型、分割一切、跟踪一切摘得桂冠

news2025/1/12 9:54:58

昨天计算机视觉三大顶级会议之一的ICCV 2023在法国巴黎正式“开奖”了!今年共有两篇论文获得最佳论文奖,大名鼎鼎的“分割一切”荣获最佳论文提名。

ICCV今年共收录了2160篇论文,从今年的录用论文的主题领域来看,3D视觉、图像视频合成、迁移少样本持续学习方向排名前三。

下面我们进入正题,一起来看看ICCV 2023的获奖论文详情:

最佳论文奖

Adding Conditional Control to Text-to-Image Diffusion Models

标星2.4万,被引用量已破300+

标题:向文本到图像扩散模型添加条件控制

作者:斯坦福大学

内容:论文提出了ControlNet,这是一种神经网络架构,可向大型预训练的文本到图像扩散模型添加空间条件控制。ControlNet固定了可用于生产的大型扩散模型,并重用它们在数十亿张图像上预训练的深度和稳健的编码层,作为强大的骨干来学习各种条件控制。该神经网络架构通过“零卷积”(即初始化为零的卷积层)进行连接,逐步从零增长参数,确保调优过程不会受到任何有害噪声的影响。

Passive Ultra-Wideband Single-Photon Imaging

标题:被动超宽带单光子成像

作者:多伦多大学

内容:论文考虑同时成像一个动态场景的极端时间范围的问题——从秒到皮秒级——并且采用被动方式,不需要太多光照,也不需要来自发光源的任何定时信号。由于现有的单光子相机通量估计技术在这种情况下会失效,作者开发了一种通量探测理论,其从随机微积分中获得启发,以使我们能够从单调增加的光子检测时间戳流重构像素的时间变化通量。作者使用这一理论:(1)显示被动自由运行的单光子雪崩二极管相机在低通量条件下具有覆盖整个直流至31GHz范围的可实现频带宽,(2)推导出一种新的傅里叶域通量重建算法,它扫描时间戳数据中具有统计显著支持的频率范围,(3)确保该算法的噪声模型甚至在非常低的光子计数或不可忽略的死时间下仍然有效。

最佳论文荣誉提名奖

Segment Anything

标星4万,被引用量690

标题:分割一切

作者:Meta

内容:论文提出了“分割任何物体”(Segment Anything)项目:一个用于图像分割的新任务、模型和数据集。利用高效的模型进行数据收集,作者构建了迄今为止最大的分割数据集(目前是最大的),包含超过10亿个掩膜和1100万张授权和尊重隐私的图像。该模型的设计和训练使其可以即兴提示,因此可以零样本向新图像分布和任务进行转移。

最佳学生论文奖

Tracking Everything Everywhere All at Once

标题:随时随地追踪一切

作者:康奈尔大学

内容:论文提出了一种新的测试时优化方法,用于从视频序列中估计稠密和长距离运动。以前的光流或粒子视频跟踪算法通常在有限的时间窗口内运行,在遮挡情况下跟踪效果不佳,估计的运动轨迹整体一致性较差。作者提出了一种完整的全局一致运动表示OmniMotion,可以准确地对视频中的每个像素进行全过程运动估计。OmniMotion使用准三维规范体积表示视频,并通过局部空间和规范空间之间的双射进行像素级跟踪。这种表示允许我们确保全局一致性,跟踪遮挡情况,并建模任意组合的相机和物体运动。

其他奖项

Helmholtz 奖

Action recognition with improved trajectories

标题:使用过改进的轨迹进行动作识别

作者:Heng Wang, Cordelia Schmid

内容:最近,稠密轨迹被证明是动作识别的一种高效视频表示,并在各种数据集上获得了最先进的结果。本文通过考虑相机运动来校正轨迹,从而提高了其性能。为了估计相机运动,作者使用SURF描述子和稠密光流匹配帧之间的特征点,然后使用这些匹配来用RANSAC稳健地估计单应矩阵。人体运动通常与相机运动不同,会生成不一致的匹配。为了改进估计,使用人体检测器去除这些匹配。给定估计的相机运动,作者删除与其一致的轨迹,还使用此估计从光流中消除相机运动,这显著改进了基于运动的描述子,如HOF和MBH。

PAMI Everingham 奖

  • The Ceres Solver open source non-linear optimization software library

  • The Common Objects in Context (COCO) dataset

获奖候选

  • Adding Conditional Control to Text-to-lmage Diffusion Models - Zhang et al.

  • Advancing Example Exploltation Can Alleviate Critical Challenges in Adversarial Training -Ge et al.

  • DiffusionDet: Diffusion Model for Object Detection - Chen et al

  • ITI-GEN: Inclusive Text-to-lmage Generation - Zhang et al.

  • Passive Ultra-Wideband Single-Photon imaging - Wei et al.

  • Ref-NeuS:Ambiguity-Reduced Neural implicit Surface Learning for Multi-View Reconstruction with Reflection -Ge et al.

  • Scale-MAE: A Scale-Aware Masked Autoencoder for Multiscale Geospatfal Representation Learning - Reed et al.

  • Segment Anything - Kirillov et al.

  • Shape Analysis of Euclidean Curves under Frenet-Serret Framework -Chassat et al.

  • The Victim and The Beneficiary: Exploiting a Potsoned Model to Train a Clean Model on Poisoned Data - Zhu et al.

  • Tracking Everything Everywhere All at Once-Wang et al.

  • Tri-MipRF: Tri-Mip Representation for Effcient Anti-Aliasing Neural Radiance Fields -Hu et al.

  • UniDexGrasp++: improving Universal Dexterous Grasping via Geometry-aware Curriculum Learning and terative Generalist-Specialist Learning - Wan et al.

  • Viewing Graph Solvability in Practice - Arrigoni et al.

  • VQ3D: Learning a 3D-Aware Generative Modet on imageNet-Sarget et al.

  • When Noisy Labels Meet Long Tail Dilemmas: A Representation Calibration Method -Zhang et al.

  • Zip-NeRF: Anti-Allased Grid-Based Neural Radiance Fields - Barron et al.

关注下方《学姐带你玩AI》🚀🚀🚀

回复“ICCV获奖”获取全部获奖论文+代码+录用清单合集

码字不易,欢迎大家点赞评论收藏!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1062024.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

大促节奏:速卖通黑五接力双十一,如何打造产品权重瓜分活动流量

双十一和黑五作为一种独特的消费文化现象,已经逐渐成为了消费领域中的一块“金字招牌”。无论是消费者还是商家,都非常期待这一天的到来,因为它不仅代表着购物的欲望和刺激,更重要的是,双十一和黑五已经成为了一种全新…

在springboot项目中整合Druid

或 1.导入maven坐标 <dependency><groupId>com.alibaba</groupId><artifactId>druid-spring-boot-starter</artifactId><version>1.2.19</version> </dependency>2.在application.properties中配置连接池 spring:datasource:d…

微信管理系统

在这个全民微信的时代&#xff0c;微信已成为生活和工作中不可缺少的工具&#xff0c;为了方便&#xff0c;大部分人都不会只有一个微信&#xff0c;很多企业老板和创业者都已经开始用微信管理系统来提升自身的业务效率和客户满意度。 微信管理系统适用哪些行业呢&#xff1f; …

SSM - Springboot - MyBatis-Plus 全栈体系(二十)

第四章 SpringMVC 二、SpringMVC 接收数据 3. 接收 Cookie 数据 可以使用 CookieValue 注释将 HTTP Cookie 的值绑定到控制器中的方法参数。 考虑使用以下 cookie 的请求&#xff1a; JSESSIONID415A4AC178C59DACE0B2C9CA727CDD84下面的示例演示如何获取 cookie 值&#x…

小谈设计模式(19)—备忘录模式

小谈设计模式&#xff08;19&#xff09;—备忘录模式 专栏介绍专栏地址专栏介绍 备忘录模式主要角色发起人&#xff08;Originator&#xff09;备忘录&#xff08;Memento&#xff09;管理者&#xff08;Caretaker&#xff09; 应用场景结构实现步骤Java程序实现首先&#xff…

如何使用 Media.io 生成不同年龄的照片

Media.io 是一个在线图片编辑器&#xff0c;提供多种功能&#xff0c;包括照片滤镜、图像裁剪和图像转换。其中&#xff0c;Media.io 的 AI 年龄转换功能可以根据上传的照片&#xff0c;生成不同年龄的照片。 使用 Media.io 生成不同年龄的照片 要使用 Media.io 生成不同年龄…

微信朋友圈还可以这么玩?

微信“朋友圈”除了日常了解好友动态外&#xff0c;就是时不时分享下自己的生活日常&#xff01; 但你知道吗&#xff0c;其实朋友圈还有许多有趣的玩法&#xff0c;只可惜只有“少数人”知晓&#xff01;一起来看看吧 01 关闭个性化“朋友圈”广告 微信作为我们生活的社交圈&…

try catch无法获取空指针异常的长度的问题

项目代码里有对异常进行捕获&#xff0c;然后根据异常的长度决定是否截取异常内容保存数据库的操作&#xff0c;然后对于空指针的异常是无法获取异常的长度的。 这个是获取空指针异常长度。 然后现在不获取异常的长度 解决方法&#xff1a;

Vue3 模糊搜索筛选

Vue3 模糊搜索筛选 环境&#xff1a; vue3 tselement plus 目标&#xff1a; 输入框输入内容&#xff0c;对展示的列表进行模糊搜索筛选匹配的内容。 代码如下&#xff1a; <div style"margin-top: 50px"><el-input v-model"valueInput" size&…

C++笔记之信号量、互斥量与PV操作

C笔记之信号量、互斥量与PV操作 文章目录 C笔记之信号量、互斥量与PV操作1.信号量概念2.信号量例程一3.信号量例程二4.信号量例程三5.互斥量6.PV操作概念7.PV操作详解——抄自&#xff1a;https://mp.weixin.qq.com/s/vvjhbzsWQNRkU7-b_dURlQ 1.信号量概念 C中的信号量是一种同…

【牛客网-面试必刷TOP 101】01链表

BM1 反转链表 解题思路 第一种方法&#xff1a;借助栈 1. 栈的特点是先进后出&#xff0c;用stack来存储链表&#xff0c;之后新建一个头节点&#xff0c;按出栈顺序拼接形成新的链表。 2. 注意&#xff0c;最后一个节点的next要赋值null 3. 空间复杂度O(N), 时间复杂度O(N)J…

竞赛选题 深度学习 opencv python 公式识别(图像识别 机器视觉)

文章目录 0 前言1 课题说明2 效果展示3 具体实现4 关键代码实现5 算法综合效果6 最后 0 前言 &#x1f525; 优质竞赛项目系列&#xff0c;今天要分享的是 &#x1f6a9; 基于深度学习的数学公式识别算法实现 该项目较为新颖&#xff0c;适合作为竞赛课题方向&#xff0c;学…

uCOSIII实时操作系统 二 同步与通信

目录 同步概念&#xff1a; 互斥概念&#xff1a; 临界区概念&#xff1a; 任务时间概念&#xff1a; 信号量概念&#xff1a; 互斥信号量概念&#xff1a; 事件标志组概念&#xff1a; 消息邮箱和消息梯队概念&#xff1a; 内存管理概念&#xff1a; 如何从裸机开发…

Linux网络编程1-简单的CS通信程序

Linux网络编程1-简单的CS通信程序 1.Socket相关API说明1.1字节序转换函数&#xff1a;用于ip和port转换1.2sockaddr结构1.3socket函数 以及两个队列1.4bind listen connect accept1.5收发数据 2.服务器和客户端程序代码流程3.服务器端4.客户端5.测试accept不是建立连接而是从已…

1803_ChibiOS网络书籍阅读_嵌入式RTOS介绍

全部学习汇总&#xff1a; GreyZhang/g_ChibiOS: I found a new RTOS called ChibiOS and it seems interesting! (github.com) 1. RTOS指的是实时性操作系统&#xff0c;但是并不是只有嵌入式领域使用RTOS。然而&#xff0c;嵌入式是RTOS的主要使用领域。 2. 一般的RTOS有一组…

国庆中秋宅家自省:偷偷尝鲜

Python3中类的高级语法及实战 Python3(基础|高级)语法实战(|多线程|多进程|线程池|进程池技术)|多线程安全问题解决方案 Python3数据科学包系列(一):数据分析实战 Python3数据科学包系列(二):数据分析实战 Python3数据科学包系列(三):数据分析实战 国庆中秋宅家自省: Pytho…

【visual studio 小技巧】项目属性->生成->事件

需求 我们有时会用到一些dll&#xff0c;需要把这些dll和我们生成的exe放到一起&#xff0c;一般我们是手动自己copy&#xff0c; 这样发布的时候&#xff0c;有时会忘记拷贝这个dll&#xff0c;导致程序运行出错。学会这个小技巧&#xff0c;就能实现自动copy&#xff0c;非…

Ubuntu1804 安装后无法使用root登录解决方法

1. 给root用户设置密码 sudo passwd root2. 确认是否安装ssh服务 (在安装Ubuntu 的时候可以勾选安装ssh 远程服务),没有安装的话执行以下命令(Ubuntu可以连接互联网) sudo apt-get instll openssh-server3. 设置允许root 用户进行远程连接 sudo vim /etc/ssh/sshd_config 在…

10.3 调试事件转存进程内存

我们继续延申调试事件的话题&#xff0c;实现进程转存功能&#xff0c;进程转储功能是指通过调试API使获得了目标进程控制权的进程&#xff0c;将目标进程的内存中的数据完整地转存到本地磁盘上&#xff0c;对于加壳软件&#xff0c;通常会通过加密、压缩等手段来保护其代码和数…

【Ubuntu】基于C++实现人脸识别

人脸识别考勤机 文章目录 人脸识别考勤机概述第一章 搭建Ubuntu环境1.1 什么是物联网1.2 物联网应该怎么学1.3 Linux开发环境搭建1.4 Linux基本使用1.5 Ubuntu网络配置 第二章 “hello,world!”程序2.1 什么是程序2.2 “hello,world!”程序2.3 C语法扩展2.4 常见错误调试 第三章…