CVPR‘24 最佳学生论文,从灵感到成稿仅用一个月,源自业余创意!

news2024/11/29 14:51:39



北京时间6月20日凌晨,CVPR 2024正式公布了最佳论文和最佳学生论文等奖项。

其中,最佳论文有两篇,分别是BioCLIP和Mip-Splatting。

据Mip-Splatting论文的第一作者Zehao Yu的导师、图宾根大学教授Andreas Geiger透露,这篇论文从想法到成稿只用了一个月的时间!




没体验过OpenAI最新版GPT-4o?快戳最详细升级教程,几分钟搞定:
升级ChatGPT-4o Turbo步骤icon-default.png?t=N7T8https://www.zhihu.com/pin/1768399982598909952

Geiger还提到,Zehao Yu之前参与过多个项目并发表过论文,但在Mip-Splatting项目之前,他从未接触过高斯泼溅技术。

在回顾Zehao Yu的研究历程时,Andreas Geiger提到:

Zehao已经在我的实验室里做了一段时间的博士生了。他和实验室里的许多人一样,做了很多出色的工作。首先,他参与了一些项目(如TransFuser),并在NeurIPS 2022会议上发表了他的第一篇独立论文(MonoSDF)。

他还开发了一个用于表面重建的完整软件框架,基于SDF模型(SDFStudio)。

在Mip-Splatting之前,他没有使用过高斯泼溅方法。事实上,他当时正在研究另一个使用更「传统」神经隐式表示的项目,但那个项目进展不顺利,遇到了很多障碍。

到了2023年10月,他在业余时间开始尝试高斯泼溅技术。他喜欢在业余时间尝试新事物并研究新的模型。

3DGS(3D Gaussian Splatting)是当时的新技术。简而言之,它可以从几个输入图像中生成逼真的新视角,比NeRF和之前的其他方法更快。

但Zehao对在超出训练姿态分布时渲染的表现感到困惑。这些渲染效果会退化,结构变得太细或太粗。大概当时很多人都注意到了这些现象,但还没有人解决它们。

Zehao有一个简单的解决方案,并且在想这个方法是否够好,是否值得发表。

在10月18日,Zehao写道:「大家好,我计划提交一篇关于解决最近3D高斯泼溅的抗锯齿/缩放伪影的论文到CVPR。我发现这些伪影的主要原因是低通滤波器。

在使用泼溅方法进行渲染时,低通滤波器是非常常见的。

但当它应用于优化框架(从多视图图像重建)时,它会引入一种偏置,使得真实的3D高斯变小(因为滤波器在渲染过程中会使其变大)。

所以当我们放大或缩小时,由于视角与训练视角不同,我们会看到伪影。但我们不能简单地抛弃低通滤波器,因为这样就无法实现抗锯齿。我的解决方案非常简单:

1)我们应该使用较小的低通滤波器,这样低通滤波器的效果不会在训练中占主导地位;

2)添加一个正则化,使得高斯不会变得太小。」

时间非常紧张:从想法到CVPR截止日期只有一个月。通常这种努力不会顺利进行,因为剩下的时间太少,无法进行论文润色或实验。

但Zehao坚信他甚至可以在截止日期前1-2周完成。他正在做实验,我们所有人都开始一起写论文。

我们在11月17日提交给CVPR,并在1月23日惊讶地收到3个「strong accept」的评审意见。

昨天,Mip-Splatting在CVPR获得了最佳学生论文奖。我们非常感谢社区、评审、领域主席和奖项委员会对这个小小想法的认可。


他对高斯泼溅的入门是在业余时间以个人兴趣的形式展开的。

Geiger感叹道:「研究是高度非线性的,难以规划,这正是它令人畏惧和兴奋的地方。我们必须接受这一点。

Mip-Splatting论文的完整标题是「Mip-Splatting: Alias-free 3D Gaussian Splatting」。

论文链接:https://arxiv.org/pdf/2311.16493



论文介绍了一种用于3D图像渲染的抗锯齿3D高斯泼溅方法——Mip-Splatting

3D图像渲染是生成三维图像的过程,比如电脑游戏中的逼真场景或动画电影中的角色。

锯齿(alias)是指图像边缘出现的锯齿状不平滑现象。

抗锯齿技术用于消除这些锯齿,使图像边缘更加平滑和自然。



高斯泼溅技术利用高斯分布来平滑图像边缘,减少锯齿效应,使图像更为自然。

Geiger谦虚地表示,这里面有运气的成分,评审结果也未必100%公平。但他分享这段经历是为了表达:研究往往是非线性的。在从事某项工作时,你会发现其他有趣的东西。


不过,他也指出,在现行科研系统中,科学家需要通过提交研究计划和撰写资助申请书来获取资金,这与好奇心驱动的研究理念不符,尤其是在AI这样快速发展的领域。



「你很难制定出一个精确的3年甚至5年愿景,并完全按照这个愿景行事。更可能的是,在研究过程中会出现一些有趣的相关问题,这些问题值得研究,你不应该因为它们与你最初的研究计划不完全一致而忽视它们。」Vladlen Koltun写道。但对此,他也没有很好的解决方案。


如何使用WildCard正确方式打开GPT-4o,目前 WildCard 支持的服务非常齐全,可以说是应有尽有!

官网有更详细介绍:WildCard



推荐阅读:


超越GPT-4o!新王Claude 3.5 Sonnet来啦!免费使用
 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1851016.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

CompletableFuture 基本用法

一、 CompletableFuture简介 CompletableFuture 是 Java 8 引入的一个功能强大的类,用于异步编程和并发处理。它提供了丰富的 API 来处理异步任务的结果,支持函数式编程风格,并允许通过链式调用组合多个异步操作。 二、CompletableFuture中…

Rocky Linux archive下载地址

Index of /vault/rocky/https://dl.rockylinux.org/vault/rocky/

【人工智能】—XGBoost算法在构建互联网防火墙异常行为识别模型应用案例

摘要: 近年来,各地党委、政府加快推进新型工业化,部署实施制造强市战略,提出工业企业“智改数转”是推动全市工业经济稳增长的重要引擎,更是稳增长、促发展的重要抓手。今天博主就以互联网防火墙异常行为识别为例给大家…

【Streamlit学习笔记】Streamlit-ECharts箱型图添加均值和最值label

Streamlit-ECharts Streamlit-ECharts是一个Streamlit组件,用于在Python应用程序中展示ECharts图表。ECharts是一个由百度开发的JavaScript数据可视化库Apache ECharts 安装模块库 pip install streamlitpip install streamlit-echarts绘制箱型图展示 在基础箱型…

内容安全复习 7 - 对抗攻击与防御

文章目录 概述攻击对抗性攻击的目的攻击的损失函数如何攻击FGSM黑盒与白盒真实世界的攻击 防御被动防御主动防御 概述 动机 (1)不仅要在实验室中部署机器学习分类器,也要在现实世界中部署;实际应用 (2)分类…

从一到无穷大 #29 ByteGraph的计算,内存,存储三级分离方案是否可以通用化为多模数据库

本作品采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可。 本作品 (李兆龙 博文, 由 李兆龙 创作),由 李兆龙 确认,转载请注明版权。 文章目录 引言ByteGraph现有架构阿里云Lindorm腾讯YottaDB多模型化修改点ByteGraph论文中的优化…

IOS开发学习日记(十七)

简单的第三方登录和分享功能 第三方登录系统 URL Scheme:App间的跳转及通信 App间跳转场景 登陆系统: 跨平台,跨App 标记用户,个性化的推送 使用第三方登录(减少注册成本 / 无须维护敏感信息) 微信 / Q…

068、PyCharm 关于Live Template模板

在 PyCharm 编辑器中,Live Templates 是一种功能强大的工具,可以帮助我们快速插入常用的代码片段或模板。 以下是在 PyCharm 中添加 Live Templates 的步骤: 添加 Live Templates 步骤: 打开 PyCharm 编辑器。 转到菜单栏中的 …

33 - 连续出现的数字(高频 SQL 50 题基础版)

33 - 连续出现的数字 -- 开窗函数lead(col,n) 统计窗口内往下第n行值 -- over(partition by xxx) 按照xxx所有行进行分组 -- over(partition by xxx order by aaa) 按照xxx分组,按照aaa排序select distinct num as ConsecutiveNums from(select num,# 从当前记录获…

Python——常用数据降维算法应用

随着数据的积累,数据的维度越来越高,高维的数据在带来更多信息的同时,也带来了信息冗余、计算困难等问题,所以对数据进行合理的降维,并保留主要信息非常重要。这些问题主要可以通过主成分分析及相关的降维算法来解决。…

国内外大模型生态发展报告!

很多同学只知类似Check GPT或者说对国内的一些比较了解,对国外的不太了解,所以在这总结。 1 大模型的发展 左表 名称参数特点发布时间GPT-215亿英文底模,开源2019年Google T5110亿多任务微调, 开源2019年GPT-3.51750亿人工反馈微调2022年M…

《计算机英语》 Unit 6 Internet 互联网

Section A Internet 互联网 The Internet is a global system of interconnected computer networks that use the standard Internet protocol suite (TCP/IP) to link several billion devices worldwide. 互联网是一个全球性的互连计算机网络系统,使用标准的互联…

Echarts实现动态背景

最近在公司工作中,遇到一个图表的需求,要求实现背景图是可以动态跟随最高点而改变位置的。 好玩的是,我实现了效果,但是没在官方配置项看到我这个用法的出处,所以记录一下。 话不多说,配置项也没什么好解释…

Redis的安装及详解

1.Redis介绍? 1.1 Redis是什么? Redis(Remote Dictionary Server,远程字典服务器)是一个开源免费的,用C语言编写的一个高性能的分布式内存数据库,基于内存运行并支持持久化的NoSQL数据库。是当前最热门的…

IPv6 address status lifetime

IPv6 地址状态转换 Address lifetime (地址生存期) 每个配置的 IPv6 单播地址都有一个生存期设置,该设置确定该地址在必须刷新或替换之前可以使用多长时间。某些地址设置为“永久”并且不会过期。“首选”和“有效”生存期用于指定其使用期限和可用性。 自动配置的…

开源与在线 M3U8 Downloader 项目介绍及使用指南

M3U8 是一种用于播放列表格式的文件类型,广泛应用于流媒体服务中,特别是 HLS(HTTP Live Streaming)协议。它包含了一系列的 TS(Transport Stream)视频片段地址,使得视频能够分段加载&#xff0c…

亿联 AM610 M.2 SSD PCIE 3.0X2 128GB测评

亿联 AM610 M.2 SSD PCIE 3.0X2 128GB测评 厂商:union memory国产固态硬盘SSD。 接口:PCIE 3.0X2 协议:支持NVME 1.协议 固件:固件版本号11.82 读取量:18TB左右 写入量:14TB左右,NAND闪存约被编…

win10/11磁盘管理

win10/11磁盘管理 合并磁盘分区的前提是你的两个磁盘区域是相邻的,比如如下: 如果需要吧这个磁盘进行分解,你可以选择压缩一部分磁盘或者是直接删除卷 我这里的话,因为压缩出来的卷和C盘好像是不相邻的(我之前做过&…

kettle从入门到精通 第七十三课 ETL之kettle kettle调用http分页接口教程

场景:kettle调用http接口获取数据(由于数据量比较大,鉴于网络和性能考虑,所以接口是个分页接口)。 方案:构造页码list,然后循环调用接口。 1、总体设计 1)、初始化分页参数pageNum1…