Talk | ICCV‘23清华大学博士生诸子钰:3D-VisTA通用统一的3D视觉语言预训练模型

news2025/2/28 17:08:59

 ​​​​​​

图片

本期为TechBeat人工智能社区529线上Talk!

北京时间9月7(周四)20:00 清华大学博士生—诸子钰的Talk已准时在TechBeat人工智能社区开播!

他与大家分享的主题是: 3D-VisTA通用统一的3D视觉语言预训练模型,他聚焦于3D视觉语言领域,介绍了3D视觉语言的相关任务,以及他们团队的最新工作3D-VisTA是如何设计通用统一的视觉语言模型的。

Talk·信息

主题:3D-VisTA通用统一的3D视觉语言预训练模型

嘉宾:清华大学博士生—诸子钰

时间:北京时间 9月7日(周四)20:00

地点:TechBeat人工智能社区

点击下方链接,即可观看视频!

TechBeatTechBeat是荟聚全球华人AI精英的成长社区,每周上新来自顶尖大厂、明星创业公司、国际顶级高校相关专业在读博士的最新研究工作。我们希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。icon-default.png?t=N7T8https://www.techbeat.net/talk-info?id=807

Talk·介绍

在大语言模型时代,对齐3D的物理世界和自然语言是实现通用具身智能十分重要的一步。本次讲座我们聚焦于3D视觉语言领域,介绍3D视觉语言的相关任务,以及我们的最新工作3D-VisTA是如何设计通用统一的视觉语言模型,用简洁的方式来解决这些任务的。

Talk大纲

1. 3D视觉语言领域介绍和相关任务。

2. 通用模型和任务特定模型的区别。

3. 3D-VisTA在通用3D视觉语言学习的探索。

Talk·预习资料

图片

论文链接:

https://arxiv.org/pdf/2308.04352.pdf

图片

论文链接:

https://arxiv.org/pdf/2108.07258.pdf

项目代码:

https://language3dscenes.github.io

Talk·提问交流

在Talk界面下的【交流区】参与互动!留下你的打call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!

图片

你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!

Talk·嘉宾介绍

图片

诸子钰

清华大学博士生

诸子钰,清华大学计算机系二年级博士生。研究方向为3D视觉语言学习,生成式模型,在AAAI,ICML,TMM, ICCV等顶级会议和期刊发表多篇论文。

个人主页: 

https://www.techbeat.net/grzytrkj?id=8463


关于TechBeat人工智能社区

TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。

我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。

期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!

更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/990097.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

FreeBASIC通过Delphi7 DLL调用MS SOAP使用VB6 Webservice

前几篇笔记习练了IIS soapis30配置、VB6 webservice创建、Delphi7和VB6 webservice访问: VB6 COM webservice发布,VB.NET和Delphi 7 对webservice访问,及MS Soap Toolkit 3.0在IIS上的ISAPI配置_Mongnewer的博客-CSDN博客 本篇笔记重点编写…

IIS短文件名泄露漏洞复现

IIS短文件名泄露漏洞复现 前言一、漏洞描述二、漏洞原理1.什么是短文件2.短文件特征 三、漏洞验证三、漏洞防御总结 前言 IIS短文件名泄露漏洞比较老了,而且只适合于windowsiisasp的网络结构,所有如下的复现步骤看下就行了,关键是要弄懂原理…

钉钉(自建应用)无需代码连接畅捷通T+Cloud的方法

1 使用场景 企业日常工作中,经常会涉及到各种各样的订单审批流程,为了提高工作效率,大多数企业内部会选择畅捷通TCloud作为财务ERP系统,钉钉作为OA审批系统。为了保证流程的顺畅和高效,需要将畅捷通TCloud创建的销售单…

opencv基础: 视频,摄像头读取与保存的常用方法

当然还可以从视频中抓取截图,所以现在聊一下常用的抓取视频截图的的方法。 VideoCapture 方法 cv2.VideoCapture();cv2.VideoCapture( device);cv2.VideoCapture(filename);上面有三种构造方法, 第一种是无法构造方法。 第二种参数device是一个数字。 …

F#奇妙游(30):计算表达式与ADT

Computation Expression More F#中自定义的 Computation Expression 一共有8个语法构造,其中match!是let!的语法糖。 在前面的一个帖子里CE初探我们已经介绍了 computation expression 中的绑定和返回,语法是let!和return。通过使用这两个语法&#xff…

浅谈 Spring AOP

AOP(Aspect Oriented Programming):⾯向切⾯编程,它是⼀种思想,它是对某⼀类事情的集中处理。⽐如⽤户登录权限的效验,没学 AOP 之前,我们所有需要判断⽤户登录的⻚⾯(中的⽅法&…

ipad必须要配原装的笔么?电容笔性价比高的品牌

众所周知,由于Apple pencil的出现,现在网上越来越多平替触控笔的出现,无论是价格和功能,几乎都很接近。很多小伙伴不知如何下手,不知道如何从众多品牌中挑选出适合自己的,今天我为大家总结几款好用平价电容…

Baklib:2023年企业知识库的新最好选择!

传统的企业知识管理方式主要是通过文件档案、会议记录、员工手册等方式来进行知识管理。这种方式的缺点是效率低下,信息不够及时、准确、全面,而且很难达到知识共享的效果。随着信息技术的发展,现代化的企业知识管理方式越来越受到企业的青睐…

骨传导耳机佩戴舒适吗?盘点骨传导耳机舒适度比较好的几款耳机!

相信很多年轻人和我一样,佩戴耳机成了日常的习惯,蓝牙耳机已经融入了我们的日常生活和工作。但长期戴耳机也有很多的问题存在,比如长时间佩戴导致耳道疼痛、甚至头痛,或是耳机隔音效果太好,导致错过身边的重要信息&…

记录aardio和Pythonl联动,为python做界面、做单exe文件的几个知识点

关于aardio的几个目录的说明 如果要aardio创建python关联程序,强烈建议新建工程向导中选择“窗口程序”+python来生成,会自动建立好目录,十分方便。 写好的python脚本或工程,直接放到py目录中,aardio中可以直接import导入该目录中的python模块,无需带目录,类似: aar…

实战ResNet:CIFAR-10数据集分类

本节将使用ResNet实现CIFAR-10数据集的分类。 7.2.1 CIFAR-10数据集简介 CIFAR-10数据集共有60 000幅彩色图像,这些图像是3232像素的,分为10类,每类6 000幅图,如图7-9所示。这里面有50 000幅图用于训练,构成了5个训…

概念:推理 训练 模型

训练 训练是通过从已有的数据中学习到某种能力; 推理 推理是简化并使用该能力,使其能快速、高效地对未知的数据进行操作,以获得预期的结果。 模型 训练是计算密集型操作,模型一般都需要使用大量的数据来进行训练,通…

婚恋相亲交友红娘小程序源码开发搭建方法

目前婚恋市场基本处于兵家必争之地,从一二线城市到四五线城市单身男女多,传统婚恋相亲很多已经不满足现在年轻人市场,因此我们推出婚恋相亲交友小程序。 注意:小程序过审需ICP经营许可证。 程序支持多端:H5端、小程序…

go开发之个微机器人的二次开发

请求URL: http://域名/addRoomMemberFriend 请求方式: POST 请求头Headers: Content-Type:application/jsonAuthorization:login接口返回 参数: 参数名必选类型说明wId是String登录实例标识chatRoom…

国家网络安全周2023时间是什么时候?有什么特点?谁举办的?

国家网络安全周2023时间是什么时候? 2023年国家网络安全宣传周将于9月11日至17日在全国范围内统一开展。其中开幕式等重要活动将在福建省福州市举行。今年网安周期间,除开幕式外,还将举行网络安全博览会、网络安全技术高峰论坛、网络安全微视…

计算机竞赛 基于深度学习的动物识别 - 卷积神经网络 机器视觉 图像识别

文章目录 0 前言1 背景2 算法原理2.1 动物识别方法概况2.2 常用的网络模型2.2.1 B-CNN2.2.2 SSD 3 SSD动物目标检测流程4 实现效果5 部分相关代码5.1 数据预处理5.2 构建卷积神经网络5.3 tensorflow计算图可视化5.4 网络模型训练5.5 对猫狗图像进行2分类 6 最后 0 前言 &#…

SpringMVC的增删改查的案例

目录 前言: 1.总体思路: 2.前期准备 3.前台页面 前言: 我们今天来学习研究SpringMVC的增删改查,希望这篇博客能够帮助正在学习,工作的你们!!! 1.总体思路: 首先我们得…

在linux上挂载windows共享目录

挂载要求 非root用户(普通用户)能够读写windows共享目录,比如查看文件、创建文件、修改文件、删除文件 # 让普通用户也可以正常读写 uidvalue and gidvalue Set the owner and group of the root of the file system (default: uidgid0, bu…

《算法竞赛·快冲300题》每日一题:“附近的牛”

《算法竞赛快冲300题》将于2024年出版,是《算法竞赛》的辅助练习册。 所有题目放在自建的OJ New Online Judge。 用C/C、Java、Python三种语言给出代码,以中低档题为主,适合入门、进阶。 文章目录 题目描述题解C代码Java代码Python代码 “ 附…

学习笔记——Java入门第三季

1.1 Java异常简介 异常:有异于常态,和正常情况不一样,有错误出现,阻止当前方法或作用域。 异常处理:将出现的异常提示给编程人员与用户,使原本将要中断的程序继续运行或者退出。并且能够保存数据和释放资源…