Talk | 香港科技大学博士生叶汉荣:面向2D/3D场景理解的多任务学习

news2024/12/26 9:31:22

图片

本期为TechBeat人工智能社区540线上Talk!

北京时间10月25日(周三)20:00香港科技大学博士生—叶汉荣的Talk已准时在TechBeat人工智能社区开播!

他与大家分享的主题是: “面向2D/3D场景理解的多任务学习”,分享了他的团队在多任务学习机制以提升性能和效率的相关研究上所做的一系列研究成果。

Talk·信息

主题:面向2D/3D场景理解的多任务学习

嘉宾:香港科技大学博士生 叶汉荣

时间:北京时间 10月25日(周三)20:00

地点:TechBeat人工智能社区

点击下方链接,即可观看视频! 

TechBeatTechBeat是荟聚全球华人AI精英的成长社区,每周上新来自顶尖大厂、明星创业公司、国际顶级高校相关专业在读博士的最新研究工作。我们希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。icon-default.png?t=N7T8https://www.techbeat.net/talk-info?id=818

Talk·介绍

人的视觉是多任务的。尽管我们人为地在计算机视觉领域细分出了许多任务,如分割、检测、深度估计等,这些任务仍然彼此高度相关。另一方面,随着神经网络的蓬勃发展,单任务模型的性能不断提高,但针对多任务学习机制以提升性能和效率的相关研究仍处于初级阶段。

在本次讲座中,我将系统地介绍我们团队在这一问题上所做的一系列研究成果,这些成果已发表在ECCV、ICLR、ICCV等主流学术会议上。我们发现,在计算机视觉中多任务学习不仅可以提高效率,甚至可以获得比单任务模型更优的性能。我们相信在不久的将来,计算机视觉相关的研究将进入多任务时代。

Talk大纲

1. 为什么要研究多任务学习

2. 多任务学习中的关键问题

3. 2D Multi-Task Transformer: InvPT (ECCV 2022) & TaskExpert (ICCV 2023)

4. 2D/3D Multi-Task Transformer: TaskPrompter (ICLR 2023)

Talk·预习资料

图片

论文链接:https://openreview.net/pdf?id=-CwPopPJda

图片

论文链接:https://arxiv.org/pdf/2203.07997.pdf

图片

论文链接:https://arxiv.org/pdf/2307.15324.pdf

Talk·提问交流

在Talk界面下的【交流区】参与互动!留下你的打call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!

图片

你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!

Talk·嘉宾介绍

图片

叶汉荣

香港科技大学博士生

叶汉荣,香港科技大学计算机科学与工程系博三学生,近期工作主要关注CV领域的多任务多模态学习和图像生成。相关研究成果以第一作者身份发表在ECCV/ICLR/ICCV等顶级会议上。

个人主页:   https://www.techbeat.net/grzytrkj?id=13405 


关于TechBeat人工智能社区

TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。

我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。

期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!

更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1135712.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

小白必看!画出自己第一个界面,PyQt5安装以及使用

目录 1,介绍 2,windows安装 安装PyQt5-tools 设置环境变量 验证是否安装成功 QT Designer 3,Mac平台安装 安装PyQt5 安装 Qt Creater 验证是否安装成功 4,使用 PyCharm 开发 4.1 新建工程 4.2 添加外部工具 hellowo…

危机现场 | 令人窒息的彩色气球

点击文末“阅读原文”即可参与节目互动 剪辑、音频 / 阿福 运营 / SandLiu 卷圈 监制 / 姝琦 封面 / 姝琦 产品统筹 / bobo 场地支持 / 声湃轩天津录音间 1986年,美国克利夫兰城市广场上, 人们正期盼一场即将载入史册的募捐活动。 而此时&#xff0…

一个全响应式的企业级物联网平台,开源了

JetLinks 是一个开源的、企业级的物联网平台,它集成了设备管理、数据安全通信、消息订阅、规则引擎等一系列物联网核心能力,支持以平台适配设备的方式连接海量设备,采集设备数据上云,提供云端 API,通过调用云端 API 实…

HackTheBox - Starting Point -- Tier 0 --- Explosion

文章目录 一 题目二 实验过程 一 题目 Tags Network、Programming、RDP、Reconnaissance、Weak Credentials译文:网络、编程、RDP、侦察、凭证薄弱Connect To attack the target machine, you must be on the same network.Connect to the Starting Point VPN us…

代码随想录 | Day61 and 62

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 今日学习目标一、算法题1.下一个更大元素 II2.接雨水3.柱状图中最大的矩形 今日心得学习及参考书籍 今日学习目标 下一个更大元素 II(503) …

InstructionGPT

之前是写在[LLM:提示学习Prompt Learning]里的,抽出来单独讲一下。 基本原理 InstructGPT/ChatGPT都是采用了GPT-3的网络结构,通过指示学习构建训练样本来训练一个反应预测内容效果的奖励模型(RM),最后通过…

轻松批量剪辑:将MP4视频转换为FLV格式

在视频制作和编辑领域,批量剪辑和格式转换是非常常见的操作。将MP4视频转换为FLV格式,可以帮助我们更好地管理和发布视频内容。本文将介绍云炫AI智剪如何轻松批量剪辑,将MP4视频转换为FLV格式,帮助您提高工作效率,减少…

避雷!又有2本期刊被标记“On Hold”!含中科院2区(TOP),共8本有风险!

期刊动态:新增2本期刊“On Hold” 最新,又有2本期刊被科睿唯安标记为「On Hold」!这2本期刊分别为MIGRATION LETTERS和REVISTA DE GESTAO E SECRETARIADO-GESEC。 目前科睿唯安官网:共有8本期刊被标记为「On Hold」,…

极盾故事|某头部私募基金“扩展检测响应XDR平台”建设

极盾科技助力某头部私募基金,基于极盾析策,打造扩展检测响应XDR平台: 1、接入堡垒机、网关、Gitlab、资产类接口、登录数据源、运维网络设备等日志,实现日均十亿级别数据量分析,日均安全告警数量从数万降至100条左右&a…

【大数据】Hadoop环境搭建及运行

Hadoop概述 Hadoop 是一个由 Apache 基金会所开发的 分布式系统基础架构 。主要解决,海量数据的 存储 和海量数据的 分析计算 问题。广义上来说, Hadoop 通常是指一个更广泛的概念 —— Hadoop 生态圈 。 Hadoop优势 高可靠性:Hadoop底层维…

使用Jetpack Compose构建Flappy Musketeer街机游戏

使用Jetpack Compose构建Flappy Musketeer街机游戏 一步一步创建沉浸式移动游戏的指南 引言 Flappy Musketeer不仅是又一个移动游戏;它将令人上瘾的“轻点飞行”游戏玩法和引人入胜的视觉效果融合在一起,吸引玩家进入埃隆马斯克(Elon Musk…

大数据-Storm流式框架(三)--Storm搭建教程

一、两种搭建方式 1、storm单节点搭建 2、完全分布式搭建 二、storm单节点搭建 准备 下载地址:Index of /dist/storm 1、环境准备: Java 6 Python 2.6.6 2、上传、解压安装包 3、在storm目录中创建logs目录 mkdir logs 启动 ./storm help …

机器人学导论-约翰 J.克雷格

目录 第五章 雅可比:速度和静力 5.1 刚体的线速度和角速度5.5 机器人连杆运动 第五章 雅可比:速度和静力 5.1 刚体的线速度和角速度 \(V_{BORG}\)是坐标系B在A坐标系下的速度,\(^BV_Q\)是B坐标系下Q的速度,\(^A\Omega\)表示从坐标…

数据分析案例-某公司员工数据信息可视化(文末送书)

🤵‍♂️ 个人主页:艾派森的个人主页 ✍🏻作者简介:Python学习者 🐋 希望大家多多支持,我们一起进步!😄 如果文章对你有帮助的话, 欢迎评论 💬点赞&#x1f4…

打印机连接网络后怎么安装驱动?

打印机在我们办公和生活中算是比较常见的设备,特别是在上班时需要时常打印各种文件,但是有时电脑上的打印机也会有无法打印的问题,或者新买的打印机需要先安装驱动才能正常打印的。 那么这个时候我们需要先检查电脑上的打印机是否有安装驱动&…

uniapp开发h5 监听用户物理返回键 类似拼多多返回后弹窗

uniapp有个onBackPress生命周期 但是h5中只能监听到navbarr左边的返回按钮以及uni.navigateBack() 方法 h5既然监听不到物理返回键,那么用户点击了物理返回键自然会路由返回上一页,那么我们监听路由,由于路由是uni自己封装的,我测…

3D模型格式转换工具HOOPS Exchange:支持国际标准STEP格式!

HOOPS Exchange SDK是一组C软件库,使开发团队能够快速将可靠的2D和3D CAD导入和导出添加到其应用程序中,访问广泛的数据,包括边界表示 (B-REP)、产品制造信息 (PMI)、模型树、视图、持久 ID、样式、构造几何、可视化等,无需依赖任…

易点易动:引入二维码和移动技术,助力企业高效进行固定资产盘点

固定资产是企业重要的财务资源,而高效准确地进行海量固定资产盘点一直是企业管理的挑战。为了解决这一问题,易点易动固定资产管理系统引入了先进的二维码和移动技术。本文将详细介绍易点易动固定资产管理系统的二维码和移动技术,展示如何借助…

深度学习入门:一篇概述深度学习的文章

文章目录 🌟 特征工程:推荐系统有哪些可供利用的特征?🍊 1. 用户特征🍊 2. 商品特征🍊 3. 上下文特征🍊 4. 社交特征🍊 5. 行为特征 🌟 特征处理:如何利用Spa…