Talk | ICCV‘23南洋理工大学博士后李祥泰:面向统一高效的视频分割方法设计

news2025/1/19 16:59:44

图片

本期为TechBeat人工智能社区528线上Talk!

北京时间9月6(周三)20:00南洋理工大学博士后研究员—李祥泰的Talk已准时在TechBeat人工智能社区开播!

他与大家分享的主题是: 面向统一高效的视频分割方法设计,他分享了其在视频分割领域的研究进展并介绍了统一在线视频分割模型 Video K-Net 和结合在线与多帧分割方法的框架 Tube-Link。

Talk·信息

主题:面向统一高效的视频分割方法设计

嘉宾:南洋理工大学博士后研究员—李祥泰

时间:北京时间 9月6日(周三)20:00

地点:TechBeat人工智能社区

点击下方链接,即可观看视频!

TechBeatTechBeat是荟聚全球华人AI精英的成长社区,每周上新来自顶尖大厂、明星创业公司、国际顶级高校相关专业在读博士的最新研究工作。我们希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。icon-default.png?t=N7T8https://www.techbeat.net/talk-info?id=806

Talk·介绍

视频分割作为分割任务的一个重要应用,其目标主要是对视频中的每个像素进行分割与跟踪,在很多业务场景中有重要的应用,比如短视频分析,自动驾驶视频感知应用。现有的视频分割算法大多数是关注一个特定的分割任务,比如视频实例分割或者视频语义分割。随着近期Transformer与大模型的出现,更多的研究更关注于如何构建一个统一的分割模型来解决不同的分割任务。本次讲座主要介绍课题组如何研究更好的视频分制框架并介绍课题组在过去两年的一些关于视频分割与检测任务的成果。

Talk大纲

1、视频分割的研究进展,问题与挑战。

2、Video K-Net:第一个统一在线的视频分割模型。Video K-Net 是一个基于Transformer的在线视频分割模型,在多个不同的视频分割任务,包括视频全景分割以及视频语义分割取得了领先的效果。论文发表在了CVPR-2022。

3、Tube-Link: 第一个把在线视频分割方法与多帧的分割方法相结合的框架。在三个不同的视频分割任务上取得了领先于其他针对任务单独设计的模型更好的性能。论文发表在了ICCV-2023。

Talk·预习资料

图片

论文链接:

https://arxiv.org/pdf/2204.04656.pdf

图片

论文链接:

https://arxiv.org/pdf/2303.12782.pdf

图片

论文链接:

https://arxiv.org/pdf/2304.09854.pdf

图片

论文链接:

https://arxiv.org/pdf/2107.01153.pdf

Talk·提问交流

在Talk界面下的【交流区】参与互动!留下你的打call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!

图片

你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!

Talk·嘉宾介绍

图片

李祥泰

南洋理工大学博士后研究员

李祥泰,南洋理工大学博士后研究员(MMLab@NTU)。2022年博士毕业于北京大学智能学院,是校级与北京市优秀毕业生。主要研究方向包括:图像分割与检测、多模态学习和视频理解,专注于让智能机器真正理解各种复杂的场景输入。在计算机视觉国际顶级会议 (CVPR、ICCV、ECCV、ICLR、NeurIPS等)和期刊 (TPAMI、IJCV、TIP等)上发表20余篇论文。读博期间在商汤京东多家企业做科研实习生,获得北大校长奖学金、国家奖学金,部分研究成果应用到了实习单位的产品中。

个人主页: 

https://www.techbeat.net/grzytrkj?id=6355


关于TechBeat人工智能社区

TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。

我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。

期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!

更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/982771.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

外滩大会今日开幕 近20位“两院”院士、诺贝尔奖和图灵奖得主齐聚

2023 Inclusion外滩大会9月7日在上海黄浦世博园正式开幕。这场以“科技创造可持续未来”为主题的大会为期三天,近20位“两院”院士、诺贝尔奖和图灵奖得主,全球超500位有影响力的科技领军企业和专家学者,将在此带来一场科技、人文和产业的思想…

机器学习笔记:轨迹驻留点 staypoint

1 定义 在轨迹数据分析中,"停留点"(Staypoint)是一个非常关键的概念,它反映了个体或物体在某一地点的停留行为。通常,在一段时间内,如果一个人或物体在一个较小的地理区域内的移动距离低于某个阈…

成都优优聚专业美团代运营团队!

成都优优聚是一家专业从事美团代运营的公司,为餐饮商家提供全方位的代运营服务。总部位于成都市,拥有一支经验丰富、专业的团队。 作为一家专注于美团代运营的公司,成都优优聚致力于帮助商家提升在美团平台上的曝光率,提高订单量和…

介绍两款生成神经网络架构示意图的工具:NN-SVG和PlotNeuralNet

对于神经网络架构的可视化是很有意义的,可以在很大程度上帮助到我们清晰直观地了解到整个架构,我们在前面的 PyTorch的ONNX结合MNIST手写数字数据集的应用(.pth和.onnx的转换与onnx运行时) 有介绍,可以将模型架构文件(常见的格式都可以)在线上…

LeetCode:二分查找

题目 给定一个 n 个元素有序的(升序)整型数组 nums 和一个目标值 target ,写一个函数搜索 nums 中的 target,如果目标值存在返回下标,否则返回 -1。 示例 1: 输入: nums [-1,0,3,5,9,12], target 9 输出: 4 解释: …

小程序引入高德/百度地图坐标系详解

小程序引入高德/百度地图坐标系详解 官网最近更新时间:最后更新时间: 2021年08月17日 高德官网之在原生小程序中使用的常见问题 链接 目前在小程序中使用 高德地图只支持以下功能 :地址描述、POI和实时天气数据 小结:从高德api中获取数…

idea意外退出mac

目录 问题描述 解决过程 问题描述 mac上的idea我很久没用了,之前用的时候还是发布新版的开源项目,这几天再用的时候,就出现了idea意外退出的问题,我上网查找了很久,对于我的问题都没有很好的解决。 解决过程 在寻求…

基于ADS的marx雪崩电路设计-设计实践(射频脉冲源)

基于ADS的marx雪崩电路设计-设计实践(射频脉冲源) 设计一个ns级别的脉冲源,属于是半路转行的,虽然不了解具体原理但是也可以进行设计。具体的设计理论以及优化方法将在之后进行讨论. 参考文献:基于Marx电路的亚纳秒级…

Acwing算法心得——街灯(差分)

大家好,我是晴天学长,差分广泛用于一段范围的加减运算,可以优化时间复杂度,需要的小伙伴请自取哦!如果觉得写的不错的话,可以点个关注哦,后续会继续更新的。💪💪&#x1…

log4j2Scan.jar在log4j漏洞复现中的使用

首先在burp中安装该插件 装完后浏览器打开一个有log4j漏洞的网站 不需要开启拦截,插件就可以自动检测该网站有没有log4j的漏洞 有号说明发现了漏洞

pytorch代码实现注意力机制之MHSA

MHSA注意力机制 MHSA是多头自注意力机制(Multi-Head Self-Altention),是自然语言处理领域中用于语言模型中的一种特殊机制。它能够让模型在预测下一个词的时候,更好地关注句子中不同位置的词,以适应不同的语言场景。MHSA的核心思想是将一个线…

学生台灯选什么光源好?2023热门护眼台灯推荐

现在的台灯可以说是孩子必不可少的一个学习灯具了,几乎每家每户都会备着一台。不过台的好坏也有区别,相对而言,以前所用的白炽灯、日光灯、节能灯等等传统台灯已经是不适合孩子使用的了,目前而言最好的是LED灯。下面小编为大家推荐…

ROS速成2——机器人运动控制

1. 2.实现思路 创建软件包 定义发布者对象,名字叫vel_pub, 让advertise发布一个类型为geometry_msgs的Twist,话题名称是cmd_vel 声明一个 Twist类型的消息包,名字叫vel_msg,用来承载要发送的速度值 开启while循环,不停使用vel_pub对象发送…

亚马逊美国站直接插入式夜间照明灯具认证标准要求UL1786检测报告办理周期

亚马逊为什么要求电子产品UL检测报告? 美国是一个对安全要求非常严格的国家,美国本土的所有电子产品生产企业早在很多年前就要求有相关安规检测。 而随着亚马逊在全球商业的战略地位不断提高,境外的电子设备通过亚马逊不断涌入美国市场&…

【Python】【Fintech】用Python和蒙特卡洛法预测投资组合未来收益

【背景】 想利用蒙特卡洛方法和yahoo,stooq等财经网站上的数据快速预测特定portfolio的收益。 【分析】 整个程序的功能包括 读取json中的portfolio组合创建蒙特卡洛模拟预测收益的算法创建从财经网站获得特定投资组合数据,并根据2的算法获得该Index或Portfolio收益预测结…

一套成熟的实验室信息管理系统(云LIS源码)ASP.NET CORE

一套成熟的实验室信息管理系统,集前处理、检验、报告、质控、统计分析、两癌等模块为一体的网络管理系统。它的开发和应用将加快检验科管理的统一化、网络化、标准化的进程。 LIS把检验、检疫、放免、细菌微生物及科研使用的各类分析仪器,通过计算机联…

正中优配:政策预期叠加资金面压制 债市回调至“降息”前

地产方针利好和资金面边沿收紧的压制之下,债券商场出现了回调。 到9月6日收盘,10年期国债收益率上行2.4个基点报2.665%,已回到降息之前的点位。 资金面也在收敛,到6日收盘,DR001加权均匀利率报1.51%,较前…

数学建模竞赛常用代码总结-PythonMatlab

数学建模过程中有许多可复用的基础代码,在此对 python 以及 MATLAB 中常用代码进行简单总结,该总结会进行实时更新。 一、文件读取 python (pandas) 文件后缀名(扩展名)并不是必须的,其作用主要一方面是提示系统是用…

ROS地图/像素坐标描点调试【Python源码实现】

文章目录 ROS python 地图描点调试工具1. Rviz描点1.1 需求描述1.2 visualization Marker1.3 工程实践 2. 静态地图图片描点2.1 需求描述2.2 工程实践 ROS python 地图描点调试工具 1. Rviz描点 1.1 需求描述 在ROS开发中,有时会加载图片文件转为地图载入move_ba…

算法——组合程序算法解析

组合就是从m个元素的数组中求n个元素的所有组合&#xff0c;代码如下&#xff1a; #include <iostream> #include <vector> using namespace std; // 递归求解组合 void combinations(vector<int>& nums, vector<int>& combination, int star…