Talk | 南洋理工大学博士后研究员李祥泰:基于Transformer的视觉分割模型总结、回顾与展望

news2024/9/22 7:22:58

图片

本期为TechBeat人工智能社区517线上Talk!

北京时间7月27(周四)20:00南洋理工大学博士后研究员—李祥泰的Talk已经准时在TechBeat人工智能社区开播了!

他与大家分享的主题是: 基于Transformer的视觉分割模型总结、回顾与展望,系统性地回顾与总结了Transformer模型。

Talk·信息

主题:基于Transformer的视觉分割模型总结、回顾与展望

嘉宾:南洋理工大学博士后研究员 李祥泰

时间:北京时间 7月27日(周四)20:00

地点:TechBeat人工智能社区

http://www.techbeat.net/

 点击下方链接,一键预约TALK!

TechBeatTechBeat是荟聚全球华人AI精英的成长社区,每周上新来自顶尖大厂、明星创业公司、国际顶级高校相关专业在读博士的最新研究工作。我们希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。https://www.techbeat.net/talk-info?id=794

Talk·介绍

分割是一个基础性质的视觉任务,其目标是把输入的图像,视频,点云等划分成为带有语义性质的区域块。作为一个重要的场景理解任务,分割任务有着广泛的应用价值,包括自动驾驶,机器人导航,短视频分析。

在深度学习时代,分割领域采用以卷积神经网络为基础的全卷积网络,在各个子方向上取得了突破性的进展。近期,以Transformer为基础的一些方法在NLP以及CV领域各个方向上也取得了突破性的进展。相比于CNN模型,Transformer模型结构上更灵活,更适用于多模态,多任务的输入。

在分割与检测领域,基于Transformer的模型在各个基准上也取得了领先的效果。自从ViT和DETR出现后,在各个子方向上,最新的研究方法均建立在Transformer为骨干网络和解码器的基础框架上。鉴于目前这个领域近期快速进展,我们课题组对整个领域做了系统性地回顾与总结。整个Survey的内容包括基础知识与任务设置介绍,Transformer的基础内容介绍,CNN分割模型的系统性回顾,基于Transformer的分割模型回顾,相关基准数据集的评估与测试,以及未来可行的研究方向探索。

Talk大纲

1、近期3-4年内常见的分割方法系统回顾与探索。

2、基于Transformer 的分割与检测方法的系统性回顾,包含图像,视频,点云三个不同的领域。

3、本研究组以及近期相关研究组的Transformer-based Segmentation/Detection 方法的研究。

4、近期与分割大模型相关的研究回顾。

Talk·预习资料

图片

论文链接:

https://arxiv.org/abs/2304.09854

repo:

https://github.com/lxtGH/Awesome-Segmentation-With-Transformer

Talk·提问交流

在Talk界面下的【交流区】参与互动!留下你的打call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!

图片

你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!

Talk·嘉宾介绍

图片

李祥泰

南洋理工大学博士后研究员

南洋理工大学S-lab博士后研究员,博士毕业于北京大学,研究方向包括计算机视觉和机器学习,图像视频分割与检测,多模态场景理解等。曾以第一作者身份在CVPR,ECCV,ICCV,PAMI顶级会议以及期刊上发表一些相关研究。

个人主页: 

https://www.techbeat.net/grzytrkj?id=6355


关于TechBeat人工智能社区

TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。

我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。

期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!

更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/802072.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

无涯教程-jQuery - animate()方法函数

animate()方法执行一组CSS属性的自定义动画。 animate( params, [duration, easing, callback] ) - 语法 selector.animate( params, [duration, easing, callback] ); 这是此方法使用的所有参数的说明 params - 动画将朝其移动的CSS属性图。duration - 这是可选…

idea常用技巧/idea常见问题

idea常见问题 idea全局搜索默认只显示100条解决方案 如上图,每次搜索时只显示100条,没法展示全。因版本的不同,配置也有些差异,以下也是经过各种搜索整理出了两个方案来解决这个问题。 方案一: 快捷键Ctrl shift a…

windows环境启动redis-server.exe出现闪退问题解决方案(亲测有效)

现象 windows环境下,启动redis-server.exe,出现闪退现象 解决方案 在你的redis解压目录下,新建一个start.bat文件 在start.bat文件里面写上这一句话: redis-server.exe redis.windows.conf然后保存,后面启动redis…

网络安全/信息安全—学习笔记

一、网络安全是什么 网络安全可以基于攻击和防御视角来分类,我们经常听到的 “红队”、“渗透测试” 等就是研究攻击技术,而“蓝队”、“安全运营”、“安全运维”则研究防御技术。 无论网络、Web、移动、桌面、云等哪个领域,都有攻与防两面…

【暑期每日一练】 day7

目录 选择题 (1) 解析: (2) 解析: (3) 解析: (4) 解析: (5) 解析: 编程题 题一…

​LeetCode解法汇总2500. 删除每行中的最大值

目录链接: 力扣编程题-解法汇总_分享记录-CSDN博客 GitHub同步刷题项目: https://github.com/September26/java-algorithms 原题链接:力扣 描述: 给你一个 m x n 大小的矩阵 grid ,由若干正整数组成。 执行下述操作…

方差分析学习

有时候能看的下去,有时候看书看不下去。 为了加深理解和记忆,先把基础的内容记忆一下。 组内方差(误差平方和)和组间方差(效应平方和)的定义: 注意:图中红线部分是一个整体。 误差…

基于java SpringBoot和HTML的博客系统

随着网络技术渗透到社会生活的各个方面,传统的交流方式也面临着变化。互联网是一个非常重要的方向。基于Web技术的网络考试系统可以在全球范围内使用互联网,可以在本地或异地进行通信,大大提高了通信和交换的灵活性。在当今高速发展的互联网时…

Quartz实战:基于Quartz实现定时任务的动态调度,实现定时任务的增删改查

文章目录 一、Quartz基础二、使用Quartz实现定时任务的动态调度1、使用Quartz-jobStore 持久化2、前端页面实现效果图3、自定义job表4、增删改查Controller5、Quartz工具类6、测试任务类7、springboot启动初始化定时任务8、自定义JobFactory,使Task注册为Bean9、省略…

PoseiSwap 即将开启质押,利好刺激下 POSE通证短时涨超 30%

随着Nautilus Chain主网的上线,预示着Web3世界迎来全新的模块化、Layer3时代,为Web3世界与Web2世界的深入融合构建基础。而PoseiSwap作为Nautilus Chain上的首个DEX,也成为了加密行业首个以模块化为基础构建的DEX。 基于Nautilus Chain&#…

免费商城搭建之java商城 开源java电子商务Spring Cloud+Spring Boot+mybatis+MQ+VR全景+b2b2c 手机商城免费搭建

1. 涉及平台 平台管理、商家端(PC端、手机端)、买家平台(H5/公众号、小程序、APP端(IOS/Android)、微服务平台(业务服务) 2. 核心架构 Spring Cloud、Spring Boot、Mybatis、Redis 3. 前端框架…

【lesson6】gcc和动静态库介绍

文章目录 gcc介绍gcc使用gcc -Egcc -Sgcc -cgcc *.ogcc *.c一步到位翻译 动静态库介绍动态链接和静态链接动态链接静态链接动静态链接总结 gcc介绍 gcc是一款翻译器,专门用来翻译C语言文本的翻译器。 程序的翻译过程: 是C文本---->计算机二进制可执行…

Qt5.14.2+VS2019配置MSVC2017

问题: The compiler " Microsoft Visual C Compiler 16 . 11 . 32106 . 194 ( amd64 x86 )( x86-windows-msvc2019-pe-32bit ) cannot produce code for the Qt version " Qt5.14.2 MSVC2017 64bit " ( x86-windows-msvc2017-pe-64bit 编译器“…

Docker安装部署ShardingProxy详细教程

🚀 ShardingSphere 🚀 🌲 算法刷题专栏 | 面试必备算法 | 面试高频算法 🍀 🌲 越难的东西,越要努力坚持,因为它具有很高的价值,算法就是这样✨ 🌲 作者简介:硕风和炜&…

求整数中的最大值

才用打擂台的形式,先放一个数max在擂台上,然后每个数都上去和他比较,如果上去的那个数比max大,那么就把max替换成那个数站在擂台上,依次比较,直到所有数都比较完后,站在擂台上的那个max就是最大…

码元、波特率、比特率、频带利用率及数字通信系统的可靠性指标

文章目录 前言一、码元二、码元传输速率 R B R_B RB​(传码率、波特率)三、信息传输速率 R b R_b Rb​(传信率,比特率)四、 R B R_B RB​ 和 R b R_b Rb​的关系——H(信源的熵) 为纽带五、频带…

四步从菜鸟到高手,Python编程真的很简单(送书第一期:文末送书2本)

🍁博主简介 🏅云计算领域优质创作者   🏅华为云开发者社区专家博主   🏅阿里云开发者社区专家博主 💊交流社区:运维交流社区 欢迎大家的加入! 🐋 希望大家多多支持,我…

使用多个神经网络进行细菌分类(Matlab代码实现)

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…

Web课堂笔记

Web课堂笔记 文章目录 Web课堂笔记第一周html部分CSS部分php部分 第二周B/S工作原理http协议**块标记** 第三周标准盒状模型标签优先级**伪类选择器**伪元素派生选择器 第四周Flex布局多媒体查询下拉菜单作业 第五周创建一个NodeLocalStorage 和 SessionStorge 异同JQuery作业 …

小米面试题解析:深入剖析final、finally、finalize的区别

大家好,我是你们的小米!今天我要和大家聊一聊在编程中常常让人迷惑的三个词:final、finally 和 finalize。这些词看似相似,但实际上在Java编程中有着截然不同的作用。如果你在面试中遇到相关问题,可千万别慌张&#xf…