每日学术速递3.2

news2024/11/15 6:00:31

CV - 计算机视觉 |  ML - 机器学习 |  RL - 强化学习 | NLP 自然语言处理  

Subjects: cs.CV

1.Interactive Segmentation as Gaussian Process Classification(CVPR 2023)

标题:作为高斯过程分类的交互式分割

作者:Minghao Zhou, Hong Wang, Qian Zhao, Yuexiang Li, Yawen Huang, Deyu Meng, Yefeng Zheng

文章链接:https://arxiv.org/abs/2302.14578v1

项目代码:https://github.com/zmhhmz/gpcis_cvpr2023

摘要:

        基于点击的交互式分割(IS)旨在提取用户交互下的目标对象。对于这项任务,当前大多数基于深度学习 (DL) 的方法主要遵循语义分割的一般流程。尽管取得了令人鼓舞的性能,但它们并没有完全明确地利用和传播点击信息,不可避免地导致不令人满意的分割结果,即使在点击点也是如此。针对这个问题,在本文中,我们建议将 IS 任务制定为每个图像上基于高斯过程 (GP) 的逐像素二进制分类模型。为了解决这个模型,我们利用分摊变分推理以数据驱动的方式逼近难处理的 GP 后验,然后将近似的 GP 后验解耦为双空间形式,以实现具有线性复杂度的高效采样。然后,我们相应地构建了一个 GP 分类框架,命名为 GPCIS,它与深度内核学习机制相结合,具有更大的灵活性。所提出的 GPCIS 的主要特点在于:1)在派生 GP 后验的明确指导下,点击中包含的信息可以很好地传播到整个图像,然后促进分割;2)点击预测的准确性有很好的理论支持。GPCIS 的这些优点及其良好的通用性和高效率已通过几个基准的综合实验得到证实,并与代表性方法进行了定量和定性比较。

2.ProxyFormer: Proxy Alignment Assisted Point Cloud Completion with Missing Part Sensitive Transformer(CVPR 2023)

标题:ProxyFormer:代理对齐辅助点云完成与缺失部分敏感变压器

作者:Shanshan Li, Pan Gao, Xiaoyang Tan, Mingqiang Wei

文章链接:https://arxiv.org/abs/2302.14435v1

项目代码:https://github.com/i2-multimedia-lab/proxyformer

摘要:

        设备缺陷或视点受限等问题会导致捕获的点云不完整。因此,从部分点云中恢复完整点云在许多实际任务中起着至关重要的作用,而关键之一在于对缺失部分的预测。在本文中,我们提出了一种新颖的点云完成方法,即 ProxyFormer,它将点云分为现有(输入)和缺失(待预测)部分,每个部分通过其代理传递信息。具体来说,我们通过特征和位置提取器将信息融合到点代理中,并从现有点代理的特征中生成缺失点代理的特征。然后,为了更好地感知缺失点的位置,我们设计了一个缺失部分敏感转换器,将随机正态分布转换为合理的位置信息,并使用代理对齐来细化缺失代理。它使预测点代理对缺失部分的特征和位置更加敏感,从而使这些代理更适合后续的由粗到精的过程。实验结果表明,我们的方法在几个基准数据集上优于最先进的补全网络,并且具有最快的推理速度。代码可在 https://github.com/I2-Multimedia-Lab/ProxyFormer 获得。

Subjects: cs.LG

3.RoPAWS: Robust Semi-supervised Representation Learning from Uncurated Data(ICLR 2023)

标题:RoPAWS:从未经整理的数据中进行稳健的半监督表示学习

作者:Sangwoo Mo, Jong-Chyi Su, Chih-Yao Ma, Mido Assran, Ishan Misra, Licheng Yu, Sean Bell 

文章链接:https://arxiv.org/abs/2302.14483v1

项目代码:https://github.com/facebookresearch/suncet

摘要:

        半监督学习旨在使用有限的标签训练模型。用于图像分类的最先进的半监督方法(例如 PAWS)依赖于使用大规模未标记但经过整理的数据学习的自我监督表示。但是,当使用未经整理的真实世界未标记数据(例如,包含类外数据)时,PAWS 通常效率较低。我们提出了 RoPAWS,它是 PAWS 的强大扩展,可以处理真实世界的未标记数据。我们首先将 PAWS 重新解释为使用核密度估计对密度进行建模的生成分类器。从这个概率的角度来看,我们根据标记和未标记数据的密度校准其预测,从而根据贝叶斯规则得出一个简单的封闭形式的解决方案。我们证明,RoPAWS 显着提高了未策划的 Semi-iNat 的 PAWS + 5.3% 和策划的 ImageNet + 0.4%。

更多Ai资讯:公主号AiCharm
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/382089.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

tensorflow1.14.0安装教程--保姆级

//方法不止一种,下面仅展示一种。 注:本人电脑为win11,anaconda的python版本为3.9,但tensorflow需要python版本为3.7,所以下面主要阐述将python版本改为3.7后的安装过程以及常遇到的问题。 1.首先电脑安装好anaconda…

java进阶—多线程

学习线程,我们先来了解了解什么是进程?什么是线程 进程:就是在操作系统中运行的程序 线程:就是进程的一个执行单元,或者一条执行路劲 比如:我们打开应用商店,这个应用商店就是一个进程&#…

字节实习二面

网络体系结构分层(7、5、4) 答: OSI七层网络体系结构:物理层、数据链路层、网络层、传输层、会话层、表示层、应用层 TCP/IP四层网络体系结构:物理层、网际层、传输层、应用层 TCP/IP五层网络体系结构:物…

ShopWind 多商户商城更新,Vue 3 前后端分离,页面自定义装修

本次为 V4 版本更新,新系统架构(技术栈)vue3 vite (打包编译工具) Composition API(组合式 API setup) Element Plus vueRouter (路由) 第三方组件:axios (数据请求) wangeditor(编辑器),都是通过接口访问数据,页面效果更佳了…

【强烈建议收藏:MySQL面试必问系列之并发事务锁专题】

一.知识回顾 上节课我们一起学习了MySQL面试必问系列之事务,没有学习的同学可以看一下上一篇文章,肯定对你会有帮助,学习过的同学肯定知道,上节课我们留了一个小尾巴,这个小尾巴是什么呢?就是没有详细展开…

MPI ubuntu安装,mpicc,mpicxx,mpif90的区别

介绍 MPI是并行计算的一个支持库,支持对C、C、fortran语言进行并行计算。 安装基础环境 ubuntu进行gcc/g/gfortran的安装: gcc: ubuntu下自带gcc编译器。可以通过gcc -v命令来查看是否安装。 g: sudo apt-get install buil…

【Python学习笔记】第二十四节 Python 正则表达式

一、正则表达式简介正则表达式(regular expression)是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。正则表达式是对字符串(包括普通字符(例如,a 到 z 之间的字母)和特…

Day07-flex布局

文章目录弹性布局一 简介二 弹性容器案例-让多个div排成一行三 容器项目的对齐方式案例1-justify-content(主轴对齐)案例2-flex-wrap(换行)案例3-align-items(侧轴对齐)案例4-align-self(项目垂直对齐)案例5-flex-direction(改变轴向)案例6-弹性布局应用四 弹性项目-flex属性案…

离开央视的欧阳夏丹,在艺考培训机构当老师,是金子到哪都会发光

说起中央电视台,大家都认为这是主持界的殿堂,但凡能在这里工作的人,都是出类拔萃的人才。在中央电视台,确实也出现过很多人才,比如说主持界的康辉、撒贝宁、朱军、周涛等等。 除了以上这些主持人,欧阳夏丹也…

【高效办公】批量生成固定模板的文件夹名称

老师让你按照他的要求生成每位学生的文件夹,你是学委,让你马上完成该任务,但你又不想是手动一个一个码字,因此聪明的你就看到了本篇文章啦!!! 虽说一个人懒惰,并不是好的事情。 但这个似乎合情合理啊~ 然后,就动手想办法,一开始就真的打算码字了。。 思路 在实际开…

机器学习笔记之狄利克雷过程(二)基于标量参数作用的推导过程

机器学习笔记之狄利克雷过程——基于标量参数作用的推导过程引言回顾:狄利克雷过程——基本介绍狄利克雷过程——定义小插曲:狄利克雷分布的简单性质关于标量参数作用的推导过程引言 上一节以高斯混合模型为引,简单介绍了狄利克雷过程(Diric…

虹科分享| 浅谈HK-Edgility边缘计算平台

上周,我们推出了虹科新品HK-Edgility边缘计算平台以及uCPE解决方案。本篇文章我们再来谈一谈到底什么是边缘计算?为什么需要边缘计算?边缘计算和云计算有什么关系?HK-Edgility边缘计算平台将为您带来什么?一、边缘计算…

【C++】vector实现(深浅拷贝详细理解,迭代器失效)

🍅可以先去这个网站看一下个个函数的功能 本文不再详细介绍,vector的底层还是顺序表,我讲的很详细,建议没学过顺序表的先预习一下(主页搜索顺序表,还有配套习题) C网站关于vector的接口函数信息…

雅思积累(十八)同义替换

同义替换:sophisticated —— complicatedspecific —— detailed —— particularquantity —— wealth —— volume —— numbersettle —— schedule —— arrange —— fixswift —— rapid —— fast —— quickexpertise —— professional knowledge —— sk…

【云原生kubernetes】k8s中job与cronjob使用详解

一、前言 job,顾名思义就是任务,job的概念在很多框架中都有,而且实际业务场景中也使用非常广泛,比如大家熟悉的hadoop,客户端可以向集群提交一个job,然后集群根据一定的调度策略来处理这个job; …

【2023unity游戏制作-mango的冒险】-6.关卡设计

👨‍💻个人主页:元宇宙-秩沅 hallo 欢迎 点赞👍 收藏⭐ 留言📝 加关注✅! 本文由 秩沅 原创 收录于专栏:unity游戏制作 ⭐mango的冒险关卡设计⭐ 文章目录⭐mango的冒险关卡设计⭐👨‍&#…

软件测试之jira

Jira 1. Jira 概述 JIRA 是澳大利亚 Atlassian 公司开发的一款优秀的问题跟踪管理软件工具,可以对各种类型的问题进行跟踪管理,包括缺陷、任务、需求、改进等。JIRA采用J2EE技术,能够跨平台部署。它正被广泛的开源软件组织,以及…

更新 TKK 失败,请检查网络连接。谷歌翻译 translation插件不能用解决办法 亲测有效

谷歌翻译无法使用,谷歌回应解释是,谷歌翻译使用率过低,所以选择停止服务。网上也有说法,指出根本原因为,提供API接口的googleapis被墙,这导致js文件和字体资源无法加载。 这里提供两种解决办法 方案一 修…

枯燥迷茫?先来玩玩这些经典的计算机视觉项目

B站|公众号:啥都会一点的研究生 颜色检测 从检测颜色到绿幕应用(用自定义视频或背景替换绿色背景),再到简单的照片编辑软件,构建颜色识别器是计算机视觉入门的一个很棒的项目 项目地址:https://github.…

PostgresSQL存储过程和触发器

在次之前首先要搞清楚一个概念 存储过程和触发器,是在基础sql语句之后的另一门语言,类似小学的加减乘除和奥数的关系,他们虽然都是数学,但是运算复杂度和定向思维都有了很大程度的不同 这篇文章不打算把存储过程和触发器事无巨细…