每日已开源的AI论文分享【2023920期】

news2024/12/29 10:51:34

目录

前言

3D语义场景补全

视频修复

3D人脸重建

视频线条检测

3D物体重建

尾言


前言

作者介绍:作者本人是一名人工智能炼丹师,目前在实验室主要研究的方向为生成式模型,对其它方向也略有了解,希望能够在CSDN这个平台上与同样爱好人工智能的小伙伴交流分享,一起进步。谢谢大家鸭~~~

 如果你觉得这篇文章对您有帮助,麻烦点赞、收藏或者评论一下,这是对作者工作的肯定和鼓励。  

3D语义场景补全

Semantic Scene Completion via Integrating Instances and Scene in-the-Loop

摘要:语义场景补全旨在从单视角深度或RGBD图像中重建具有精确体素级语义的完整3D场景。这是室内场景理解中至关重要但具有挑战性的问题。在这项工作中,我们提出了一种名为“场景-实例场景网络(SISNet)”的新框架,它充分利用了实例和场景级语义信息的优势。我们的方法能够推断出精细的形状细节,以及语义类别容易混淆的附近对象。关键是我们将实例从粗略完成的语义场景中分离出来,而不是从原始输入图像中分离,以指导实例和整体场景的重建。SISNet进行了迭代的场景到实例(SI)和实例到场景(IS)语义补全。具体而言,SI能够编码对象周围的上下文,以有效地将实例从场景中分离出来,每个实例都可以被像素化为更高分辨率以捕获更细的细节。通过IS,精细的实例信息可以集成回3D场景中,从而实现更准确的语义场景补全。利用这种迭代机制,场景和实例的补全相互受益,以实现更高的补全精度。大量实验证明,我们提出的方法在真实的NYU、NYUCAD和合成的SUNCG-RGBD数据集上始终优于最先进的方法。

Code:https://github.com/yjcaimeow/SISNet

论文:https://arxiv.org/abs/2104.03640

 视频修复

Progressive Temporal Feature Alignment Network for Video Inpainting

摘要:视频修复旨在用合理的内容填充时空上的“损坏”区域。为了实现这一目标,需要找到从相邻帧中的对应关系,以忠实地虚构未知内容。目前的方法通过注意力、基于光流的扭曲或3D时间卷积来实现这一目标。然而,基于光流的扭曲在光流不准确时可能会产生伪影,而时间卷积可能会受到空间不对齐的影响。我们提出了“渐进式时间特征对齐网络”,它通过使用光流逐渐丰富从当前帧提取的特征,并将其与从相邻帧扭曲的特征结合起来。我们的方法在时间特征传播阶段纠正了空间不对齐,极大地提高了修复视频的视觉质量和时间一致性。使用我们提出的架构,与现有的深度学习方法相比,我们在DAVIS和FVI数据集上实现了最先进的性能。

Code:https://github.com/MaureenZOU/TSAM

论文:https://arxiv.org/abs/2104.03507

 3D人脸重建

Riggable 3D Face Reconstruction via In-Network Optimization

摘要:本文提出了一种从单目图像进行可控三维人脸重建的方法,该方法共同估计了个性化的人脸模型和包括表情、姿势和光照在内的每张图像的参数。为了实现这一目标,我们设计了一个端到端可训练的网络,嵌入了一个可微分的网络内优化过程。网络首先使用神经解码器将人脸模型参数化为一个紧凑的潜在代码,然后通过可学习的优化过程来估计潜在代码以及每张图像的参数。通过估计个性化的人脸模型,我们的方法超越了静态重建,实现了诸如视频重定向等下游应用。网络内优化明确强制执行了从第一原理中导出的约束,因此引入了比基于回归方法更多的先验信息。最后,利用深度学习的数据驱动先验来限制不适定的单目设置,减轻了优化难度。实验证明,我们的方法在重建精度、稳健性和泛化能力方面都达到了最先进水平,并支持标准的人脸模型应用。 

Code:https://github.com/zqbai-jeremy/INORig

论文https://arxiv.org/abs/2104.03493

视频线条检测

SOLD2 : Self-supervised Occlusion-aware Line Description and Detection

摘要:与特征点的检测和描述相比,检测和匹配线段提出了额外的挑战。然而,线特征对于多视图任务来说是特征点的有力补充。线段在图像梯度的作用下具有明确定义,在纹理较差的区域甚至经常出现,并提供了强大的结构线索。因此,我们在此介绍了首个在单一深度网络中联合检测和描述线段的方法。由于采用了自监督训练,我们的方法不需要任何注释的线标签,因此可以推广到任何数据集。我们的检测器能够在图像中重复且准确地定位线段,不同于线框解析方法。利用描述符学习的最新进展,我们提出的线段描述符具有高度区分性,同时对视角变化和遮挡具有鲁棒性。我们在多视图数据集上评估了我们的方法,这些数据集是通过同态变换创建的,还包括了真实世界的视角变化。我们的完整流程提供了更高的重复性、定位精度和匹配度量,因此代表了与学习的特征点方法缩小差距的第一步。 

Code:https://github.com/cvg/SOLD2

论文https://arxiv.org/abs/2104.03362

 3D物体重建

3D Shape Generation and Completion through Point-Voxel Diffusion

摘要:我们提出了一种用于概率生成三维形状的新方法。与大多数现有的模型不同,这些模型学习将潜在向量确定性地转换为形状,我们的模型,Point-Voxel Diffusion(PVD),是一个统一的、概率的公式,用于无条件形状生成和有条件的多模态形状完成。PVD将去噪扩散模型与三维形状的混合点-体素表示相结合。它可以看作是一系列去噪步骤,将观察到的点云数据的扩散过程逆转为高斯噪声,并通过优化条件似然函数的变分下界进行训练。实验证明,PVD能够合成高保真度的形状,完成部分点云数据,并从实际物体的单视图深度扫描中生成多个完成结果。 

Code: GitHub - alexzhou907/PVD

论文: https://arxiv.org/abs/2104.03670

尾言

 如果您觉得这篇文章对您有帮忙,请点赞、收藏。您的点赞是对作者工作的肯定和鼓励,这对作者来说真的非常重要。如果您对文章内容有任何疑惑和建议,欢迎在评论区里面进行评论,我将第一时间进行回复。 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1033922.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【TypeScript】类、类的属性及抽象类(七)

【TypeScript】类、类的属性及抽象类(七) 【TypeScript】类、类的属性及抽象类(七)一、前言二、语法及属性定义三、类的继承四、属性类型五、readonly修饰符六、static 静态属性七、存取器-get/set八、抽象类 一、前言 传统的Jav…

定制SQLmap和WAF绕过

1. SQLmap tamper 脚本编写 以sqli-lab第26关为例 输入?id1’ --,报错字符型注入 考虑闭合问题,输入?id1’ and 1,但是回显中and和空格消失了,可知and和空格被过滤了 因为and和or被过滤考虑使用双写绕过手段,空格使…

2023华为杯数学建模D题第三问——区域双碳目标情景设计样例

在第二问建立好预测模型的基础上,如何设计第三问所说的区域双碳路径,以对宏观政策进行指导! 采用STIRPA的基本模型对中国碳达峰时间进行预测,对该模型公式两边取对数得到: 其中:P为人口,A为GDP…

NIO圣经:一次穿透NIO、Selector、Epoll底层原理

此pdf电子书,是尼恩架构团队持续升级、持续迭代的作品。 目标是,通过不断升级、持续迭代,为大家构筑一个超底层、超强悍的高性能技术内功。 原 :《九阳真经:彻底明白操作系统 select、epoll 核心原理》 改&#xff1…

2023年研赛华为杯选题人数发布

选题人数发布!经过长达30个小时,各个平台的相关选题投票、相关文章阅读量等各项数据进行统计,利用之前的评估办法(详见注释)。在开赛后30小时,我们基本确定各个赛题选题人数,大致为 题号选题人数…

时间轮算法

思考 假如现在有个任务需要3s后执行,你会如何实现? 线程实现:让线程休眠3s 如果存在大量任务时,每个任务都需要一个单独的线程,那这个方案的消耗是极其巨大的,那么如何实现高效的调度呢? 时…

兰贡生物:打造生物医药研发“独角兽”

当我们站在医学科学的最前沿,探索着无尽的健康奥秘时,生物制药行业正经历着前所未有的变革和机遇。新的疾病不断涌现,现有的治疗方法也在不断演进,这需要有着创新精神和科学追求的企业来推动新药研发的进程。值此时代背景下&#…

网络安全—黑客技术—自学笔记

目录梗概 一、自学网络安全学习的误区和陷阱 二、学习网络安全的一些前期准备 三、网络安全学习路线 四、学习资料的推荐 想自学网络安全(黑客技术)首先你得了解什么是网络安全!什么是黑客! 网络安全可以基于攻击和防御视角来…

Linux常用命令—find命令大全

文章目录 一、find命令常用功能1、find命令的基本信息如下。2、按照文件名搜索3、按照文件大小搜索4、按照修改时间搜索5、按照权限搜索举例:6、按照所有者和所属组搜索7、按照文件类型搜索8、逻辑运算符 一、find命令常用功能 1、find命令的基本信息如下。 命令名…

力扣213打家劫舍2(简单动态规划)

题目描述: 你是一个专业的小偷,计划偷窃沿街的房屋,每间房内都藏有一定的现金。这个地方所有的房屋都 围成一圈 ,这意味着第一个房屋和最后一个房屋是紧挨着的。同时,相邻的房屋装有相互连通的防盗系统,如…

1790_给通过USB连接到树莓派的NTFS硬盘设置固定的挂载名称

全部学习汇总: GreyZhang/little_bits_of_raspberry_pi: my hacking trip about raspberry pi. (github.com) 我用过好几个树莓派形式的单板电脑,但是遇到过磁盘挂载位置不确定的时候。有些甚至不会自动挂载。这些行为跟对应的OS的行为是相关的&#xff…

Mallox勒索病毒:最新变种.mallox_lab袭击了您的计算机?

引言 在数字化时代,数据是我们生活和工作的重要组成部分,但同时也引发了各种网络威胁,.mallox_lab勒索病毒便是其中之一。这种恶意软件以其加密文件并勒索赎金的方式而闻名,给个人和组织带来了巨大的风险和损失。本文将深入探讨.…

【小沐学C++】C++ MFC中嵌入64位ActiveX控件(VS2017)

文章目录 1、简介1.1 MFC1.2 ActiveX 2、VS2017添加ActiveX控件结语 1、简介 1.1 MFC Microsoft 基础类 (MFC) 库针对大部分 Win32 和 COM API 提供面向对象的包装器。 虽然此包装器可用于创建极为简单的桌面应用程序,但当你需要开发具有多个控件的更复杂的用户界…

你真的懂ArrayList吗?

ArrayList底层原理 ​ 1.ArrayList动态扩容的方法? 使用空参创建集合,在底层创建一个长度默认为0的数组;添加第一个元素时,底层会创建一个数组长度为10的数组;存满的时候,数组会自动扩容1.5倍;…

【算法思想-排序】按出现频率排序 - 力扣 1636

💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:kuan 的首页,持续学…

基于STM32+华为云IOT设计的智能车库管理系统

一、项目介绍 随着城市化进程和汽车拥有率的不断提高,停车难的问题也日益凸显。在城市中,停车场是一个非常重要的基础设施,但是传统的停车场管理方式存在很多问题,比如车位难以管理、停车费用不透明等。为了解决这些问题&#xf…

基于Vue+ELement搭建登陆注册页面实现后端交互

🎉🎉欢迎来到我的CSDN主页!🎉🎉 🏅我是Java方文山,一个在CSDN分享笔记的博主。📚📚 🌟推荐给大家我的专栏《ELement》。🎯🎯 &#x1…

C语言入门Day_24 函数与指针

目录 前言: 1.指针和数组 2.函数和指针 3.易错点 4.思维导图 前言: 我们知道数组是用来存储多个数据的,以及我们可以用指针来指向一个变量。那么我们可以用指针来指向一个数组中的数据么? 指针除了可以像指向一个变量一样指…

【C++心愿便利店】No.6---C++之拷贝构造函数

文章目录 一、拷贝构造函数的引入二、拷贝构造函数 👧个人主页:小沈YO. 😚小编介绍:欢迎来到我的乱七八糟小星球🌝 📋专栏:C 心愿便利店 🔑本章内容:拷贝构造函数 记得 评…

python安全工具开发笔记(四)——python网络编程

一、C/S架构 什么是C/S架构 C : Client S : Server。客户机和服务器结构。 Server 唯一的目的就是等待Client 的请求,Client 连上 Server 发送必要的数据,然后等待Server端完成请求的反馈。 C/S网络编程 Server端进行设置,首先创建一个通信…