朱松纯教授场景理解相关文章简介

news2024/11/28 14:33:10

朱松纯教授场景理解相关文章简介

Holistic 3D Scene Parsing and Reconstruction from a Single RGB Image

基于单张图像的整体场景解译与重建

image-20221121225511808

我们提出了一个计算框架来联合解译单帧RGB图像,通过使用一系列的随机语法模型生成的CAD模型构成整体的3D结构。具体地说,我们引入了整体场景语法(HSG)来表示三维场景结构,其建立了一个室内场景的功能与几何性的联合分布,提出的HSG方法捕捉三种必要的而且常见的潜在室内场景的表示:

  1. 潜在的人背景,描述一个房间布置的可视性和功能性,对场景配置的几何约束.
  2. 保证物理上合理解析的物理约束重建。
  3. 物理约束

我们解决了这个联合解译和重建问题以综合分析的方式,寻求最小化差异在输入图像和我们的3D生成的渲染图像之间表示,在空间的深度,表面法线,和对象分割图。用解析图表示的最佳配置,用马尔可夫链蒙特卡洛(MCMC)进行推断,有效地遍历不可微解空间,共同优化对象定位,3D布局和隐藏的目标上下文语义。实验结果表明,该算法提高了三维布局的泛化能力,显著优于现有算法估计、三维目标检测和整体场景理解。

image-20221121225930378

Single-View 3D Scene Parsing by Attributed Grammar

image-20221121230002210

我们提出了一种属性语法,用于解译man-made的外部场景同时用于语义外表与3D模型恢复,这个语法将超像素作为最终节点并使用5个生产规则用于产生层次化的解译图,每个图节点实际关联着在3D世界或者图片中的一个表面或者表面的一部分,他们通过一些全局场景的模型属性表示,例如focal length,vanishing points, suface properties, relative localtion等等,每个产生规则都与一些等式,这些等式限制了父节点或者子节点的属性,通过输入一张图片,我们的目标是构建一个层次化的解译图,通过递归地应用五个语法规则当保存属性限制的时候,我们开发了一种有效的、自上而下的聚类采样流程,能够有效地探索受限空间。我们我们通过公开数据集和自建的新数据集验证我们的想法,并取得了SOTA的结果,在布局估计和区域分割任务上。我们也展示了我们方法能够恢复3D模型的细节。

image-20221121230045219

Cooperative Holistic Scene Understanding: Unifying 3D Object, Layout, and Camera Pose Estimation

image-20221121230110706

整个的3D室内场景理解指的是:联合预测以下几点:一,预测目标的锚框,二,内部环境的布局,三,相机的位姿,目前已有的方法要么效率不高,要么就只解决了部分的问题。在本工作中,我们提出了一个端到端的模型能够同步地解决以上的三个任务并且能够实时运行,仅用输入RGB图像。我们提出的方法的本质就是:一是将目标参数化而不是直接估计目标,二是通过协作训练而不是单个的训练多个模块。特别指出,我们如何对目标参数化?通过预测相机位姿、目标的属性来实现目标的3d bbox的参数化,目前已提出的方法有两个优点:一个是参数化能够保证2D&3D空间的连续性,因此能够大量减小3D坐标中的预测方差,二是限制条件也能够影响到不同模块的训练。我们称这些方法为“协作损失”,我们使用了三种协作损失用于3D bbox预测、2D投影,物理实体的限制,去估计一个具有几何连续性和实体灵活性的3D场景。作者在SUN RGB-D数据集上做了实验,能够很好的提升3D检测、3D布局的预测性能,相机位姿估计任务等。

image-20221121230123446

Beyond Point Clouds: Scene Understanding by Reasoning Geometry and Physics

image-20221121230140290

本文提出从点云中通过推理目标的物理稳定性,实现场景理解,我们利用一种简单的观测,通过人工设计,目标在稳定的场景中应该是重力场下稳定的状态,这个假设适用于所有场景中的各类种类,并且对场景的解译问题施加了很多有用的限制。我们的方法包括两个步骤:一是集合推理,通过恢复刚性3D物体的原本形态从有缺陷的点云中,二是物理推理,将不稳定的原始物体组合到一个物理稳定的物体,通过优化稳定性和场景鲜艳,我们提出使用新的不连接图表示地平面并且使用MCMC方法优化。实验中我们算法实现了更好的性能:目标分割、3D物体恢复,场景理解解译

image-20221121230217893

Single-Image 3D Scene Parsing Using Geometric Commonsense

image-20221121230255296

提出一种统一的语法框架,能够重建大量的场景类型例如城市、校园等,从单帧图像中。我们的关键思想在于研究如何学习一种新的通识推理框架,能够主要探索两种类型的先验知识:一是单维度下目标的先验分布,例如某个常见物体的长度等形状信息。二是点对级别的关系在实体之间,例如轿车的长度比巴士要段,这些相对的先验几何知识,在常见的场景下都是成立的,能够极大增强在2D&3D场景下的场景理解。方法上来说,我们提出了一种层次化的图结构图表示作为一种联合表示,用于表示输入图像相关的几何知识。我们将这些客观知识公式化表示,用一种联合概率公式,并且开发了一种数据驱动的方法,推测最佳的解决方案,用一种从下到上或者是从上到下的计算方法。

image-20221121230314305

Scene Parsing by Data Driven Cluster Sampling

image-20221121230401024

image-20221121230419215

本文提出一种数据驱动的聚类采样框架,用于解译场景图片到一些常见区域(例如天空,高山,水)和目标(牛,马,车),我们采用了通用模型用于通用区域检测(目标检测和分割),因此他们的置信度概率是通过一些常见的信息投影原则。这种推理算法是一种数据驱动的DDMCMC范式,将目标检测和区域检测模型相互协作和竞争为了实现在贝叶斯框架内的最佳解释。这类算法有两个流程构成:一是自下至上的计算用于通用数据驱动的检测(分割、检测)通过训练一个独一无二的模型根据目标的外表。一个candacy graph的构建可以联合所有的自下而上的信息,通过将这些检测结果作为节点,上下文关系视作边。二是自顶向下,通过聚类采样寻找最优的解决方案,为了最大化贝叶斯后验概率,这类方法包括更有效地探索解空间。在每一步,采样+/-边的概率在candidacy graph中,并将graph拆分成多个子部份。在实验中,我们的算法超越了SOTA方法在LHI 15-class数据集中等等。

image-20221121230446044

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/26774.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

智慧农业SaaS系统

真正的大师,永远都怀着一颗学徒的心! 一、项目简介 智慧农业SaaS系统 二、实现功能 监控管理:支持海康摄像头监控。 用户管理:支持用户是系统操作者,该功能主要完成系统用户配置。 岗位管理:支持配置系统用户所属担…

bugku渗透测试 1 writeup(无需VPS)

靶场地址:BugKu渗透测试1 该靶场只需要20金币就可以开启两小时,算的上非常良心实惠了,趁着有空赶紧刷一刷题目 目录 第一场景: 第二场景: 第三场景: 第四场景: 第五场景: 第六…

第五章:面向对象(上)

第五章:面向对象(上) 5.1:面向过程与面向对象 面向过程(POP)与面向对象(OOP) ​ 二者都是一种思想,面向对象是相对于面向过程而言的。面向过程,强调的是功能行为,以函数为最小值,考虑怎么做。面向对象&…

【BOOST C++ 线程】boost::thread库的基本使用方法总结

一、说明 boost::thread的六种使用方法总结,本文初步介绍线程的函数、构造、执行的详细解释。 二、boost::thread的几个函数 函数功能join()让主进程等待子线程执行完毕后再继续执行get_id()获得线程的 id 号detach()标线程就成为了守护线程,驻留后台运…

【项目实战:核酸检测平台】第二章 大卸八块

本章目标 完成项目架构设计和数据库结构设计 重点:全是重点 文章目录本章目标总体设计(架构设计)技术选型部署结构设计工程文档结构设计第一步:项目和模块命名第二步:约定项目工程文件内容第三步:设计文档…

Hadoop高可用环境搭建-HDFSNameNode高可用搭建、Yarn高可用搭建

本文环境搭建的前提条件:JDK、Zookeeper、Hadoop完全分布式环境搭建完成。如果未满足条件且不会搭建,可以前往博主的主页搜索相关文章进行搭建。 目录 一、HDFSNameNode高可用搭建 二、 Yarn高可用搭建 本文主节点hostname:master&#xff0c…

安装semantic segmentation editor

两天啊, 整整两天,知道这两天我是怎么过的吗??1 步骤概述(以下命令行都是在管理员条件下执行)1.1 安装choco1.2 安装meteor1.3 安装semantic segmentation editor2过程3 我还是用Ubuntu安装过3.1Window安装…

【Mysql】主从一致

【Mysql】主从一致(一)主从复制【1】什么是主从复制【2】为什么需要主从复制【3】mysql复制原理【4】具体步骤【5】mysql主从形式【6】具体操作过程(1)首先在虚拟机服务器上安装mysql,进行简单的配置(2&…

力扣(LeetCode)38. 外观数列(C++)

双指针模拟 初始字符串 sss 已给定,根据 sss 构造下一个外观数列 ttt ,构造完毕, ststst ,循环 n−1n-1n−1 次,构造出一个外观数列。 构造步骤 : 令 jjj 指向当前元素 , kkk 从 jjj 往右,记录…

新库上线 | CnOpenData招聘公司基本信息扩展数据

招聘公司基本信息扩展数据 一、数据简介 线上招聘是指各公司将其岗位需求、工作地点能力要求和薪酬等招聘信息发布在互联网上,供求职者参考,以线上的方式进行招聘。线上招聘网站是通过互联网相关技术,集结这些线上招聘信息,帮助雇…

Linux下自动删除过期备份和自动异地备份的脚本

每天自动删除过期备份 首先编写一个简单的Shell脚本DeleteExpireBackup.sh: 1 2 3 4 5 6 7 #!/bin/bash # 修改需要删除的路径 location"/database/backup/" # 删除最后修改时间为30天以前的备份文件夹 find $location -mtime 30 -type d | xargs rm …

3dmax渲染大图有斑点怎么办?

嗨喽大家好,经常有后台私信问:3dmax渲染大图老是有斑点怎么办?而且斑点有白色的,还有绿色、黑色甚至彩色。怎么去除这些斑点呢? 其实以上的常见的斑点问题,大部分是灯光设置的问题。今天我们便来盘点下下面…

第二章:字节码指令集与解析案例

一、概述执行模型字节码与数据类型字节码指令分类加载与存储指令局部变量压栈指令常量入栈指令出栈装入局部变量表指令算术运算指令代码举例一代码举例二代码举例三:i 和 i 的区别比较指令的说明类型转换指令宽化类型转换(Widening Numeric Conversions)窄化类型转换…

指纹浏览器是什么?可以用来解决跨境电商的什么问题?

如果你是跨境电商中的一员,那我相信你肯定不陌生指纹浏览器吧!毕竟指纹浏览器可以说是每个跨境人必备的工具了,更别说它的一系列功能简直是为跨境电商商家量身打造的! 龙哥作为跨境老手,对指纹浏览器不要太熟悉&#x…

葡萄糖-顺铂Glucose-cisplatin|葡萄糖-聚乙二醇-顺铂cisplatin-PEG-Glucose

葡萄糖-顺铂Glucose-cisplatin|葡萄糖-聚乙二醇-顺铂cisplatin-PEG-Glucose 中文名称:葡萄糖-顺铂 英文名称:Glucose-cisplatin 别称:生物素修饰葡萄糖,生物素-葡萄糖 PEG接枝修饰葡萄糖 葡萄糖-聚乙二醇-顺铂 cisplatin-PE…

Go:命令行参数解析包 flag 简介

文章目录示例运行小结在 Golang 程序中有很多种方法来处理命令行参数。简单的情况下可以不使用任何库,直接处理 os.Args;其实 Golang 的标准库提供了 flag 包来处理命令行参数;还有第三方提供的处理命令行参数的库,比如 Pflag 等。…

【附源码】计算机毕业设计JAVA研究生推免系统

【附源码】计算机毕业设计JAVA研究生推免系统 目运行 环境项配置: Jdk1.8 Tomcat8.5 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: JAVA myba…

期货开户手机APP有哪些?

一、文华随身行 随身行是文华财经旗下APP软件,提供行情、图表、交易、行情讨论等综合服务。随身行是主流的期货交易软件,已接通全国139家期货公司 不过目前使用文华随身行APP是需要付费的,是直接向软件公司付费,与期货公司无关&…

2022 裁员风潮着实有点大,席卷全球~

近期无论国内外,裁员新闻接连不断,这次裁员风,给人的感觉,像是全球所有公司达成了 “某种协议”,行动上高度一致,开始接二连三的裁员,以往每年各个公司都有裁员,只是比例很小&#x…

【SpringBoot】SpringBoot+SpringSecurity+CAS实现单点登录

文章目录一.CAS的概述1.SSO2.CAS3.概念二.CAS的流程三.CAS服务端部署1.下载地址2.源码打包3.部署运行4. java.io.FileNotFoundException: \etc\cas\thekeystore (系统找不到指定的文件。)四.CAS的定制1.定制数据源2.兼容 HTTP3.定制登录页五.SpringBoot集成CAS1.工程创建2.导入…