RoMo: Robust Motion Segmentation Improves Structure from Motion

RoMo: Robust Motion Segmentation Improves Structure from Motion

news2025/4/7 13:05:21

前言

看起来像是一篇投稿CVPR的文章，不知道被哪个瞎眼审稿人拒了。同期还有一篇CVPR被接收的工作Segment Any Motion in Videos，看起来不如这篇直白（也可能是因为我先看过spotlesssplats的缘故），后面也应该一并介绍了的。总体来说：就是如何给sam2提供一个很好地prompt，获得视频序列的dynamic mask 分割结果。

RoMo: Robust Motion Segmentation Improves Structure from Motion

造成像素变化的原因有两种：相机移动和物体移动，如何把这两种解耦并只获得物体移动的变化？

第一步

epipolar（RANSAC） 估计相机运动，RAFT估计光流变化，使用以下公式计算t到t’上的重投影误差：
在这里插入图片描述
并设置两个阈值：2v和0.01v，其中v是整体光流的平均移动速度。

这里获得了两个大致的动态mask和静态mask。

第二步

训练一个简单的分割网络（2个iteration），损失函数如下：
在这里插入图片描述
其中，H就是网络估计出来的dynamic mask。G是从sam2的encoder中取的最后一层feature。

对于公式(5)，目的就是让上述mask中估计出来的动态位置，MLP的预测值一定尽可能接近1，静态位置MLP预测值尽可能接近0。
由于上面是feature层面的操作，所以分辨率小于原始分辨率，最后再使用SAM2做致密化。

Segment Any Motion in Videos

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2329222.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

MCP 极简入门 - 三分钟 Cline + Smithery 运行 time 服务

MCP 极简入门 - 三分钟 Cline + Smithery 运行 time 服务

文章目录一、🚀 初识Smithery：AI服务的新大陆找到心仪的服务二、Cline 编辑配置文件🔧1、打开配置文件2. 添加Time Server配置3. 验证配置效果三、💬 实战对话：让AI告诉你时间四、服务管理小技巧🔄&…

阅读更多...

基本机动飞行性能

基本机动飞行性能

机动飞行时描述飞机在给定构型和发动机工作状态下改变飞行速度、飞行高度和飞行方向的能力 1. 水平加（减）速水平加（减）速性能反映飞机在水平面内改变直线飞行速度的能力。描述水平加（减）速性能的参数包括…

阅读更多...

【Linux】进程间通信、匿名管道、进程池

【Linux】进程间通信、匿名管道、进程池

一.什么是通信进程间通信(Inter-Process Communication，IPC),是指在操作系统中，不同进程之间进行数据交换和同步的机制。由于每个进程通常拥有独立的内存空间，进程间无法直接访问对方的内存，因此需要通过特定的机制来实现通信和…

阅读更多...

【MATLAB定位例程】TDOA（到达时间差）的chan-tylor，三维环境，附完整代码

【MATLAB定位例程】TDOA（到达时间差）的chan-tylor，三维环境，附完整代码

该代码实现了基于三维空间的动态目标TDOA定位，结合了Chan算法（解析解）与Taylor级数展开法（迭代优化）的双重优势。文章目录运行结果MATLAB代码代码讲解代码功能概述核心算法原理代码结构解析可视化与结果分析运行结果定位示意图：三轴状态曲线：三轴误差曲线： MA…

阅读更多...

数字化转型中的开源AI智能客服与S2B2C商城小程序的融合创新

数字化转型中的开源AI智能客服与S2B2C商城小程序的融合创新

摘要数字经济时代，企业需通过技术重构用户交互与供应链体系。本文以“开源AI智能客服”“AI智能名片”及“S2B2C商城小程序”为核心，研究三者如何通过技术协同与场景化应用实现企业营销、客户服务与供应链管理的智能化升级。通过案例分析、技术架构设…

阅读更多...

重生之我是去噪高手——diffusion model

重生之我是去噪高手——diffusion model

diffusion model是如何运作的？ 想象一下，你有一张清晰的图片。扩散模型的核心思想分为两个过程： 前向过程（Forward Process / Diffusion Process）：逐步加噪反向过程（Reverse Process / Denois…

阅读更多...

【C#】.net core 6.0 依赖注入常见问题之一，在构造函数使用的类，都需要注入到容器里，否则会提示如下报错，让DeepSeek找找原因，看看效果

【C#】.net core 6.0 依赖注入常见问题之一，在构造函数使用的类，都需要注入到容器里，否则会提示如下报错，让DeepSeek找找原因，看看效果

🌹欢迎来到《小5讲堂》🌹 🌹这是《C#》系列文章，每篇文章将以博主理解的角度展开讲解。🌹 🌹温馨提示：博主能力有限，理解水平有限，若有不对之处望指正！&#…

阅读更多...

论文阅读笔记——RDT-1B: A DIFFUSION FOUNDATION MODEL FOR BIMANUAL MANIPULATION

论文阅读笔记——RDT-1B: A DIFFUSION FOUNDATION MODEL FOR BIMANUAL MANIPULATION

RDT-1B 论文模型表达与泛化能力：由于双臂操作中动作空间维度是单臂空间的两倍，传统方法难以建模其多模态分布。数据：双臂数据少且不同机器人的物理结构和动作空间差异（如关节数、运动范围）导致数据分布不一致&#x…

阅读更多...

Vue中将pdf文件转为图片

Vue中将pdf文件转为图片

平时开发中，我们经常遇到的场景应该是调用后端接口返回给前端pdf格式的文件流，然后我们可以通过URL.createObjectURL的方式转为object url临时路径然后可以通过window.open的方式来打开一个新的浏览器页签来进行预览，效果如下图：但有时候这样满足不了的需求，它不想这样预…

阅读更多...

day39——输入操作：多值输入

day39——输入操作：多值输入

数组输入： int main() {//***** 1、多值输入（C）/*输入：3 --> 3个值5 4 9*/int n;cin >> n; //输入个数const int MAX_SIZE 0xFFFF;//限定最大个数int a[MAX_SIZE];for (int i 0; i < n; i) {//用 n 作控制输入…

阅读更多...

微软的 Copilot 现在可以浏览网页并为您执行操作

微软的 Copilot 现在可以浏览网页并为您执行操作

在庆祝其 50 岁生日之际，微软正在向其人工智能驱动的 Copilot 聊天机器人传授一些新技巧。从 BASIC 到 AI，改变世界的公司：微软微软表示，Copilot 现在可以在“大多数网站”上采取行动，使其能够预订门票、预订餐厅等…

阅读更多...

深入理解Python元组：从基础到高级应用

深入理解Python元组：从基础到高级应用

1. 元组基础认知 1.1 什么是元组不可变序列：元组(tuple)是Python内置的不可变序列类型异构容器：可以存储不同类型的数据（与列表类似）语法特征：使用圆括号()定义，元素间用逗号分隔 # 基本示例 t1 (1, 2…

阅读更多...

【零基础入门unity游戏开发——动画篇】unity旧动画系统Animation组件的使用

【零基础入门unity游戏开发——动画篇】unity旧动画系统Animation组件的使用

考虑到每个人基础可能不一样，且并不是所有人都有同时做2D、3D开发的需求，所以我把【零基础入门unity游戏开发】分为成了C#篇、unity通用篇、unity3D篇、unity2D篇。【C#篇】：主要讲解C#的基础语法，包括变量、数据类型、运算符、…

阅读更多...

Python+AI提示词用贝叶斯样条回归拟合BSF方法分析樱花花期数据模型构建迹图、森林图可视化

Python+AI提示词用贝叶斯样条回归拟合BSF方法分析樱花花期数据模型构建迹图、森林图可视化

原文链接：https://tecdat.cn/?p41308 在数据科学的领域中，我们常常会遇到需要处理复杂关系的数据。在众多的数据分析方法中，样条拟合是一种非常有效的处理数据非线性关系的手段。本专题合集围绕如何使用PyMC软件，对樱花花期数据进…

阅读更多...

实战打靶集锦-38-inclusiveness

实战打靶集锦-38-inclusiveness

文章目录 1. 主机发现2. 端口扫描&服务枚举3. 服务探查4.系统提权靶机地址：https://download.vulnhub.com/inclusiveness/Inclusiveness.ova 1. 主机发现目前只知道目标靶机在192.168.56.xx网段，通过如下的命令，看看这个网段上在线的主…

阅读更多...

Unhandled exception: org.apache.poi.openxml4j.exceptions.InvalidFormatException

Unhandled exception: org.apache.poi.openxml4j.exceptions.InvalidFormatException

代码在main方法里面没有报错，在Controller里面就报错了。原来Controller类里面少了行代码 import org.apache.poi.openxml4j.exceptions.InvalidFormatException; 加上去就解决了。

阅读更多...

03.unity开发资源获取

03.unity开发资源获取

03.unity开发资源获取提示：帮帮志会陆续更新非常多的IT技术知识，希望分享的内容对您有用。本章分享的是Python基础语法。前后每一小节的内容是存在的有：学习and理解的关联性，希望对您有用~ unity简介-unity基础第三节 &#xf…

阅读更多...

OpenCV界面编程

OpenCV界面编程

《OpenCV计算机视觉开发实践：基于Python（人工智能技术丛书）》(朱文伟，李建英)【摘要书评试读】- 京东图书 OpenCV的Python开发环境搭建(Windows)-CSDN博客 OpenCV也支持有限的界面编程，主要是针对窗口、控件和鼠标…

阅读更多...

【leetcode】记录与查找：哈希表的题型分析

【leetcode】记录与查找：哈希表的题型分析

前言 🌟🌟本期讲解关于力扣的几篇题解的详细介绍~~~ 🌈感兴趣的小伙伴看一看小编主页：GGBondlctrl-CSDN博客 🔥 你的点赞就是小编不断更新的最大动力 🎆那么废话不…

阅读更多...

AntDesign下，Select内嵌Menu标签，做一个多选下拉框，既可以搜索，还可以选择下拉项

AntDesign下，Select内嵌Menu标签，做一个多选下拉框，既可以搜索，还可以选择下拉项

话不多说，直接上效果和代码效果图一： 效果图二： renderAddStyleOption (item: any) > {const { value } this.props;const { currentSelectedOptionIds, currentStyleId } this.state;const styleSettings value?.styleSettings;c…

阅读更多...

推荐文章

最新文章