SAM遥感图像处理开源新SOTA!在GPU上实现40倍加速,不损准确性

news2024/12/22 19:36:58

在遥感图像处理领域,通过SAM捕捉复杂图像特征和细微差异,可以实现高精度的图像分割,提升遥感数据的处理效率。这种高度的准确性让SAM+遥感展现出了比传统方法更优越的性能。

不仅如此,这种策略灵活普适的特性还能拓展遥感技术的应用领域,因此具有很大的创新潜力。对论文er来说,是个发论文的前沿好方向。最近发布于CVPRW24的SAM-Road模型证明了这点。

SAM-Road 模型发挥了SAM模型的能力,结合了语义分割和图神经网络,在城市数据集上的处理速度比现有最先进的方法快 40 倍。

除SAM-Road外,还有一些很值得学习的SAM+遥感最新成果,我从中挑选了9篇,简单提炼了可参考的创新点,希望可以给同学们提供论文灵感。

论文原文以及开源代码需要的同学看文末

Segment Anything Model for Road Network Graph Extraction

方法:研究提出了SAM-Road模型,该模型结合了分割和图形方法的优势,能够高效准确地生成大规模道路网络图,并在城市规模和SpaceNet基准测试中取得了与现有方法相当的准确性。SAM-Road模型不仅具有较高的准确性,而且在GPU推理速度上也比现有方法快得多,具有很高的实际应用价值和研究意义。

创新点:

  • 提出了SAM-Road模型,将Segment Anything Model (SAM) 应用于从卫星图像中提取大规模、矢量化的道路网络图。

  • 将图形几何预测任务转化为密集语义分割任务,利用SAM的优势进行预测。

  • 设计了基于Transformer的轻量级图神经网络,利用SAM的图像嵌入来估计顶点之间的边存在概率。

SAM-Assisted Remote Sensing Imagery Semantic Segmentation with Object and Boundary Constraints

方法:本文介绍了一种用于遥感图像语义分割的简单而灵活的框架,通过充分利用SAM的原始输出与通用遥感图像语义分割模型相结合。该框架通过利用两个损失函数——对象一致性损失和边界保护损失,以及SAM的原始输出,实现了不同网络结构的基本语义分割任务的改进。

创新点:

  • 提出了一种简单而通用的框架,旨在充分利用SAM的原始输出与通用的遥感图像语义分割模型相结合。该框架通过利用两个损失函数(对象一致性损失和边界保持损失)的辅助优化策略,改进了基本的语义分割任务,并且不需要额外的模块。

  • 引入了对象一致性损失,该损失函数可以直接利用SGO的信息,而无需语义信息,以达到精确语义分割结果的目的。这是首次将对象和边界约束引入语义分割任务中,直接利用SAM的原始输出而无需额外的类别提示。

RSPrompter: Learning to Prompt for Remote Sensing Instance Segmentation based on Visual Foundation Model

方法:本研究提出了RSPrompter方法,通过学习生成与语义类别相关的提示,使SAM能够在遥感图像中产生语义明确的分割结果。RSPrompter方法包括一个轻量级的多尺度特征增强器和一个基于锚点的提示生成器。多尺度特征增强器从SAM的ViT骨干网络提取特征,并生成多尺度的特征图。基于锚点的提示生成器利用锚点区域建议网络(RPN)生成候选目标框,并通过语义头、定位头和提示头生成适用于SAM的提示嵌入。

创新点:

  • RSPrompter是一种学习提示的方法,用于远程感知图像的实例分割。

  • RSPrompter结合了SAM模型,通过生成语义相关的提示嵌入来增强SAM模型的实例分割能力。

  • RSPrompter分为基于锚点和基于查询的两种实现方式,它们都能有效地提高实例分割的性能。

GeoSAM: Fine-tuning SAM with Sparse and Dense Visual Prompting for Automated Segmentation of Mobility Infrastructure

方法:本文介绍了一种针对地理图像的自动化移动基础设施分割方法GeoSAM。该方法采用SAM模型作为基础模型,并通过精细调整和提示来对SAM进行改进,以适用于地理图像的分割任务。研究通过自动生成稀疏和密集提示的自动化流程,提高了SAM在移动基础设施分割任务上的准确性和效率。

创新点:

  • 首次将基础模型SAM应用于移动基础设施细分,解决了使用地理图像进行多类别细分的问题,无需人工干预,克服了零样本SAM的局限性。

  • 开发了SAM在地理图像中的微调和提示,通过利用稀疏和密集提示从领域特定知识中增强SAM的能力。

  • 设计和实施了一个新颖的自动化流程,用于从零样本学习生成密集提示和从预训练的CNN编码器生成稀疏提示,以提高SAM在性能低下的移动基础设施细分任务上的效果和效率。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“SAM遥感”获取全部论文+代码

码字不易,欢迎大家点赞评论收藏

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1707469.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

苹果手机数据不慎删除?这4个方法果粉必看!

苹果手机该怎么恢复丢失的数据呢?有时候会因为使用不当或者是被他人误删等原因,导致重要的数据丢失,这时我们需要找回丢失手机数据,小编给大家分享4种恢复苹果手机数据的技巧,大家赶紧来学一学吧! 一、iclo…

元宇宙vr美术虚拟展馆激发更多文化认同和互鉴

科技引领创新潮流,借助前沿的Web3D技术,我们为用户打造了一个沉浸式的纯3D虚拟空间体验平台:元宇宙线上互动展厅。您只需通过网页即可轻松访问这个充满未来感的互动平台。 在这个独特的虚拟环境中,用户可以轻松创建个性化角色&…

JSP简介——[JSP]2

希望你开心,希望你健康,希望你幸福,希望你点赞! 最后的最后,关注喵,关注喵,关注喵,大大会看到更多有趣的博客哦!!! 喵喵喵,你对我真的…

决策树算法实战

本实战主要目标是讲解如何使用sklearn库来构造决策树,包括其中的一些参数的使用,以及参数调优对模型精确度的影响。 1. 数据处理 导入Pandas和Matplotlib两个库。 # 导入Pandas和Matplotlib两个库 %matplotlib inline import matplotlib.pyplot as pl…

svg画简单的立方体

开发背景 要开发一个拖拽的大屏项目,其中涉及到一个装饰组件,是一个立方体cube,要求颜色可以修改,大小可以拖拽改变。 效果如下 分析 经过我一番奇思妙想,决定用svg实现,因为对svg比较熟悉。那就先来在草…

数据大屏vue3+ts+axios+MockJS+dataV+echarts

一、官网/文档 vue3:https://cn.vuejs.org/api/TypeScript:https://www.tslang.cn/docs/handbook/basic-types.htmlaxios:http://www.axios-js.com/zh-cn/docs/MockJS:http://mockjs.com/dataV:http://datav.jiamingh…

利用预测大模型完成办公室饮水机剩余热水量

背景 在每天上班的时候,很多同事都有喝热水的习惯,但是饮水机内的热水量总是比较少的,如何避免等待,高效的接到热水是我接下来要做的事情的动机。 理论基础 在大量真实数据的情况下,可以分析出用水紧张的时间段和用水…

YOLOv8猫狗检测:从SwanLab可视化训练到Gradio Demo网站

基于YOLO模型在自定义数据上做训练,实现对特定目标的识别和检测,是CV领域非常经典的任务,也是AI项目落地最热门的方向之一。 这篇文章我将带大家使用Ultralytics、SwanLab、Gradio这两个开源工具,完成从数据集准备、代码编写、可…

打工人都在偷偷做的副业项目—steam搬砖

steam搬砖其实是一个非常老牌的项目了,之前只有玩游戏玩市场的人知道,其他普通人都不知道。 我们陪跑这个项目不是说这个项目不行了,再拿出来割韭菜,现在依然可以做,我们本身就是项目和培训一比一在做,这一…

es安装错误Exception in thread “main“ java.nio.file.NoSuchFileException解决方案

docker 启动es出现一下错误的解决方案 Exception in thread “main” java.nio.file.NoSuchFileException: /usr/share/elasticsearch/config/jvm.options Exception in thread "main" java.nio.file.NoSuchFileException: /usr/share/elasticsearch/config/jvm.op…

【Linux命令】--- Linux下的分卷压缩与解压

在编程的艺术世界里,代码和灵感需要寻找到最佳的交融点,才能打造出令人为之惊叹的作品。而在这座秋知叶i博客的殿堂里,我们将共同追寻这种完美结合,为未来的世界留下属于我们的独特印记。 【Linux命令】--- 多核压缩命令大全&…

JavaWeb Servelt原理

Servlet简介: Servlet的主要工作:处理客户端请求,生成动态响应,通常用于扩展基于HTTP协议的Web服务器。 Servlet技术是Java EE规范的组成部分,代表了服务器端的Java程序,主要负责处理来自客户端的Web请求,…

centos7防火墙入站白名单配置

firewall-cmd --set-default-zonedropfirewall-cmd --get-active-zone记录下当前激活网卡firewall-cmd --permanent --change-interfaceens33 --zonedrop firewall-cmd --zonedrop --list-all 添加信任的源IP和开放端口 firewall-cmd --permanent --add-source192.168.254.1 -…

基于springboot+vue+Mysql的逍遥大药房管理系统

开发语言:Java框架:springbootJDK版本:JDK1.8服务器:tomcat7数据库:mysql 5.7(一定要5.7版本)数据库工具:Navicat11开发软件:eclipse/myeclipse/ideaMaven包:…

七人拼购新模式:革新购物体验,共创价值

在数字时代,消费者的购物体验正经历着前所未有的变革。七人拼购模式作为一种新兴的购物方式,通过汇集消费者的力量,实现商品价格的最优化,让消费者享受到前所未有的实惠与便利。以下,我们将以一款标价499元的商品为例&…

面试准备-八股【面试准备】

面试准备-八股【面试准备】 Java基础解决hash冲突的方法try catch finallyException与Error的包结构OOM你遇到过哪些情况,SOF你遇到过哪些情况线程有哪些基本状态?Java IO与 NIO的区别堆和栈的区别对象分配规则notify()和notifyAll()有什么区别?sleep()…

在组件外使用pinia的坑

来源 项目包含很多静态的类型,我新建了一个js来专门管理和使用这些类型,如下图这种,有一部分是固定的,千年不变,有一部分是偶尔会变(需要后台获取),还有一部分是要登录后才能拿到的…

广告界的奥斯卡:揭秘成功广告策划的核心要素

在这个品牌林立、竞争激烈的市场大潮中,想要让自己的品牌声音被听见,一个成功的广告策划无疑是你的超级扩音器。 一个成功的广告策划一般来说需要以下十大要素: 1. 明确的目标和受众定位:你的指南针 首先,咱们得有个…

three.js能实现啥效果?看过来,这里都是它的菜(08)

在Three.js中实现旋转动画的原理是通过修改对象的旋转属性来实现的,通常使用渲染循环(render loop)来更新对象的旋转状态,从而实现动画效果。 具体的原理包括以下几个步骤: 创建对象:首先创建一个需要旋转…

网络——多区域OSPF配置(OSPF系列第1篇)

简介 路由协议OSPF全称为Open Shortest Path First,也就开放是的最短路径优先协议,使用链路状态路由算法,isis协议也是使用链路状态路由算法。而RIP协议使用距离矢量路由算法。 区域 为了能够降低OSPF计算的复杂程度,OSPF采用分…