探究SAM和眼球追踪技术在自动医学图像分割的应用(2023+GazeSAM: What You See is What You Segment)

news2024/12/29 0:23:12

摘要:

本研究探讨眼动追踪技术与SAM的潜力,以设计一个协同的人机交互系统,自动化医学图像分割。提出了GazeSAM系统,使放射科医生能够在图像诊断过程中通过简单地查看感兴趣的区域来收集分割掩模。该系统跟踪放射科医生的眼球运动,并利用眼球注视数据作为SAM的输入提示符,自动实时生成分割掩码。该系统使用眼动追踪技术识别放射科医生感兴趣的roi,然后提示SAM模型根据眼睛注视点对图像进行相应的分割。该系统具有用户友好、准确、快速生成分割结果的特点。值得注意的是,这是首次利用眼动追踪数据和SAM的力量实现医学图像实时分割过程自动化的研究。

贡献点:

1. 本文提出了一种将眼动追踪技术与SAM相结合的人机协作系统GazeSAM,用于放射科医生的实时医学图像分割。

2. GazeSAM系统采用基于屏幕的眼动仪,与Meta虚拟现实团队使用的基于眼镜的眼动仪相比,它为放射科医生提供了更高的准确性和更大的舒适度。此外,大多数眼动数据集是使用基于屏幕的眼动仪收集的,这使得我们的系统更适合于标准的眼动数据集收集。

3.我们的系统具有独特的2D和3D图像操作能力,这通常用于医疗环境。这是第一个为提高放射科医生在日常临床实践中的工作效率而开发的。

4. 该系统既可以用于粗分割掩码的采集,也可以用于眼动跟踪的采集。

方法:

整体框架如下图所示,包括数据收集和图像分割两部分。

 数据收集:本研究使用Tobii Pro Nano屏幕眼动仪。它是一款体积小、重量轻、使用方便的眼动仪,长度为170mm,重量为59g,采样率为60Hz。在实验之前,需要对眼动仪进行校准,以确保准确跟踪眼球运动,并使屏幕上的凝视坐标与用户所看的位置保持一致。在这里,在Tobii Pro眼动仪管理器中采用五点校准程序。标定完成后,眼球注视数据以屏幕上位置坐标的形式采集。

提示工程:眼球注视数据可以被认为是一组离散点序列,这些散点与眼球随时间的运动相对应。因此,可以将人眼注视数据转换为一个点或一个点序列,作为SAM的点提示。如下图所示,选择的提示有两种:第一种选择是使用随时间收集的整个眼球注视点序列,这可以提供更全面的用户注视轨迹表示。第二种选择是使用最后一个时间点采集到的眼球注视点作为提示。当需要单个对象的粗分割掩码时,这种方法更合适。

 值得注意的是,SAM可能并不总是产生完美的分割掩码,特别是对于边界区域。为了优化生成的掩码,用户需要手动向这些区域添加点,这可能是繁琐和耗时的。在第一个选项中,GazeSAM简化了这个过程,允许用户通过简单地查看所需的区域来添加点。这样,提供了一种更有效的分割掩码细化方法,有可能极大地提升整个流水线的用户体验和速度。通过预先计算的图像嵌入和人眼注视数据转换的提示,SAM可以近乎实时地生成分割掩码,使其成为一种利用眼动追踪技术的交互式分割系统。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/820618.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Vue3 的ref和reactive的用法和区别

一、是什么? ref和reactive是Vue3中用来实现数据响应式的API,一般情况下,ref定义基本数据类型,reactive定义引用数据类型。 二、基础用法 1. ref ref的参数一般是基本数据类型,也可以是对象类型;如果参…

BugKu CTF(杂项篇MISC)—想要种子吗

BugKu CTF(杂项篇MISC)—想要种子吗 提 示: 描 述:flag{} 题目下载后是一张图片,打开如下。 一、工具 十六进制编辑器010 editor kali系统文件分离工具binwalk或者foremost 维吉尼亚密码 STEGHIDE图片隐写工具 文章所需的软件下载地址 ARCHPR压缩包密码破解…

5分钟快速掌握低代码和无代码工具

一、低代码和无代码平台,堪比编程界的美图秀秀! 与传统编程平台相比,低代码和无代码开发平台让开发人员及非技术用户可以更快速地开发应用程序,而成本变得更低。本文将带你一起了解什么是低代码与无代码平台。 低代码和无代码开发…

Spark性能调优之数据序列化

前言 在使用Spark进行数据开发的时候,避不开的一个问题就是性能调优。网上一搜一大堆所谓的调优策略很多作者自己都不知所云,导致读者看了后只会更加困惑。我们在研究一个技术的时候第一手资料永远都请参考官网,官网对性能优化不一定是最全甚至最优,但是可以解决大部分问题…

微信新增的“上锁”功能,上班族狂喜!

近期 微博话题 #微信新增锁定功能# 冲上热搜 引发关注 微信锁🔒 这个功能对于经常使用微信办公的上班族来说很实用,信息安全得到极大提升,当你搬砖时,在电脑登陆了自己的微信,如果这个时候去拿个外卖,又…

021 - STM32学习笔记 - Fatfs文件系统(三) - 细化与总结

021 - STM32学习笔记 - Fatfs文件系统(三) - 细化与总结 上节内容中,初步实现了FatFs文件系统的移植,并且实现了设备的挂载、文件打开/关闭与读写功能,这里对上节遗留的一些问题进行总结,并且继续完善文件…

经纬恒润推出整车E/E全链路测试实验室解决方案

仿真测试作为“V流程”右半部分最重要的组成部分,是汽车电子电气测试不可或缺的技术手段。随着各种各样的测试设备进场,如何高效地统筹规划仿真测试实验室,成为了各车企关心的问题。 仿真测试实验室不仅能够服务于汽车电子零部件的仿真测试&…

Robot Framweork之UI自动化测试---元素定位的4种方式

在Robot Framweork的UI自动化测试中,元素定位主要有四种,即通过id,name,xpath和CSS定位。 一、id定位 id就好比一个人身份证,元素在 HTML 页面中的唯一标识符,因此 ID 定位方式是最常用的方式之一&#xf…

WMI 介绍

1.什么是WMI WMI的全称是Windows Management Instrumentation,即WIndows管理规范。它允许通过一个公共接口访问多种操作系统的构成单元,实现对操作系统的信息获取及管理操作。 Windows提供了一个WMI测试器,使得查询这些内容变得尤为方便。按下"winR&q…

安装nvm之后,node -v 提示‘node‘ 不是内部或外部命令,也不是可运行的程序 或批处理文件

1. 检查有没有执行这个命令:nvm use [nodejs version name] 2. 检查nvm安装位置同级,有没有nodejs文件夹,是一个快捷键!如果有一个其他的nodejs,把它删掉,然后到cmd中,重新nvm install一下&…

Centos7 上安装 redis-dump 和redis-load 命令

一、安装rvm 1、安装GPG keys gpg2 --keyserver keyserver.ubuntu.com --recv-keys 409B6B1796C275462A1703113804BB82D39DC0E3 7D2BAF1CF37B13E2069D6956105BD0E739499BDBcurl -sSL http://rvm.io/mpapis.asc | gpg2 --import - curl -sSL http://rvm.io/pkuczynski.asc | g…

SQL-多表

create table course (id int auto_increment primary key comment 主键id,name varchar(10) comment 课程名字 ); insert into course (name) values (java),(linux),(SQL);create table course_student (id int auto_increment primary key comment 主键id,studentid int not…

低代码开发平台源码:基于模型驱动,内置功能强大的建模引擎,零代码也能快速创建智能化、移动化的企业应用程序

管理后台低代码PaaS平台是一款基于 Salesforce Platform 的开源替代方案,旨在为企业提供高效、灵活、易于使用的低代码开发平台。低代码PaaS平台的10大核心引擎功能:1.建模引擎 2.移动引擎 3.流程引擎 4.页面引擎 5.报表引擎 6.安全引擎 7.API引擎 8.应用集成引擎 9…

MySQL执行一条select语句,执行过程怎么样

执行一条select语句,执行过程怎么样 连接器 与客户端进行 TCP 三次握手建立连接;MySQL基于TCP协议进行传输的校验客户端的用户名和密码,如果用户名或密码不对,则会报错如果用户名和密码都对了,会读取该用户的权限&…

湖南省物业满意度研究(群狼调研)

01 行业现状 随着湖南省物业行业的蓬勃发展,物业管理走向规范化的道路。近年来,湖南省物业管理行业迎来飞速发展的黄金时期,全省物业服务相关企业已超过9万家,其中长沙市占据了四成以上。 数据来源:天眼查公开数据 在…

直播丨如何用最新的 Serverless 技术让文化古籍“活过来”?

当前,古籍数字化面临技术难度高、资金缺口大、人才紧张等难点。云计算和人工智能技术可以高效实现古籍产品化、可视化、平台化,不仅使其保存形式迈上一个新台阶,还可以有效降低用户阅读门槛。 本次 Serverless 圆桌派 特别邀请上海慧游文化 …

TCGA数据批量运行Coxph函数

df数据框形如&#xff1a; djs.coxph <- function(df,genelist){library(survival)library(survminer)dir.create("./survival")setwd("./survival")# 准备好的生存分析数据框&#xff0c;变量中包括OS.time,OS以及values of gene expression df <…

论文阅读 - Few-shot Network Anomaly Detection via Cross-network Meta-learning

论文链接&#xff1a;https://arxiv.org/pdf/2102.11165.pdf 目录 摘要&#xff1a; 引言 问题定义 方法 Graph Deviation Networks Cross-network Meta-learning 摘要&#xff1a; 网络异常检测旨在找到与绝大多数行为显着不同的网络元素&#xff08;例如节点、边、子图…

河北沃克仓储解决方案最新布局|HEGERLS四向穿梭车在高标仓和楼层仓中的应用

河北沃克金属制品有限公司是业内十分稀缺可提供整体物流仓储解决方案并落地的企业&#xff0c;既拥有自主研发和生产等一整套核心软硬件的能力&#xff0c;又具备丰富的整体方案规划与实施经验。经过多年积累和开拓&#xff0c;河北沃克金属制品有限公司业务已拓展覆盖近众多行…

如何列出phpMyAdmin左侧菜单中的所有表格 - 不分页 - 显示数据库所有的表

效果图 原来 优化后 步骤 点击logo&#xff0c;回到首页 点击设置 》 导航面板 》 导航树 》 节点中最大项数 》 应用 ok