医疗机器人中的具身智能进展——自主超声策略模型的任务编码和局部探索

news2024/11/15 17:34:29

医疗机器人一直是具身智能的研究热点。医学图像、医疗触诊、血压血氧、心率脉搏和生物电信号等多模态生物医学信息,不断丰富着医疗机器人的感知范畴。

自主超声

“自主超声”属于具身智能医疗机器人领域中话题度较高的研究方向。作为临床检查的重要手段之一,传统医疗超声成像技术面临的主要问题为:长期重复性工作造成超声医师的肌体劳损;较长的培训周期导致专业超声医师的缺口持续增大;面对传染性疾病,医患隔离的需求难以满足。临床上,超声医师通过手眼配合和手感训练,锻炼出了对超声探头精准灵巧的操作手法,如图1所示。

图1
在这里插入图片描述

临床超声医师的专业性在于,一方面需要结合日积月累的专业医学知识,对超声图片进行实时的观察和判断,另一方面,超声医师的灵巧操作手法也需要因人而异,病人的高矮、胖瘦、性别、年龄,都会影响超声探头应被施加的压力和扫查方向。

研究进展

超声机器人系统大致可以区分为遥操作和自主式两种。在遥操作超声机器人系统中,超声扫查由超声医师通过直接动作映射进行远程控制。而在自主系统中,超声机器人须具备部分自主决定的能力,保证在超声医师尽量不干预的情况下完成扫查任务。例如,自主超声任务可以被定义为搜寻特定的区域或体积,通常需结合其他医学成像方式如磁共振成像(MRI)和计算机断层扫描(CT)。除此之外,一些研究将自主超声定义为路径跟踪任务,但是需事先在3D相机捕获的点云上进行标记。以上的方法非常依赖于超声医师预先定义的运动规则和引导。与之相比,更理想的自主超声系统应该能够学着去理解超声图像,然后自动完成规划以定位到超声图像。研究学者们也尝试用传统计算机视觉技术与深度学习方法来制定详尽的运动规划方案。此外,一些最新的研究也正在开发基于强化学习和模仿学习的策略模型,有可能在某些特点任务中替代超声医师。

问题与挑战

对于具有显著个体差异的患者群体而言,现有方法在安全性和可靠性方面仍然是一个问题,这归结于两个因素。首先,作为具身智能医疗机器人的研究方向之一,几种关键的临床医疗数据模态并未整合到现有的策略学习框架中,例如超声探头方向和其与患者皮肤的多维接触力。这些医疗数据模态都会显著影响超声扫查的质量,并在患者群体中表现出显著的个体差异性。其次,如何从分布内患者的策略模型外推泛化到分布外的超声技能,例如从年轻到年长、从瘦小到肥胖,从男性到女性,这一关键问题始终没有被提出、强调和验证。

解决思路

武汉大学的李淼教授带领其团队在国际期刊“IEEE Transactions on Automation Science and Engineering (TASE)”上发表了一篇题目为“Learning Freehand Ultrasound Through Multimodal Representation and Skill Adaptation”的文章。其主要贡献点在于,提出了一种多模态融合框架来隐性表征临床超声医师徒手示教的扫查技能,不需要额外地在超声图片中标注兴趣区域和器官轮廓,并综合考虑了超声图像、探头方向和接触力等数据模态。同时,提出了一种超声技能的自适应方案,改善了超声技能在具有显著个体差异性的患者群之间外推泛化的能力。

图2
在这里插入图片描述

图2展示了所提出的可学习和可泛化的自主超声工作流程。首先从临床场景中收集徒手超声的示教数据;在学习阶段,通过多模态融合框架将这些示教数据表征到低维空间中;在部署阶段,将离线建模的自主超声技能复现到徒手超声或机器人超声的应用中。

图3所示为临床场景中收集徒手超声的示教数据的硬件设备细节。除了使用视频捕捉设备获取实时超声图片,超声探头上搭载的惯性测量单元(IMU)和6D力/扭矩传感器能够获得超声探头的方向和接触力数据模态。临床实验场景如图4所示。

图3
在这里插入图片描述

图4
在这里插入图片描述

在多模态融合框架中,超声图像特性通过Masked Auto-Encoder(MAE)进行提取。预处理图像被表征为40维的特征向量,并与4维的探头姿态向量和6维的探头接触力向量进行拼接融合。完成示教数据的降维编码后,用高斯混合模型(GMM)进行建模和预测,如图5所示。

图5
在这里插入图片描述

图6
在这里插入图片描述

在图6所示的算法流程中,通过临床徒手示教的多模态时间序列被嵌入到潜在空间。利用概率模型对示教中的全局动作分布进行建模,并由此可以确定选择某一动作的概率,称之为“似然值”。动作的似然值可以被视为一个潜在的评价指标,似然值低的动作被判定为不可靠的预测结果,后续需利用局部搜索对其进行微调,使其更加接近可靠动作。局部搜索方法如图7所示,其中橙色、绿色、蓝色和紫色区域绘制了四个高斯分布。若预测值能够对应到任意高似然动作(例如A1),则表明该预测结果是可靠的。在此条件下,后续算法将执行逐步迭代过程,沿着条件概率的梯度方向找到局部最优解。而如果预测值位于低似然区域(例如B1),则被判定为不可靠动作。在这种情况下,由于缺乏类似的示教数据,概率空间中的局部似然值仅有着非常小的变化梯度,逐步迭代往往无法找到局部最优解。此时应进行局部探索以找到最近的高斯分布(例如从B1到B2),从而避免沿着条件概率梯度而遇到相对随机的结果(例如从B1到B∗)。

图7
在这里插入图片描述

局部搜索的方法很好地解决了离线学习的自主超声策略模型在部署阶段泛化和外推能力不足的问题,能够在完整的超声检查任务过程中取得接近于人类超声专家的决策能力。如图8所示为超声专家和所提出自主超声算法,在完成同样的患者左肾检查任务中的表现(灰色为人类专家的动作,橙色为自主超声算法的动作)。

图8
在这里插入图片描述

论文中开展了大规模临床实验,从总计24名志愿者中收集了120条示教轨迹,共包含53571组“临床左肾俯卧位检查”的多模态样本。志愿者中包含14名男性和10名女性,年龄跨度从19岁到67岁,BMI指标范围从16.4(瘦小)到26.7(超重)。除了“患者内”和“患者间”的验证方法,实验中提出了一系列相较于N则交叉验证更加复杂和困难的实验方式,将不同患者按照个体差异性划分到训练集和验证集中:将年龄偏小、身材瘦小、或者男性患者的数据作为训练集,而将年龄偏大、身材超重、或者女性患者的数据作为验证集,以此凸显在实际应用中可能面临的数据分布偏移的极端情况。如图9所示,相比于基准算法,论文中提出的自主超声算法框架取得了显著的性能表现和预测精度。

图9
在这里插入图片描述

论文同样验证了所提出的自主超声策略框架兼容一些流行的表征学习基础架构,并在超声图像质量欠佳的情况下表现出良好的训练稳定性。在未来的工作中,基于具身智能的自主超声机器人将更快地进入人们的视野。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1915557.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

27. 738.单调递增的数字,968.监控二叉树,贪心算法总结

class Solution { public:int monotoneIncreasingDigits(int n) {string strNum to_string(n);// flag用来标记赋值9从哪里开始// 设置为这个默认值,为了防止第二个for循环在flag没有被赋值的情况下执行int flag strNum.size();for(int i strNum.size() - 1; i &…

FOLANNIC FD31 UPS工作原理介绍

1.1简介 FOLANNIC FD31系列UPS系工业级电厂型不间断电源,是为重要负载提供不受电网干扰、稳压、稳频的电力供应的电源设备,在市电掉电后,UPS可给负载继续提供一段时间供电,此系列UPS采用带输出隔离变压器的高频双变换结…

多头注意力的公式理解

多头注意力 (Multihead Attention) 多头注意力是一种通过并行使用多个注意力机制来增强模型能力的方法。每个注意力机制被称为一个“头”(head)。这种机制使得模型可以在不同的子空间中并行计算注意力,从而捕捉输入数据中不同范围的依赖关系…

java.lang.NullPointerException: null cannot be cast to non-null type kotlin.Int

java.lang.NullPointerException: null cannot be cast to non-null type kotlin.Int fun main(args: Array<String>) {var any1: Any?any1 nullval n1 any1 as? Int ?: -2024println(n1)kotlin.runCatching {var any2: Any?any2 nullval n2 any2 as Intprintln(…

【Linux】IP地址与主机名

文章目录 1.IP地址2.特殊IP地址3.主机名4.域名解析 1.IP地址 每一台联网的电脑都会有一个地址&#xff0c;用于和其它计算机进行通讯 IP地址主要有2个版本&#xff0c;V4版本和V6版本 IPv4版本的地址格式是&#xff1a;a.b.c.d,其中abcd表示0~255的数字&#xff0c;如192.168.…

论文翻译 | (TAKE A STEP BACK) 后退一步:在大型语言模型中通过抽象来调用推理

摘要 我们介绍了STEP-BACK提示&#xff0c;这是一种简单的提示技术&#xff0c;使LLM能够进行抽象&#xff0c;从而从包含特定细节的实例中派生高级概念和第一原则。使用概念和原则来指导推理&#xff0c;LLM显着提高了他们遵循正确推理路径的能力。我们使用PaLM-2L、GPT-4和Ll…

Linux:进程池制作(基于匿名管道和命名管道两个版本)

Linux&#xff1a;进程池制作 & 匿名管道 & 命名管道 前言一、匿名管道制作进程池一、进程池框架二、创建管道、创建进程、工作进程执行任务2.1 创建管道、创建进程 2.2 工作进程执行任务三、主进程向子进程发送任务3.1 任务封装3.2 主进程向子进程发送任务 四、回收资…

昇思Mindspore25天学习打卡Day21:Diffusion扩散模型

昇思Mindspore25天学习打卡Day21&#xff1a;Diffusion扩散模型 1 模型简介1.1 什么是Diffusion1.2 扩散模型实现原理1.2.1 Diffusion前向过程1.2.2 Diffusion逆向过程1.2.3 U-Net神经网络预测噪声 2 构建Diffusion模型2.1 位置向量2.2 ResNet/ConvNeXT块2.3 Attention模块2.4 …

JVM原理(二三):JVM虚拟机线程安全的实现方法

1. 互斥同步 互斥同步(MutualExclusion&Synchronization)是一种最常见也是最主要的并发正确性保障手段。同步是指在多个线程并发访问共享数据时&#xff0c;保证共享数据在同一个时刻只被一条(或者是一些&#xff0c;当使用信号量的时候)线程使用。而互斥是实现同步的一种…

防御---001

一、实验拓扑二、要求 1&#xff0c;DMZ区内的服务器&#xff0c;办公区仅能在办公时间内(9:00 - 18:00)可以访问&#xff0c;生产区的的设备全天可以访问. 2&#xff0c;生产区不允许访问互联网&#xff0c;办公区和游客区允许访问互联网 3,办公区设备10.0.2.10不允许访问DMZ…

数据结构(Java):集合类LinkedList集合类Stack

1、集合类LinkedList 1.1 什么是LinkedList LinkedList的底层是一个双向链表的结构&#xff08;故不支持随机访问&#xff09;&#xff1a; 在LinkedList中&#xff0c;定义了first和last&#xff0c;分别指向链表的首节点和尾结点。 每个节点中有一个成员用来存储数据&…

第十一篇——兵势篇:部下强不强,责任在领导

目录 一、背景介绍二、思路&方案三、过程1.思维导图2.文章中经典的句子理解3.学习之后对于投资市场的理解4.通过这篇文章结合我知道的东西我能想到什么&#xff1f; 四、总结五、升华 一、背景介绍 领导力的体现&#xff0c;也是要通过区分不同层次程度的内容来体现最终的…

Bash ——shell

Bash作为用户与操作系统之间的接口&#xff0c;让用户通过命令行输入各种指令来控制和操作计算机系统。 shell的两种解释&#xff1a; 1.linux命令解释器 Terminal 终端 ——》shell命令 ——》 Linux kernel &#xff08;内核&#xff09; Linux内核的作用&#xff1a; 1.…

Java中实现一维数组逆序交换的完整解决方案

引言 ❤❤点个关注吧~~编程梦想家&#xff08;大学生版&#xff09;-CSDN博客 在日常编程中&#xff0c;处理数组时经常会遇到需要逆序交换数组元素的情况。逆序交换即是将数组的第一个元素与最后一个元素交换&#xff0c;第二个元素与倒数第二个元素交换&#xff0c;依此类推…

Internet Download Manager6.42最新下载器互联网冲浪小能手们!

今天我要来种草一个超级棒的宝贝——Internet Download Manager&#xff08;简称 IDM&#xff09;。这个小家伙简直是下载界的“速度与激情”代言人&#xff0c;让我彻底告别了等待的日子。&#x1f389; IDM马丁正版下载如下: https://wm.makeding.com/iclk/?zoneid34275 …

【最强八股文 -- 计算机网络】【快速版】TCP 与 UDP 头部格式

目标端口和源端口: 应该把报文发给哪个进程包长度: UDP 首部的长度跟数据的长度之和校验和: 为了提供可靠的 UDP 首部和数据而设计&#xff0c;接收方使用检验和来检查该报文段中是否出现差错 源端口号和目的端口号: 用于多路复用/分解来自或送到上层应用的数据。告诉主机报文段…

自动气象站的主要功能优势

在科技日新月异的今天&#xff0c;我们生活的方方面面都受到了科技的影响。其中&#xff0c;自动气象站作为气象观测领域的重要一环&#xff0c;不仅提升了气象数据的准确性和时效性&#xff0c;还为我们的日常生活、农业生产、灾害预防等提供了重要的数据支持。 自动气象站概述…

【GIS开发小课堂】WebGIS开发必学开源框架Openlayers,附赠视频教程、电子书、笔记源码

WebGIS开发之Openlayers 当前&#xff0c;WebGIS开发热门程度越来越高&#xff0c;市场招聘供需比处于较为紧张的状态。 常见的WebGIS开源框架有&#xff1a;OpenLayers、Leaflet、MapBox、MapFish、GeoServer、GeoEXT、MapInfo等。公司最希望求职者具备至少一种框架开发技能…

数字信号处理及MATLAB仿真(5)——z变换

采样的其他概念咱们后面再慢慢的讲述吧&#xff0c;先把z变换的程序给大家展示一下&#xff0c;总的来说呢&#xff0c;就用一个函数——ztran就行了。在 MATLAB 中&#xff0c;可以使用 ztrans 函数来进行 Z 变换。ztrans 函数用于对离散时间信号或系统进行 Z 变换&#xff0c…

MySQL Undo Log

总结自bojiangzhou undo log称为撤销日志或回滚日志。在一个事务中进行增删改操作时&#xff0c;都会记录对应的 undo log。在对数据库进行修改前&#xff0c;会先记录对应的 undo log&#xff0c;然后在事务失败或回滚的时候&#xff0c;就可以用这些 undo log 来将数据回滚到…