自然语言处理(NLP)在放射学报告评价中的应用:应用和技术进展

news2024/11/26 8:27:36

自然语言处理(NLP)在放射学报告评价中的应用:应用和技术进展

  • 写在最前面
  • 摘要
  • 引言
  • 先进的技术
  • BERT
    • 算法
    • 优点
  • Applications in Radiology 放射学应用
    • Quality 质量
      • 将关键发现通知转诊临床医生
      • 放射科关键绩效指标和评估 个别放射科医生的表现
      • 同行学习和同行评审
  • Clinical and Clinical Research Applications 在临床和临床研究中的应用
  • Language Discovery 语言发现
  • Other Applications 其他应用
  • 总结

写在最前面

研究主体、研究方法、研究目的
在这里插入图片描述

摘要

自然语言处理(NLP)专注于计算机对人类语言的解释,可以用来评估放射学报告、展示有用的应用程序在医学成像交付

成像数据的解释,提高图像采集、图像分析,提高成像服务的效率

本文在希望临床放射科医生理解的水平上回顾了NLP的一般技术方法,讨论了NLP技术的最新进展,并讨论了NLP在放射学中的当前和潜在应用。

引言

先进的数据分析,如人工智能(AI)和机器学习,已经在医学成像传输的基本所有方面展示了有用的应用:成像数据的解释、改善图像采集、图像分析和提高成像服务的效率。自然语言处理(NLP)是这些更广泛的数据分析技术的一个子集,专注于人类语言的计算机解释。1-5
NLP涉及到一系列的操作,将自由形式的文本转换为结构化的数值数据,然后可以通过机器学习算法进行处理,以创建可用的信息。4 NLP已被发现在基于文本的放射学报告的分析中有许多用途。1-5

放射学报告是一份文本文件,其中包含有关放射科医生对影像学研究中发现的所有影像学结果的解释的所有记录信息。3
放射学报告是主要和官方机制放射科医生和护理医生以及病人和他们的家庭和放射学报告是放射科医生的最终输出,它包含所有的相关信息生成的解释放射科医生。1-5
因此,放射学报告是许多潜在的有用应用的数据抽象的理想目标

NLP已经被用于生成放射学中的许多现实世界的应用程序——包括自动翻译系统、语音识别软件、报告搜索引擎、聊天机器人和数字助手。1
本文在临床放射科医生希望能理解的水平上回顾了NLP的一般技术方法,讨论了NLP技术的最新进展,并讨论了NLP在放射学中的当前和潜在的应用。

先进的技术

技术进步虽然由于放射学报告是放射科医生创造的信息的总和,因此具有丰富的信息,但从这些文件中提取信息存在许多挑战。
如上所述,NLP涉及一系列操作,将信息转换为可以分析的结构化数值数据。

由于许多放射学报告都包含自由的文本信息,因此提取出这些信息可能是一个挑战。虽然标准化报告的实施有助于解决许多这些问题,但很多这些报告仍然是自由文本的,而有意义的数据提取仍然具有挑战性。

放射学报告的一些挑战包括歧义、语法、同义词、医学缩写、放射科医生之间风格和语言选择的变化,以及特定放射科医生的语言选择随时间的不一致。1-6

这些自由形式的放射学报告可分为两大类。
第一个是象征性的或基于规则的。
基于规则的系统使用已定义的算法协议来模仿人类设计的规则。

优点:理解为什么一个特定的解释是正确的,因为角色是定义的,规则是可修改的,以及不需要提供训练数据来训练模型1。

缺点:难以将此类应用扩展到更复杂的问题,系统无法适应细微差别,以及语言问题的挑战,如排版错误、同义词、代词的使用和听写方法的风格差异。1

大多数NLP放射学报告的最初尝试都使用了基于规则的方法。

另一种广义的自然语言处理方法被称为统计技术或机器学习技术。1
机器学习技术不是依赖于一组已定义的规则,而是依赖于对已由专家评估并进行注释的训练数据集的评估
然后,机器学习算法使用各种数学模型对这些数据进行训练,最显著的是神经网络。

优点:缺乏必要创建大量的语言规则,以及能够处理可能包含定义不明确的关系数据的复杂问题和大型数据集。1

缺点:需要在大型训练数据集上执行高质量的注释,缺乏对算法如何决定结果的理解,以及由于系统使用的规则未知,无法从分析中的外部编辑单个规则或行为。

这反过来又导致了解释能力的问题:依赖机器学习方法的系统充当“黑匣子”,对它们的运作方式几乎没有提供人类可以理解的见解,这使医学法律权利和监管要求的问题变得复杂。

虽然目前放射学报告的自然语言处理方法可以通过基于规则或机器学习方法来创建,但机器学习方法正变得越来越普遍,并在许多情况下被证明是有用的。1-5

表1提供了常用术语NLP的定义。

在这里插入图片描述
其他的在之前的文章有写,不详细展开
https://blog.csdn.net/wtyuong/article/details/130313812

BERT

在过去的几年中,NLP中最重要的发展之一是来自变压器的双向编码器表示(BERT)的发展。

BERT是一个开源的无监督框架,首次由谷歌AI于2018.8发布,它不同于以前的NLP方法,它提供了为特定单词生成不同的向量表示的能力,取决于其在句子或短语中的上下文。

BERT为单词提供了上下文的嵌入,这取决于它在句子中的上下文。1-5,8

算法

BERT的训练过程不同于以前的算法,大约有15%的令牌被masked“掩盖”。然后,该算法试图预测掩模标记的向量。1-5,8

Transformer“转换器”是指BERT用来学习标记之间的上下文关系的神经网络架构。这允许对每个词的标记1进行逐步“更深层次”的向量表示,从而提高了NLP的性能。

masked“掩蔽”方法,即随机选择的单词在原始文本中被掩蔽,系统学习从周围的上下文中预测它们,不需要标记数据进行训练。

大多数生成的模型都是在从网页中刮取的异常大的通用数据集上进行完全预训练的。

通过transfer learning迁移学习可以获得性能的额外改进,其中通用模型进行fine-tuned微调以捕获特定领域的方言 和/或 语义。

优点

BERT可以间接地获取一般的语言知识,并可以在各种挑战中产生惊人的强大的结果。
作为自动编码器,转换器使用一个抽象的概念向量来捕获许多复杂的概念和关系。这给了伯特一种明显优于语言方法的推理能力。
例如,变形者可以简单地推断出语法极性(例如,确定语句是否包含否定,就像“结节被排除了”一样)。没有自定义训练过的分类器。1-5,9

Applications in Radiology 放射学应用

上述NLP技术在放射学报告中的应用已经证明了其在多个领域的应用,包括质量、临床护理、研究、语言发现、行政支持和教育。在本节中,我们将回顾在这些领域的一些示例。

Quality 质量

在质量改进和质量保证方面,NLP已经展示了多种潜在的应用。

将关键发现通知转诊临床医生

目前放射学质量界关注的领域之一是 遵守和执行有效沟通有关偶然结果的关键结果通知和后续建议。1-5,9

规定要求,放射科在影像研究中确定的关键发现通知转诊临床医生,并记录此类沟通。先前的研究表明,NLP程序可以被设计来定义关键发现沟通的比率。10,11
其他研究表明,NLP程序对临床重要发现的检测的敏感性为98.9%,特异性为94.9%。

另一项使用BERT的研究表明,该项目在从放射学报告中识别可操作的项目时,受试者工作特征(AUROC)曲线下的面积为0.9516。
这些程序可能有助于
①提高关键发现沟通的可靠性,
②使监管目的的文件减少对人工审计的依赖。

这样的程序也可能会增加与重大的偶然发现有关的沟通的可靠性。类似的程序也可以应用于诸如放射科医生建议的额外成像等领域。1

放射科关键绩效指标和评估 个别放射科医生的表现

放射学报告的NLP评估也可能被证明有助于能够更有效地生成与放射科关键绩效指标和评估个别放射科医生的表现有关的数据。

通过这种方法,可以增强对用于放射学记分卡或仪表板14的任何关键性能指标的更有效的数据创建。
例如,放射科使用标准化报告已被证明与改善与转诊医生的沟通有关。15-20
监测这种合规性在历史上是通过使用人工审计来完成的,这可能非常耗时。
与人工审计相比,NLP程序能够计算放射科医生的合规率,以达到使用标准化报告的高准确性。15
根据人工审计计算的使用标准化报告的平均依从性为91.2%,置信区间为89.3%至92.8%。在置信区间内,NLP自动审计计算的平均符合率为92.0%。
NLP自动化审计的使用为跟踪该指标节省了大量的体力劳动。

同行学习和同行评审

NLP可用于监测报告附加物,以确定同伴学习目的的学习机会1。

最近的一篇文章展示了使用NLP来识别同伴学习案例,并在放射学-病理学相关会议上进行审查。21

另一篇论文使用机器学习算法来分析胸部CT研究中的图像,以识别肺结节。22
有潜在图像/报告差异的影像学研究被标记为随访对象,并在同行评审委员会中进行了审查。

这是传统同行评审的替代方法,在传统同行评审中,随机选择的研究的固定比例是双读的。
在30,000项CT研究中,有3.79%被标记为差异,并包括0.67%的真实漏诊。在200个真实的遗漏中,有118个被标记为具有临床意义。

Clinical and Clinical Research Applications 在临床和临床研究中的应用

从放射学报告中提取的NLP数据已经证明了多种应用来改善个别患者的护理,并通过临床试验和临床研究共同改善护理

改善临床护理的一个例子是使用来自放射学报告的NLP数据来量化肿瘤反应。1-5
一项研究显示,来自CT研究的放射学报告的NLP处理数据在预测直肠癌患者的生存方面优于其他临床生存预测因子,包括癌胚抗原定量。23
另一项研究表明,使用BERT可以结合来自腹部和骨盆CT扫描报告的信息来预测肝癌的存在
放射学报告的NLP处理也被用于标记癌症患者间隔变化的实例25以及识别特定疾病,如肺炎。26

另一项研究描述了一种Transformer模型,适用于包含偶然肺结节的研究的fine-grain classification细颗粒分类,以计算潜在重新成像的召回率,或使用弗莱施纳协会的其他行动指南。
为了得出recall decision召回率,系统回答了一些关于报告内容的非常细微的问题:肺部是否有结节?有多少人?有大于6毫米吗?回答细致入微的问题和得出逻辑推断的能力远远超出了传统语言系统的能力,但通过BERT可以很好地处理,特别是当通用的预训练模型使用代表诊断成像叙述的语料库进行微调后(表2)。27

在这里插入图片描述
在这里插入图片描述

多项研究表明,可以从放射学报告中提取数据来进行临床研究。
使用NLP算法从头部ct的放射学报告中准确识别颅内肿块效应。28

其他研究表明,NLP可用于识别肺结节和基于人群的研究中的结节特征。29在另一个例子中,研究人员通过对大量癌症患者CT研究的放射学报告的评估,创造了转移性表型。放射学报告的NLP也可用于在临床试验中识别和聚合患者等任务。1-5

Language Discovery 语言发现

放射学报告的NLP也可以是一个有用的工具来理解和潜在地改进放射学报告本身的语言。之前的一项研究使用NLP来评估放射科医生报告的风格变化。6

研究表明每个放射学报告的异常指标在放射科医生之间差异很大,最大值比最低值高10倍。与未使用标准化模板的放射学报告相比,这种差异显著更大,这表明使用标准化报告确实减少了自由文本相关的风格变化。

该研究的一个方面评估了放射科医生之间冗长的差异。冗长性被定义为在报告中存在1个或1个以上的句子,且该句子有超过30个单词。包含超过30个单词的句子的报告频率在不到1%到12%之间变化(图1),表明放射科医生的听写风格有很大差异。6
在这里插入图片描述

NLP在放射学报告语言学研究中的其他应用是基于对研究结果中的语言的评估,the automated generation of report impressions自动生成报告印象。
NLP还被用于将以临床医生为目标受众的技术放射学报告语言翻译为使用患者和家属能够理解的非专业术语的语言。这可以改善患者和家庭的体验。

Other Applications 其他应用

在放射学实践的许多其他方面,从放射学报告中的NLP评估中收集的数据可能被证明是有用的。这当然包括提高我们在放射学教育中的表现。检测能力通过NLP分析在放射学报告中进行的具体诊断可能有助于创建教学案例,以及在放射学工作领域识别比较样本案例,以便在临床工作期间进行及时教育。1-5
使用数字助理和聊天机器人等工具,进行临床解释时对放射科医生的行政支持也被证明在提高效率和改善健康方面的潜在用途。例如,聊天机器人可以提供关于临床病史的快速答案,比如“病人怀孕了吗?”放射科医生不必搜索电子病历。它们也可以用于在护理点提供急性诊断成像结果,如通知急诊科医生,阑尾炎的超声结果是可用的。

总结

NLP的科学在过去的几年中取得了巨大的进步。NLP将成为放射学临床实践和工作流程的越来越综合的方面。本文回顾了最新的技术进展,为临床放射学家理解与NLP相关的命名提供了一个基本的框架,并提供了NLP在放射学中的位置和如何有用的例子。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/471685.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

WRF模式的移植、运行、后处理及在多领域的应用

1、WRF模式的各个组成部分; 2、自主完成该模式的移植;3、自主完成模式运行; 4、自主完成模式后处理;5、通过多领域案例分析、实践,熟悉在多领域中的应用。 随着生态文明建设和“碳中和”战略的持续推进,我…

jmeter常用的命令行参数有哪些?常用的jmeter命令行如何编写

目录:导读 引言 一、JMete执行方式 二、JMete非GUI运行优点 三、jmeter非GUI运行参数 四、jmeter非GUI运行命令 4.1非GUI基本命令格式: 4.2非GUI并生成html报告基本命令格式 结语 引言 你是否在使用JMeter进行负载测试时感到手忙脚乱&#xff1…

【MATLAB数据处理实用案例详解(14)】——利用RBF径向基网络预测地下水位

目录 一、问题描述二、RBF径向基网络实现地下水位预测三、算法步骤3.1 定义数据样本3.2 划分训练数据与测试数据3.3 数据增强3.4 创建径向基神经网络3.5 测试 四、结果展示五、完整代码 一、问题描述 地下水系统是一个复杂的非线性、随机系统。建立微分方程模型需要大量详尽的…

C++刨析(this指针,构造,析构函数)

目录 this指针 构造函数 析构函数 this指针 在我们创建一个对象,对象去调用类中的函数的时候,有没有想过它是怎么进行修改的,回想我们以前写C语言的时候,如果我们写了一个栈,当需要操作栈中的数据时,我们需要把构造出来栈的变量的地址传过去,让函数拿到这个地址来对我们的栈…

通过Mars3d在地图上加载风力发电机车模型

首先理清需求,通过Mars3d的基础项目,在基础项目模板上添加一个风力发电机模型。 Mars3d官网的基础项目下载地址:Mars3D三维可视化平台 | 火星科技 gitee地址: git clone https://gitee.com/marsgis/mars3d-vue-project.git 下载…

【Linux】7、一篇文章学习 Linux 中一些硬核的常用知识

目录 一、systemctl二、软链接三、日期(date 命令)四、Linux 的时区(1) 修改时区(2) ntp 五、IP 地址六、主机名七、域名解析八、配置 Linux 的固定 IP 地址(1) 在 VMwareWorkstation 中配置 IP 地址网关和网段(IP 地址的范围)(2)…

深入理解计算机系统2--理解计算机系统的基本组成以及程序的运行

深入理解计算机系统2–理解计算机系统的基本组成以及程序的运行 前言 前面一章简单记录了程序在计算机系统是以什么形式被存储的以及编译器编译的过程,这篇文章则会记录程序是如何被运行的,它在磁盘中是如何被读取,计算机系统将会通过那些器…

BPF技术整理笔记

目录 eBPF是什么? eBPF是做什么的?可以解决什么问题? eBPF可以带来的解决方案是什么? eBPF的技术点 eBPF hookeBPF MapeBPF Helper FunctioneBPF有什么限制吗? 前言 21年因为项目需求而要开发一个工具,可以…

Bitmap引起的OOM问题

作者:向阳逐梦 1.什么是OOM?为什么会引起OOM? 答:Out Of Memory(内存溢出),我们都知道Android系统会为每个APP分配一个独立的工作空间,或者说分配一个单独的Dalvik虚拟机,这样每个APP都可以独立…

你的 Redis为什么变慢了?一文讲透Redis性能优化如何做

一、Redis为什么变慢了 1.Redis真的变慢了吗? 对 Redis 进行基准性能测试 例如,我的机器配置比较低,当延迟为 2ms 时,我就认为 Redis 变慢了,但是如果你的硬件配置比较高,那么在你的运行环境下&#xff…

哈夫曼树【北邮机试】

一、哈夫曼树 机试考察的最多的就是WPL,是围绕其变式展开考察。 哈夫曼树的构建是不断选取集合中最小的两个根节点进行合并,而且在合并过程中排序也会发生变化,因此最好使用优先队列来维护单调性,方便排序和合并。 核心代码如下…

2023有哪些适合学生的蓝牙耳机?盘点四款适合学生的无线蓝牙耳机

随着时代的发展,人们更青睐于能够提升生活品质的产品。蓝牙耳机因为摆脱了线的束缚,使用体验会更好。接下来,我来给大家推荐几款适合学生用的无线蓝牙耳机,有需要的朋友可以当个参考。 一、南卡小音舱Lite2蓝牙耳机 参考价&…

探索未来的数字人生:全景VR数字人

在数字化时代,人工智能和虚拟现实技术正日益成为我们生活中不可或缺的一部分。而全景VR数字人,则是这一时代的最新产品,吸引了越来越多的关注和研究。 一、什么是全景VR数字人? 全景VR数字人是一种通过虚拟现实技术创造的数字人形…

学术ChatGPT——利用ChatGPT助力日常工作与学习

ChatGPT的出现给各个行业带来了前所未有的冲击,其中也包括学术研究领域。在学术研究领域,有着「数学天才」之称陶哲轩之前就曾表示,他已经将ChatGPT纳入了自己的工作流程。 那么做为一名普通的工作或者学习的人员,如何使用ChatGPT…

[mars3d 学习] 最近升级版本造成的问题

1、mars3d升级3.5以上,使用的时候报错; 需要看下 Mars3D三维可视化平台 | 火星科技 版本更新日志; 使用将Cesium的版本升级到1.103 2、升级Cesium到1.103,之后打包又会报错 - error in ./node_modules/mars3d-Cesium/Build/Cesi…

用手机APP操作使用井用采样器更省时省力

井用采样器的主要功能特点就是:机身小巧,方便操作。可用于井下作业,手机APP可实时查看采样数据,节省人力。 利用自动采样器进行水样采集可以说节省很大的人力物力,但是有时为了采到更具代表性的水样,我们需…

如何选择多参数水质分析仪?

如何选择适合的多参数水质分析仪? 首先水质检测仪分为实验室(台式)和户外使用的便携式多参数水质检测仪。我们呢就要了解自己的需 求使用在什么领域,根据使用领域选择仪器;其次就是选择需要测定的指标,最好…

JAVA-6-[Spring框架]Bean的作用域和生命周期

1 Spring Bean 1、Spring有两种类型bean,一种普通bean,另外一种工厂bean(FactoryBean)。 2、普通bean:在配置文件中定义的bean类型就是返回的类型。 3、工厂bean:在配置文件中定义的bean类型可以和返回类型不一样。 第一步 创建类…

Streamlit 使用介绍

Streamlit 使用介绍 安装和运行参考资料 公共组件页面设置显示代码并运行st.help 查询帮助文档多页渲染 对象渲染直接渲染对象文本渲染st.markdown代码渲染公式渲染 展示图表显示表格趋势小卡片 显示图表显示媒体画迷宫显示本地图片播放视频/音频 显示状态彩蛋-放气球进度条 互…

KVM虚拟机的定时逐次开机设定方法-systemd方式

前言:KVM虚拟机系统是榨取服务器最大性能的一种好方法,但是谁也不想让服务器启动的时候要等待5分钟甚至以上的时间。 为了减轻服务器开机时的任务数量,需要虚拟机在开机后一段时间内,按顺序逐次启动,以达到各个服务间的…