自然语言处理（NLP）在放射学报告评价中的应用：应用和技术进展

写在最前面
摘要
引言
先进的技术
BERT
- 算法
- 优点
Applications in Radiology 放射学应用
- Quality 质量
- - 将关键发现通知转诊临床医生
  - 放射科关键绩效指标和评估个别放射科医生的表现
  - 同行学习和同行评审
Clinical and Clinical Research Applications 在临床和临床研究中的应用
Language Discovery 语言发现
Other Applications 其他应用
总结

写在最前面

研究主体、研究方法、研究目的
在这里插入图片描述

摘要

自然语言处理（NLP）专注于计算机对人类语言的解释，可以用来评估放射学报告、展示有用的应用程序在医学成像交付：

成像数据的解释，提高图像采集、图像分析，提高成像服务的效率。

本文在希望临床放射科医生理解的水平上回顾了NLP的一般技术方法，讨论了NLP技术的最新进展，并讨论了NLP在放射学中的当前和潜在应用。

引言

先进的数据分析，如人工智能（AI）和机器学习，已经在医学成像传输的基本所有方面展示了有用的应用：成像数据的解释、改善图像采集、图像分析和提高成像服务的效率。自然语言处理（NLP）是这些更广泛的数据分析技术的一个子集，专注于人类语言的计算机解释。1-5
NLP涉及到一系列的操作，将自由形式的文本转换为结构化的数值数据，然后可以通过机器学习算法进行处理，以创建可用的信息。4 NLP已被发现在基于文本的放射学报告的分析中有许多用途。1-5

放射学报告是一份文本文件，其中包含有关放射科医生对影像学研究中发现的所有影像学结果的解释的所有记录信息。3
放射学报告是主要和官方机制放射科医生和护理医生以及病人和他们的家庭和放射学报告是放射科医生的最终输出，它包含所有的相关信息生成的解释放射科医生。1-5
因此，放射学报告是许多潜在的有用应用的数据抽象的理想目标。

NLP已经被用于生成放射学中的许多现实世界的应用程序——包括自动翻译系统、语音识别软件、报告搜索引擎、聊天机器人和数字助手。1
本文在临床放射科医生希望能理解的水平上回顾了NLP的一般技术方法，讨论了NLP技术的最新进展，并讨论了NLP在放射学中的当前和潜在的应用。

先进的技术

技术进步虽然由于放射学报告是放射科医生创造的信息的总和，因此具有丰富的信息，但从这些文件中提取信息存在许多挑战。
如上所述，NLP涉及一系列操作，将信息转换为可以分析的结构化数值数据。

由于许多放射学报告都包含自由的文本信息，因此提取出这些信息可能是一个挑战。虽然标准化报告的实施有助于解决许多这些问题，但很多这些报告仍然是自由文本的，而有意义的数据提取仍然具有挑战性。

放射学报告的一些挑战包括歧义、语法、同义词、医学缩写、放射科医生之间风格和语言选择的变化，以及特定放射科医生的语言选择随时间的不一致。1-6

这些自由形式的放射学报告可分为两大类。
第一个是象征性的或基于规则的。
基于规则的系统使用已定义的算法协议来模仿人类设计的规则。

优点：理解为什么一个特定的解释是正确的，因为角色是定义的，规则是可修改的，以及不需要提供训练数据来训练模型1。

缺点：难以将此类应用扩展到更复杂的问题，系统无法适应细微差别，以及语言问题的挑战，如排版错误、同义词、代词的使用和听写方法的风格差异。1

大多数NLP放射学报告的最初尝试都使用了基于规则的方法。

另一种广义的自然语言处理方法被称为统计技术或机器学习技术。1
机器学习技术不是依赖于一组已定义的规则，而是依赖于对已由专家评估并进行注释的训练数据集的评估。
然后，机器学习算法使用各种数学模型对这些数据进行训练，最显著的是神经网络。

优点：缺乏必要创建大量的语言规则，以及能够处理可能包含定义不明确的关系数据的复杂问题和大型数据集。1

缺点：需要在大型训练数据集上执行高质量的注释，缺乏对算法如何决定结果的理解，以及由于系统使用的规则未知，无法从分析中的外部编辑单个规则或行为。

这反过来又导致了解释能力的问题：依赖机器学习方法的系统充当“黑匣子”，对它们的运作方式几乎没有提供人类可以理解的见解，这使医学法律权利和监管要求的问题变得复杂。

虽然目前放射学报告的自然语言处理方法可以通过基于规则或机器学习方法来创建，但机器学习方法正变得越来越普遍，并在许多情况下被证明是有用的。1-5

表1提供了常用术语NLP的定义。

在这里插入图片描述
其他的在之前的文章有写，不详细展开
https://blog.csdn.net/wtyuong/article/details/130313812

BERT

在过去的几年中，NLP中最重要的发展之一是来自变压器的双向编码器表示（BERT）的发展。

BERT是一个开源的无监督框架，首次由谷歌AI于2018.8发布，它不同于以前的NLP方法，它提供了为特定单词生成不同的向量表示的能力，取决于其在句子或短语中的上下文。

BERT为单词提供了上下文的嵌入，这取决于它在句子中的上下文。1-5,8

算法

BERT的训练过程不同于以前的算法，大约有15%的令牌被masked“掩盖”。然后，该算法试图预测掩模标记的向量。1-5,8

Transformer“转换器”是指BERT用来学习标记之间的上下文关系的神经网络架构。这允许对每个词的标记1进行逐步“更深层次”的向量表示，从而提高了NLP的性能。

masked“掩蔽”方法，即随机选择的单词在原始文本中被掩蔽，系统学习从周围的上下文中预测它们，不需要标记数据进行训练。

大多数生成的模型都是在从网页中刮取的异常大的通用数据集上进行完全预训练的。

通过transfer learning迁移学习可以获得性能的额外改进，其中通用模型进行fine-tuned微调以捕获特定领域的方言和/或语义。

优点

BERT可以间接地获取一般的语言知识，并可以在各种挑战中产生惊人的强大的结果。
作为自动编码器，转换器使用一个抽象的概念向量来捕获许多复杂的概念和关系。这给了伯特一种明显优于语言方法的推理能力。
例如，变形者可以简单地推断出语法极性（例如，确定语句是否包含否定，就像“结节被排除了”一样）。没有自定义训练过的分类器。1-5,9

Applications in Radiology 放射学应用

上述NLP技术在放射学报告中的应用已经证明了其在多个领域的应用，包括质量、临床护理、研究、语言发现、行政支持和教育。在本节中，我们将回顾在这些领域的一些示例。

Quality 质量

在质量改进和质量保证方面，NLP已经展示了多种潜在的应用。

将关键发现通知转诊临床医生

目前放射学质量界关注的领域之一是遵守和执行有效沟通有关偶然结果的关键结果通知和后续建议。1-5,9

规定要求，放射科在影像研究中确定的关键发现通知转诊临床医生，并记录此类沟通。先前的研究表明，NLP程序可以被设计来定义关键发现沟通的比率。10,11
其他研究表明，NLP程序对临床重要发现的检测的敏感性为98.9%，特异性为94.9%。

另一项使用BERT的研究表明，该项目在从放射学报告中识别可操作的项目时，受试者工作特征（AUROC）曲线下的面积为0.9516。
这些程序可能有助于
①提高关键发现沟通的可靠性，
②使监管目的的文件减少对人工审计的依赖。

这样的程序也可能会增加与重大的偶然发现有关的沟通的可靠性。类似的程序也可以应用于诸如放射科医生建议的额外成像等领域。1

放射科关键绩效指标和评估个别放射科医生的表现

放射学报告的NLP评估也可能被证明有助于能够更有效地生成与放射科关键绩效指标和评估个别放射科医生的表现有关的数据。

通过这种方法，可以增强对用于放射学记分卡或仪表板14的任何关键性能指标的更有效的数据创建。
例如，放射科使用标准化报告已被证明与改善与转诊医生的沟通有关。15-20
监测这种合规性在历史上是通过使用人工审计来完成的，这可能非常耗时。
与人工审计相比，NLP程序能够计算放射科医生的合规率，以达到使用标准化报告的高准确性。15
根据人工审计计算的使用标准化报告的平均依从性为91.2%，置信区间为89.3%至92.8%。在置信区间内，NLP自动审计计算的平均符合率为92.0%。
NLP自动化审计的使用为跟踪该指标节省了大量的体力劳动。

同行学习和同行评审

NLP可用于监测报告附加物，以确定同伴学习目的的学习机会1。

最近的一篇文章展示了使用NLP来识别同伴学习案例，并在放射学-病理学相关会议上进行审查。21

另一篇论文使用机器学习算法来分析胸部CT研究中的图像，以识别肺结节。22
有潜在图像/报告差异的影像学研究被标记为随访对象，并在同行评审委员会中进行了审查。

这是传统同行评审的替代方法，在传统同行评审中，随机选择的研究的固定比例是双读的。
在30,000项CT研究中，有3.79%被标记为差异，并包括0.67%的真实漏诊。在200个真实的遗漏中，有118个被标记为具有临床意义。

Clinical and Clinical Research Applications 在临床和临床研究中的应用

从放射学报告中提取的NLP数据已经证明了多种应用来改善个别患者的护理，并通过临床试验和临床研究共同改善护理

改善临床护理的一个例子是使用来自放射学报告的NLP数据来量化肿瘤反应。1-5
一项研究显示，来自CT研究的放射学报告的NLP处理数据在预测直肠癌患者的生存方面优于其他临床生存预测因子，包括癌胚抗原定量。23
另一项研究表明，使用BERT可以结合来自腹部和骨盆CT扫描报告的信息来预测肝癌的存在。
放射学报告的NLP处理也被用于标记癌症患者间隔变化的实例25以及识别特定疾病，如肺炎。26

另一项研究描述了一种Transformer模型，适用于包含偶然肺结节的研究的fine-grain classification细颗粒分类，以计算潜在重新成像的召回率，或使用弗莱施纳协会的其他行动指南。
为了得出recall decision召回率，系统回答了一些关于报告内容的非常细微的问题：肺部是否有结节？有多少人？有大于6毫米吗？回答细致入微的问题和得出逻辑推断的能力远远超出了传统语言系统的能力，但通过BERT可以很好地处理，特别是当通用的预训练模型使用代表诊断成像叙述的语料库进行微调后（表2）。27

在这里插入图片描述

多项研究表明，可以从放射学报告中提取数据来进行临床研究。
使用NLP算法从头部ct的放射学报告中准确识别颅内肿块效应。28

其他研究表明，NLP可用于识别肺结节和基于人群的研究中的结节特征。29在另一个例子中，研究人员通过对大量癌症患者CT研究的放射学报告的评估，创造了转移性表型。放射学报告的NLP也可用于在临床试验中识别和聚合患者等任务。1-5

Language Discovery 语言发现

放射学报告的NLP也可以是一个有用的工具来理解和潜在地改进放射学报告本身的语言。之前的一项研究使用NLP来评估放射科医生报告的风格变化。6

研究表明每个放射学报告的异常指标在放射科医生之间差异很大，最大值比最低值高10倍。与未使用标准化模板的放射学报告相比，这种差异显著更大，这表明使用标准化报告确实减少了自由文本相关的风格变化。

该研究的一个方面评估了放射科医生之间冗长的差异。冗长性被定义为在报告中存在1个或1个以上的句子，且该句子有超过30个单词。包含超过30个单词的句子的报告频率在不到1%到12%之间变化（图1），表明放射科医生的听写风格有很大差异。6
在这里插入图片描述

NLP在放射学报告语言学研究中的其他应用是基于对研究结果中的语言的评估，the automated generation of report impressions自动生成报告印象。
NLP还被用于将以临床医生为目标受众的技术放射学报告语言翻译为使用患者和家属能够理解的非专业术语的语言。这可以改善患者和家庭的体验。

Other Applications 其他应用

在放射学实践的许多其他方面，从放射学报告中的NLP评估中收集的数据可能被证明是有用的。这当然包括提高我们在放射学教育中的表现。检测能力通过NLP分析在放射学报告中进行的具体诊断可能有助于创建教学案例，以及在放射学工作领域识别比较样本案例，以便在临床工作期间进行及时教育。1-5
使用数字助理和聊天机器人等工具，进行临床解释时对放射科医生的行政支持也被证明在提高效率和改善健康方面的潜在用途。例如，聊天机器人可以提供关于临床病史的快速答案，比如“病人怀孕了吗？”放射科医生不必搜索电子病历。它们也可以用于在护理点提供急性诊断成像结果，如通知急诊科医生，阑尾炎的超声结果是可用的。