文献速递:深度学习胰腺癌诊断--胰腺肿瘤的全端到端深度学习诊断

news2024/11/26 16:37:41

Title 

题目

Fully end-to-end deep-learning-based diagnosis of

pancreatic tumors

胰腺肿瘤的全端到端深度学习诊断

01

文献速递介绍

胰腺癌是最常见的肿瘤之一,预后不良且通常是致命的。没有肿瘤的患者只需要进一步观察,而胰腺肿瘤的诊断需要紧急行动和明确的手术计划。如果延迟治疗,病情恶化和死亡的风险将增加,使得胰腺肿瘤的准确诊断对其成功的手术治疗至关重要。

人工智能可以帮助提高影像解释的准确性,并使诊断专业知识更广泛地可用。然而,胰腺肿瘤诊断的人工智能方法发展不够成熟,因为这一任务尤其具有挑战性。首先,目标在形状、大小和位置上高度可变,并且仅占整个CT图像的非常小的一部分。在我们的CT数据集中,胰腺仅占每个CT图像的约1.3%。其余信息来自其他器官,如肝脏、胃、肠道和图像背景,这些信息几乎不会影响人工智能模型的诊断。此外,肿瘤与周围组织的高相似性进一步降低了准确性和诊断效率。第三点是缺乏合适的胰腺图像数据集,这直接影响了人工智能模型的发展。

先前的研究已经尝试解决这些问题。一种有效的方法是胰腺分割。Chakraborty等人基于手动分割的CT图像,利用随机森林和支持向量机学习预测胰腺高风险乳头状粘液性肿瘤(IPMN)。Wei等人提出了一个支持向量机系统,包含24个基于指南的特征和385个放射组学高通量特征,结合由放射科医师标记的感兴趣区域(ROI)来诊断胰腺浆液性囊性肿瘤(SCN)。随着深度学习框架的发展,研究人员已经能够构建有效的深度编码器-解码器网络进行胰腺分割,提高了诊断准确性。Zhu等人报告了一种多尺度分割方法,通过检查是否有足够数量的体素被分割为肿瘤来筛查胰管腺癌(PDAC)。Liu等人首先分割胰腺,然后分类异常以检测PDAC。然而,在不增加医疗专家工作量或程序成本的情况下,高效获得即时诊断和治疗建议仍然是一个重大问题。由于原始患者数据(来自医院记录)包含了CT检查的诊断报告和不同成像平面以及血管造影阶段的图像,因此可用于诊断的有效CT图像的比例很小。因此,成功应用深度学习框架的关键在于对原始数据进行详细的自动预处理。

本研究提出了一个完全端到端的深度学习(FEE-DL)模型,用于从原始腹部CT图像自动诊断胰腺肿瘤。该模型的方法论有四个步骤,用于从原始数据中定位胰腺肿瘤:影像筛选、胰腺定位、胰腺分割和胰腺肿瘤诊断。

Abstract-Background 

摘要

Artificial intelligence can facilitate clinical decision making by considering massive amounts of medical imaging data. Various algorithms have been implemented for different clinical applications. Accurate diagnosis and treatment require reliable and interpretable data. For pancreatic tumor diagnosis, only58.5% of images from the First Affiliated Hospital and the Second Affiliated Hospital, Zhejiang University School of Medicine are used, increasing labor and time costs to manually filter out images not directly used by the diagnostic model.

人工智能在临床决策中能够通过考虑大量医学影像数据来提供帮助。不同的算法已经应用于不同的临床应用中。准确的诊断和治疗需要可靠且可解释的数据。对于胰腺肿瘤的诊断,浙江大学医学院附属第一医院和第二医院的影像数据只使用了58.5%,增加了手动筛选出未被诊断模型直接使用的影像的劳动力和时间成本。

Results

结果

We established a fully end-to-end deep-learning model for diagnosing pancreatic tumors and proposing treatment. The model considers original abdominal CT images without any manual preprocessing. Our artificial-intelligence-based system achieved an area under the curve of 0.871 and a F1 score of 88.5% using an independent testing dataset containing 107,036 clinical CT images from 347 patients. The average accuracy for all tumor types was 82.7%, and the independent accuracies of identifying intraductal papillary mucinous neoplasm and pancreatic ductal adenocarcinoma were 100% and 87.6%, respectively. The average test time per patient was 18.6 s, compared with at least 8 min for manual reviewing. Furthermore, the model provided a transparent and interpretable diagnosis by producing saliency maps highlighting the regions relevant to its decision.

我们建立了一个完全端到端的深度学习模型,用于诊断胰腺肿瘤并提出治疗方案。该模型考虑了原始腹部CT影像,没有进行任何手动预处理。我们基于包含347名患者的107,036张临床CT影像的独立测试数据集,人工智能系统实现了0.871的曲线下面积和88.5%的F1分数。对于所有肿瘤类型的平均准确率为82.7%,识别乳头状粘液性肿瘤和胰管腺癌的独立准确率分别为100%和87.6%。每位患者的平均测试时间为18.6秒,而手动审查至少需要8分钟。此外,该模型通过生成突出显示与其决策相关区域的显著性图,提供了透明且可解释的诊断。

Conclusions

结论

The proposed model can potentially deliver efficient and accurate preoperative diagnoses that could aid the surgical management of pancreatic tumor.

所提出的模型有可能提供高效准确的术前诊断

Method

方法

This study used a training dataset of 143,945 dynamic contrast-enhanced CT images of the abdomen from 319 patients. The proposed model contained four stages: image screening, pancreas location, pancreas segmentation, and pancreatic tumor diagnosis.

本研究使用了319名患者的143,945张动态增强CT腹部影像的训练数据集。提出的模型包含四个阶段:影像筛选、胰腺定位、胰腺分割和胰腺肿瘤诊断。

Figure

图片

Figure 1. The original files obtained from the hospitals contain different file formats, different imaging planes and different angiography phases. (A) Artificial intelligence approaches currently used for pancreatic diagnosis focus on the analysis of valid CT images, and ignore the importance of screening the original data at an early stage. (B) Our proposed FEE-DL model first screens out transverse plane CT images containing the pancreas from complex original files before deep-learning diagnosis.

图1. 从医院获取的原始文件包含不同的文件格式、不同的成像平面和不同的血管造影相。(A) 当前用于胰腺诊断的人工智能方法专注于分析有效的CT图像,忽略了在早期阶段筛选原始数据的重要性。(B) 我们提出的完全端到端深度学习模型首先从复杂的原始文件中筛选出包含胰腺的横断面CT图像,然后进行深度学习诊断。

图片

Figure 2. Multiplex original clinical data. (A-C) Images not directly used by the FEE-DL model containing (A) coronal plane CT scan, (B) sagittal plane CT scan, and (C) CT scan without pancreas. (D) Arterial, (E) venous, and (F) delayed phase CT scans.

图2. 多重原始临床数据。(A-C) 不直接被完全端到端深度学习模型使用的图像,包括(A) 冠状面CT扫描,(B) 矢状面CT扫描,以及(C) 不含胰腺的CT扫描。(D) 动脉期,(E) 静脉期,和(F) 延迟期CT扫描。

图片

Figure 3. Workflow diagram of the model’s training and testing phase. In the training phase, after valid images screening and data augmentation from the original abdominal CT images, we constructed a deep-learning model involving pancreas location, pancreas segmentation, image fusion and pancreatic tumor diagnoses. The loss function is calculated according to the prediction and label, and the weights of the neural networks are updated according to the back-propagation algorithm. The best weights are fixed for subsequent use on the testing dataset to diagnose pancreatic tumor.

图3. 模型的训练和测试阶段的工作流程图。在训练阶段,经过从原始腹部CT图像中筛选出有效图像并进行数据增强后,我们构建了一个深度学习模型,涉及胰腺定位、胰腺分割、图像融合和胰腺肿瘤诊断。根据预测和标签计算损失函数,并根据反向传播算法更新神经网络的权重。最佳权重被固定用于对测试数据集进行胰腺肿瘤的诊断。

图片

Figure 4. Architectures of the three sub-networks: (A) ResNet18 for pancreas location, (B) U-Net32 for pancreas segmentation, and (C) ResNet34 for pancreatic tumor diagnosis. (D) Detailed structures of the identity (ID), down sampling (DS), and convolution (Conv) blocks. (AvgPool, average-pooling; BN, batch normalization; Concate, concatenation; FC, fully connected; MaxPool, max-pooling; ReLU, rectified linear unit; Trans, transposed).

图4. 三个子网络的架构:(A) 用于胰腺定位的 ResNet18,(B) 用于胰腺分割的 U-Net32,以及 (C) 用于胰腺肿瘤诊断的 ResNet34。(D) 身份(ID)、下采样(DS)和卷积(Conv)模块的详细结构。(AvgPool,平均池化;BN,批量归一化;Concate,串联;FC,全连接;MaxPool,最大池化;ReLU,修正线性单元;Trans,转置)。

图片

Figure 5. Performance of each sub-network in the training and validation datasets. (A) ResNet18 for pancreas location. (B) U-Net32 for pancreas segmentation. (C) ResNet34 for pancreatic tumor diagnoses. (D) Representative results of pancreas segmentation. Rows from top to bottom are input CT images, ground truth, prediction, fusion results, and pancreas contours in CT, respectively, where radiologists’ annotations are shown in green and computerized segmentation is displayed in red. Higher resolution images are also shown on the lower left side.

图5. 每个子网络在训练和验证数据集中的性能。(A) 用于胰腺定位的 ResNet18。(B) 用于胰腺分割的 U-Net32。(C) 用于胰腺肿瘤诊断的 ResNet34。(D) 胰腺分割的代表性结果。从上到下的行分别是输入 CT 图像、地面真相、预测、融合结果和 CT 中的胰腺轮廓,其中放射科医生的标注显示为绿色,计算机分割显示为红色。较高分辨率的图像也显示在左下角

图片

Figure 6. Performance of the FEE-DL model. (A) Confusion matrix. (B) Receiver operating characteristic (ROC) curves of the model and random prediction for comparison. The area under the curve (AUC) was 0.871. (C) Prediction accuracy of different pancreatic tumors with respect to the average accuracy (82.7%). (IPMN, intraductal papillary mucinous neoplasm; PDAC, pancreatic ductal adenocarcinoma; SCN, serous cystic neoplasm).

图6. FEE-DL模型的性能。(A) 混淆矩阵。(B) 模型和随机预测的接收者操作特征曲线(ROC曲线)进行比较。曲线下面积(AUC)为0.871。(C) 不同胰腺肿瘤的预测准确度与平均准确度(82.7%)的关系。(IPMN,胰管内乳头状黏液性肿瘤;PDAC,胰管腺癌;SCN,浆液性囊性肿瘤)。

图片

Figure 7. Comparison of saliency maps for (A-C) a tumor patient and (D-F) a normal control in different angiography phases: left, arterial phase; center, venous phase; and right, delayed phase.

图7. 不同血管造影相位下肿瘤患者(A-C)和正常对照(D-F)的显著性图比较:左侧,动脉期;中间,静脉期;右侧,延迟期。

Table

图片

Table 1 lists the types of pancreatic tumor and their frequency in the training and testing datasets. Pancreatic cancer (PDAC) and pancreatic tumors such as IPMN, pancreatic neuroendocrine tumors (PNET), SCN, and ‘Other’ are considered as positive cases. Rare cases or lesions on the pancreas caused by

表1 列出了训练和测试数据集中胰腺肿瘤的类型及其频率。胰腺癌(PDAC)和诸如IPMN、胰腺神经内分泌肿瘤(PNET)、SCN和“其他”等胰腺肿瘤被视为阳性病例。由胰腺引起的罕见病例或病变。

图片

Table 2. Patient characteristics in the training and testing datasets

表2 列出了训练和测试数据集中患者的特征。

图片

Table 3. Performance of each sub-network

表3. 每个子网络的性能

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1577597.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C/C++中局部变量static用法实例

1. 普通局部变量存储于进程栈空间,使用完毕会立即释放,静态局部变量使用static修饰符定义,即使在声明时未赋初值,编译器也会把它初始化为0,并且静态局部变量存储于进程的全局数据区,即使函数返回&#xff0…

用three.js做一个3D汉诺塔游戏(下)

本文由孟智强同学原创。 接上期:《用three.js做一个3D汉诺塔游戏(上)》 在上一期,我们成功地搭建了基础的 3D 场景。在本期中,我们将对场景进行优化,使其在视觉上更加真实,并为场景中的物体添加…

golang es查询的一些操作,has_child,inner_hit,对索引内父子文档的更新

1.因为业务需要查询父文档以及其下子文档,搞了很久才理清楚。 首先还是Inner_hits,inner_hits只能用在nested,has_child,has_parents查询里面 {"query": {"nested": {"path": "comments","query": {"match…

vulhub之fastjson篇-1.2.27-rce

一、启动环境 虚拟机:kali靶机:192.168.125.130/172.19.0.1(docker地址:172.19.0.2) 虚拟机:kali攻击机:192.168.125.130/172.19.0.1 本地MAC:172.XX.XX.XX 启动 fastjson 反序列化导致任意命令执行漏洞 环境 1.进入 vulhub 的 Fastjson 1.2.47 路径 cd /../../vulhub/fa…

企业IT运维事中故障定位方法及工具

企业IT故障定位指诊断故障直接原因或根因,故障定位有助于故障恢复动作更加有效。故障定位通常是整个故障过程中耗时最长的环节,定位的目标围绕在快速恢复的基础上,而非寻找问题根因,后者由问题管理负责。通常大部分可用性故障&…

GEE案例——小流域汇流计算以缅甸仰光为例(如何绘制除小流域内的河道)

简介 本案例主要介绍如何实现小流域内河流汇流的计算,这里需要用到地形中的坡度以及卷积的计算内容。 流域 流域是指一个地理区域内所有水流都会汇集到同一个主要水体(如河流、湖泊或海洋)的区域。流域由周围山脉、丘陵和地形特征所定义,其中的水流通过降水、融雪和地下…

计算机网络针对交换机的配置

实验 目的 交换机的基本配置,交换机VLAN配置 实验条件 Windows,Cisco packet tracer 实验 内容 交换机的基本配置,交换机VLAN配置 实验 过程 一、交换机的基本配置 进入特权模式 Switch>enable 进入配置模式 Switch#configure ter…

德国SycoTec义齿雕刻机主轴 助力高精密雕铣加工

随着科技的不断进步,义齿加工机械在牙科领域的应用越来越广泛。为了满足市场对高精度、高效率义齿加工设备的需求,SycoTec高速电主轴凭借其卓越的性能和可靠的质量,为CNC四轴、五轴义齿加工设备、五轴联动义齿加工中心、CAM/CAD义齿雕刻机、椅…

算法题中nextInt(),nextLine()的易错陷阱

nextInt()读取空格或回车前的整数 nextLine()读取回车前的一行,空格不会中断读取 陷阱代码如下: public class nextInt {public static void main(String[] args) {Scanner scannernew Scanner(System.in);System.out.println("请输入字符串数组…

C++11可变模板参数:海纳百川的Args

目录 一、可变模板参数的概念及功能 1.1Args的概念与使用 1.2获取args中的参数 二、emplace可变模板参数的实际应用 三、逗号表达式展开参数包 一、可变模板参数的概念及功能 1.1Args的概念与使用 C11的新特性可变参数模板能够让您创建可以接受可变参数的函数模板和类模板…

item_get_app在竞品分析中的应用与效果评估

item_get_app作为淘宝开放平台的重要API接口,为商家在竞品分析中提供了强大的数据支持。在竞争激烈的电商市场中,竞品分析是商家不可或缺的一环,而item_get_app的应用则使得这一分析过程更加高效、精准。通过调用item_get_app接口&#xff0c…

C语言 08 类型转换

一种类型的数据转换为另一种类型的数据&#xff0c;这种操作称为类型转换。 类型转换分为自动类型转换和强制类型转换。 自动类型转换 比如现在希望将一个 short 类型的数据转换为 int 类型的数据&#xff1a; #include <stdio.h>int main(){short s 10;// 直接将s的…

Redis: 配置文件详解(Redis.conf)

文章目录 一、Units二、INCLUDES三、NETWORK四、GENERAL五、SECURITY六、LIMITS 一、Units 单位&#xff0c;配置大小单位&#xff0c;开头定义了一些基本的度量单位&#xff0c;只支持bytes&#xff0c;不支持bit&#xff0c;大小写不敏感 二、INCLUDES 包含&#xff0c;多…

275. 传纸条(DP)

题目描述 小渊和小轩是好朋友也是同班同学&#xff0c;他们在一起总有谈不完的话题。一次素质拓展活动中&#xff0c;班上同学安排坐成一个 m 行 n 列的矩阵&#xff0c;而小渊和小轩被安排在矩阵对角线的两端&#xff0c;因此&#xff0c;他们就无法直接交谈了。幸运的是&…

easyExcel - 按模板导出

目录 前言一、情景介绍二、文档介绍2.1 读取模板2.2 填充模板 三、代码示例3.1 案例一&#xff1a;工资表3.2 案例二&#xff1a;报价单 四、我所遇到的问题 前言 Java-easyExcel入门教程&#xff1a;https://blog.csdn.net/xhmico/article/details/134714025 之前有介绍过如…

人工智能研究生前置知识—Anaconda与python工作环境

人工智能研究生前置知识—Anaconda与python工作环境 python环境管理 python工作环境的管理是需要满足的基本条件&#xff0c;指的是不同的python版本之间的切换。或者说是允许安装不同版本的python 解决&#xff1a;conda是一个跨平台的包管理工具&#xff0c;其环境管理功能允…

Python学习,记录不熟悉知识点

目录 Set&#xff08;集合&#xff09; 集合内置方法完整列表 根据字符串的表达式计算结果 ​编辑 条件控制&#xff1a; if – elif – else match...case 循环语句&#xff1a; while循环 for循环 在同一行中有多个赋值操作&#xff08;先计算&#xff0c;再赋值&…

创建型模式--5.建造者模式【卡雷拉公司】

1. 造船&#xff0c;我是专业的 在海贼世界中&#xff0c;水之都拥有全世界最好的造船技术&#xff0c;三大古代兵器之一的冥王就是由岛上的造船技师们制造出来的。现在岛上最大、最优秀的造船公司就是卡雷拉公司&#xff0c;它的老板还是水之都的市长&#xff0c;财富权力他都…

Discord注册教程:Discord刚注册就被封怎么办?附申诉教程!

Discord如今在海外社交媒体平台中迅速崛起&#xff0c;许多社交媒体营销人员也纷纷利用其社群特性进行推广&#xff0c;Discord注册也就成为社媒营销人员必经之路。然而&#xff0c;很多人注册Discord账号时常常会想&#xff1a;“在国内使用Discord会封号吗&#xff1f;”事实…

订阅edk2社区邮件列表

给社区发邮件步骤 UEFI订阅邮件列表 开发者订阅邮箱 develedk2.groups.io | Home 点击Join This Group&#xff0c;按照步骤填写自己邮箱地址&#xff08;该地址是edk2,发送邮件到该邮箱的地址&#xff09; 自己邮箱确认就可以自动收到邮件了 比如&#xff1a;