【读论文】End-to-end reproducible AI pipelines in radiology using the cloud

news2024/9/20 16:08:25

文章目录

  • End-to-end reproducible AI pipelines in radiology using the cloud
    • 01 研究背景与目的
      • 医学成像领域
        • (1)研究现状
        • (2)存在问题
      • 其他研究领域:基因组学(genomics)
      • 研究目的:提高医学成像领域的AI研究的可复现性(reproducibility)和可扩展性(scalability)
    • 02 研究方法:cloud-based workflow
      • Data from Imaging Data Commons(IDC)
      • Cloud-based implementation of DL pipelines
      • Use Case 1:deep learning for lung cancer prognostication
      • Use Case 2:foundation models for quantitative biomarker discovery
    • 03 专有名词积累
      • metrics
      • survival analysis(生存分析)

End-to-end reproducible AI pipelines in radiology using the cloud

论文链接:https://www.nature.com/articles/s41467-024-51202-2
代码仓库:https://github.com/ImagingDataCommons/idc-radiomics-reproducibility/tree/v2.0.0

01 研究背景与目的

医学成像领域

(1)研究现状
  • reporting guidelines, checklists and standards
  • community-driven: a registry of AI models developed for biomedical applications
(2)存在问题
  • 只提供了实验设计的规则,没有提供:a practical way to share AI-based pipelines with the community。
  • 缺乏实现的具体信息,包括domain-specific tools、specific software versions、hardware capability

其他研究领域:基因组学(genomics)

  • MIAME guidelines
  • MCI Genomics Data Commons

研究目的:提高医学成像领域的AI研究的可复现性(reproducibility)和可扩展性(scalability)

解决办法:cloud-based workflow
通过简化开发流程实现AI算法的快速临床转化。

  • democratizing access to large standardized datasets(平等地访问大型标准化数据集)
  • free-to-use, easily accessible, consistent computational environments(免费使用、易于访问、一致的计算环境)

02 研究方法:cloud-based workflow

在这里插入图片描述

Data from Imaging Data Commons(IDC)

https://datacommons.cancer.gov/repository/imaging-data-commons

  • Imaging Data Commons (IDC) 是一个基于云的公共癌症影像数据存储库,它与分析和探索工具以及资源共同位于美国国家癌症研究所 (NCI) 癌症研究数据共享平台 Cancer Research Data Commons (CRDC) 内。IDC 是CRDC的一部分,提供了对大量、全面且不断扩展的癌症研究数据的安全访问。
  • 所有由IDC托管的数据都是公开可用的,当前IDC的内容主要来自癌症影像档案库 (The Cancer Imaging Archive, TCIA) 的放射学系列,以及其他主要NCI计划如TCGA、CPTAC、NLST和HTAN收集的数据。
  • IDC不执行图像的去标识化(de-identification),但接受由TCIA或其他NCI安全批准的数据协调中心去标识化的数据。
  • IDC提供使用数字影像和通信医学 (DICOM) 标准标准化的数据访问。它与生成数据的项目合作,将其他格式的数据协调成DICOM表现形式。IDC的内容不仅包括图像,还包括图像注释和分析结果,并且使用通用标识符与CRDC中的其他类型的癌症数据(如蛋白质组学和基因组学数据集)相关联。数据访问通过标准接口支持。
  • 鉴于IDC作为成像数据科学平台的角色,其主要关注点之一是建立成像研究的最佳实践(best practices)。在这方面,IDC的一个关键角色是准备和调整常用的图像分析工具,使其能够在IDC托管的数据集(IDC hosted datasets)上运行的云环境中使用。以前运行分析的总结派生数据(summarized derived data)将与IDC上的影像数据相关联,以方便研究社区使用。

(1)NSCLC-Radiomics collection(LUNG1 dataset)
(2)NSCLC-Radiogenomics collection

Cloud-based implementation of DL pipelines

computing infrastructure:Google Colaboratory (or Colab),Colab是一个免费的云服务,允许用户运行Jupyter笔记本。作者在几个Colab配置(“standard” CPU-only, “high RAM” CPU-only, “free” GPU, and “pro” GPU)下进行测试。

tools:选择open-source and actively developed (or maintained)

  • 医学影像准备和DICOM CT数据预处理:Plastimatch、Numpy和SimpleITK(Insight Segmentation and Registration Toolkit的简化开源接口)
  • 可视化工具:ITKWidgets
  • 影像数据查看器:a browser-based zero-footprint DICOM viewer based on the OHIF viewer,提供了链接到Imaging Data Commons查看器的链接
  • 数据传输工具:将云托管的数据传输到Colab实例,作者使用了s5cmd,这是一个跨平台的开源工具
  • DICOM文件处理:由于从Imaging Data Commons交叉加载的数据以DICOM格式保存,使用dicomsort工具来自定义排序和重命名DICOM文件,以统一其结构
  • 其他DICOM文件操作工具:使用了pydicom和dcmrtstruct2nii等工具来读取、转换或准备DICOM文件
  • 评估指标和生存分析:Scipy、Scikitlearn和Lifelines

Use Case 1:deep learning for lung cancer prognostication

在这里插入图片描述
任务:分析CT图像上的肿瘤病变来预测结果
原数据集:NSCLC-Radiomics数据集的一个子集(N = 211 for the AUC analysis, N = 307 for the Kaplan–Meier analysis
数据集更新:同一队列的更新数据集(2020年底更新的临床和随访数据,clinical and follow-up data)
预处理pipeline:IDC data->format suited for deep learning,开源工具实现
模型权重转换:原始模型权重->open nerual network exchange(ONNX)
评价指标:area under the receiver operating characteristic curve(AUC)、receiver operating characteristic (ROC)、双侧Mann-Whitney U检验、DeLong检验配对AUC曲线、Kaplan-Meier(KM)、Cox比例风险(PH)建模

Use Case 2:foundation models for quantitative biomarker discovery

在这里插入图片描述
任务:自监督训练的基础模型是否可以提高基于深度学习的成像生物标志物的发展

03 专有名词积累

metrics

ROC:receiver operating characteristic
AUC:area under the receiver operating characteristic curve,用于评估分类模型的性能

survival analysis(生存分析)

Kaplan–Meier (KM) analysis,用于估计生存函数和生存曲线
Cox Proportional Hazard (PH) modeling,一种用于生存分析的回归模型,用于评估多个因素对生存时间的影响

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2127804.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Vue3使用vue-qrcode-reader实现扫码绑定设备功能

需求描述 移动端进入网站后,登录网站进入设备管理界面。点击添加设备,可以选择直接添加或者扫一扫。点击扫一扫进行扫描二维码获取设备序列号自动填充到添加设备界面的序列号输入框中。然后点击完成进行设备绑定。 安装vue-qrcode-reader 这里使用的版…

《OpenCV计算机视觉》—— 身份证号码识别案例

文章目录 一、案例实现的整体思路二、代码实现1.首先定义两个函数2.模板图像中数字的定位处理3.身份证号码数字的定位处理4.使用模板匹配,计算匹配得分,找到正确结果 一、案例实现的整体思路 下面是一个数字0~9的模板图片 案例身份证如下: 对…

http有什么方法升级成https?

🔒 获取与安装证书 JoySSL注册填写申请码230907即可领取免费申请资格https://www.joyssl.com/certificate/select/free.html?nid7 📄 申请SSL证书 选择证书:首先需选择合适的SSL证书,如域名认证(DV)、公…

120页ppt丨集团公司战略规划内容、方法、步骤及战略规划案例研究

响应会员需求,晓零分享一份经典资料《120页ppt集团公司战略规划内容、方法、步骤及战略规划案例研究》,欢迎进入星球下载学习。 以下是对企业战略规划三个阶段八个步骤的详细解析: 一、阶段一:内外分析 项目启动和前期准备&…

Parallels Desktop 20 发布下载,macOS Sequoia 和 Windows 11 24H2 支持准备就绪

Parallels Desktop for Mac 20.0.0 (build 55653) - 在 Mac 上运行 Windows macOS Sequoia 和 Windows 11 24H2 支持准备就绪 请访问原文链接:https://sysin.org/blog/parallels-desktop/,查看最新版。原创作品,转载请保出处。 作者主页&a…

Java | Leetcode Java题解之第400题第N位数字

题目: 题解: class Solution {public int findNthDigit(int n) {int d 1, count 9;while (n > (long) d * count) {n - d * count;d;count * 10;}int index n - 1;int start (int) Math.pow(10, d - 1);int num start index / d;int digitInde…

wifiip地址可以随便改吗?wifi的ip地址怎么改变

对于普通用户来说,WiFi IP地址的管理和修改往往显得神秘而复杂。本文旨在深入探讨WiFi IP地址是否可以随意更改,以及如何正确地改变WiFi的IP地址。虎观代理小二将详细解释WiFi IP地址的基本概念、作用以及更改时需要注意的事项,帮助用户更好地…

欧盟《人工智能法案》的重点监管要求

文章目录 前言一、欧盟《人工智能法案》的重点监管要求(一)基于风险的监管路径1.具有不可接受风险的人工智能系统2.高风险人工智能系统3.有限风险与低风险人工智能系统(二)对高风险人工智能的监管要求1.针对高风险人工智能系统的要求2.针对高风险人工智能系统产业链参与者的…

shader 案例学习笔记之fract函数

fract函数 可以理解为模1取余,获取一个数的小数部分,如果参数是向量,那就是获取每个向量分量上的小数 案例一 #ifdef GL_ES precision mediump float; #endif// 渲染分辨率 uniform vec2 u_resolution; // 程序运行时间 uniform float u_ti…

【卷起来】VUE3.0教程-08-路由管理

在Vue中,我们可以通过vue-router路由管理页面之间的关系。 Vue Router是Vue.js的官方路由,它与Vue.js核心深度集成,让用Vue.js构建单页应用变得轻而易举。 🌲 在Vue中引入路由 安装路由 npm install --save vue-router 建立三个…

【C++登堂入室】类和对象(中)——类的6个默认成员函数

目录 一、类的6个默认成员函数 ​编辑二、构造函数 2.1 概念 2.2 特性 三、析构函数 3.1 概念 3.2 特性 四、拷贝构造函数 4.1 概念 4.2 特征 五、赋值运算符重载 5.1 运算符重载 5.2 赋值运算符重载 5.3 前置和后置重载 六、日期类的实现 七、const成员 八、…

气膜建筑:设备吊装口临时封闭的理想选择—轻空间

在设备吊装作业中,吊装口的临时封闭对于保障工作环境安全、设备保护及操作顺利至关重要。传统封闭方式,如钢结构或简易的盖板封闭,不仅耗时耗力,还可能影响施工效率。气膜建筑技术凭借其轻便、快速和高效的特点,为设备…

亚信安全亮相2024国家网安周主会场,多样活动助推行业新发展

9月9日至15日,2024年国家网络安全宣传周在全国范围内统一开展。本届网安周以“网络安全为人民,网络安全靠人民”为主题,亚信安全网安周系列活动在全国30多个城市全面展开,通过线下展览、专题论坛和网络安全知识宣讲等多种形式&…

【软件方案】大屏可视化智能展示平台解决方案(word原件完整版)

构建综合大屏可视化展示平台,旨在整合各业务板块,打造统一大数据分析引擎。此平台将深度融合数据驾驶舱与智慧调度系统,实现对企业运营的全面洞察与高效指挥。我们深入钻研客户信息数据,秉承“大数据”精髓,推动业务模…

【测试八股】软件测试面试八股文

🍅 点击文末小卡片,免费获取软件测试全套资料,资料在手,涨薪更快 以下是软件测试相关的面试题及答案,希望对各位能有帮助! 1、测试分为哪几个阶段? 一般来说分为5个阶段:单元测试、集成测试…

警惕!血糖升高初期,这10大微妙信号你捕捉到了吗?

在这个快节奏的时代,饮食不规律、缺乏运动等生活习惯悄然间让高血糖这一“隐形杀手”潜伏在我们身边。然而,高血糖并非悄无声息,它在早期往往会通过一系列微妙却重要的身体信号向我们发出警告。今天,就让我们一同揭开血糖高早期的…

【Unity错误】No cloud project ID was found by the Analytics SDK

在编译默认的URP 2D项目时,出现这样一个错误:No cloud project ID was found by the Analytics SDK. This means Analytics events will not be sent. Please make sure to link your cloud project in the Unity editor to fix this problem. 原因&…

yolov5明厨亮灶检测系统,厨师帽-口罩检测,带pyqt界面-可检测图片和视频,支持中文标签,检测接口已封装好并优化,代码可读性强!

明厨亮灶检测系统是一个专门用于餐饮业厨房安全监管的智能系统。该系统结合了先进的计算机视觉技术,尤其是使用YOLOv5模型进行厨师帽和口罩的实时检测,并通过PyQt5构建了一个用户友好的图形界面。该系统不仅能够检测图片和视频中的目标,而且支…

如何看待 IBM 中国研发部裁员?

文章目录 引言背景趋势与影响人才发展对 IT 人才市场的影响IT 从业者积极应对全球化挑战 产业发展IT 产业的应对策略提升核心竞争力 结语 引言 近日,IBM 中国宣布撤出在华两大研发中心,引发了 IT 行业对于跨国公司在华研发战略的广泛讨论。这一决定不仅…

共享打印机无法连多种错误代码原因分析及解决方法

日常办公和生活中,打印机是不可或缺的重要设备。然而,在添加共享或使用共享打印机过程中,经常会遇各种问题。然后我们在添加共享打印机遇到最多的向种错误:0x0000011b、0x000004005、0x000006d9、0x00000040等等,然后这…