R语言机器学习之影像组学分析的原理详解

news2024/11/25 2:40:27

a6e8b01df9a3473c99c3a0d6e40df1d2.jpg


 

概要

 

影像组学从常规医学图像中高通量提取大量的放射学定量数据,并以非侵入性方式探索它们与临床结果的相关性,在医学研究中得到广泛的应用。


 

01 影像组学(Radiomics)的概念:

影像组学(Radiomics)和机器学习技术结合是AI影像辅助诊断的常用方法。

影像组学研究的一般步骤如下:从CT、PET或MRI等医学图像中高通量地提取并分析影像学特征,而后基于图像分割、提取筛选特征、构建预测模型等机器学习算法来实现疾病的诊断、评估、预测等临床应用。

2ed22b9ec50f45839a542f79c692a1f7.png

 即,获取图像、勾画感兴趣区(Region of interset, ROI)、从 ROI中提取定量特征及降维、筛选特征,最后基于不同机器学习模型利用筛选得到的特征构建预测和分类模型。

 

02 影像组学特征的介绍:

影像组学特征:影像组学可从医学图像中提取大量定量特征,在一定程度上反映生物医学图像中隐藏的潜在病理生理学信息。

影像组学特征可分为语义特征和不可知特征:

① 语义特征包括:尺寸、形状等参数;

② 不可知特征包括:一阶、二阶和高阶特征;

一阶特征描述个体体素值分布而不考虑空间关系;二阶特征主要描述图像的纹理特征;高阶特征则需以多种滤波器网络获取,包括小波变换和拉普拉斯变换等。

影像组学通过图像分割和标注获取特征。在图像分割前通常需要预先对医学影像数据进行标注,而后通过机器学习等算法模型展开训练,进行自动图像分割。目前国内外标注软件多是功能单一的附带简单标注功能的医学图像处理软件。例如,LabelImg和LabelMe是两款常见的标注工具,可支持对图像进行多边形、圆形、线段和点等形式的勾画,但不具备获取、存储和管理医疗数据及数据统计等功能,且不同专病医学影像检查涉及的设备不同,医学图像格式类型各异,常见的标注工具难以同时支持多种格式类型的医学图像标注。

影像组学所需的特征工程:不同专病影像涉及的器官位置、需提取的图像特征(如轮廓、灰度、纹理、毛刺、边缘等)不尽相同,且特征选择的过程非常复杂。通常需要先提取成百上千种图像特征,经过相关性分析后筛选出少数几种和任务具有强相关的特征。特征选择的过程对模型诊断的准确率至关重要,但需要计算机视觉的专业知识。

 

03 影像组学分析平台:

影像组学分析平台包含:数据管理、阅片标注、课题管理和丰富的影像组学及机器学习组件。

通过本平台,临床医生无需任何编程便可完成影像组学的全流程分析,包括特征提取、特征分析、模型选择等,并生成相应的结构化分析报告(英文表述)。该报告可直接用于科研论文的撰写。

640?wx_fmt=png&tp=wxpic&wxfrom=5&wx_lazy=1&wx_co=1

bab78afae4c84831bfdbd929003ec47a.png

 影像组学分析平台一般流程如下:平台提供了基于影像组学和机器学习技术的分析建模全周期功能,所有过程都提供中间数据,并根据中间数据生成对应图表,作为分析报告提供给用户,以便进行分析总结。

① 分析数据选择:在进行课题分析时,用户可根据数据分布情况选择部分或全部当前课题组所有的案例进行分析。为了避免模型过拟合,所选案例最少不低于20例。

② 特征值计算:对所选案例,平台可自动提取每个案例的1688个影像组学特征,特征包括灰度特征、三维特征、纹理特征、小波变换特征。

③ 分析特征选择:用户可从影像组学特征和临床特征中选择部分或全部特征,进入模型建立模块。单次可只选择影像组学特征或临床特征分别建模,也可联合两部分特征共同建模。

④ 数据分组:在建模模块时,平台提供了2种数据分组方法:随机法和K折法,随机法将按指定比例进行数据分组;K折法将数据随机分为等量的K组,进行K次训练,第X次训练以第X组作为测试集,其余组作为训练集。

⑤ 特征筛选:根据影像组学方法,在进行机器学习建模前,需要筛选所选特征。平台提供了3种特征筛选方法:方差选择法(Variance Threshold)、单变量特征值选择法(SelectKBest)和最小绝对收缩算子(Lasso)。

⑥ 机器学习建模:平台提供了12种常见的机器学习算法模型组件供用户调用。按照学习方式,这些模型可分为监督式学习、非监督式学习、半监督式学习、增强学习4类。按照学习任务,这些模型可分为分类、回归、聚类3类。其中,分类与回归都属于监督学习,前者是预测一个离散的标签,后者是预测一个连续的数量,聚类则属于无监督学习。

平台模型库中共包含13种机器学习算法模型,用于数据分析建模,分别是:K近邻(k-nearest neighbor, KNN)、支持向量机(support vector machines, SVM)、极端梯度提升(extreme gradient boosting, XGBoost)、梯度提升树(gradient boosting machine, GBM)、伯努利贝叶斯分类(Bernoulli NB)、高斯朴素贝叶斯(Gaussian NB)、决策树(decisiontree, DT)、线性判别分析(linear discriminant analysis, LDA)、随机森林(random forest, RF)、逻辑回归(logistic regression, LR)、自适应(adaptive boosting, AdaBoost)、多项式朴素贝叶斯(Multinomial NB)以及随机梯度下降(stochastic gradient descent, SGD)。

3156a422b6214a93a58cea6ad6d5b7f6.png

⑦ 模型验证:分析模型建立后,为了评估模型的性能,平台会自动计算模型在训练集和测试集上的敏感性(sensitivity, SE)、特异性(specificity, SP)、

准确率(accuracy, Acc)、曲线面积(area under curve, AUC)、可信度等指标,部分指标公式如下:

  • SE=TP/(TP+FN) (1)

  • SP=FP/(FP+TN) (2)

  • Acc=(TP+FN)/(TP+TN+FP+FN) (3)

式中:TP、FP、FN、TN分别是指模型预测为阳性的阳性案例、预测为阳性的阴性案例,预测为阴性的阳性案例,预测为阴性的阴性案例。

⑧ 分析报告:平台将数据分析和模型运行的中间过程生成的图表汇总,生成分析报告。报告中包括特征筛选过程图、筛选后的特征列表、模型在训练集和验证集上的性能表、ROC曲线图等。

6f3799bdcea44cc1939ddd0d7219c483.png

 

 

04 总结:

f99604bc372c4e288a57e1763fa7f1ad.png

 

 

今天的内容就到这里,欢迎点赞收藏转发,感谢🙏

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/783884.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

JVM堆内存介绍

一:JVM中内存 JVM中内存通常划分为两个部分,分别为堆内存与栈内存,栈内存主要用运行线程方法 存放本地暂时变量与线程中方法运行时候须要的引用对象地址。 JVM全部的对象信息都 存放在堆内存中。相比栈内存,堆内存能够所大的多&am…

图为科技应邀出席第38届中国计算机应用大会

第38届中国计算机应用大会(CCF NCCA 2023)暨2023年人工智能应用学术会议于7月16日-19日在苏州召开。 本次会议由中国计算机学会(CCF)主办,CCF计算机应用专业委员会承办,苏州大学、苏州科技大学、南京理工大学等单位协办&#xff0…

数字孪生搭高台,温控节能唱新戏

“孪生”的基本思想最早起源于1969年的阿波罗计划,通过留在地球上的航天器对发射到太空的航天器进行工作状态的仿真模拟,进而辅助航天员完成决策,减少各种操作结果的未知性。 从2002年开始,数字孪生的概念和定义在不同领域逐渐被提…

三种数据库架构模式

数据架构设计模式 数据架构主要有三种模式: Shared Everything、Shared Disk、Shared Nothing。 Shared Disk 各处理单元使用本地的私有CPU和Memory,共享磁盘系统,分布式数据库。 典型的代表是Oracle RAC、DB2 PureScale。 例如&#xf…

Navicat远程连接服务器失败 2002 - Can‘t connect to server on ...(10060)

报错如下: 2002 - Can’t connect to server on ‘192.168.33.59’(10060) 解决方案: 下面列举可能出现的几种情况: 1.防火墙原因,需要关闭防火墙 systemctl stop firewalld systemctl disable firewalld2.数据库未开启&#x…

基于机器学习的情绪识别算法matlab仿真,对比SVM,LDA以及决策树

目录 1.算法理论概述 2.部分核心程序 3.算法运行软件版本 4.算法运行效果图预览 5.算法完整程序工程 1.算法理论概述 情绪识别是一种重要的情感分析任务,旨在从文本、语音或图像等数据中识别出人的情绪状态,如高兴、悲伤、愤怒等。本文介绍一种基于…

Linux软件/系统看门狗嵌入式独立看门狗

updating linux看门狗的使用 freertos看门狗的使用 一、看门狗简介 看门狗,又叫Watchdog timer(看门狗定时器)是一种电子计时器,其用于检测和恢复计算机故障。一般有一个输入和一个输出,其中的输入叫做喂狗( kickingthe dog or service the dog)。输出一般连接到另外一个部…

HP暗影精灵9 Plus OMEN 17.3英寸游戏本17-ck2000出厂Win11系统原厂预装OEM系统

惠普暗影9笔记本电脑原装Windows11系统ISO镜像包 适用机型17-ck2000TX,17-ck2001TX,17-ck2002TX,17-ck2003TX 自带所有驱动、出厂主题壁纸LOGO、Office办公软件、惠普电脑管家、OMEN Command Center等预装程序 所需要工具:32G或以上的U盘 文件格式:IS…

软件外包开发可行性调研

软件开发的可行性调研对软件工程来说是必要的,也是开启软件工程建设的第一步。在进行软件外包开发的可行性调研时,需要调查的内容比较多,同时调查研究并不是一次性完成的任务,而是一个持续过程,应随着项目进行进行调整…

FPGA开发:按键消抖

按键是FPGA开发板上的重要交互元件,因为按键的内部的结构设计,在按下和松开按键时,按键会无法避免地产生机械抖动,因此要对按键输入进行特殊处理,否则可能会因为机械抖动产生意外的重复触发。 按键消抖有很多方法&…

Git-分布式版本控制工具

Git仓库:本地和远程 获取git仓库: 本地初始化Git仓库(创建空目录,右键git bansh,执行git init)远程仓库克隆,git clone 远程仓库地址 版本库:.git隐藏文件夹,储存配置信…

【C++初阶】:优先队列(仿函数)

优先队列 一.基本使用二.模拟实现三.仿函数1.优先队列里的使用2.概念3.模拟 一.基本使用 优先队列的底层默认是使用vector构造的,也就是使用数组模拟(二叉树)堆。并且默认是按大堆存放数据(也就是父节点>子节点,左节…

51单片机串口

该部分的笔记来自视频教程链接https://www.bilibili.com/video/BV1bt4y197NR/?spm_id_from333.788&vd_sourceb91967c499b23106586d7aa35af46413 一、51单片机串口基础介绍 一般的应用层的协议中采用和校验或CRC校验,而奇偶校验还是解决基本通信中的帧格式中的…

练习时长两年半的网络安全防御“second”

目录 1.防火墙的安全区域 Trust区域 DMZ区域 Untrust区域 Local区域 安全区域的受信任程度与优先级 2. 安全策略 ​编辑 安全域间、安全策略与报文流动方向 安全域间是用来描述流量的传输通道,它是两个“区域”之间的唯一“道路”。如果希望对经过这条通 …

C++初阶 - 4.类和对象(下)

目录 1.再谈构造函数 1.1 构造函数体赋值 1.2 初始化列表 ---- 是构造函数的一部分 1.3 explicit 关键字 2.static成员 2.1概念 2.2 特性 3.友元 3.1友元函数 3.2 友元类 4.内部类 5.再次理解类和对象 1.再谈构造函数 1.1 构造函数体赋值 在创建对象时&#xff0…

Hadoop中HDFS的架构

一、Switch语句 语法规则: ①语句中的变量类型可以是byte、short、int或者char;从javaSE5开始支持枚举类型; javaSE7开始,switch支持String。 ②没有break时,后续case的语句都会执行 二、修饰符 访问修饰符 Java中&#xff0c…

机器人导航(2):导航实现

文章目录 SLAM建图gmapping简介gmapping节点说明gmapping使用 地图服务map_server简介map_server使用之地图保存节点(map_saver)map_server使用之地图服务(map_server)map_server节点说明地图读取地图显示 定位amcl简介amcl节点说明订阅的Topic发布的Topic服务调用的服务参数坐…

prometheus直方图实践

目录 1.简介 2.方案 1.简介 Prometheus提供了Counter、Gauge、Histogram、Summary四类指标(详见Metric types | Prometheus),可以通过"github.com/prometheus/client_golang/prometheus"自定义采集指标、注册、采集数据、发布UR…

gerrit 提交搞了一天的账号密码

搞了一整天的账号密码怎么输入都不对 以为输入了也不对,查找各种文档也不太行 参考也不太行: https://blog.csdn.net/qq_43279637/article/details/103595122 最后发现 是使用了git clone http 脑残方式,正确应该使用 git clone ssh 就可以…

XILINX ZYNQ 7000 AXI总线 (三) AXI GPIO

一步一步来搭建一下AXI GPIO 创建ZYNQ 后先来看下各个接口的含义 1.M_AXI_GP0_ACKL和M_AXI_GP0 ZYNQ的PS部分是有一个GP接口,32 Bit 的AXI master接口,默认是打开的,如果双击绿框可以看到是打开的 M_AXI_GP0 就是AXI的主机接口&#xff…