44、基于深度学习的癌症检测(matlab)

news2025/1/16 16:50:55

1、基于深度学习的癌症检测原理及流程

基于深度学习的癌症检测是利用深度学习算法对医学影像数据进行分析和诊断,以帮助医生准确地检测癌症病变。其原理和流程主要包括以下几个步骤:

  1. 数据采集:首先需要收集包括X光片、CT扫描、MRI等医学影像数据以及对应的癌症诊断结果的大量数据集。

  2. 数据预处理:对采集的医学影像数据进行预处理,包括去噪、标准化、图像增强等操作,以确保数据的质量和一致性。

  3. 特征提取:利用深度学习算法对预处理后的影像数据进行特征提取,提取出代表影像中癌症病变特征的高级特征表示。

  4. 训练模型:搭建深度学习模型,如卷积神经网络(CNN)、循环神经网络(RNN)等,使用提取的特征表示进行训练,让模型能够自动学习影像数据中与癌症相关的模式和规律。

  5. 模型评估:通过验证集或交叉验证等方法对训练好的深度学习模型进行评估,评估模型在未见过的数据上的性能表现。

  6. 癌症检测:使用训练好的深度学习模型对新的医学影像数据进行检测和诊断,判断是否存在癌症病变,并输出诊断结果。

  7. 可解释性分析:在输出诊断结果的同时,深度学习模型还可以提供对诊断依据的可解释性分析,解释模型是如何判断出病变的,并帮助医生理解判断依据。

通过以上流程,基于深度学习的癌症检测技术可以提高检测的准确性和效率,帮助医生更早地发现和治疗癌症,促进癌症的早期诊断和治疗。

2、基于深度学习的癌症检测说明

针对问题

训练一个神经网络来使用蛋白质表达谱上的质谱数据检测癌症。

数据来源

来自 FDA-NCI 临床蛋白质组学计划数据库的ovarian_dataset.mat文件

数据预处理

新文件包含变量 Y、MZ 和 grp。

说明:

Y 中的每列表示从一名患者身上获取的测量值。Y 中有 216 列,表示有 216 个患者,其中 121 个是卵巢癌患者,95 个是非癌症患者。
Y 中的每行表示 MZ 中指示的特定质量-电荷值下的离子强度水平。MZ 中有 15000 个质量-电荷值,Y 中的每行代表在特定质量-电荷值下患者的离子强度水平。
grp 保存关于哪些样本表示癌症患者以及哪些样本表示非癌症患者的索引信息。

3、关键特征排名

说明

特征的数量远大于观测值的数量,但是单个特征即可实现正确分类。因此,目标是找到一个分类器,该分类器应适当学习如何加权多个特征,同时生成不会过拟合的广义映射。
找到重要特征的简单方法:假设每个 M/Z 值都是独立的,并计算双向 t 检验。rankfeatures 返回最重要的 M/Z 值的索引,例如,按检验统计量绝对值排名的 100 个索引。
x 中的每一列表示 216 个不同患者中的一个。
x 中的每行表示每个患者在 100 个特定质量-电荷值之一下的离子强度水平。
变量 t 具有两行,包含 216 个值,其中每个值为 [1;0](表示癌症患者)或 [0;1](表示非癌症患者)。


代码

[x,t] = ovarian_dataset;
whos x t%显示数据信息

4、使用前馈神经网络进行分类

1)说明

已确定一些重要特征,可以使用这些信息对癌症样本和正常样本进行分类

设置随机种子以便每次都重现相同的结果

代码

setdemorandstream(672880951)

2)创建单隐藏层前馈神经网络

说明:创建并训练具有 5 个隐藏层神经元的单隐藏层前馈神经网络。

输入样本和目标样本自动分为训练集、验证集和测试集。

训练集用于对网络进行训练。只要网络针对验证集持续改进,训练就会继续。

测试集提供独立的网络准确度测量。
输入和输出的大小为 0,因为网络尚未配置成与输入数据和目标数据相匹配。在训练网络时会进行此配置。

代码

net = patternnet(5);
view(net)

视图效果

3) 开始训练

说明:样本自动分为训练集、验证集和测试集。训练集用于对网络进行训练。只要网络针对验证集持续改进,训练就会继续。测试集提供独立的网络准确度测量。

代码

[net,tr] = train(net,x,t);

4)均方误差图

说明:性能以均方误差衡量,并以对数刻度显示。随着网络训练的加深,均方误差迅速降低。

代码

plotperform(tr)

视图效果

5) 测试训练的神经网络

说明:从主数据集划分出来的测试样本测试经过训练的神经网络。
在训练中没有以任何方式使用过测试数据,因此测试数据是可用来测试网络的“样本外”数据集。这样可以估计出当使用真实数据进行测试时,网络的表现如何。
网络输出的范围为 0-1。对输出应用阈值以获得 1 和 0,分别表示癌症患者和非癌症患者。

 代码

testX = x(:,tr.testInd);
testT = t(:,tr.testInd);
testY = net(testX);
testClasses = testY > 0.5

 6)混淆矩阵图

说明

混淆矩阵图:衡量神经网络数据拟合程度
该混淆矩阵显示了正确和错误分类的百分比。正确分类表示为矩阵对角线上的绿色方块。红色方块表示错误分类。
如果网络是准确的,则红色方块中的百分比应该很小,表示几乎没有错误分类。
如果网络不准确,则可以尝试训练更长时间,或者训练具有更多隐藏神经元的网络。
正确和错误分类的总体百分比

代码

[c,cm] = confusion(testT,testY);
fprintf('Percentage Correct Classification   : %f%%\n', 100*(1-c));
fprintf('Percentage Incorrect Classification : %f%%\n', 100*c);

 7)受试者工作特征图

说明

受试者工作特征图:衡量神经网络数据拟合程度
显示随着输出阈值从 0 变为 1,假正率和真正率之间的相关性。
线条越偏向左上方,达到高的真正率所需接受的假正数越少。最佳分类器是线条从左下角到左上角再到右上角,或接近于该模式。
第 1 类表示癌症患者,第 2 类表示非癌症患者。

代码

plotroc(testT,testY)
legend('种类1','种类2')

视图效果

 

5、总结

基于深度学习的癌症检测在 MATLAB 中的实现通常涉及以下几个关键步骤:

  1. 数据预处理:首先,收集和准备医学影像数据集,包括癌症病变的影像数据和对应的标签(是否患有癌症)。然后对数据进行预处理,包括图像的调整、裁剪、缩放、标准化等,以确保数据质量和一致性。

  2. 构建深度学习模型:使用 MATLAB 中深度学习工具箱中的函数和工具来构建深度学习模型,如卷积神经网络(CNN)、循环神经网络(RNN)等。在模型的构建过程中,需要定义网络的架构、层的数量和类型,以及激活函数等参数。

  3. 数据划分和训练:将数据集划分为训练集、验证集和测试集。然后,使用训练集数据对深度学习模型进行训练,通过反向传播算法来不断调整模型参数,提高模型的准确性和泛化能力。

  4. 模型评估和优化:在训练过程中,通过验证集来评估模型的性能,根据评估结果进行模型的优化和调整,以提高模型在未见过数据上的泛化能力。

  5. 测试和应用:最终,在训练好的深度学习模型上使用测试集来评估模型的性能和准确性。通过模型对新的医学影像数据进行预测和诊断,实现癌症病变的检测。

通过以上步骤,基于深度学习的癌症检测在 MATLAB 中可以很好地实现,并且 MATLAB 提供了丰富的深度学习工具和函数,方便用户搭建和训练深度学习模型,应用于医学影像数据的分析和诊断。

6、源代码

代码

%% 基于深度学习的癌症检测
%说明:训练一个神经网络来使用蛋白质表达谱上的质谱数据检测癌症。
%数据来源:来自 FDA-NCI 临床蛋白质组学计划数据库的ovarian_dataset.mat文件
%数据预处理:新文件包含变量 Y、MZ 和 grp。
%Y 中的每列表示从一名患者身上获取的测量值。Y 中有 216 列,表示有 216 个患者,其中 121 个是卵巢癌患者,95 个是非癌症患者。
%Y 中的每行表示 MZ 中指示的特定质量-电荷值下的离子强度水平。MZ 中有 15000 个质量-电荷值,Y 中的每行代表在特定质量-电荷值下患者的离子强度水平。
% grp 保存关于哪些样本表示癌症患者以及哪些样本表示非癌症患者的索引信息。
%% 关键特征排名
%说明:特征的数量远大于观测值的数量,但是单个特征即可实现正确分类。因此,目标是找到一个分类器,该分类器应适当学习如何加权多个特征,同时生成不会过拟合的广义映射。
%找到重要特征的简单方法:假设每个 M/Z 值都是独立的,并计算双向 t 检验。rankfeatures 返回最重要的 M/Z 值的索引,例如,按检验统计量绝对值排名的 100 个索引。
%x 中的每一列表示 216 个不同患者中的一个。
%x 中的每行表示每个患者在 100 个特定质量-电荷值之一下的离子强度水平。
%变量 t 具有两行,包含 216 个值,其中每个值为 [1;0](表示癌症患者)或 [0;1](表示非癌症患者)。
[x,t] = ovarian_dataset;
whos x t%显示数据信息
%% 使用前馈神经网络进行分类
%说明:已确定一些重要特征,可以使用这些信息对癌症样本和正常样本进行分类。
%设置随机种子以便每次都重现相同的结果
setdemorandstream(672880951)
%创建并训练具有 5 个隐藏层神经元的单隐藏层前馈神经网络。输入样本和目标样本自动分为训练集、验证集和测试集。训练集用于对网络进行训练。只要网络针对验证集持续改进,训练就会继续。测试集提供独立的网络准确度测量。
%输入和输出的大小为 0,因为网络尚未配置成与输入数据和目标数据相匹配。在训练网络时会进行此配置。
net = patternnet(5);
view(net)
%开始训练
%样本自动分为训练集、验证集和测试集。训练集用于对网络进行训练。只要网络针对验证集持续改进,训练就会继续。测试集提供独立的网络准确度测量。
[net,tr] = train(net,x,t);
%性能以均方误差衡量,并以对数刻度显示。随着网络训练的加深,均方误差迅速降低。
%绘图会显示训练集、验证集和测试集的性能。
plotperform(tr)
%从主数据集划分出来的测试样本测试经过训练的神经网络。
%在训练中没有以任何方式使用过测试数据,因此测试数据是可用来测试网络的“样本外”数据集。这样可以估计出当使用真实数据进行测试时,网络的表现如何。
%网络输出的范围为 0-1。对输出应用阈值以获得 1 和 0,分别表示癌症患者和非癌症患者。
testX = x(:,tr.testInd);
testT = t(:,tr.testInd);
testY = net(testX);
testClasses = testY > 0.5
%混淆矩阵图:衡量神经网络数据拟合程度
%该混淆矩阵显示了正确和错误分类的百分比。正确分类表示为矩阵对角线上的绿色方块。红色方块表示错误分类。
%如果网络是准确的,则红色方块中的百分比应该很小,表示几乎没有错误分类。
%如果网络不准确,则可以尝试训练更长时间,或者训练具有更多隐藏神经元的网络。
%正确和错误分类的总体百分比
[c,cm] = confusion(testT,testY);
fprintf('Percentage Correct Classification   : %f%%\n', 100*(1-c));
fprintf('Percentage Incorrect Classification : %f%%\n', 100*c);
%受试者工作特征图:衡量神经网络数据拟合程度
%显示随着输出阈值从 0 变为 1,假正率和真正率之间的相关性。
%线条越偏向左上方,达到高的真正率所需接受的假正数越少。最佳分类器是线条从左下角到左上角再到右上角,或接近于该模式。
%第 1 类表示癌症患者,第 2 类表示非癌症患者。
plotroc(testT,testY)
legend('种类1','种类2')










本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1844791.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【vite】define 全局常量定义

&#x1f9ed; define 说明 类型&#xff1a; Record<string, any> 定义全局常量替换方式。其中每项在开发环境下会被定义在全局&#xff0c;而在构建时被静态替换。 Vite 使用 esbuild define 来进行替换&#xff0c;因此值的表达式必须是一个包含 JSON 可序列化值&a…

xshell传输文件速率为0

你们好&#xff0c;我是金金金。 场景 此时我通过xshell客户端上传文件&#xff0c;速率一直为0 解决 安装 yum -y install lrzsz 即可 这个工具主要提供 rz 和 sz 命令&#xff0c;用于通过 Zmodem 协议在本地计算机和远程服务器之间传输文件 编写有误还请大佬指正&#xff0…

C++的智能指针 RAII

目录 产生原因 RAII思想 C11的智能指针 智能指针的拷贝与赋值 shared_ptr的拷贝构造 shared_ptr的赋值重置 shared_ptr的其它成员函数 weak_ptr 定制删除器 简单实现 产生原因 产生原因&#xff1a;抛异常等原因导致的内存泄漏 int div() {int a, b;cin >> a…

在Ubuntu系统中部署Java及Spring Boot开发环境

选择Java及Spring Boot构建Web服务具有显著优势&#xff0c;Java的跨平台兼容性保证了服务可在不同操作系统上顺畅运行&#xff0c;而Spring Boot的成熟框架则大大简化了开发流程&#xff0c;减少了繁琐配置。此外&#xff0c;强大的社区支持、易于维护与扩展的特性、优异的性能…

a-table 根据数据自动进行 行合并

<template><div class"chat_query_result"><button click"temp">点击</button><a-table :columns"columns" :data-source"data" bordered></a-table></div> </template><script&g…

计算机毕业设计hadoop+spark+hive游戏推荐系统 游戏数据分析可视化大屏 steam游戏爬虫 游戏大数据 大数据毕业设计 机器学习 知识图谱

游戏推荐系统开题报告 一、引言 随着信息技术和网络技术的飞速发展&#xff0c;电子游戏已成为人们日常生活中不可或缺的一部分。然而&#xff0c;面对海量的游戏资源&#xff0c;用户往往难以找到适合自己的游戏。因此&#xff0c;构建一个高效、准确的游戏推荐系统显得尤为…

C++ | Leetcode C++题解之第171题Excel表列序号

题目&#xff1a; 题解&#xff1a; class Solution { public:int titleToNumber(string columnTitle) {int number 0;long multiple 1;for (int i columnTitle.size() - 1; i > 0; i--) {int k columnTitle[i] - A 1;number k * multiple;multiple * 26;}return num…

万界星空科技MES系统中的仓库管理功能

制造执行系统&#xff08;Manufacturing Execution System&#xff0c;简称MES&#xff09;作为一种面向车间生产调度的管理信息系统&#xff0c;被广泛应用在车间作业调度和控制管理系统中&#xff0c;它以实现车间生产调度最优化为目标。同时&#xff0c;MES作为衔接ERP&…

Scikit-Learn梯度提升决策树(GBDT)

Scikit-Learn梯度提升决策树 1、梯度提升决策树(GBDT)1.1、Boosting方法1.2、GBDT的原理1.3、GBDT回归的损失函数1.4、梯度下降与梯度提升1.5、随机森林与GBDT1.6、GBDT的优缺点2、Scikit-Learn梯度提升决策树(GBDT)2.1、Scikit-Learn GBDT回归2.1.1、Scikit-Learn GBDT回归…

阿里云上构建_VPC专有网络_子网划分_原理说明_创建_释放---分布式云原生部署架构搭建006

可以看到有这种子网掩码计算工具可以使用 可以看到这个是,我们设计的一个子网 192.168.0.0/16 可以看到地址是 从192.168.0.1 到 192.168.255.254 有了子网,我们去看,可以看到在阿里云的管理后台,就有个 创建交换机.可以看到 然后指定这个交换机的网段 这里我们指定了192…

编写水文专业串口通讯软件的开发经历

编写水文专业串口通讯软件的开发经历 一、关于开发 YAC9900 水位雨量 RTU 通讯软件二、软件开发遇到的问题和困难1、开发架构的适应2、开发语言的学习3、.net core 8 架构中串口构建的难点4、YAC9900 水位雨量 RTU 通讯软件开发中的 UI 冻结 三、发现问题解决问题的具体办法1、…

会声会影2024专业免费版下载附带激活码序列号

&#x1f31f; 会声会影2024&#xff1a;你的视频编辑新伙伴&#xff01;大家好&#xff0c;今天来给你们安利一个超级棒的视频编辑软件——会声会影2024最新版本&#xff01;作为一位热爱创作的小伙伴&#xff0c;找到一款既强大又易用的视频编辑工具真的太重要了。而会声会影…

什么是嵌入式,单片机又是什么,两者有什么关联又有什么区别?

在开始前刚好我有一些资料&#xff0c;是我根据网友给的问题精心整理了一份「嵌入式的资料从专业入门到高级教程」&#xff0c; 点个关注在评论区回复“888”之后私信回复“888”&#xff0c;全部无偿共享给大家&#xff01;&#xff01;&#xff01;从科普的角度&#xff0c;…

【减法网络】Minusformer:通过逐步学习残差来改进时间序列预测

摘要 本文发现泛在时间序列(TS)预测模型容易出现严重的过拟合。为了解决这个问题&#xff0c;我们采用了一种去冗余的方法来逐步恢复TS的真实值。具体来说&#xff0c;我们引入了一种双流和减法机制&#xff0c;这是一种深度Boosting集成学习方法。通过将信息聚合机制从加法转…

Java线程池七个参数详解

ThreadPoolExecutor 是JDK中的线程池实现&#xff0c;这个类实现了一个线程池需要的各个方法&#xff0c;它提供了任务提交、线程管理、监控等方法 下面是 ThreadPoolExecutor 类的构造方法源码&#xff0c;其他创建线程池的方法最终都会导向这个构造方法&#xff0c;共有7个参…

Spring Boot -- 图书管理系统(登录、展示+翻页、添加/修改图书)

文章目录 一、应用分层二、数据库的设计三、登录功能四、展示列表&#xff08;使用虚构的数据&#xff09;五、翻页 展示功能六、添加图书七、修改图书 一、应用分层 为什么我们需要应用分层&#xff1a;当代码量很多时&#xff0c;将其全部放在一起查找起来就会很麻烦&#…

通过MindSpore API实现深度学习模型

快速入门 将相应的包逐一导入到项目中&#xff0c;这是制作项目的第一步。 import mindspore from mindspore import nn from mindspore.dataset import vision, transforms from mindspore.dataset import MnistDataset 处理数据集 先从网上下载对应的数据集文件,MindSpor…

【LeedCode】二分查找算法(一)

二分查找算法的时间复杂度是O(logN) &#xff0c;更优于传统的遍历数组算法值得我们学习。 注意二分查找一般使用的前提是&#xff1a;待操作的数组的元素有某种规律也就是要有二阶性&#xff0c;二阶性就是在数组中选取一点根据该数组元素某种规律可以把数组分为两部分&#x…

Kafka基础教程

Kafka基础教程 资料来源&#xff1a;Apache Kafka - Introduction (tutorialspoint.com) Apache Kafka起源于LinkedIn&#xff0c;后来在2011年成为一个开源Apache项目&#xff0c;然后在2012年成为一流的Apache项目。Kafka是用Scala和Java编写的。Apache Kafka是基于发布-订…

2024广东省职业技能大赛云计算赛项实战——Minio服务搭建

Minio服务搭建 前言 这道题是比赛时考到的&#xff0c;没找到具体题目&#xff0c;但在公布的样题中找到了&#xff0c;虽然很短~ 使用提供的 OpenStack 云平台&#xff0c;申请一台云主机&#xff0c;使用提供的软件包安装部署 MINIO 服务并使用 systemctl 管理 Minio是一个…