4+miRNA+机器学习生信思路,常规又简单的miRNA也能发4+

news2024/9/21 10:40:33


今天给同学们分享一篇生信文章“Machine learning algorithms reveal potential miRNAs biomarkers in gastric cancer”,这篇文章发表在Sci Rep期刊上,影响因子为4.6。

0bb268471d446c05e79970ad5af8dd8b.jpeg

结果解读:

数据来源

本研究包括348名男性(占64.9%)和188名女性(占35.1%)的临床病理信息,这些信息从TCGA下载并总结。平均年龄为65.3岁,约有250人(占46.6%)患有晚期胃癌。


相关性分析

在临床病理数据中,只有疾病阶段与癌症显著相关。衡量相关性的显著标准被认为是 p 值小于 0.05(图2A)。

864a814231ab441bc681a81014e6955c.jpeg


数据收集

如材料和方法部分所述,临床信息和测序的原始数据来源于TCGA数据库。根据所述标准,选择了536个样本进行进一步研究,其中约465个与GC患者相关,72个与年龄和性别匹配的对照组相关。


数据预处理和不同表达的miRNA(DeMiRs)的鉴定

数据集包括1882个miRNA,在使用Limma软件包和R软件进行归一化后,减少到220个miRNA。在使用热图进行处理的步骤中,选择了最重要的特征(图2B),并使用机器学习算法进行分类。然后,使用五种算法(SVM、dts、rf、逻辑回归和knn)以及四种不同的指标(准确率、f1得分、ROC曲线和混淆矩阵)进行检验,最后根据这四个指标得到的分数,选择了SVM算法作为最准确的算法(DTS,准确率:88%,AUC = 47%;随机森林,准确率:93%,AUC = 39.5%;SVM,准确率:93%,AUC = 88.5%;KNN,准确率:93%,AUC = 41.7%;逻辑回归,准确率:93%,AUC = 88%)。混淆矩阵也可以在图2C中看到。因此,在胃癌中选择了一个包含29个miRNA的列表,其中有5个显著上调表达和24个显著下调表达,以进行进一步分析(图3)。

843707e0df8ead47f5682adf0bf61963.jpeg


ROC曲线分析用于识别诊断生物标志物

ROC曲线分析的结果显示了hsa-miR-29c的诊断能力(AUC为0.7,敏感性为0.5,特异性为0.8,截断值为0.88),当与hsa-miR-93结合时,其诊断能力得到改善(组合的AUC为0.76,敏感性为0.69,特异性为0.73,截断值为0.86)(图2D)。


demiRs的生存分析

使用SPSS 进行了demiR的生存分析,p值被认为是<0.05。结果表明,有13个miRNA(Hsa-miR-21、Hsa-miR-146b、Hsa-miR-185、Hsa-miR-1.1、Hsa-miR-1.2、Hsa-miR-143、Hsa-miR-4652、Hsa-miR-1911、Hsa-miR-29c、Hsa-miR-3170、Hsa-miR-139、Hsa-miR-5683和Hsa-miR-133a.2)具有预后能力(图4)。

57b246160eb77660a977ce7991de94d9.jpeg


候选微小RNA在数据集中的验证

在材料和方法部分提到的在线网络服务器中,使用机器学习算法得出的29个候选microRNA中,hsa-miR-21、hsa-miR-133a、hsa-miR-146b、hsa-miR-29c和hsa-miR-204的表达水平在(EXP00118(GSE28700)、EXP00131(GSE23739)、EXP00230(GSE26595)、EXP00268、EXP00270(GSE54397)、EXP00326(GSE31568)、EXP00337(GSE59856)、EXP00404、EXP00460(GSE93415)、EXP00524(GSE106817)、EXP00405、EXP00118(GSE28700)、EXP00406、EXP00666、EXP00444(GSE78775)、EXP00476(GSE99415)、EXP00316(GSE77380)和EXP00175(GSE33743)中得到了高度验证,使用miRPathDB在线服务器进行了热图分析(https://mpd.bioinf.uni-sb.de/,图5A)。

a972d84ab224d50849e2206415ee083d.jpeg


miRNA靶点预测

miRNA靶向预测是通过使用几个数据库完成的,包括:miRwalk、miRdb和Targetscan。使用一个在线Venn图数据库,确定了包含407个共同基因的列表(图5B)。


蛋白质相互作用网络分析

在前一步中预测的候选基因被提交到STRING数据库,根据材料和方法中提到的标准构建了一个蛋白质相互作用网络(PPI网络)。为了获得具有重要作用的关键基因,PPI网络随后被导入并通过Cytoscape软件进行可视化。使用Cytohubba工具选择了基于度数的100个得分最高的基因(图5C)。最后,这些关键基因被导入到STRING数据库中重新分析PPI网络(图5D)。


功能分析

为了揭示所选关键基因的作用,使用R软件进行了富集分析。结果表明,就分子功能而言,关键基因主要富集于转录因子结合、酶结合、RNA聚合酶II顺式调控区域特异性DNA结合、蛋白质结合、双链DNA结合、阻滞素家族蛋白结合、特异性DNA结合和染色质结合。在生物过程方面,大多数基因富集于miRNA介导的翻译抑制、宿主对病毒转录的正调控、基因表达的遗传印记调控、miRNA介导的基因沉默产生的miRNA、Wnt信号通路、钙调节通路、细胞衰老调控、基因表达的负调控和表观遗传基因沉默。染色质、真染色质、核质、非膜结合细胞器和细胞质是富集程度最高的细胞组分。使用KEGG数据库识别重要的信号通路表明,候选关键基因主要涉及到胶质瘤、黑色素瘤、前列腺癌、非小细胞肺癌、肾细胞癌、GnRH分泌、醛固酮调节的钠重吸收以及胰腺癌(图6)。

ff89a6d839ade61b1ce60c9da9d7d665.jpeg


总结

总之,使用机器学习算法鉴定了29种miRNA,随后的分析显示,一组四种miRNA具有很高的诊断和预后能力,包括hsa-miR-21、hsa-miR-133a、hsa-iR-146b和hsa-miR-29c,这已通过多个数据集进行了验证。这项研究强调了机器学习作为预测癌症生物标志物的替代选择的重要性。然而,为了进一步验证,建议在实验室的几个队列中分析候选miRNA。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1325680.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

解析资产管理的革新之路:从手工盘点到易点易动RFID散步式方案

随着科技的不断进步和应用&#xff0c;资产管理领域也在不断演进和革新。从最初的手工盘点到现代的智能化解决方案&#xff0c;我们目睹了资产管理的巨大变革。其中&#xff0c;易点易动RFID散步式方案以其高效、准确和便捷的特点&#xff0c;正在成为资产管理的新宠。本文将深…

Linux之yum管理器

目录 yum管理器 yum相关指令 yum list yum list | grep yum install yum remove 拓展 1.yum install -y man-pages 2.切换yum源 3.yum install -y epel-release 4. yum install -y lrzsz rz指令 sz指令 在window系统上&#xff0c;我们会在电脑自带的应用商…

Android Studio使用Genymotion

1. Genymotion介绍 GenyMotion速度之快令人发指&#xff0c;模拟效果堪比真机调试&#xff0c;支持绝大部分的模拟器功能&#xff0c;甚至包括语音&#xff0c;Google Now&#xff0c;支持eclipse, android studio。非常适合用来开发和演示效果。 2. Genymotion下载 Genymotio…

上 GitHub 热榜,星星暴涨,这个项目相继超越了 Archery, Flyway 和 Yearning

「 登上 GitHub Trending 星星超越 Yearning 键盘的敲击不停 传播开发的福音 」⚡️ Bytebase 是一款面向开发和 DBA 的一站式数据库 CI/CD 工具。它的所有代码都开源在 GitHub 上。GitHub 也是我们触达全球用户的核心阵地。虽然 GitHub Star 数一直是一个饱受争议的指标&a…

深度学习模型压缩方法:剪枝方法分类介绍

本文将介绍深度学习模型压缩方法中的剪枝,内容从剪枝简介、剪枝步骤、结构化剪枝与非结构化剪枝、静态剪枝与动态剪枝、硬剪枝与软剪枝等五个部分展开。 一、剪枝简介 在介绍剪枝之前,首先介绍过参数化这个概念,过参数化主要是指在训练阶段,在数学上需要进行大量的微分求解…

外贸函电开发信模板?写客户开发邮件方法?

如何写好外贸函电开发信&#xff1f;英语函电中的开发信怎么写&#xff1f; 在国际贸易中&#xff0c;外贸函电开发信扮演着至关重要的角色。这是一种有效的沟通工具&#xff0c;用来建立和维护与潜在客户或合作伙伴的联系。在这篇文章中&#xff0c;蜂邮将为您提供一个外贸函…

数字化营销的未来:TikTok在圣诞季的流量引爆与转化

随着数字化时代的发展&#xff0c;社交媒体平台成为品牌数字营销不可或缺的一部分。而TikTok&#xff0c;以其独特的短视频形式和强大的用户基础&#xff0c;正逐渐崭露头角。本文将探讨TikTok在圣诞季的数字化营销策略&#xff0c;着重分析流量的引爆和转化&#xff0c;以及数…

深入了解 npm 命令

目录 前言1 初始化项目2 安装依赖3 更新依赖4 发布包5 卸载包6 查看依赖7 运行脚本8 包搜索9 查看包信息结语 前言 在现代 Web 开发中&#xff0c;JavaScript 是一种至关重要的语言&#xff0c;而 npm&#xff08;Node Package Manager&#xff09;作为 Node.js 平台的默认软件…

@WebParam(name = “param“) 这个注解的作用

WebParam 是 JAX-WS&#xff08;Java API for XML Web Services&#xff09;中的一个注解&#xff0c;用于定义 Web 服务操作中参数的详细信息。这个注解主要用于 Web 服务方法的参数上&#xff0c;以提供有关如何映射和处理这些参数的额外信息。 主要用途 指定参数名称&#…

图像卷积操作

目录 一、互相关运算 二、卷积层 三、图像中目标的边缘检测 四、学习卷积核 五、特征映射和感受野 一、互相关运算 严格来说&#xff0c;卷积层是个错误的叫法&#xff0c;因为它所表达的运算其实是互相关运算&#xff08;cross-correlation&#xff09;&#xff0c;而不是…

2023_Spark_实验三十二:消费Kafka数据并保存到MySQL中

实验目的&#xff1a;掌握Scala开发工具消费Kafka数据&#xff0c;并将结果保存到关系型数据库中 实验方法&#xff1a;消费Kafka数据保存到MySQL中 实验步骤&#xff1a; 一、创建Job_ClickData_Process 代码如下&#xff1a; package examsimport org.apache.kafka.clien…

【C++初阶】第一站:C++入门基础(下)

前言&#xff1a; 紧接着上两篇文章&#xff0c;c入门基础(上)&#xff1a;C入门基础(上) c入门基础(中)&#xff1a;C入门基础(中) 继续补充完c初阶入门基础的知识点&#xff0c;本章知识点包括&#xff1a; 引用和指针的区别、内联函数、auto关键字(C11)、基于范围的for循环…

开源投票微信小程序源码系统+超强的盈利模式+礼物道具刷不停+完整的代码包 附带安装部署教程

微信小程序的日益普及&#xff0c;越来越多的企业和开发者开始关注如何利用小程序进行业务拓展和创新。投票微信小程序源码系统就是在这样的背景下应运而生。这款源码系统旨在为广大开发者提供一个功能强大、易于扩展的投票系统&#xff0c;以满足各种行业和场景的需求。 以下…

vp与vs联合开发-Ini配置文件

1.*.ini文件是Initialization file的缩写&#xff0c;即为初始化文件&#xff0c;是Windows系统配置文件所采用的存储格式&#xff0c;统管Windows的各项配置&#xff0c; 2.可以用来存放软件信息、注册表信息等 3.可以使用代码方式和手动编辑操作 &#xff0c;一般不用直接编辑…

工业互联网平台存在意义是什么?国内有哪些工业互联网平台?

一、工业互联网平台存在意义是什么&#xff1f; 工业互联网平台是一个连接设备与服务、数据与人的跨行业、跨领域的全新工业平台。工业互联网平台利用了互联网、物联网、大数据、AI等技术&#xff0c;集成各类工业设备&#xff0c;不断采集和分析数据&#xff0c;以实现设备状…

分享一些实用工具和学习网站

1 前言 虽然已经工作过几年的时间了&#xff0c;但是学习的脚步是不能停止的&#xff0c;对于学习&#xff0c;特别是自学&#xff0c;善于搜索网上的一些资源来辅助&#xff0c;还是非常有必要的&#xff0c;下面我就把这几年私藏的各种资源&#xff0c;网站贡献出来给你们。…

外汇天眼:五大常见交易心理陷阱,你中了几个?

抗争的心理 我们从小所受的教育都是建立在抗争和竞争的基础上&#xff0c;如征服自然&#xff0c;战胜各种艰难障碍&#xff0c;与困难搏斗。 这种意识已经深深地扎根于我们的内在。 当我们进入证券市场还是带着这样的心理意识。 我们常常看到一些各行各业的精英来到证券市场…

SAP ABAP 双击回应

导语&#xff1a;最近在做带自定义屏幕的功能开发&#xff0c;用户希望点击屏幕上的内容进行穿透。 一、需求 用户希望点击下面屏幕上的客户代码&#xff0c;穿透到BP界面&#xff0c;这种功能在SAP标准的屏幕上屡见不鲜&#xff0c;研究一下了&#xff0c;这个属于屏幕上的【…

算法----Dota2 参议院

题目 Dota2 的世界里有两个阵营&#xff1a;Radiant&#xff08;天辉&#xff09;和 Dire&#xff08;夜魇&#xff09; Dota2 参议院由来自两派的参议员组成。现在参议院希望对一个 Dota2 游戏里的改变作出决定。他们以一个基于轮为过程的投票进行。在每一轮中&#xff0c;每…

64. 最小路径和已解答 23.12.07(一)补

给定一个包含非负整数的 m x n 网格 grid &#xff0c;请找出一条从左上角到右下角的路径&#xff0c;使得路径上的数字总和为最小。 说明&#xff1a;每次只能向下或者向右移动一步。 示例 1&#xff1a; 输入&#xff1a;grid [[1,3,1],[1,5,1],[4,2,1]] 输出&#xff1a;7…