小罗碎碎念
还未从microRNA的知识海洋中抽身出来,又要面对受限玻尔兹曼机带来的冲击。
这两天随着诺贝尔奖的公布,学术界可谓是热闹非凡,我也正好趁着这个机会,拾起停更半个月的公众号。
作为医学人工智能研究大军中的一员,诺贝尔生理学或医学奖是必须要关注的,因为获奖者的研究方向一定程度会影响未来的临床研究趋势。说实话,我也真心没想到,诺贝尔物理学奖有一天居然会和自己研究的领域如此接近——发给了Hinton老爷子。
对于microRNA我不是很了解,所以这篇推文我会先介绍一下microRNA的背景知识,然后分析一下这届诺贝尔奖对医学AI的影响。
推文目录
一、microRNA
简介
二、microRNA
在肿瘤中的应用
三、microRNA
&circularRNA
在鼻咽癌中的应用
四、人工智能在microRNA
中的应用
一、microRNA简介
北京时间2024年10月7日17:30,2024年诺贝尔生理学或医学奖揭晓,授予美国科学家维克托·安布罗(Victor Ambros)和美国生物学家加里·鲁夫昆(Gary Ruvkun),以表彰他们发现了微小核糖核酸(microRNA)及其在转录后基因调控中的作用。
在介绍分子生物学的基础知识时,我们通常会从遗传信息的存储和表达开始。基因是遗传信息的载体,它们储存在DNA中。这些信息需要被“解读”并转化为具有生物学功能的蛋白质。在这个过程中,mRNA(信使核糖核酸)扮演了至关重要的角色。
首先,让我们来重温一下mRNA的作用。mRNA可以被视作是遗传信息的“快递员”。它的开头的“m”,也正是“信使”(messenger)的意思。通常来说,基因里的遗传信息首先会被转录成mRNA,然后mRNA会携带这些信息到细胞质中,在那里被翻译成蛋白质,行使生理功能。
RNA种类繁多,功能多样,但最主要的作用是引导蛋白质的合成,这也是生命的基础。在RNA的众多种类中,有一种特殊的RNA叫做microRNA(微小核糖核酸)。microRNA是一类内源性非编码型RNA(核糖核酸),它们的长度很短,仅约为22个左右的核苷酸,因此这种非编码小核糖核酸分子也被称作微小RNA(microRNA)。
microRNA本身在细胞分化、生物发育及疾病发生发展过程中发挥着巨大作用。它们通过与目标mRNA结合,调控其稳定性和翻译效率,从而影响蛋白质的合成。在人类健康领域,microRNA的研究具有重要意义。在阐明microRNA和某种疾病的关系后,某些microRNA有可能成为疾病诊断的生物标志物。
同时,这些microRNA还可能成为药物作用的靶点,可针对这些microRNA开展新药研发。在科学研究领域,microRNA的上调或下调已被用于鉴定特定基因功能。这种调控机制为理解复杂的生物学过程提供了新的视角。
在疾病诊断和预后方面,当恶性肿瘤发生时,某些microRNA的表达量会出现变化。通过分析这些特定的microRNA组合,可以实现部分癌症的早期诊断,这对于提高患者的生存率至关重要。
在治疗领域,由于miRNA是调控肿瘤发生的许多关键因素,利用microRNA进行肿瘤治疗正获得广泛关注。例如,通过设计特定的小分子或药物来调节异常表达的microRNA,可以抑制肿瘤细胞的生长,甚至诱导其死亡。
总的来说,microRNA在分子生物学和医学领域中扮演着越来越重要的角色,它们不仅是基因表达调控的关键分子,也是未来疾病诊断和治疗的潜在靶点。随着研究的深入,我们有望开发出更多基于microRNA的诊断工具和治疗方法,为人类健康带来更多的希望。
二、microRNA在肿瘤中的应用
在这一部分,我挑选三篇顶刊,大致的介绍一下microRNA在肿瘤研究中的应用现状。
第一篇文章属于偏临床的综述,方便我们快速的建立起对与microRNA对认识。
第二篇文章结合microRNA和mRNA,训练神经网络,进而区分结直肠癌转移的分子亚型,如果对这方面感兴趣的,可以好好看看。
第三篇文章结合病理和空间转录组学,这个方向未来一定会出大文章,资本也会持续跟进,有实力的速度抢占阵地!!
2-1:nature reviews cancer|肾上腺皮质癌的分子机制与治疗新策略
这篇文章综述了肾上腺皮质癌的分子基础研究进展,探讨了其遗传变异、表观遗传学改变、代谢组学特征以及潜在的治疗靶点。
在这篇综述中,microRNA(miRNA)被视为肾上腺皮质癌(ACC)研究中的关键因素,因为它们在肿瘤的发展、进展和预后中起着重要作用。miRNA是一类小的非编码RNA分子,它们通过与信使RNA(mRNA)结合来调控基因的表达,从而控制蛋白质的产生。在ACC中,特定的miRNA可能被过度表达或抑制,这会影响肿瘤细胞的生物学行为。
miRNA在肿瘤研究中的作用:
-
作为生物标志物:miRNA可以作为诊断和预后的标志物。例如,某些miRNA(如miR-483-5p和miR-195)在ACC中的表达水平与良性肾上腺皮质腺瘤不同,因此可以用于区分良恶性肿瘤。
-
参与肿瘤发展:特定的miRNA可能在ACC的发展中起到促进或抑制作用。例如,miR-503在ACC中的表达增加,与肿瘤和腺瘤的区分有关。
-
影响治疗反应:miRNA的表达水平可能影响肿瘤对治疗的反应。一些miRNA可能与治疗敏感性或抗药性有关。
-
作为治疗靶点:鉴于miRNA在调控基因表达中的作用,它们可以作为潜在的治疗靶点。通过调节特定miRNA的活性,可能有助于开发新的治疗方法。
文章中还提到了一些具体的miRNA,如miR-483-5p、miR-195、miR-503等,它们在ACC中的表达水平与肿瘤的侵袭性和预后密切相关。此外,一些研究已经探索了通过调节这些miRNA来抑制肿瘤生长的可能性。
总之,miRNA在肾上腺皮质癌的研究中扮演着多方面的角色,包括作为生物标志物、参与肿瘤发展、影响治疗反应和作为潜在的治疗靶点。这些发现为未来针对ACC的精准医疗提供了新的思路。
2-2:JAMA Oncology|结直肠癌肝转移的分子亚型与临床风险分层
这篇文章报道了一项研究,该研究通过独立的3期临床试验验证了结直肠癌肝转移的三种分子亚型,并探讨了它们在个性化治疗中的潜在应用。
在这篇文章中,microRNA(miRNA)作为分子亚型分类的一部分,与mRNA一起被用于训练神经网络分类器,以预测结直肠癌肝转移的分子亚型。miRNA是一类小分子非编码RNA,它们在调控基因表达方面起着重要作用,包括在癌症发展中的调控作用。
以下是文章中提到的miRNA的一些关键作用:
-
分子亚型分类:在发现队列中,研究者使用miRNA和mRNA的表达数据来训练一个神经网络分类器,以区分三种分子亚型:典型型、免疫型和基质型。
-
预测模型的特征:分类器的31个特征中包括7个miRNA,这些miRNA被选为分类器的一部分,因为它们在不同亚型中的表达模式有助于区分这些亚型。
-
验证生物学表型:使用单样本基因集富集分析(ssGSEA)和免疫解卷积分析,研究者确认了计算出的分子亚型在验证队列中具有预期的生物学表型。miRNA的表达模式与特定的生物学过程相关联,有助于验证每种亚型的生物学特性。
-
预后价值:miRNA的表达水平与无进展生存期(PFS)和总生存期(OS)相关,这表明miRNA可能在结直肠癌肝转移的预后中发挥作用。
-
治疗反应的潜在预测因子:文章还暗示了这些分子亚型(包括miRNA表达模式)可能作为预测生物标记物,有助于个性化治疗决策。
总的来说,miRNA在这篇文章中作为分子分类的一部分,有助于更好地理解结直肠癌肝转移的生物学特性,并可能作为未来治疗策略的预测工具。
2-3:Cell|高精度空间转录组分析:Patho-DBiT技术助力病理学研究
这篇文章介绍了一种名为Patho-DBiT的新技术,能够在临床FFPE样本中实现高精度的空间全转录组测序,揭示了RNA生物学的丰富信息,为病理学研究和疾病诊断提供了新的工具。
在这篇文章中,microRNA作为非编码RNA的一种,其空间表达模式在临床样本中被Patho-DBiT技术所检测和分析。microRNA在调控基因表达方面发挥着重要作用,通常通过结合信使RNA(mRNA)来抑制其翻译或促进其降解。
文章中提到microRNA的几个关键作用和发现:
-
空间表达谱:Patho-DBiT检测了1,063个microRNA在E13小鼠胚胎切片中的表达,揭示了它们在不同组织区域的分布模式。
-
与mRNA的协同分析:文章中提到了microRNA与mRNA的共表达分析,这有助于理解它们在细胞功能和疾病中的调控网络。
-
肿瘤发展和进展:在肿瘤样本(如AITL和MALT淋巴瘤)中,特定microRNA的表达模式与肿瘤细胞的生物学行为相关,可能参与了肿瘤的发展和进展。
-
microRNA调控网络:文章中对microRNA的调控网络进行了分析,揭示了它们在肿瘤发生中的作用,包括与肿瘤细胞标志物的关联。
-
诊断和治疗潜力:microRNA的特定表达模式可能作为诊断标记或治疗靶点,尤其是在区分肿瘤和非肿瘤区域时。
-
与病理学的关联:通过与病理切片的比较,microRNA的表达模式与组织病理学特征相吻合,这表明它们在病理诊断中的潜在应用。
-
预后和治疗反应:microRNA的表达水平可能与患者的预后和治疗反应相关,有助于指导个性化医疗。
文章中特别提到了miR-142、miR-155、miR-21等microRNA在肿瘤生物学中的作用,它们在肿瘤发展中的表达变化可能对理解肿瘤的分子机制和开发新疗法具有重要意义。
三、microRNA&circularRNA在鼻咽癌中的应用
因为小罗是研究鼻咽癌的,所以这一部分,我会列举三篇与鼻咽癌结合的顶刊。
第一篇和第三篇研究的是circularRNA在NPC中的作用,第二篇研究的是microRNA在NPC中的作用。
3-1:Mol Cancer|circPVT1: 鼻咽癌预后和治疗的新靶点
这篇文章研究了环状RNA circPVT1在鼻咽癌中的高表达及其通过β-TrCP/c-Myc/SRSF1正反馈循环促进癌症转移的作用。
在这篇文章中,circular RNA(circRNA)特别是circPVT1在鼻咽癌(NPC)的发展和转移中扮演了一个关键角色。
-
高表达: circPVT1在鼻咽癌的细胞和组织样本中表达显著上调。
-
促进侵袭和转移: 研究表明,circPVT1能够促进鼻咽癌细胞的侵袭和转移。
-
与β-TrCP的相互作用: circPVT1通过与E3泛素连接酶β-TrCP结合,抑制了β-TrCP介导的c-Myc蛋白的泛素化和降解。
-
稳定c-Myc: 通过与β-TrCP结合,circPVT1稳定了c-Myc蛋白,c-Myc是一种在多种癌症中促进肿瘤发展的转录因子。
-
影响细胞骨架和黏附: circPVT1通过稳定c-Myc,进一步调节与细胞黏附和细胞骨架重塑相关的基因表达,促进了鼻咽癌细胞的迁移和侵袭。
-
正反馈循环: c-Myc能够转录性地上调SRSF1的表达,并招募SRSF1以增强circPVT1的生物合成,形成了一个正反馈循环,进一步促进circPVT1的产生和癌细胞的转移。
-
潜在的生物标志物和治疗靶点: 文章提出circPVT1可能作为鼻咽癌患者的预后生物标志物或治疗靶点。
总结来说,circPVT1在鼻咽癌中的作用是多方面的,它通过与关键蛋白相互作用和参与正反馈循环来促进癌症的进展和转移。
3-2:nature communications|EBV编码miRNAs调节PD-L1表达的分子机制研究
这篇文章研究了EBV编码的miR-BART11和miR-BART17-3p如何通过靶向FOXP1和PBRM1来上调PD-L1表达,进而促进肿瘤免疫逃逸。
在这篇文章中,微小RNA(miRNA)扮演着调控基因表达的重要角色,特别是在EBV病毒与肿瘤发展的关系中。具体来说,文章研究了EBV编码的两种miRNA:BART11和BART17-3p,它们通过以下机制影响肿瘤细胞的免疫逃逸:
-
靶向转录因子:miR-BART11和miR-BART17-3p分别靶向FOXP1和PBRM1这两个转录因子。正常情况下,FOXP1和PBRM1能够抑制PD-L1的表达。
-
抑制PD-L1抑制因子:通过降低FOXP1和PBRM1的表达,miR-BART11和miR-BART17-3p间接上调了PD-L1的表达水平。
-
增强PD-L1转录:文章指出,FOXP1和PBRM1能够与PD-L1的增强子区域结合,抑制其转录。而miRNA通过抑制这两个转录因子,减少了它们对PD-L1增强子区域的抑制作用,从而增强了PD-L1的转录。
-
促进肿瘤免疫逃逸:由于PD-L1在肿瘤细胞表面的表达增加,可以与T细胞表面的PD-1受体结合,抑制T细胞的活性,使肿瘤细胞能够逃避免疫系统的监视和攻击。
-
潜在的治疗靶点:文章还暗示了通过靶向这些miRNA来降低PD-L1表达,可能有助于提高EBV相关肿瘤对免疫治疗的响应。
总结来说,miRNA在本文中的作用是作为EBV病毒调控宿主细胞基因表达的工具,通过精细调控与免疫逃逸相关的基因,影响肿瘤的发展和对治疗的响应。
3-3:Mol Cancer|鼻咽癌中circCAMSAP1的高表达及其促癌机制研究
这篇文章研究了环状RNA circCAMSAP1在鼻咽癌中的高表达及其通过SERPINH1/c-Myc正反馈回路促进肿瘤增殖和转移的作用。
在文章中,circular RNA(circRNA)circCAMSAP1被发现在鼻咽癌(NPC)中扮演着重要的角色。
-
促进增殖和转移: circCAMSAP1在NPC组织中表达水平较高,能够促进NPC细胞的增殖和转移。
-
结合mRNA: circCAMSAP1能够通过结合SERPINH1 mRNA的3’非翻译区(3’UTR),提高SERPINH1 mRNA的稳定性,从而增加SERPINH1蛋白的表达。
-
形成正反馈循环: circCAMSAP1通过促进SERPINH1的表达,进而影响了c-Myc的稳定性。高水平的SERPINH1减少了c-Myc的泛素化和降解,从而增加了c-Myc的表达。c-Myc是一种转录因子,可以与SRSF10合作促进CAMSAP1前mRNA的转录和回剪接,形成更多的circCAMSAP1,从而形成一个正反馈循环。
-
作为潜在的生物标志物和治疗靶点: 文章提出circCAMSAP1-SERPINH1-c-Myc正反馈可能在NPC的发展中起关键作用,这表明circCAMSAP1可以作为NPC患者的预后生物标志物或潜在的治疗靶点。
-
提高mRNA稳定性: 与线性mRNA相比,circRNA通常更稳定,因为它们不受RNase的降解,这有助于它们在细胞中执行功能。
-
细胞内定位: circCAMSAP1主要定位在细胞质中,这与其功能和作用机制有关。
综上所述,circCAMSAP1通过与特定mRNA结合,影响关键蛋白的表达,进而参与调控鼻咽癌的生物学过程。
四、人工智能在microRNA中的应用
4-1:机器学习揭示DNA甲基化在胰腺癌诊断中的应用
这篇文章通过机器学习方法,利用DNA甲基化标记,成功区分了胰腺癌和慢性胰腺炎,为胰腺癌的诊断提供了新的生物标志物。
模型流程
-
数据收集:研究团队首先收集了345个组织样本,包括胰腺癌、慢性胰腺炎和健康对照组的样本。这些样本用于分析DNA甲基化、mRNA和microRNA的表达水平。
-
机器学习模型建立:使用随机森林机器学习方法,研究者建立了模型来分析上述生物标志物。随机森林是一种集成学习方法,它通过构建多个决策树并进行投票来提高预测的准确性。
-
特征选择:研究者从全基因组数据中筛选出最有区分度的特征,即DNA甲基化位点。他们比较了不同组样本间的差异,选择了差异显著的甲基化位点作为特征。
-
模型训练与验证:使用部分样本对模型进行训练,然后用留出的数据进行测试,以验证模型的诊断性能。通过交叉验证的方式,研究者优化了模型参数,确保模型具有良好的泛化能力。
-
低维嵌入和可视化:使用UMAP(Uniform Manifold Approximation and Projection)方法将高维数据降维,以便于在低维空间中可视化不同样本的分布情况。
-
诊断准确性评估:通过计算模型的AUC(Area Under the Curve)值,研究者评估了模型区分PDAC和CP的能力。AUC值越接近1,说明模型的诊断准确性越高。
-
独立样本验证:研究者使用独立的样本集对模型进行验证,以确保模型的稳健性和可靠性。
-
液体活检样本分析:研究者进一步在液体活检样本(如血液中的游离DNA)中验证了这些甲基化标记的诊断准确性。
通过这些步骤,模型成功地识别出了能够区分胰腺癌和慢性胰腺炎的DNA甲基化标记,为临床诊断提供了新的可能。
4-2:泛癌分析揭示细胞游离免疫相关miRNA作为早期癌症检测的强有力生物标志物
这篇文章报道了一项大规模的泛癌研究,通过分析15,832名参与者的循环微小RNA(miRNA)谱,建立了一个基于细胞游离免疫相关miRNA(cf-IRmiRNA)的早期癌症检测标志物,该标志物在多个癌症类型中显示出高准确性和可靠性。
模型流程
-
数据集划分:将15,832名参与者的循环miRNA数据随机分为训练集、验证集和测试集(比例为7:2:1),并额外设置了一个外部测试集。
-
差异表达分析:在训练集中识别出100个在恶性肿瘤和非恶性对照组之间差异表达的cf-IRmiRNAs(|logFC| > 1, P值 < 0.01)。
-
特征选择:使用最小绝对收缩和选择算子(LASSO)方法从差异表达的miRNAs中筛选出39个miRNAs。
-
机器学习算法:采用五种机器学习算法(逻辑回归、LASSO回归、支持向量机(SVM)、随机森林(RF)和极端梯度提升(XGBoost))来构建基于选定cf-IRmiRNAs的诊断分类器。
-
模型训练与验证:通过5折交叉验证和网格搜索对模型进行参数调整,以优化模型性能。在验证集上,基于XGBoost算法的分类器显示出优异的癌症检测性能(AUC:0.984)。
-
性能评估:在测试集和外部测试集上进一步评估分类器的可靠性和有效性,确认了分类器的诊断性能(AUC:0.980至1.000)。
-
癌症类型的区分:使用t-SNE分析在低维空间中可视化不同癌症类型基于差异表达cf-IRmiRNAs的差异。
-
诊断指数计算:计算基于cf-IRmiRNAs签名的诊断指数,该指数在恶性肿瘤样本中的得分高于非恶性样本。
-
ROC分析:通过接收者操作特征曲线(ROC)分析确认分类器在不同组织中区分良恶性病变的有效性。
通过这些步骤,人工智能不仅分析了miRNA的表达模式,还构建了一个高效的癌症检测模型,能够区分早期癌症和良性病变。
4-3:预测妊娠期高血压严重程度的ex-miRNA生物标志物研究
这篇文章通过应用机器学习方法从小RNA测序数据中鉴定出多个外泌体微小RNA(ex-miRNA)生物标志物,用于早期诊断和预测妊娠期高血压疾病的严重程度。
在这篇文章中,机器学习方法被应用于通过小RNA测序技术获得的母体血清样本数据,以识别和验证用于早期诊断和预测妊娠期高血压(preeclampsia, PE)严重程度的外泌体微小RNA(ex-miRNA)生物标志物。
-
数据预处理:首先对母体血清样本进行小RNA测序,获得ex-miRNA的表达数据。
-
模式识别:使用机器学习算法分析不同高血压疾病类别之间的ex-miRNA表达模式。
-
特征选择:通过迭代的方法和机器学习(如XGBoost)识别出能够区分PE病例与对照组的miRNA生物标志物。
-
模型训练与验证:将数据集分为训练集(discovery cohort)和验证集(verification cohort),使用训练集构建模型,然后在验证集上评估模型的性能。
-
生物标志物筛选:通过比较不同miRNA生物标志物的敏感性、特异性、阳性预测值(PPV)和阴性预测值(NPV),筛选出最佳的生物标志物组合。
-
结果分析:分析选定的miRNA生物标志物在不同高血压疾病亚型中的表达情况,并探讨它们与临床特征之间的关联。
-
独立验证:在独立的小样本队列中验证所选生物标志物的诊断性能。
通过这种方法,研究者能够从大量的候选生物标志物中筛选出表现最佳的几个miRNA生物标志物,并验证它们在独立样本中的有效性,展示了AI在生物医学研究中的应用潜力。