识别肿瘤内微生物的生物信息学工具—MEGA

news2024/10/6 5:59:46

谷禾健康

在这里插入图片描述

已有研究证明宿主微生物癌症预防和治疗反应中的关键作用,了解宿主微生物和癌症之间的相互作用,可以推动癌症诊断和微生物治疗(即用微生物作为药物)。

然而肿瘤内微生物组数据通常是复杂的,想要厘清相互关系也是极为困难的,有许多可能导致虚假关联的混杂因素,还需要足够多样本的大型数据集进行分析。

近期,研究人员开发了一个生物信息学工具——MEGA,这是一个基于深度学习的Python包,用于识别癌症相关的肿瘤内微生物

该模型使用ORIEN(Oncology Research Information Exchange Network)的RNA-seq测序数据进行训练,以识别12种人类癌症最相关的微生物。本文我们来详细了解一下。

01
方 法

在这里插入图片描述

1. 使用ORIEN数据集和两个数据库依赖项作为数据源

ORIEN数据集包括2891份样本中的2603个种水平物种以及对应的癌症类型元数据

NJS16代谢数据库是通过对大量文献的整理和分析构建的,旨在提供关于微生物种间相互作用代谢活动的信息,内含约570种微生物物种和3种人类细胞类型;

NCBI数据库,从中提取ORIEN数据集中物种的系统发育关系

2. 生成用于图神经网络训练的人工智能准备数据

准备数据包括筛选后的数据归一化的相对丰度矩阵(相对丰度大于0.1%的物种)、代谢关系网络系统发育关系网络

3. 深度学习模型训练后,根据样本水平上每个物种的attention scores,选择与癌症相关的微生物特征

利用之前开发的基于PyTorch(v1.4.0)实现的heterogeneous graph转换模型进行训练。

heterogeneous graph转换模型是一种用于处理不同类型节点它们之间关系的模型,在这个场景中,节点代表了微生物物种和样本,而表示它们之间的关系

为了训练这个模型,使用了两个自编码器来生成每个节点的密集向量,每个向量都是256维,这些向量作为深度学习模型的输入值,用于学习样本和物种之间的关系。

训练中,使用Adam优化器,并设置学习率为0.003,其他超参数的默认设置为:

  • n_hid=128
  • KL_COEF=0.00005
  • THRES=3

Focal Loss函数用于量化预测癌症类型标签与真实标签之间的差异。当评估指标连续5个epoch没有改善时,学习率会降低0.5倍。最终生成attention score值作为重要的训练结果。

这个分数表示源节点对目标节点的重要性

较高的分数表示该物种在样本中具有较高的代表性,然后通过计算具有较高分数的每个物种在癌症类型中的样本数量,确定与癌症类型显著相关的物种,p值小于0.05的物种被认为与癌症类型显著相关。

4. 最终识别出的与癌症相关的微生物群落结果将输出为以tab分隔的文件,可用于后续的可视化操作

结果可以以UpSet图进行展示,也可以通过Cytoscape软件生成网络图。

MEGA的Github地址:

https://github.com/OSU-279BMBL/MEGA

02
使用MEGA识别ORIEN数据集中与癌症相关的微生物

MEGA在ORIEN数据集中鉴定出了来自12种癌症类型的73种独特的微生物群落。

分析结果显示,在12种癌症类型的微生物群落中有15个物种是共有的。而在结肠腺癌、直肠腺癌其它结直肠癌中,有8种物种是独属于它们的。

下图展示了已确定的物种癌症类型的分布

在这里插入图片描述

条带的宽度指示该癌症中检测到的物种总数,并且与各自存在的物种相连。

COAD(结肠腺癌); 肺腺癌(LUAD); LUSC(肺鳞状细胞癌);

OtherCR(未指明的其他结直肠癌类型);

OtherLung(未指明的其他肺癌类型);

OtherPancreatic(未指明的其他胰腺癌类型);

胰腺腺癌(PAAD); READ(直肠腺癌); SARC(肉瘤);

小细胞肺癌(SCLC); 皮肤黑色素瘤(SKCM);

THCA(甲状腺癌)

03
使用MEGA鉴定与结肠腺癌和甲状腺癌相关的微生物

为了展示MEGA的数据分析和解释能力,研究人员重点研究了结肠腺癌甲状腺癌的案例。

分析发现,有8种物种是只在结直肠相关癌症类型中共享的,分别为:

  • Bacteroides fragilis (脆弱拟杆菌)
  • Ruminococcus gnavus (活泼瘤胃球菌)
  • Bacteroides ovatus (卵形拟杆菌)
  • Lacrimispora saccharolytica
  • Odoribacter splanchnicus
  • Phocaeicola dorei
  • Phocaeicola vulgatus
  • Streptococcus porcinus

其中的Bacteroides fragilis, Ruminococcus gnavusBacteroides ovatus 这3个物种与之前的验证实验结果一致,这表明MEGA仅通过整合代谢和系统发育关系就成功鉴别出了这些物种。

结直肠癌

通过整合物种与代谢之间的关系,发现在结肠腺癌中,Fusobacterium nucleatum具有较强的代表性,而在小鼠模型的研究中,它通过改变黏膜微生物群和结肠转录组促进了结直肠癌的进展

Ruminococcus gnavus与结肠腺癌的相关性较弱,其丰度与结直肠癌肿瘤数量和疾病评分呈显著负相关

然而,这两种菌Fusobacterium nucleatumRuminococcus gnavus 共享了同一种代谢物——N- Acetylneuraminate acid,它参与的细胞间的黏附事件在结直肠癌的血管生成、转移和生长控制中可能起着重要作用

Ruminococcus gnavus还与Bacteroides fragilis 共享了同一种代谢物L-Fucose,而最近的研究发现,Bacteroides fragilis毒素可能有助于结直肠癌的形成。

甲状腺癌

甲状腺癌中,发现 Pseudomonas aeruginosaStaphylococcus aureus代谢物甘油三酯相关。而最近的研究表明,甘油三酯水平可能与甲状腺癌的发生风险相关。

通过整合物种的系统发育关系,能够发现与癌症相关性较弱的物种之间的关联。

例如,Bacteroides ovatus(卵形拟杆菌)在以往的研究被证明是结肠癌中的代表物种之一,但在MEGA的分析中,它与结肠腺癌的关联较弱,很有可能被遗漏,但通过分析Bacteroides fragilis的系统发育,依旧被识别出了。

在这里插入图片描述

图为结肠腺癌和甲状腺癌中已鉴定微生物群落的网络可视化。圆形节点指代微生物物种,黄色三角形节点指代代谢物,线条厚度表示物种与癌症之间关系的强度,灰色线条表示系统发育关系。

A) 结肠腺癌相关微生物与代谢物间的关联。

B) 甲状腺癌相关微生物与代谢物间的关联。

C) 结肠腺癌相关微生物与系统发育关系的关联。

D) 甲状腺癌相关微生物与系统发育关系的关联。

04
结 论

MEGA的开发代表着在识别和解读与癌症相关的肿瘤内微生物方面,迈出了重要一步。

研究中提出的深度学习模型可以识别与12种不同癌症类型相关的微生物特征,并将相关性的强弱通过attention scores进行了量化,通过网络图直观展示,从而可以更全面、更细致地理解相互关系

此外,研究人员认为将MEGA应用于单细胞RNA-seq数据,可以更详细地了解微生物群落与肿瘤细胞在细胞水平上的相互作用,从而为基于肿瘤内微生物多样性肿瘤异质性表征提供新的视角,也可能为癌症的治疗干预提供新的靶点。

参考文献:

Wang C, Ma A, McNutt ME, Hoyd R, Wheeler CE, Robinson LA, Chan CHF, Zakharia Y, Dodd RD, Ulrich CM, Hardikar S, Churchman ML, Tarhini AA, Singer EA, Ikeguchi AP, McCarter MD, Denko N, Tinoco G, Husain M, Jin N, Osman AEG, Eljilany I, Tan AC, Coleman SS, Denko L, Riedlinger G, Schneider BP, Spakowicz D, Ma Q. A bioinformatics tool for identifying intratumoral microbes from the ORIEN dataset. bioRxiv [Preprint]. 2023 May 24:2023.05.24.541982.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/723667.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

低代码平台——少量编码即可快速生成应用程序

低代码平台,即无需编码或通过少量代码就可以快速生成应用程序的开发平台。 低代码平台面向的是IT或者平民程序员,解决传统软件开发模式带来的周期长、成本高等问题,客户群体主要为软件开发公司或者拥有IT的中大型企业。而零代码(N…

API接口测试工具的几个特色

API接口测试工具在软件开发过程中起着举足轻重的作用。它们帮助测试人员快速发现和解决API接口的问题,并确保系统的稳定性和性能。本文将介绍API接口测试工具的几个特色,以及为什么它们对测试人员来说非常重要。 首先,API接口测试工具的一个特…

【uniapp】学习之【生命周期】

uniapp生命周期 uni-app框架的生命周期分为两种 : 应用中的生命周期 和 页面内的生命周期 uni-app 应用生命周期 uni-app 页面生命周期

微信公众号本地开发调试 - 无公网IP —— 内网穿透

文章目录 前言1. 配置本地服务器2. 内网穿透2.1 下载安装cpolar内网穿透2.2 创建隧道 3. 测试公网访问4. 固定域名4.1 保留一个二级子域名4.2 配置二级子域名 5. 使用固定二级子域名进行微信开发 前言 在微信公众号开发中,微信要求开发者需要拥有自己的服务器资源来…

软考:中级软件设计师:进程死锁,死锁的预防和避免,银行算法家,

软考:中级软件设计师:进程死锁 提示:系列被面试官问的问题,我自己当时不会,所以下来自己复盘一下,认真学习和总结,以应对未来更多的可能性 关于互联网大厂的笔试面试,都是需要细心准备的 &…

STM32:使用RS485和多摩川编码器通信

本文主要讲使用STM32F767和绝对式多摩川TS5700N8501编码器通信的流程和注意事项。 首先使用STM32CubeMX生成RS485驱动部分功能代码,注意该款编码器的波特率是2.5Mbps。 注意使能的GPIO可以使用其他管脚,我们的主控板使用的是PA8。前期可以这么配置。 配…

zabbix的安装

前提 作为一个运维,需要会使用监控系统查看服务器系统性能、应用服务状态和网站流量指标等,利用监控系统的数据去了解网站上线发布的结果和健康状态。 利用一个优秀的监控软件,我们可以: ●通过一个友好的界面进行浏览整个网站所有的服务器…

Linux—实操篇:用户管理

1、基本介绍 Linux系统是一个多用户多任务的操作系统,任何一个要使用系统资源的用户,都必须首先向系统管理员申请一个 账号,然后以这个账号的身份进入系统。 2、添加用户 基本语法: useradd 用户名 细节说明: 1、…

【Kafka】Kafka基础操作笔记

【Kafka】Kafka基础操作笔记 文章目录 【Kafka】Kafka基础操作笔记1. 两种模式1.1 点对点模式1.2 发布/订阅模式 2. 基础架构3. Topic命令行操作3.1 查看 Topic 操作3.2 创建 Topic3.3 查看所有 Topic3.4 查看 Topic 的详情3.5 修改分区数3.6 删除 Topic 1. 两种模式 Kafka作为…

Linux设备驱动基础04:Linux设备驱动中的互斥与同步(部分)

1 并发与竞态 1.1 竞态概念 1. 并发(Concurrency)是指多个执行单元在同一时间段内执行(但并不一定在同一时刻),而并发的执行单元对共享资源(包括硬件资源和软件资源)的访问就会导致竞态&#…

期货程序化交易软件文华财经和无限易那个成交速度快?自编软件能不能接CTP通道?

期货程序化交易软件是指可以根据预设的策略和条件,自动执行买卖指令的软件。期货程序化交易软件有很多种,不同的软件有不同的特点和优劣,选择哪一种要根据自己的需求和偏好。 期货程序化交易是指将交易思路用编程语言编写成计算机可以执行的指…

Zabbix 6.0 介绍及部署

目录 一、Zabbix 6.0 介绍1. 简介2. **利用一个优秀的监控软件带来的好处**3. **zabbix 6.0 的功能组件**4.zabbix 监控原理 二、Zabbix 6.0 部署 一、Zabbix 6.0 介绍 1. 简介 Zabbix 是由 Alexei Vladishev 创建,目前是由 Zabbix SIA 在持续开发和提供支持。zab…

2023秋招,软件测试面试八股文(有答案版),金九银十季,涨薪涨薪

最近呢有很多的小伙伴问我有没有什么软件测试的面试题,由于笔者之前一直在忙工作上的事情,没有时间整理面试题,刚好最近休息了一下,顺便整理了一些面试题,现在就把整理的面试题分享给大家,希望可以帮助到各…

途乐证券|指数反弹上行周期仍未结束 建议继续做多

股票的开盘价通常可以表示商场的情绪,一起还能影响投资者进行决策。那么股票低开好仍是高开好?股票低开高走再回落是什么意思?下面为我们预备了相关内容,以供参考。 股票低开好仍是高开好? 股票高开比较好。股票高开阐…

kali安装安全漏洞扫描工具Snyk

进kali,sudo su进入root用户 apt install npm 下载npm sudo npm install -g snyk 安装snyk snyk auth进行授权,会自动跳转到一个网页,我选的是github授权。 如果github上不去的话,物理机上面科学上网开个全局就行了,…

WWW(URL,HTTP,HTML)

1.WWW 万维网(World Wide Web,WWW),是一个规模巨大、可以互联的资料空间。该资料空间的资源依靠URL进行定位,通过HTTP协议传送给使用者,又由HTML来进行文档的展现。由定义可以知道WWW的核心由三个主要标准构成:URL、HTTP、HTML。(…

软件设计模式与体系结构-设计模式-行为型软件设计模式-访问者模式

目录 二、访问者模式概念代码类图实例一:名牌运动鞋专卖店销售软件实例二:计算机部件销售软优缺点适用场合课程作业 二、访问者模式 概念 对于系统中的某些对象,它们存储在同一个集合中,具有不同的类型对于该集合中的对象&#…

力扣算法练习(三)

目录 1. N 字形变换(6) 题解一(力扣官方解析力扣) 题解二(官方解法) 题解三(力扣) 2. 整数反转(7) 题解一 题解二 题解三(官方解析&#…

车辆在刹车不及时导致与行人发生碰撞事故,产生出险记录

车辆在刹车不及时导致与行人发生碰撞事故,是一种常见的交通事故。当发生此类事故时,车主需要及时处理保险理赔事宜,同时也需要了解车辆出险、理赔、事故记录情况,以便更好地维护车辆和自身权益。为方便车主查询车辆出险、理赔、事…

UI自动化测试工具能够做的几件事情

UI自动化测试工具在软件开发过程中发挥着重要的作用。它们可以帮助测试人员自动执行各种用户界面操作,验证界面功能和性能,提高测试效率和质量。本文将介绍UI自动化测试工具能够做的几件事情,并解释为什么它们对测试人员来说非常有价值。 首先…