TaxiBGC ——分类学指导下的生物合成基因簇鉴定流程

news2024/11/24 13:01:12

谷禾健康

在这里插入图片描述

当前合成基因簇预测限制较大

微生物基因组中的生物合成基因簇 (BGC) 编码具有生物活性的次级代谢物 (SM),它可以在微生物-微生物宿主-微生物相互作用中发挥重要作用。

鉴于次级代谢物的生物学意义和当前对微生物组代谢功能的深刻兴趣,从高通量宏基因组数据中无偏见地鉴定生物合成基因簇可以为微生物群的复杂化学生态提供新的见解。

目前可用于从鸟枪法宏基因组预测生物合成基因簇的工具有几个局限性,包括需要计算要求高的读取组装、预测范围窄,以及不提供次级代谢物产品。

为了克服这些限制,最近发在mSystems的一篇技术文章:

《TaxiBGC: a Taxonomy-Guided Approach for Profiling Experimentally Characterized Microbial Biosynthetic Gene Clusters and Secondary Metabolite Production Potential in Metagenomes》

在这里插入图片描述

介绍了他们的研发成果,他们开发了生物合成基因簇(TaxiBGC)的分类指导识别,这是一种命令行工具,用于通过首先精确定位可能存在合成基因簇的微生物物种来预测宏基因组中实验特征化的合成基因簇(并推断其已知的次级代谢物)。

并在各种模拟宏基因组上对TaxiBGC进行了基准测试,表明与通过将测序读数映射到BGC基因上来直接识别BGC(平均F1得分,0.49;平均PPV得分,0.41)相比,该分类法指导的方法可以预测BGC,其性能大大提高(平均F1分数,0.56;平均PPV得分,0.80)。

接下来,通过将TaxiBGC应用于人类微生物组项目的2650个宏基因组和各种病例对照肠道微生物组研究,我们能够将BGC(及其SM)与不同的人体部位多种疾病(包括克罗恩病和肝硬化)相关联

总之,TaxiBGC提供了一个计算机平台来预测实验表征的生物合成基因簇及其在宏基因组数据中的次级代谢物生产潜力,同时展示了优于现有技术的重要优势。

文章简介

TaxiBGC (Taxonomy-guided Identification of biosynthesis Gene Clusters),用于从鸟枪法宏基因组测序数据中预测实验表征的生物合成基因簇(BGCs)及其已知的次生代谢物(SMs)(也称为天然产物)。

SMs是一组低分子量、结构多样、具有生物活性的化合物,这些化合物包括细菌真菌细胞间的信号分子、色素、细菌素和铁载体,已知它们主要介导了微生物生态系统中的关键相互作用

此外,微生物次生代谢物是抗生素、抗真菌药、抗癌药、免疫抑制剂和其他药物的重要来源。例如,生物碱被发现对人类癌细胞系具有细胞毒性活性,并抑制耐甲氧西林金黄色葡萄球菌(MRSA)和耐万古霉素肠球菌(VRE)的生物膜形成。而微生物中主要负责合成、修饰和输出次生代谢物的基因通常存在于生物合成基因簇中。

TaxiBGC的计算流程

TaxiBGC计算流程主要有三个步骤,如下图。

第一步使用Metaphan3对宏基因组进行物种注释

第二步通过查询TaxiBGC参考数据库中的这些物种(第一步中得到的)来进行BGCs的初步预测

第三步使用BBMap基于序列比对来对初步预测的结果进一步确认

在这里插入图片描述

TaxiBGC参考数据库内容

TaxiBGC参考数据库提供了实验表征的生物合成基因簇、相应的次级代谢物以及来源物种(种水平或菌株)三者的映射关系

如下图,数据库内包含390个独特的携带BGCs的微生物物种,953个独特的实验表征的BGCs,以及总共1169个SMs。一个物种可携带的BGCs数量差异很大,在所有物种中,有217种(55.6%)只携带一个BGC(图B)。

BGC中的基因数量也有很大差异,953个BGCs中的大多数只有不到25个生物合成基因(图C),但大多数BGCs只产生1种SM(图E)。

在这里插入图片描述

TaxiBGC预测BGCs的性能

在TaxiBGC中,确定宏基因组中是否存在BGCs主要取决于以下两条标准:

  • BGC基因存在阈值,即被宏基因组读长覆盖的BGC基因的最小百分比长度;
  • BGC覆盖阈值,即在宏基因组中发现的BGC基因总数的比例。

为了确定这两个阈值,研究人员在125个模拟宏基因组上测试了400对BGC基因存在的阈值(以5%的增量,5%~100%区间)和BGC覆盖率(以5%的增量,5%~100%区间)。将预测的BGCs与实际BGCs进行比较,计算出F1分值。

在这里插入图片描述

如图A,当BGC基因存在阈值为5%且BGC覆盖阈值为10%时,TaxiBGC在所有模拟宏基因组中预测BGC的性能最佳(mean F1 score=0.56)。

图BCD分别为在最佳阈值下,不同数量的宏基因组样本、文库大小、携带BGC的物种的相对丰度状态下对TaxiBGC预测准确性的影响,结果推荐在至少1000万读长的宏基因组上使用TaxiBGC。

TaxiBGC的优势与不足

★ 优势

1. 可以直接用于宏基因组,无需基因组装;

2. 预测模拟宏基因组中BGCs的能力优于直接检测BGCs的方法;

3. TaxiBGC已经应用于以下9项已发表的病例对照研究中的1433个肠道微生物组(即粪便宏基因组)样本:

  • 3项克罗恩病(CD)研究
  • 4项结直肠癌(CRC)研究
  • 针对类风湿关节炎(RA)和肝硬化的各一项研究

在这些研究中都发现了与疾病相关的BGCs。

✦不足

1.当metaphan3无法识别所有携带BGCs的物种时,TaxiBGC将无法准确地预测整个BGCs的范围;

2.关于BGCs物种来源的预测需要谨慎解读,原因是在宏基因组的“mixed bag of genes”背景下,一个特定BGC的基因元件可能来自其它BGCs和多个物种;

3.虽然极力减少了假阳率,但可能出现假阴性

4.TaxiBGC只提供少数SM产物的化学家族,而不提供特定的分子结构,如糖肽脂和胞外多糖;

5.TaxiBGC目前只用于预测已知的BGCs,其预测不能扩展未经验证的BGCs。

参考文献

Approach for Profiling Experimentally Characterized Microbial Biosynthetic Gene Clusters and Secondary Metabolite Production Potential in Metagenomes. mSystems. 2022 Nov 15:e0092522. doi: 10.1128/msystems.00925-22. Epub ahead of print. PMID: 36378489.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/90930.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

通过 ffmpeg 串流对接 OBS 等直播软件

我们要将设备通过私有通道输出到 H264 流,传给 OBS 等直播软件使用。为此,设计了上图所示的串流工具。 设计思路 私有通道通过 API 接口提供 H264 流,要传给 ffmpeg ,最简单的方法是通过进程间管道传输数据。这里 Dump 工具直接…

2023最新SSM计算机毕业设计选题大全(附源码+LW)之java美丽华驾校信息管理系统t93d7

毕业设计也不需要做多高端的程序,毕业设计对于大多数同学来说,为什么感觉到难,最重要的一个原因,那就是理论课到实践课的转变,很多人一下不适应,本能开始拒绝,如果是一个考试,大家都…

使用自定义函数实现数据编解码、格式处理与业务告警

背景 在物联网平台的设备数据接入场景中,开发者总是希望平台接入的设备数据格式标准统一,以便对数据进行统一处理。在实际情况中,由于业务需要,平台常常会面对不同类型、不同厂商的设备接入。即使设备接入协议已经统一使用 MQTT …

傻白探索Chiplet,Chiplet技术带来的“新四化”(三)

目录 一、IP芯片化 二、异质集成(HeteroMaterial Integration) 三、异构集成(HeteroStructure Integration) 四、IO增量化 五、总结 一、IP芯片化 IP(Intelligent Property)是具有知识产权核的集成电…

腾讯前端常考vue面试题(必备)

虚拟DOM的优劣如何? 优点: 保证性能下限: 虚拟DOM可以经过diff找出最小差异,然后批量进行patch,这种操作虽然比不上手动优化,但是比起粗暴的DOM操作性能要好很多,因此虚拟DOM可以保证性能下限无需手动操作DOM: 虚拟DOM的diff和patch都是在一次更新中自动进行的,我们无需手动…

driftingblues2靶机(nmap提权)

环境准备 靶机链接:百度网盘 请输入提取码 提取码:9qkq 虚拟机网络链接模式:桥接模式 攻击机系统:kali linux 2021.1 信息收集 1.探测目标靶机 2.探测目标靶机开放端口和服务 3.用dirsearch扫描目录 dirsearch -u 192.168.…

π120E31兼容Si8620EC-B-IS 双通道数字隔离器

π120E31兼容Si8620EC-B-IS 双通道数字隔离器。具有出色的性能特征和可靠性,整体性能优于光耦和基于其他原理的数字隔离器产品。 传输通道间彼此独立,可实现多种传输方向的配置,可实现3.0kVrms隔离耐压等级和 DC 到 600Mbps 信号传输。该系列…

2023最新SSM计算机毕业设计选题大全(附源码+LW)之java校园兼职招聘系统x6u36

毕业设计说实话没有想象当中的那么难,导师也不会说刻意就让你毕设不通过,不让你毕业啥的,你只要不是太过于离谱的,都能通过的。首先你得要对你在大学期间所学到的哪方面比较熟悉,语言比如JAVA、PHP等这些,数…

腾讯会议一直显示正在加入会议如何处理?

我们在使用腾讯会议时,一直显示正在加入会议,但是经过很长时间也没有反应,这该怎么办?下面小编就给大家带来了相关的解决办法,说不定有用。 腾讯会议一直显示正在加入会议怎么办? 1、手机上打开腾讯会议。 …

交易所步入「后FTX 时代」,WEEX唯客等后发新秀拉开补位战?

太阳底下没有新鲜事,11月上旬 FTX此轮的骤然崩溃,再次证明了加密行业没有「大而不能倒」的神话,也在一定程度上引爆了加密行业的信任危机与流动性困境。 但把盖子掀开、暴露出里面的风险,未尝不是一件好事——缺乏风控合规的中心…

【剧前爆米花--爪哇岛寻宝】面向对象的三大特性——封装、继承以及多态的详细剖析(下——封装)。

作者:困了电视剧 专栏:《JavaSE语法与底层详解》 文章分布:这是一篇关于Java面向对象三大特性——封装的文章,在本篇文章中我会分享封装的一些基础概念以及实现。 目录 封装定义和优点 访问限定符实现封装 private限定符 priv…

深度学习-LeNet(第一个卷积神经网络)

文章目录简介数据集模型搭建模型训练模型测试前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站。 简介 LeNet模型是在1998年提出的一种图像分类模型,应用于支票或邮件编码上的手写…

双模蓝牙MIDI模块BT401的功能简单描述和蓝牙MIDI协议

目录 一、蓝牙MIDI概念和功能简述 蓝牙MIDI,实际上是由苹果公司推广并且应用的,目的是借助于低功耗蓝牙来实现 主机和设备之间的无线连接 。协议的标准也是苹果定的。目前也充分的应用到安卓平台了 二、详细记录--功能说明 2.1 蓝牙MIDI的测试说明--m…

【笔记】计算机组成原理复习重点——篇三

计算机组成原理复习重点笔记 第二篇 计算机系统的硬件结构 第3章 系统总线第4章 存储器第5章 输入输出系统 第3章 系统总线 3.1 总线的基本概念 一、为什么要用总线 计算机的各个系统功能部件连在一起才能协同工作,部件之间不可能采用全互联形式&…

MATLB|基于复杂网络的配电系统微电网优化配置

目录 一、概述 二、系统研究 三、复杂网络框架 四、结果与讨论 五、Matlab代码实现 一、概述 多年来,各个领域的科学家开发了一套广泛的工具:数学、计算和统计,旨在分析、建模和理解网络。网络研究的基础可以追溯到图论的发展&#xff0…

第三方软件测试机构如何选择?

什么是软件产品检测报告? 软件测试机构根据委托方提供的测试需求,对软件进行功能性的检测,保证软件功能能正常运行。 软件产品登记测试也是申请软件产品登记的必要条件,对于买方来说,通过第三方检测机构出具的测试报告…

yolov5修改骨干网络-使用自己搭建的网络-以efficientnetv2为例

yolov5修改骨干网络–原网络说明 yolov5修改骨干网络-使用pytorch自带的网络-以Mobilenet和efficientnet为例 yolov5修改骨干网络-使用自己搭建的网络-以efficientnetv2为例 增加网络的深度depth能够得到更加丰富、复杂的特征并且能够很好的应用到其它任务中。但网络的深度过深…

全面适配 Android12

本文目录 背景技术分析实战总结与展望 背景 2021 年 10 月 5 日 Google 发布 Android12 操作系统,安全性和隐私性大幅提升,各手机厂家陆续更新 Android12 操作系统。 2022 年随着各大 APP 应用市场推动 Android12 适配工作,开发者积极响应…

应用性能监控管理工具

应用程序性能监控 Application Manager 的应用程序性能监控(APM Insight) 使应用程序开发人员和 DevOps 工程师能够了解应用程序性能,并帮助他们在问题影响最终用户之前对其进行故障排除。在应用程序性能问题影响收入之前监控、查明并解决它…

计算机毕设Python+Vue校园社团管理系统(程序+LW+部署)

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…