LotuS2:新一代扩增子数据分析神器(更快、更准、更稳定)

news2024/12/26 13:26:39

一、研究背景

扩增子测序是分析微生物组成熟且成本较低的方法。然而,扩增子数据处理需要生物信息学技能和高计算能力来处理大数据集。此外,只有小部分工具适用于长读长扩增子数据分析。2022年10月Microbiome发表了一种新的扩增子数据处理神器——LotuS2,用户操作更友好、运行速度更快、精确度更高。LotuS2可以通过以下方式安装:(i) Bioconda, (ii)带有提供的autoInstaller脚本的GitHub;(iii)使用Docker映像;(iv) Galaxy web服务器也可以运行LotuS2。

二、LotuS2的分析流程

输入扩增子测序reads、barcode、样本信息以及其他信息。经过筛选得到高质量序列,聚类生成ASV或OTU。计算每个OTU/ ASV的最佳序列,其中中等质量的reads也被映射到OTU/ ASV上,以增加序列丰度。从OTU/ASV序列构建系统发生树,并对每个簇进行分类分配。这些结果以多种标准格式提供,如制表符分隔、biom或phyloseq,以支持下游分析。

图1  LotuS2的工作流程

三、LotuS2的计算性能和可靠性

使用4个数据集验证LotuS2计算性能和可靠性。数据集由技术重复(肠道- 16s、土壤- 16s和土壤- its)和模拟群落组成。技术重复用于评估群落结构的重现性,并使用不同的16S rRNA扩增引物(肠道-16S和土壤-16S)或ITS序列(土壤-ITS)来代表不同的生物群落。

1. 计算性能和数据利用率

对gut-16S数据集的完整分析在LotuS2中是最快的(图2A)。与其他测试流程相比,LotuS2在分析soil- 16S数据集时也更快(图2B)。LotuS2和QIIME 2之间的速度差异在soil-ITS数据集的分析中更为明显,LotuS2的平均速度是QIIME 2和DADA2的69倍。

LotuS2报告的asv / otu最少,但在丰度表中包含的reads却最多,这表明LotuS2在每个ASV/OTU覆盖更大的序列空间的同时,可以更有效地使用输入数据。

图2  扩增子测序管道的计算性能

2. 群落组成的可重复性

研究者通过比较技术重复之间的beta多样性来评估肠道- 16s、土壤- 16s和土壤- its数据集的管道之间的群落组成的再现性。发现LotuS2生成的群落组成具有更大的重现性(图3A, B)。在肠道和土壤- 16s数据集中,LotuS2- uparse的BCd和Jd最低(图3A, B)。

在使用相同聚类算法的情况下,LotuS2- DADA2组分的重现性也高于QIIME 2-DADA2和DADA2(仅在土壤数据上显著)。

最后,研究者计算了在肠道-16S数据集和土壤-16S数据集中技术重复样本之间报告的alpha多样性的再现性。在这两个数据集中,LotuS2和PipeCraft 2结果中 alpha多样性在技术重复之间没有显著差异。但mothur、QIIME 2和DADA2结果中的alpha多样性存在显著差异。

 图3  不同扩增子序列数据分析管道的再现性

3. 对soil - ITS数据集进行基准测试

与16S rRNA基因扩增子相比,ITS扩增子通常片段长度差异更大。在数据利用方面,LotuS2和QIIME 2- dada2都检索到相似的reads数量(图2F)。与LotuS2-UPARSE相比,QIIME 2-DADA2在复制样品中复制的真菌成分明显较差。然而,它在最接近其技术复制的样品中所占比例最高,尽管该比例在所有管道中总体上都非常高(图3F)。与其他流程相比,DADA2复制样本之间的数据使用效率最低(图2F)和最低的可重复性(图3C)。在使用UPARSE和CD-HIT聚类时,LotuS2在重复之间的BCd和Jd总体上最低(图3C)。

4. 对模拟微生物群落的数据集进行基准测试

利用已知物种组成的模拟群落对扩增子序列数据分析管道的性能进行基准测试。LotuS2-VSEARCH和LotuS2-UPARSE具有最高的精度、f值和分配为真阳性分类群的reads的比例(图4A)

研究者探究了哪种软件可以更好地生成正确的OTU/ASV序列。为此,计算了每个软件中与参考基因组16S rRNA序列具有97-100%核苷酸相同的TP OTUs/ASVs的比例(图4B)。LotuS2- dada2和LotuS2- vsearch优于其他软件,这可能与LotuS2中严格的读筛选和种子扩展步骤有关。

LotuS2对已报道的16S rRNA基因序列进行了更精确的排序,得到更多正确的分类,并检测了生物多样性。

图 利用模拟群落对扩增子序列数据分析管道的性能进行基准测试

四、实验结论

LotuS2 中提供了六种不同的序列聚类算法以及广泛的前后-处理选项,给用户提供更灵活的数据分析范围,其中参数可以完全调整,新手可以为不同的场景提供默认值。通过对独立的肠道和土壤数据集进行了测试,发现LotuS2具有运行速度快、可重复性高的优点。相比其他软件,LotuS2能够提供更高比例的正确分类单元。总体而言,LotuS2 是一个轻量级、用户友好型分析软件。

参考文献

LotuS2: an ultrafast and highly accurate tool for amplicon sequencing analysis. Microbiome. 2022

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/54620.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

0113 链表Day2

剑指 Offer 06. 从尾到头打印链表 输入一个链表的头节点,从尾到头反过来返回每个节点的值(用数组返回)。 示例 1 输入:head [1,3,2] 输出:[2,3,1] /*** Definition for singly-linked list.* public class ListN…

通过源码来理解Cglib与JDK动态代理

最近在阅读到了Spring源码对于两种动态代理使用在不同场景下的使用,两种方式各有利弊写一篇文加深自己的认识。文中对于源码的涉及较少,更多的是作者自己的理解和举例,然后通过部分源码验证。 首先看两个面试经常会遇到的关于Spring的问题&a…

纳尼?华为首席架构师只用434页笔记,就将网络协议给拿下了

不管是前端还是后端,几乎所有的程序运行都会涉及到网络协议。10 个程序员里面,10 个都说自己学过网络协议,9 个说自己懂网络协议。但真正面试的时候,能回答出相关问题的,可能只有两三个。 金九银十跳槽热季&#xff0…

七、【React-Router6】路由传参 之 search

文章目录1、routes.js2、Message.jsx3、Detail.jsx4、Result5、另外一个可以获取 search 的新 Hook :useLocation项目修改自 上一节 的 Demo 1、routes.js import { Navigate } from react-router-dom import About from ../components/About import Home from ../…

【D3.js】1.18-给 D3 标签添加样式

title: 【D3.js】1.18-给 D3 标签添加样式 date: 2022-12-02 14:44 tags: [JavaScript,CSS,HTML,D3.js,SVG] 标签也可以添加样式。 一、学习目标 如何设置字体大小? .attr(“font-size”,25) 如何填充颜色? .attr(“fill”,“red”) 二、题目 将 text 元…

LeetCode简单题之不同的平均值数目

题目 给你一个下标从 0 开始长度为 偶数 的整数数组 nums 。 只要 nums 不是 空数组,你就重复执行以下步骤: 找到 nums 中的最小值,并删除它。 找到 nums 中的最大值,并删除它。 计算删除两数的平均值。 两数 a 和 b 的 平均值…

[操作系统笔记]连续分配管理方式

内容系听课复习所做笔记,图例多来自课程截图 连续分配管理方式 连续分配:指为用户进程分配的必须是一个连续的内存空间 相应地,非连续分配可以是离散的 对于固定分区分配,需要有一个分区说明表,类似下表: …

【jmeter录制浏览器上特定的单个请求】

目录准备工作jmeter代理设置设置postman代理复制浏览器是特定的url背景:想要对浏览器某一个请求做测试,直接手动输入到jmeter不切实际,一般是使用jmeter代理的方式录制下来,但会有个问题,一般浏览器加载许多其他请求&a…

在虚拟机中安装Linux操作系统详细步骤

欢迎关注博主 Mindtechnist 或加入【Linux C/C/Python社区】一起探讨和分享Linux C/C/Python/Shell编程、机器人技术、机器学习、机器视觉、嵌入式AI相关领域的知识和技术。 在虚拟机中安装Linux操作系统详细步骤专栏:《Linux从小白到大神》| 系统学习Linux开发、VI…

达梦数据库表空间误删恢复实操

达梦数据库表空间误删恢复实操1.表空间失效文件检查2.表空间失效文件恢复准备3.表空间失效文件恢复4.表空间失效文件恢复实操1.表空间失效文件检查 表空间恢复失效文件的检查。 语法格式 SP_FILE_SYS_CHECK ();语句功能 在 LINUX 操作系统下,检查是否有数据文件被…

一个已经存在10年,却被严重低估的 Python 库

今天介绍的是一个已经存在十年,但是依旧不红的库 decorator,好像很少有人知道他的存在一样。 这个库可以帮你做什么呢 ? 其实很简单,就是可以帮你更方便地写python装饰器代码,更重要的是,它让 Python 中被…

代码随想录刷题Day52 | 300. 最长递增子序列 | 674. 最长连续递增序列 | 718. 最长重复子数组

代码随想录刷题Day52 | 300. 最长递增子序列 | 674. 最长连续递增序列 | 718. 最长重复子数组 300. 最长递增子序列 题目: 给你一个整数数组 nums ,找到其中最长严格递增子序列的长度。 子序列 是由数组派生而来的序列,删除(或…

2022年NPDP新版教材知识集锦--【第四章节】(6)

《产品经理认证(NPDP)知识体系指南(第2版)》已于2022年4月正式上架发行,新版教材自2022年11月NPDP考试起使用。将新版NPDP教材中的相关知识点进行了整理汇总,包括详细设计与规格阶段相关内容,快来看看吧。 【制造与装配阶段】(全部获取文末) …

SAP-ABAP-企业微信:ZCSM37-后台JOB异常检查主动推送企业微信群

场景:异常JOB主动推送企业微信群 (企业微信机器人可百度创建,注意群不能有企业外的人员,否则接口无效) 事务代码:ZSM37_CHECK程序名称:ZSM37_CHECK程序目的: ZCSM37-后台JOB异常检…

Java+JSP+MySQL基于SSM的物流公司物流订单管理系统-计算机毕业设计

项目介绍 随着我国经济的高速增长,物流快递的数量也在不断的增加,同时面临的就是如何更加方便快捷和高效的管理物流订单的问题,传统模式的物流订单管理模式明显已经不能够满足当下的需求,于是我们提出了基于B/S的贴心物流公司物流…

Redis未授权漏洞利用

1、背景介绍 近期公司内部安装主机安全组件,检测出一些安全漏洞,其中就有利用redis未授权漏洞进行攻击。 2、攻击原理 正常redis默认情况下,会绑定在0.0.0.0:6379,如果没有限制来源IP并且甚至没有密码,那么就会导致…

举个栗子~Minitab 技巧(5):掌握常用快捷键,提高统计分析效率

在日常使用 Minitab 时,大部分小伙伴的习惯是使用鼠标进行点击和拖拽等操作。然而,在使用频率很高的情况下,这种方式会带来很多重复且低效的劳动。 其实,Minitab 软件内置了许多快捷键,可以快速实现新建、打开、保存、…

虹科分析 | 终端安全 | 移动目标防御是“变革性”技术——GARTNER

使用前Gartner连续第二年将移动目标防御(MTD)作为特色技术,并将Morphisec作为该技术的样本供应商,在其报告《新兴技术影响雷达:安全》中。作者将MTD定义为“…一种技术趋势,其中动态或静态排列变形、转换或…

sentinel中流控规则 并发线程数的实战理解

先看下官网文档关于并发线程数的解释:链接地址 public class FlowThreadDemo {private static AtomicInteger pass new AtomicInteger();private static AtomicInteger block new AtomicInteger();private static AtomicInteger total new AtomicInteger();priva…

linux_mysql安装教程带安装包(亲测有效)

文章目录1.检查当前系统是否安装mysql2.上传mysql安装包/opt/software目录下3.解压安装包4.在安装目录下执行rpm安装5.删除/etc/my.cnf文件中datadir指向的目录下所有内容,6.初始化数据库7.查看临时生成的root用户密码8.启动mysql服务9.登陆mysql数据库10.修改root用…