2023.07.26【微生物】|qiime2组间分析,ANCOM算法介绍与结果解读

news2024/11/24 3:05:16

目录

  • 摘要
  • ANCOM简介
  • 主要步骤
    • 数据聚合
    • 添加伪计数
    • 计算特征差异
  • 结果解读
    • 火山图
    • 差异显著特征统计表
    • 差异显著特征百分位数统计表
    • 优缺点
  • 总结

摘要

在使用qiime2进行16S/ITS分析的时候,少不了对样品进行组间分析。除了常见的PicRust和Lefse分析之外,qiime2自带了ANCOM分析。不过这个大家并不是很熟悉,网上对ANCOM的结果也没有非常详尽的介绍。因此我根据查阅的文献资料,整理出这篇文章。希望对使用qiime2分析微生物有需求的小伙伴提供一些帮助。

ANCOM简介

ANCOM(Analysis of Composition of Microbiomes)是一种用于分析微生物组成数据的统计方法。它被广泛应用于微生物组学研究中,可以帮助研究人员识别和比较不同样本或处理组之间的微生物组成差异。其原理基于组间差异性的假设,即除了一个特定的特征(如治疗组别)外,其他所有特征在各个组之间的相对丰度应该是相等的。如果某个特征在一个组别中的相对丰度显著高于其他组别,那么它可能与该组别有关联。

主要步骤

数据聚合

首先,我们要去除低丰度的微生物分类单元(OTU/ASV,可选操作),并对数据进行标准化或转换操作。在qiime2中,输入数据的格式是ASV的丰度表,类似OTU表。其中每列代表一个样本,每行代表一个微生物分类单元,用字母+数字表示。

qiime taxa collapse命令用于聚合和重命名OTU表。通过该命令,我们需要使用前面分析得到的table.qza和taxonomy.qza两个文件,将OTU表中特定分类水平的特征聚合到更高的分类水平上,并将绝对丰度转换为相对丰度,便于后续分析。该命令可以使用--p-level参数来指定特定的分类水平进行分析,2-7分别对应门纲目科属种。

添加伪计数

由于在ANCOM的分析过程中需要用到对数进行分析,而相对丰度为0的分类群无法参与对数分析,因此需要对这类数据随机添加一个很小的正数,解决计算组成差异时产生问题。

qiime composition add-pseudocount对预处理的数据进行伪计数添加,将有助于保持数据的稳定性,并提高组成差异分析的准确性。

计算特征差异

在ANCOM中,W统计量用检测不同组之间的特征(OTU、ASV等)是否存在显著差异。
W统计量的计算步骤下:
a. 对于每个特征,将其在所有样本中的相对丰度进行排序。
b. 将样本分为两组:目标组和参考组。通常情况下,目标组是我们感兴趣的组别,而参考组是其他组别的合并。
c. 对于每个特征,计算目标组和参考中的累积相对丰度。累积相对丰度指从最低相对丰度的特征开始,逐渐累积到当前特征的相对丰度之和。
d. 计算目标组和参考组中每个特征的平均累积相对丰度。
e. 对于每个特征,计算目标组和参考组中的差异值。差异值是指目标组的平均累积相对丰度减去参考组的均累积相对丰度。
f. 对于每个特征,计算其差异值的标准差。
g. 对于每个特征,计算W统计量,即将差异值除以其标准差。
根据W统计量的值判断特征是否在目标组和参考组之间存在显著差异。一般来说绝对值大1.96的W统计量被认是显著差异的特征。

qiime composition ancom命令将前面添加伪计数的相对丰度数据和样品分组信息(metadata.txt)进行输入,通过--m-metadata-column 设定目标组,分析显著差异的特征。

结果解读

qiime2得到的ANCOM结果同样可以通过网页展示,里面包含一个火山图和两个统计表格

火山图

请添加图片描述

X轴CLR指的是中心对数比例(Centered Log Ratio)变换。是对相对丰度值进行了对数压缩,同时保留了特征的相关性。具体算法是这种变换将每个特征的相对丰度除以几何平均值,然后取对数并减去所有特征的对数几何平均值。CLR越大,则相对丰度越高。Y轴则是W统计量,统计量越高,则该特征差异越显著。

差异显著特征统计表

在这里插入图片描述
在前面数据预处理时,table.qza和taxonomy.qza两个文件已经过聚合,当W统计量计算出来后,对应注释出来的分类群也可以展示出来,并根据W值从高到低排列。

差异显著特征百分位数统计表

在这里插入图片描述
Percentile abundances of features by group指的是将每个特征的相对丰度按组进行排序,并计算每个组中每个特征的百分位数。这种方法可以更好地描述组内特征的相对丰度分布,并在ANCOM分析中使用。

优缺点

ANCOM的优点包括能够处理稀疏数据、保持较低的误报率以及对异常值具有鲁棒性。然而,它也存在一些限制,例如对数据的分布假设敏感,对样本数目和特征维度的要求较高。总而言之,ANCOM是一种广泛应用于微生物组学研究中的分析方法,可以帮助研究人员发现微生物组成的差异并探索其与其他因素之间的关系。

总结

想要具体了解ANCOM算法的小伙伴可以看看文献:Full article: Analysis of composition of microbiomes: a novel method for studying microbial composition

qiime2工具中整合的分析方法还有很多,有些结果连分析人员都需要仔细研究后才能弄清楚。当然,Lefse和PicRust绘图更加直观,ANCOM可以作为组间比较的一个辅助分析方法。欢迎加v bbplayer2021 进群沟通。

(部分内容为AI创作)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/792366.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

web前端tips:js继承——借用构造函数继承

上篇文章给大家分享了 js继承中的原型链继承 web前端tips:js继承——原型链继承 在文章末尾,我提到了 原型链的继承,子类需要传递参数给父类的构造函数,就无法通过直接调用父类的构造函数来实现,需要通过中间的过程来…

分享5款有点冷门的实用派软件

​ 分享5款冷门但值得下载的Windows软件,个个都是实用,你可能一个都没见过,但是 我觉得你用过之后可能就再也离不开了。 系统监控——XMeters ​ XMeters是一个系统监控软件,可以让你在任务栏上显示各种系统信息,如C…

(十九)使用InfluxDB搭建报警系统

以下内容来自 尚硅谷,写这一系列的文章,主要是为了方便后续自己的查看,不用带着个PDF找来找去的,太麻烦! 第 19 章 使用InfluxDB搭建报警系统 19.1 什么是监控 1、监控其实每隔一段时间对数据计算一下。比如&#xf…

SAS-数据集添加序号

一、数据集添加序号 方法1:data步生成 方法2:proc sql生成 /** 方法1 **/ data class1; set sashelp.class; seq _N_; /** 添加序号 **/ run; /** 方法2 **/ proc sql;create table class2 as select monotonic() as id, * /** monotonic()添加id **…

航空发动机支架质量检测非接触式全尺寸测量CASAIM 3D扫描仪

发动机是实现飞行的强大“心脏”支撑,发动机支架是飞机这一精密而复杂系统中不可或缺的一部分,它将巨大而沉重的发动机牢固安装在飞机上,使其可以承受各种飞行载荷和各种未知的挑战,因此航空发动机支架的质量检测和尺寸测量至关重要。 使用CASAIM 3D扫描…

【java实习评审】对小说详情模块的服务封装比较到位

大家好,本篇文章分享一下【校招VIP】免费商业项目“推推”第一期书籍详情模块java同学的代码作品。该同学来自成都信息工程大学。本项目亮点难点:1 热门书籍在更新点的访问压力,2 书籍更新通知的及时性和有效性,3 书荒:同好推荐的…

文档翻译软件那么多,哪个能满足你的多语言需求?

想象一下,你手中拿着一份外文文件,上面记录着珍贵的知识和信息,但是语言的障碍让你无法领略其中的内容。而此时,一位翻译大师闪亮登场!他的翻译技巧犹如一把魔法笔,能够将文字的魅力和意境完美传递。无论是…

OpenShift 4 - 为 OpenShift 托管集群配置用户认证(视频)

《OpenShift / RHEL / DevSecOps / Ansible 汇总目录》 说明:本文已经在 OpenShift 4.13 ACM 2.8 AWS 环境中验证 本文是《OpenShift 4 - 用 HyperShift 实现以“托管集群”方式部署运行 OpenShift 集群(视频)》的后续。 文章目录 托管集群…

【vue3】vue3的一般项目结构、成功显示自己的vue3页面

一、vue3的一般项目结构 Vue 3并没有规定特定的项目结构,因此您可以根据项目的需求和个人偏好来组织您的Vue 3项目。以下是一个常见的Vue 3项目结构示例,供参考: your-project/|- public/| |- index.html # 应用程序的入口HTML文件…

项目里程碑有什么作用?设置里程碑时应注意什么?

正如 "里程碑 "一词的原意是表示所走距离的标记,项目中的里程碑也代表着迄今为止已完成的任务或活动。但实际上,里程碑的作用远不止于此。 项目里程碑为何重要? 项目的成功取决于细节。项目里程碑之所以重要,是因为它…

会不会好奇ai绘画生成器?ai创作的灵感从何而来?

在这个宁静的公园里,阳光透过树叶的缝隙洒在的地面上,微风轻拂着艺术家的发丝,带来一丝清凉。坐在长椅上的他,手中紧握着一支触控画笔,目光凝视着眼前的美景。旁边一台智能绘画助手正在悄悄发光,它似乎能够…

99%误报与1%真实告警之间,差一个“威胁情报”

在网络安全领域,平均检测时间(MTTD)与平均响应时间(MTTR)是衡量企业应对威胁事件能力的重要指标。根据 SANS 2019 事件响应的调查,52.6%的企业平均检测时间少于24小时。一旦检测到事件,67%的企业…

陪诊小程序定制|医院陪诊系统源码|陪诊小程序开发

随着人们对健康关注的日益增加,陪诊服务的需求也在不断增长。为了提供便捷、高效的陪诊服务,陪诊小程序应运而生。下面将介绍一些陪诊小程序开发的优势。   便捷的预约与安排   陪诊小程序提供了便捷的预约与安排功能。用户可以通过小程序随时随地进…

【leetcode】leetcode69 x的平方根

文章目录 给你一个非负整数 x ,计算并返回 x 的 算术平方根 。原理牛顿法(数值分析中使用到的):二分法 解决方案java 实现实例执行结果 python 实现实例 给你一个非负整数 x ,计算并返回 x 的 算术平方根 。 由于返回类型是整数&…

树、二叉树(C语言版)详解

🍕博客主页:️自信不孤单 🍬文章专栏:数据结构与算法 🍚代码仓库:破浪晓梦 🍭欢迎关注:欢迎大家点赞收藏关注 文章目录 🍊树的概念及结构1. 树的概念2. 树的相关概念3.树…

MySQL5.7 与 MariaDB10.1 审计插件兼容性验证

这是一篇关于发现 MariaDB 审计插件导致 MySQL 发生 crash 后,展开适配验证并进行故障处理的文章。 作者:官永强 爱可生DBA 团队成员,擅长 MySQL 运维方面的技能。热爱学习新知识,亦是个爱打游戏的宅男。 本文来源:原创…

20.1K Star!Notion的开源替代方案:AFFiNE

Notion这款笔记软件相信很多开发者都比较熟悉了,很多读者,包括我自己都用它来记录和管理自己的笔记。今天给大家推荐一个最近比较火的开源替代方案:AFFiNE。目前该开源项目已经斩获20.1K Star,热度非常的高,下面一起来…

Unhandled Exception: User denied permissions to access the device‘s location.

在写android app时&#xff0c;有的时候遇到这样的错误&#xff1a;未处理的异常:用户拒绝访问设备位置的权限。 即使加上了官网讲述的&#xff1a;下面两行代码任意一行&#xff0c;也不行。 <uses-permission android:name"android.permission.ACCESS_FINE_LOCATIO…

Java的第十四篇文章——文件和IO流

目录 学习目标 1. FIle类 1.1 File类的构造方法 1.2 FIle类的创建方法 1.3 File类的删除方法 1.4 File类的判断方法 1.4.1 绝对路径和相对路径 1.5 File类的获取的方法 1.6 File类的方法listFIles() 2. IO流对象 2.1 IO流对象的分类 2.1.1 按照操作的文件类型分类 …

【简单认识MySQL的MHA高可用配置】

文章目录 一、简介1、概述2、MHA 的组成3&#xff0e;MHA 的特点4、MHA工作原理 二、搭建MHA高可用数据库群集1.主从复制2.MHA配置 三、故障模拟四、故障修复步骤&#xff1a; 一、简介 1、概述 MHA&#xff08;Master High Availability&#xff09;是一套优秀的MySQL高可用…