微生物群落构建(community assembly)

news2024/12/23 0:43:37

Introduction

Zhou, J. & Ning, D. Stochastic Community Assembly: Does It Matter in Microbial Ecology? Microbiol Mol Biol Rev 81, e00002-17 (2017).
This review is very comprehensive (1)!

周集中老师实验室的长期研究兴趣集中在从基因组到生态系统的不同组织层面的环境微生物学,其中一项就是宏基因组学和微生物生态学:利用高通量基因组测序和相关基因组学技术检查不同栖息地的微生物群落多样性、微生物生物地理学和形成微生物多样性模式、分布和动态的机制;

Understanding the mechanisms controlling community diversity, functions, succession, and biogeography is a central, but poorly understood, topic in ecology, particularly in microbial ecology. Traditional niche-based theory hypothesizes that deterministic factors such as species traits, inter-species interactions (e.g., competition, predation, mutualisms, and trade-offs), and environmental conditions (e.g., pH, temperature, salt, and moisture) govern community structure, which are often referred to as deterministic processes.

In contrast, neutral theory assumes that community structures are independent of species traits and governed by stochastic processes of birth, death, colonization, extinction, and speciation.

Although, recently, it has been generally accepted that both deterministic and stochastic processes occur simultaneously in the assembly of local communities, a central debate is on their relative importance in controlling community structure, succession, and biogeography.

Methods

目前在文章中普遍出现的计算群落构建的方法主要有三套:

1.Stegen (βNTI & RCbray-based)

原始的文章 (2), (3)

在确定性与随机性二分法的背景下塑造微生物群落多样性的生态过程。该方案显示了在文中讨论的假设下,基于系统发育和分类多样性划分各种生态过程的不同步骤。 NTI(最近分类单元指数)基于系统发育多样性指数 MNTD(平均最近分类单元距离)的空模型检验,RCBray(修正的 Raup-Crick 指数)基于 Bray-Curtis 的空模型检验分类多样性指数。这两个框分别表示确定性选择和未支配部分的主要组成部分。除了影响较小的选择外,未支配部分的弱选择也可能是由于抵消了有影响的选择因素和/或不同分类群的对比选择。该图主要是根据 Stegen 等人先前报告的数据制作的。

beta-NTI(nearest taxon index):

使用 NTI/NRI 指示单个群落内共存的分类单元相比偶然预期的关系更为紧密还是分散,使用 βNTI/βNRI 指示两两群落间的变化受确定性或随机性因素影响的大小。
MNTD 即mean-nearest-taxon-distance (最近种间平均进化距离) , 关于 NTI/NRI、βNTI/βNRI 的结果解释时其显著性的判断依据是其临界值是否大于|2|,实际上这是依据标准正态分布的 95%置信区间得到的,一般认为 NRI 或者 NTI 大于 1.96 或者小于-1.96 的结果,在 95%的水平是显著的。

RCbray: 相异指数的一种。

code

https://blog.csdn.net/weixin_43367441/article/details/118515090

非常重要的一点:这类方法是基于系统发育树推断的,所以一定要有跟tax表对应的系统发育树。 但事实上,除非用的是16S/ITS测序,否则我们很难给自己的数据建一个树。 所以,替代方法是利用阶层分类关系(界门纲目科属种)来做一个拟系统发育树(枝长都为1) 参见自己写的df2tree函数

data(otutab)
df2tree(taxonomy)->phylo

#计算
nti_rc(otutab,phylo,metadata[,"Group",drop=F])->nti_res
## [1] "Result saved as nti_rc_res.rda"
#可视化
nti_res$type=factor(nti_res$type,levels = c("Homo_S","Heter_S","Homo_D","D_limit","Undominated"))
table(nti_res$type,nti_res$variable)%>%reshape2::melt()->com_p
colnames(com_p)=c("type","variable","n")
ggplot(com_p,aes(x=variable,y=n))+geom_bar(stat = "identity",aes(fill=type),position = "fill")
iCAMP

现在大家经常用的iCAMP包就是基于这个理论框架进行分析的 (4)。

2.ST,NST,MST (stochasticity ratio)

PNAS:NST方法定量生态过程中的随机性

周老师的文章,开发出新的方法对生态过程中的随机性进行了定量。提出了一个新的指数,normalized stochasticity ratio (NST),作为确定性主导(deterministic, <50%)和随机性主导(stochastic, >50%)的边界点 (5)。

code

已经有相应的包了,NST

#install.packages("NST")
library(NST)

data(tda)
comm=tda$comm
bray=beta.g(comm,dist.method="bray")
bray.3col=dist.3col(bray)
group=tda$group

tnst=tNST(comm=comm, group=group, rand=20,
          output.rand=TRUE, nworker=1)
#检验各组ST、NST的分布情况及各组ST、NST差异的显著性。
nst.bt=nst.boot(nst.result=tnst, group=NULL, rand=99,
                trace=TRUE, two.tail=FALSE, out.detail=FALSE,
                between.group=FALSE, nworker=1)
#ST和NST组间进行Permutational multivariate ANOVA
nst.pova=nst.panova(nst.result=tnst, rand=99)

#可视化
pcutils::group_box(tnst$index.pair.grp,col = 8,group = tnst$index.pair.grp$group)
example

地下水微生物群落演替过程中估计的 NST 动态变化对乳化植物油注入的响应。 NST 是基于 (A) Jaccard 和 (B) Ru ziˇ cka 指标使用空模型算法 PF 计算的。在零模型 PF 中,类群发生的概率与观察到的发生频率成正比,并且每个样本中的类群丰富度是固定的(19)。当使用基于丰度的指标 Ru ziˇ cka 时,每个样本中的空分类群丰度被计算为观察到的个体数量的随机抽取,其概率与样本中空分类群的区域相对丰度成比例(26)。 W8 是植物油对其没有影响或影响最小的对照井。

3.Solan NCM

只有当物种死亡或离开这个系统时,群落结构才会发生改变。此时,离开个体的生态位就会空余出来,其它个体会通过来自群落外的迁移群落内部的繁殖来填补空出的生态位。因此可以把群落的动态描述为死亡——繁殖/扩散——死亡这样的循环 (6)。

计算公式:

- P r ( N i + 1 N i ) = ( N T − N i N T ) [ m p i + ( 1 + α i ) ( 1 − m ) ( N i N T − 1 ) Pr(\frac{N_i+1}{N_i})=(\frac{N_T-N_i}{N_T})[mp_i+(1+\alpha_i)(1-m)(\frac{N_i}{N_T-1}) Pr(NiNi+1)=(NTNTNi)[mpi+(1+αi)(1m)(NT1Ni)

- P r ( N i N i ) = N i N T [ m p i + ( 1 + α i ) ( 1 − m ) ( N i − 1 N T − 1 ) ] + ( N T − N i N T ) [ m ( 1 − p i ) + r e d ( 1 − α i ) ( 1 − m ) ( N T − N i − 1 N T − 1 ) ] Pr(\frac{N_i}{N_i})=\frac{N_i}{N_T}[mp_i+{(1+\alpha_i)}(1-m)(\frac{N_i-1}{N_T-1})]+(\frac{N_T-N_i}{N_T})[m(1-p_i)+{red}{(1-\alpha_i)}(1-m)(\frac{N_T-N_i-1}{N_T-1})] Pr(NiNi)=NTNi[mpi+(1+αi)(1m)(NT1Ni1)]+(NTNTNi)[m(1pi)+red(1αi)(1m)(NT1NTNi1)]

- P r ( N i − 1 N i ) = N i N T [ m ( 1 − p i ) + ( 1 − α i ) ( 1 − m ) ( N T − N i N T − 1 ) ] Pr(\frac{N_i-1}{N_i})=\frac{N_i}{N_T}[m(1-p_i)+(1-\alpha_i)(1-m)(\frac{N_T-N_i}{N_T-1})] Pr(NiNi1)=NTNi[m(1pi)+(1αi)(1m)(NT1NTNi)]

物种 i 占居的频率(occurrence frequency: row sums of binary OTU table/number of sites)为其概率密度函数的积分。 此时该分布是一个beta分布,我们就可以在R语言中利用beta分布对其进行[拟合],获得参数m的评估值。

code
library(devtools)
install_github("Russel88/MicEco")
library(MicEco)
neutral.fit(t(otutab))#使用的是最大似然估计拟合模型,R2计算方法也不同

另一个代码来自https://mp.weixin.qq.com/s/opFXl-TvkJfmPcWKFwhCFA,比较经典,用的是非线性模型:

N描述了宏群落规模(metacommunity size),在本文中为每个样本中所有OTU的总丰度。 m量化了群落层面的迁移率(migration rate),该值对于每个群落成员都是统一的(与物种无关),m值越小说明整个群落中物种扩散越受限制,反之m值越高则表明物种受到扩散限制越低。 Nm是元群落规模(N)与迁移率(m)的乘积 (Nm = N*m),量化了对群落之间扩散的估计,决定了发生频率和区域相对丰度之间的相关性。

自己的绘图代码:

data(otutab)
ncm(otutab)->ncm_res
plot(ncm_res)

R2代表了中性群落模型的整体拟合优度,R2越高表明越接近中性模型,即群落的构建受随机性过程的影响越大,受确定性过程的影响越小。

值得注意,R方不是某个数值的平方,可以是负值。因为拟合程度没有下限,可以无限差,R方的范围是(−∞,1]。R方的取值,有以下的可能性:

  • 等于1。理想状况,该模型对所有的真值预测准确,没有偏差。泼个冷水,如果某篇文章里出现了R方=1,要么是问题过于简单没有研究价值,要么是模型过于复杂,对数据进行了过度拟合。

  • 小于1大于0。这是常见状况,表明该模型的拟合水平比均值模型好。

  • 等于0。该模型的拟合水平接近于均值模型。该模型没有价值。

  • 小于0。该模型的拟合水平不如均值模型。同样,该模型没有价值。

example

**随机过程,例如散布、出生、死亡、灭绝和移民,在呼气细菌和真菌群落的组装中发挥作用。**真菌微生物群的 SNM 拟合性能(图 2)优于细菌(细菌 R2 = 0.353,真菌 R2 = 0.683)。这种差异表明随机过程对于 EBC 真菌群落的组装可能相对更重要,而对 EBC 细菌群落的组装则不太重要。这种现象可能与细菌和真菌之间的大小差异有关,较小的细菌受扩散限制的影响较小,而受确定性过程的影响更大 (7)。

Stochastic processes played a role in assembling expiratory bacterial (A) and fungal (B) communities based on Sloan neutral model fitting. The black solid line represents the best fit, and the dotted lines represent the 95% CI (confidence interval) around the model fit. The blue dots refer to taxa that occur more frequently than predicted, and the red dots refer to taxa that occur less frequently than predicted. The green dots refer to taxa that occur in a manner consistent with predicted values.

原核生物细胞直径大概在0.5 ~ 2.0 μm; 微真核生物个体大小大概在1 ~ 200 mm; 之前的研究已经报道了较小的生物不太可能受到扩散限制的影响,因为它们与较大的生物相比具有更高的扩散能力。因此假设在细菌群落中生态位过程的相对影响可能比在微真核生物群落中更强。微真核生物个体大,可能会影响其扩散过程。

Others

参考自历神公众号文章:https://mp.weixin.qq.com/s/nwNuPlY7x6VScJA44c0MjQ

Competitive lottery

基于竞争彩票模型(competitive lottery model)的群落构建 假设一个两步模型:在第一步中,样本的总丰度(100%)根据某个未知的过程在组之间分配。 然后在第二步中,分配给每个小组的丰度会根据一个竞争彩票模式在小组成员之间进行分配。 竞争彩票模型的概念说明:

在第一阶段,每个样本的总丰度(100%)在一组预定义的组之间进行分割。

在第二阶段,每一组的丰度分配根据竞争彩票模型在子组之间进行分配,其中一个子组获得了大部分的丰度。

DNCI

在PER-SIMPER方法的基础上,提出了一个新的度量指标: dispersal–niche continuum index (DNCI),该指数可估计是扩散过程还是生态位过程主导群落的构建,并便于不同数据集之间的比较。

PER-SIMPER利用物种在不同站点之间的矩阵,在排列过程中生成三种不同的零模型: 通过约束行(生态位构建)、约束列(扩散构建)或两者都约束。 PER-SIMPER利用SIMPER方法对原始群落矩阵组成相似度模式进行建模,并与三个零模型比较。 PER-SIMPER通过识别哪个零模型与经验分析最匹配来进行定性评估。然而,大多数群落都是由生态位和扩散过程共同构成的,这限制了构建机制定性方法的敏感性。此外简单决策过程的定性特性使不同群落之间的构建过程难以进行精确比较。

PER-SIMPER分析返回三个E-metric分布,这与SIMPER经验值与三个PER-SIMPER零模型之间的偏差相关。本文提出的新的DNCI是由这些计算的E值推导而来的。 定量结果是基于标准效应量En(即来自”生态位”模型的E-metric分布)减去标准效应量Ed (即来自”扩散”模型的E-metric分布)。 DNCI提供了一种方法来量化和比较跨数据集构建过程的强度。DNCI值正或负表明生态位或分散过程分别是群组构建的主要过程。指数的绝对值越高,代表占主导地位的构建过程的潜力越大。
D N C I = S E S d − S E S n = 1 n ∑ i = 1 n ( E d ( i ) − E d n ‾ σ E d n ) − 1 n ∑ i = 1 n ( E n ( i ) − E d n ‾ σ E d n ) DNCI=SES_d-SES_n=\frac{1}{n}\sum_{i=1}^n\left(\frac{E_{d(i)}-\overline {E_{dn}}}{\sigma E_{dn}}\right)-\frac{1}{n}\sum_{i=1}^n\left(\frac{E_{n(i)}-\overline {E_{dn}}}{\sigma E_{dn}}\right) DNCI=SESdSESn=n1i=1n(σEdnEd(i)Edn)n1i=1n(σEdnEn(i)Edn)

如果DNCI与0差异不显著,则可以认为扩散过程和生态位过程对群落构建的影响是相等的。 当DNCI显著低于0时,扩散过程是群落构建的主导驱动因素; 如果DNCI显著高于0,生态位过程是群落构建的主要决定因素。 注意,表明扩散过程优势的负DNCI值并不能提供实际扩散速率的信息。

References

1. J. Zhou, D. Ning, Stochastic Community Assembly: Does It Matter in Microbial Ecology? Microbiology and Molecular Biology Reviews. 81, e00002–17 (2017).

2. J. C. Stegen, X. Lin, J. K. Fredrickson, X. Chen, D. W. Kennedy, C. J. Murray, M. L. Rockhold, A. Konopka, Quantifying community assembly processes and identifying features that impose them . The ISME Journal. 7, 2069–2079 (2013).

3. J. C. Stegen, X. Lin, A. E. Konopka, J. K. Fredrickson, Stochastic and deterministic assembly processes in subsurface microbial communities . The ISME Journal. 6, 1653–1664 (2012).

4. D. Ning, M. Yuan, L. Wu, Y. Zhang, X. Guo, X. Zhou, Y. Yang, A. P. Arkin, M. K. Firestone, J. Zhou, A quantitative framework reveals ecological drivers of grassland microbial community assembly in response to warming . Nature Communications. 11, 4717 (2020).

5. D. Ning, Y. Deng, J. M. Tiedje, J. Zhou, A general framework for quantitatively assessing ecological stochasticity . Proceedings of the National Academy of Sciences. 116, 16892–16898 (2019).

6. W. T. Sloan, M. Lunn, S. Woodcock, I. M. Head, S. Nee, T. P. Curtis, Quantifying the roles of immigration and chance in shaping prokaryote community structure . Environmental Microbiology. 8, 732–740 (2006).

7. Y. Zhang, F. Shen, Y. Yang, M. Niu, D. Chen, L. Chen, S. Wang, Y. Zheng, Y. Sun, F. Zhou, H. Qian, Y. Wu, T. Zhu, Insights into the Profile of the Human Expiratory Microbiota and Its Associations with Indoor Microbiotas . Environmental Science & Technology. 56, 6282–6293 (2022).

![关注公众号,获取最新推送](https://img-blog.csdnimg.cn/img_convert/1cbc6d0e6b5833fb6b31b2060cf60531.png)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1652122.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

史上最简单给大模型注入新知识的方法

《史上最简单给大模型注入新知识的方法》 image-20240508093410856 先执行 pip install --upgrade openai 。 from openai import OpenAI# 加载.env 文件到环境变量from dotenv import load_dotenv, find_dotenv_ load_dotenv(find_dotenv())# 初始化 OpenAI 服务。会自动从环…

第一个C++项目

文章目录 一、新建项目1.打开软件&#xff0c;选择“创建新项目”2.新建项目栏中&#xff0c;按自己的需求来设置项目模板&#xff0c;项目名称和文件存放位置&#xff0c;设置好后点击“确认”3. 点击“Next”4. 按照自己需求设置&#xff0c;设置完后&#xff0c;点击“Next”…

MySQL增删查改(进阶)

目录 数据库约束 表的设计 查询操作的进阶 查询搭配插入使用 聚合查询 1>count(*) 2>sum(*) 3>avg(*) 4>max(*) 5>min(*) group by分组分别进行聚合查询 联合查询 / 多表查询[重点] 外连接 自连接 子查询 合并查询 小结: 数据库约束 有时候…

虚拟机镜像文件qcow2格式转vmdk

一、在esxi上虚拟机导出qcow2镜像文件 1、卸载数据盘、网卡 2、登录虚拟机所在物理服务器&#xff0c;查找系统盘名为vm-101-disk-0的文件位置 find / -name "vm-101-disk-0"使用命令导出qcow2镜像&#xff08;进度条走完就完成了&#xff09;&#xff1a; qemu…

基于FPGA的数字信号处理(10)--定点数的舍入模式(1)四舍五入round

1、前言 将浮点数定量化为定点数时&#xff0c;有一个避不开的问题&#xff1a;某些小数是无法用有限个数的2进制数来表示的。比如&#xff1a; 0.5(D) 0.1(B) 0.1(D) 0.0001100110011001~~~~(B) 可以看到0.5是可以精准表示的&#xff0c;但是0.1却不行。原因是整数是离散的…

蓝桥杯【第15届省赛】Python B组 32.60 分

F 题列表越界访问了……省一但没什么好名次 测评链接&#xff1a;https://www.dotcpp.com/oj/train/1120/ C 语言网真是 ** 测评&#xff0c;时间限制和考试的不一样&#xff0c;E 题给我整时间超限&#xff1f; A&#xff1a;穿越时空之门 100&#x1f3c6; 【问题描述】 随…

LLMs之unsloth:unsloth的简介、安装和使用方法、案例应用之详细攻略

LLMs之unsloth&#xff1a;unsloth的简介、安装和使用方法、案例应用之详细攻略 目录 unsloth的简介 0、特点和功能&#xff1a; 特点 功能 1、免费微调 2、Unsloth.ai新闻 3、链接和资源 4、主要特征 5、性能基准测试 unsloth的安装和使用方法 1、安装说明 Conda安…

牛客热题:链表的奇偶重排

&#x1f4df;作者主页&#xff1a;慢热的陕西人 &#x1f334;专栏链接&#xff1a;力扣刷题日记 &#x1f4e3;欢迎各位大佬&#x1f44d;点赞&#x1f525;关注&#x1f693;收藏&#xff0c;&#x1f349;留言 文章目录 牛客热题&#xff1a;链表的奇偶重排题目链接方法一&…

在家中访问一个网站的思考

在家中访问一个网站的思考 1、家庭网络简介2、家庭WLAN DHCP2.1、家庭路由器PPPOE拨号2.2、DHCP&#xff08;动态主机配置协议&#xff09;2.3、接入家庭网的主机IP地址2.4、家庭总线型以太网2.5、Mac地址2.6、ARP协议2.7、IP协议 & UDP/TCP协议2.8、NAT&#xff08;Netwo…

带你快速掌握Spring Task

Spring Task ⭐Spring Task 是Spirng框架提供的任务调度工具&#xff0c;可以按照约定的时间自动执行某个代码逻辑 &#x1f4cc;一款定时任务框架 应用场景 信用卡信息银行贷款信息火车票信息 只要是需要定时处理的场景都可以使用Spring Task 只要有定时&#xff0c;就会有…

论文润色就用意得辑:让你的学术之作更上一层楼

在学术的海洋里&#xff0c;每一篇论文都是一艘承载智慧与探索的小船。然而&#xff0c;好的内容也需要好的包装&#xff0c;才能更好地展现其价值。在这个追求精益求精的时代&#xff0c;意得辑以其专业的论文润色服务&#xff0c;成为了众多学者们的得力助手。 意得辑&#…

亚马逊自养号测评系统搭建技术要点解析

亚马逊自养号测评系统搭建技术要求主要涵盖了网络环境、IP管理、设备配置、浏览器防关联、支付卡选择与管理以及账号管理等多个方面。测评是否稳定长久这些条件都是缺一不可的&#xff0c;以下是一些具体的技术要求&#xff1a; 1. 网络环境&#xff1a;使用国外服务器在云端搭…

论文润色就用意得辑,打造学术精品新篇章

在学术的世界里&#xff0c;一篇优秀的论文如同璀璨的星辰&#xff0c;吸引着同行们的目光。然而&#xff0c;好的论文并非一蹴而就&#xff0c;它需要经过反复打磨、润色&#xff0c;才能焕发出夺目的光彩。在这个过程中&#xff0c;意得辑以其专业的服务、精湛的技巧&#xf…

geojson文件规格

geojson文件示例&#xff0c; {"type": "FeatureCollection","features": [{"type": "Feature","geometry": {"type": "Point","coordinates": [102.0, 0.5]},"properties&q…

Exness外汇大陆投资者开户详细流程!

Exness是一家全球领先的外汇和差价合约交易平台&#xff0c;因其高效稳定的服务和多样化的交易工具&#xff0c;受到广大投资者的青睐。然而&#xff0c;由于中国大陆用户无法直接访问Exness官网&#xff0c;想要开户的大陆投资者需要通过特定方式才能完成注册。本文将详细介绍…

windows10打印机共享完美解决方案

提到文件共享大家并不陌生,相关的还有打印机共享,这个多见于单位、复印部,在一个区域网里多台电脑共用一台打印机,打印资料非常方便,就包括在家里,我们现在一般都会有多台电脑或设备,通过家庭网络联接,如果共享一台打印机的话也是件便捷的事。 但是随着操作系统的更新…

哪个品牌的开放式耳机好用?五款畅销拔尖爆款力荐!

在耳机市场上&#xff0c;开放式耳机正逐渐成为一股新的风潮。它们以其独特的设计和卓越的音质吸引着越来越多的耳机爱好者。相较于传统的蓝牙耳机&#xff0c;开放式耳机不仅在音质上更胜一筹&#xff0c;更在佩戴舒适度上取得了显著突破。传统的蓝牙耳机&#xff0c;由于多采…

Spring Security Oauth2 JWT 添加额外信息

目录 一、问题描述 二、实现步骤 1、自定义TokenEnhancer 2、配置授权服务器 3、自定义UserDetails的User类 三、参考文档 一、问题描述 Oauth2里默认生成的JWT信息并没有用户信息&#xff0c;在认证授权后一般会返回这一部分信息&#xff0c;我对此进行了改造。 Oauth…

2024年数维杯数学建模A题思路

文章目录 1 赛题思路2 比赛日期和时间3 竞赛信息4 建模常见问题类型4.1 分类问题4.2 优化问题4.3 预测问题4.4 评价问题 5 建模资料 1 赛题思路 (赛题出来以后第一时间在CSDN分享) https://blog.csdn.net/dc_sinor?typeblog 2 比赛日期和时间 报名截止时间&#xff1a;2024…

【Redis】Redis命令(四)

1.Geospatial 操作命令 一种由三部分构成的集合&#xff0c;这种数据结构称为空间元素。经度&#xff08;longitude&#xff09;&#xff1a;有效经度为[-180&#xff0c;180]。正的表示东经&#xff0c;负的表示西经&#xff1b;纬度&#xff08;latitude&#xff09;&#xf…