病毒是地球上数量最多的生物实体,在调控宿主群落组成、推动宿主进化及影响土壤元素的生物地球化学循环等方面起着非常重要的作用。病毒基因组结构简单,一般只含有单一核酸,探究病毒基因组在病毒的毒力系统、病毒的基因组进化与演变历程方面具有重要意义。
传统意义上有很多用于发现新病毒的方法,如病毒分离、核酸检验、血清学试验等,但它们都有一定的局限性。高通量测序技术突破了传统技术方法的局限,可以直接以标本中所有的遗传物质为研究对象,从而能够快速地鉴定出标本中存在的病毒,形成了一门研究特定环境中病毒群落的新兴学科:病毒宏基因组学(宏病毒组,Virome)。宏病毒组测序是直接以环境样本中所有病毒的遗传物质为研究对象,进行病毒分析生物学检测的技术,能够快速准确的鉴定出环境中所有病毒的组成。
凌恩生物基于最新研究方法,在宏病毒组测序结果的基础上,联合宏基因组binning分析流程,推出全新DNA宏病毒组+宏基因组binning联合分析策略。
Binning是分箱、聚类,指从微生物群体序列中将不同个体的序列(reads或contigs等)分离开来的过程。简单来说就是把宏基因组数据中来自同一菌株的序列聚到一起,得到一个菌株的基因组,可以达到菌株水平。基于binning分析策略,得到样本中的MAGs,对MAGs进行物种分类学注释,预测病毒的种类,基于宏基因组binning可以识别、鉴定病毒MAG,可更好反应样本中病毒真实组成和多样性,并可进行样本内细菌MAGs与病毒之间的相关性分析,深度解析生境中病毒与宿主之间的相互关系。
图 binning的过程
图 binning的原理
分析结果展示图
候选病毒序列鉴定(venn图)
病毒物种分类学注释
病毒与宿主相关性分析
COG功能注释
MAG系统发育树和物种注释结果
细菌MAG与病毒的关系
经典文献示例
题目:大型淡水湖泊噬菌体具有增强好氧甲烷氧化的潜力
期刊:Nature Microbiology
影响因子:30.964
DOI:10.1038/s41564-020-0779-9
噬菌体是指能够感染微生物的病毒,噬菌体基因组大小一般约为40-50kb。那么什么是大噬菌体呢?大于200kb的噬菌体被称为大噬菌体(Jumbo phage或huge phage)。到目前为止,人体和其他动物肠道内发现的基因组最大的噬菌体是megaphage,约为550 kbp,而自然界中的则约为735 kbp,它们的基因组甚至超过了某些细菌和古菌的基因组大小。虽然大噬菌体在自然界和动物肠道中广泛存在,但对它们的代谢潜能以及在地球元素循环中所扮演的角色却知之甚少。
本研究从2015年至2018年,从加拿大艾伯塔省的尾矿处理热公户多个深度收集了28个水体样品,开展病毒宏基因组和宏转录组测序研究。
研究者基于binning装箱策略,重建了共9个好氧化甲烷菌的淡基因组。结合以往研究数据,本研究分析获得的22个(其中18个基因组是完整的)基因组大小在159kb至527 kb之间的噬菌体编码pmoC基因。pmoC基因是颗粒状甲烷单加氧酶的关键亚基,是自然界中主要的甲烷氧化催化剂。噬菌体相关的PmoC序列具有高度相似性(90%),并与包括甲烷甲基球菌、甲基囊藻和甲基菌属在内的细菌甲烷营养菌共存。
图1 BML和BML_S样品中甲烷氧化的地球化学和生物学证据。a.不同采样时间点不同深度的样品中甲烷和氧气的浓度。甲烷氧化活性较低或无活性的样品用星号表示。b.甲烷氧化菌的相对丰度。橙色字值表示Methyloparacoccus_57的生长速率。
图2 细菌和噬菌体相关的PmoC。a. 一些细菌和噬菌体相关的PmoC序列的比对。b. 细菌和噬菌体相关PmoC的系统发生分析。
图3 系统发育和预测的pmoC噬菌体宿主。星号表示本研究中的完整噬菌体基因组。噬菌体及其宿主的分类用彩色正方形,三角形或星形表示。
图4 pmoC-噬菌体及其亲属的代谢。基于由至少五个噬菌体编码的蛋白质家族的存在/不存在谱,将噬菌体聚类。噬菌体相关的PmoC用绿色条突出显示。
参考文献
[1]Dissecting the role of the human microbiome in COVID-19 via metagenome-assembled genomes. Nature Communications, 2022.
[2]Genome binning of viral entities from bulk metagenomics data. Nature Communications, 2022.
[3]Large Freshwater Phages with the Potential to Augment Aerobic Methane Oxidation. Nature Microbiology, 2020.