谷禾健康
最近有客户在拿到科研报告分析结果的时候问:
“在同样的数据分析流程情况下,为什么我拿到的分析结果提取不出什么有价值的结果,而别人有着类似的项目课题,样本类型也相似,却可以拿到全面的差异分析结果,想要提取的信息一目了然?”
★项目设计和入组标准以及采样至关重要
微生物组研究涉及到生活的方方面面,从环境微生物检测,到人体疾病与微生物群的关系,再到药物与食品营养干预等,以及菌群的发酵产物等。一项好的研究一定离不开前期的项目主题优化以及合理的采样方案。
项目分析主要是依托高通量测序获取的数据和特定数据库对样本数据进行归类,识别,统计检验分析,以及差异化寻找和可视化展示,来获取全面的数据信息。
最终拿到科研分析报告结果,PDF结果报告也好,在线或平台呈现展示也好,是对结果的排列,展示和解读说明等。
个别研究者拿到结果报告后,发现结果不理想,分组没有代表性,组内差异较大,当这个时候发现前期研究不明确,或者取样不具有代表性等问题,想通过后期科研分析的手段进行补救,根据我们多年的分析经验来看,在这种情况下只能进行一定范围内的微调,差异结果大局已定。
如果想得到优质的差异分析结果靠后期数据分析筛选修改很难达到要求。这个时候如果想再次优化课题,重新取样,项目周期会延长,因此,本文就前期实验方案设计和取样环节进行详细描述和讨论,便于科研工作者获得更优质的实验结果。
一套完整的扩增子和宏基因组测序流程包括:
1. 确定实验设计与研究目的、样本规模和时间
2. 样本的采集,归纳,保存和运输
3. 预期实验结果计划,分析统计方法选择
4. 样本提取,实验,上机测序的选择
5. 数据下机,分析,与结果的呈现
一般测序公司拿到样本以后先进行样本状态查验以及样本信息核对,核对没问题后会尽快开展实验环节,包括提取,建库,上机,可以通过标准化流程减少实验误差,统一规范操作步骤;而数据分析也是通过标准的SOP分析流程拿到完整的数据分析结果,分析中分析人员可能会根据数据尝试寻找最适配的分析方法,或者增加图表展示的内容和呈现形式,以辅助客户拿到最能反映研究结果的图表。
唯有前两项主题设计与采样环节的不确定性因素较大,需要客户提前设计准备充分,同时也决定了未来数据分析结果的好坏。
实验设计就是为整个课题设定一个总的大纲,确立总的研究方向和目的;取样环节是未来能否将实验方案具体实现的关键。客户提前做好科研课题开题前这两项工作,更有利于后续测序分析的开展。
实验设计
微生物组最常见的研究方法之一是高通量测序,其原理是基于微生物基因组的特异性序列(细菌16S rDNA,真菌的ITS或宏基因组DNA),进行测序和分类,分析在特定的环境下微生物群落的物种组成和功能,微生物的多样性与丰度。
根据主题的不同可以将微生物组研究主要应用到以下几个方面:
1. 将肠道微生物与疾病进行关联以探讨疾病与健康的个体之间微生物的差异性;
2. 在特定环境下找出特异性微生物,发现耐受菌群及与特定环境具有关联性的代谢通路,通过不同样本之间的比较,研究微生物群内部、微生物与环境、微生物与宿主之间的关系;
3. 通过单一因素直接作用于特定环境或宿主(例如补充维生素、给土壤施加不同的类型的肥料)研究对应的微生物群在不同时间段的变化规律。
依照不同的课题类型提前规划好实验设计方案。
▼
差异分析
例如可以研究不同用药组菌群构成差异;在不同的地理环境下土壤菌群构成的变化;还可以研究不同疾病类型的病人与健康对照组的菌群做两两分组之间的差异分析。
•保证组内样本的均匀性和一致性
为了尽可能多的从不同分组当中找出差异结果,需要保证组内样本的均匀性和一致性,排除组内样本差异性过大等干扰因素。
例如研究某一种疾病的肠道菌群构成时,需要排除多种因素对菌群构成的影响:
- 不同的治疗方案,例如化疗组,用药组,还有不同的药物治疗等;
- 取土壤样本时,取样部位在表层、深层、以及植物根系土壤菌群构成都会有所差异;
- 发酵样本的储存时间不同,包含是否密封、隔绝空气运输等。
所以在前期实验设计的时候这些细节都需要考虑到位,避免个别的干扰因素影响整体的实验效果。
不同分组直接菌属差异比较
上图表明:尽管是用药组,但是不同的细分用药对菌群的差异影响不同,甚至差异还比较大。
下图可以看下每两组之间是有显著性差异的。
两两分组之间菌属差异比较
这刚好反馈在分组的时候,一定要按照研究方案不同或处理效应尽可能细分分组,或严格入组样本标准,或设置细分的干预浓度等。
合理细分分组,确保实验结果的科学性和有效性,从而推出更可靠的结论。
▼
相关性分析
相关性分析用于研究微生物群落内部,微生物与环境之间,微生物与宿主之间的关系。例如最常见的就是临床病人拿到的各项生理生化指标与微生物群之间做关联分析;或是环境、土壤、发酵样本的各项理化指标与微生物之间做相关性分析等。
该项目是比较自闭症儿童与正常儿童的菌群差异的项目。客户在样本信息单里详细描述了孕期各种理化指标,根据这些理化指标与菌群数据做envfit相关性分析。
从结果可以看出,自闭症谱系障碍与正常儿童之间的分组与菌群之间相关性极显著**,其次是否有先兆流产的分组与菌群之间有显著相关性*,其他的包括是否喝牛奶、孕期是否感染、妊娠高血压都与菌群有相关性。
下列CCA图、RDA图可以做环境因子与菌属、样本之间的关联分析。
图中使用点代表不同的样本,从原点发出的箭头代表不同的环境因子。箭头的长度越长,表示环境因子的影响越大。夹角越小,代表相关性越高。样本点与箭头距离越近,该环境因子对样本的作用越强。
微生物相关性网络分析,可发现物种间的相互关系。图中每个节点代表属水平的物种,节点的颜色代表对应的门水平,节点越大,与之相关的属就越多,物种间的相关性用线条连接,相关性越强,线条越粗。线条红色正相关,绿色负相关。
微生物与理化指标的相关性网络图
上调代谢物、下调代谢物与菌群和基因的互作关系
理化指标与菌群的相关性热图分析
理化指标与物种的线性回归分析
•实验设计时规划好哪些指标与菌群数据之间做关联分析
在实验方案设计阶段先规划好哪些生理生化、临床指标可以跟菌群数据之间做关联分析,在取样的同时搜集好样本相关的理化指标质量和范围,有利于后期相关性分析,增强分析结果的说服力。
将详细数据填写在样本信息单里,例如:
▼
基于时间的线性分析
微生物群是一个相对较为稳定的组合状态,在受到外部环境变化的影响下,菌群构成也会随之发生改变。在一定的时间范围内,菌群构成呈现出一定的变化规律。
•外界因素影响下肠道菌群在一定时间内变化
例如研究在抗生素药物治疗的情况下,一定时间内病人的肠道菌群变化情况。抗生素会直接影响肠道菌群的丰富度和多样性。
营养饮食的影响相对缓慢
对于益生菌,或者营养饮食等方面的摄入对肠道菌群的干预是缓慢的,被动的,需要长时间的补充摄入才能对整体的菌落构成起到影响作用,直到菌群构成趋于稳定。所以这里时间上要从几周到几个月的时间段内进行选取和采样,形成一个完整的采样周期。
婴儿的肠道菌群变化较为显著,取样间隔更短
又比如婴儿的肠道菌群在头几年变化较为显著,前期取样的时候就需要间隔更短一点,例如几天到几周采一次样,才能更细致的捕捉到婴儿肠道菌群的变化规律。
时间间隔的长短会影响微生物的时间序列分析,依据不同的样本类型,选取恰当的时间间隔周期,能观察短期或长期的菌群变化趋势,可以做个体之间的线性分析,配对T检验。
编辑
取 样
恰当的取样方法对于微生物组组学研究尤为重要,样本的收集和处理决定了后续微生物组鉴定的准确性。
前期的实验方案设计规划好以后,下一步就是落实,基于实验设计选取符合实验方案要求的高质量样本。在取样时需要注意以下几个点:
➤ 1
取样的一致性
重复取样时,确定地理位置,或取样部位、取样深度、体积等都能实现标准化,以保证各个环节的一致性和可重复性。
影响肠道菌群样本的干扰因素有:年龄、地域、感染、疾病,药物治疗如抗生素、化疗、营养饮食干预等。
•收集样本时其他条件尽量保持一致
收集疾病组样本或者健康对照组样本时,尽量选择具有相同地理环境,饮食习惯,年龄段,药物治疗相关的病例作为重复样本。
采集过程的污染物也会被检测到变成样本组成的一部分,所以采样的过程中重复使用的工具,也要进行适当的消毒处理。取样的标准化和可重复性也可以避免由于不同的批次处理带来的样本菌群构成的差异性。
➤ 2
充足的样本量
为了能合理的评估不同分组菌群之间的差异性或相似程度,必须要有一定的数据量来评估差异或者效应的大小。
一般来说,数据量规模越小,一组样本内的变异性越大。因此需要有更多的样本量来获得足够的统计能力。
每组至少3个重复,才能满足最低的组间差异统计检验条件,一般实验我们建议每组至少6个样本重复,临床样我们建议每组至少30个样重复。
➤ 3
取样方法
不同的样本类型,如环境、植物、动物到人类,微生物组的来源差别较大,取样方法也有所差异。
•不同取样部位具有各自的生理特征
关于肠道菌群取样部位问题,该取粪便样本还是取肠道内容物?
根据研究发现不同的取样部位(如:粪便、粘膜活检,肠液等样本)具有各自的生理特征,肠道菌群的研究结果也有所差异。
•肠道内容物具有侵入性,用于某些特定疾病
肠道内容物由于采样方法较为复杂且具有一定的侵入性,所以在日常的应用相对较少。但是如对于一些特定的疾病或者研究问题,需要区分肠道不同部位微生物的组成或特性时,肠道组织样本或肠道内容物样本可能更加适合。
•一般情况下选择粪便样本
从实用的角度考虑,粪便样本可以自然采集、无创,且可以重复采样成为最常用的检测工具,是肠道菌群检测的最优选择。
注意
传统的粪便样本取样方法繁琐,对样本量和保存运输方式条件较为苛刻,例如单次的取样量要达到200mg以上,保存和运输过程中必须冷冻保存。一般临床上病例和健康人收集样本的配合度和接受度也不高,这也大大增加了收集样本的难度和成本。
★谷禾取样管便于采样以及储存运输
为了解决临床和实验过程中对粪便样本的取样遇到的这些实际问题和痛点,谷禾经过多年的肠道菌群检测实践,进一步对粪便样本的取样流程进行优化,开发出了专门用于肠道菌群取样的谷禾肠道菌群取样储存盒,实现了粪便样本的日常常规取样和常温储存运输。
该取样盒操作简单,取样方便,常温可以有效保存7天,日常在家就能实现常规粪便样本取样,缩短了实验人员收集样本的效率,节省了人力成本,所以该取样盒在市面上一经推出,就受到各大院校和临床机构的欢迎。同时也为谷禾做大健康方向前期收集样本阶段,提供了有力的前期技术支持。
谷禾取样管具有以下特征:
1、在家中就可轻松自行采集高质量样品
2、起始样品需要量低至0.01g左右,快速且稳定
3、样本取样7天内常温下储存和运输可保障稳定的群落结构
4、标准样品适合高通量标准化处理
5、能有效获得适用于16S 、宏基因组和qPCR等的高质量DNA
6、条形码化全样本可追溯性
取样方法也比较简单,仅需使用棉签从厕纸上沾取粪便,然后洗脱到取样管的保存液中即可,使保存液可见粪便颜色即表示取样量足够。
谷禾取样管不仅可用于人体粪便样本的采集,动物的粪便也同样适用,例如:大鼠样本用无菌棉签沾取少量粪便样洗脱到样本管的裂解液中;小鼠样本只需要放入1~2粒的粪便粒到裂解液即可。
➤ 4
注意事项
1.如3天内使用过抗生素类,质子泵类胃药,阿片类精神药物请停药3天后进行检测;
2.感冒、腹泻或其他症状期间不影响取样,拉稀或稀便可以用棉签反复沾取粪便至取样管;
3.如长期便秘无排便可使用开塞露等辅助手段获取粪便样本;
4.取样无时间和饮食限制,取样前按照日常的用餐习惯进食即可;
5.完成取样后样本可常温有效存储一周,为保证检测时效请完成取样后尽快送检。如需长期储存,可将样本冷藏保存,-20℃冷藏最多可保存半年,-80℃可保存一年;
6.样本保存于取样管后需要拧紧瓶盖,防止取样管漏液,或者受到环境污染。
➤ 5
取样标准
其他样本类型则需要用到传统常规的取样方法严格按照标准取样,之前我们的文章有对不同样本类型的常见取样方法作详细介绍:
微生物取样方法大全 (点击查看)
注:以上是16s测序项目送样需求,如果是宏基因组测序,需要达到常规标准,而且高宿主样本例如灌洗液,尿液,组织等样本,需要提前处理。
➤ 6
运输送样
送样前要做好以下这些准备:
•样本信息单
样本信息单里填写好相关资料,包括谷禾编号,对应的科研分析名称,分组情况,有多少种分组情况就填几列,样本名称和分组名称由英文字母、数字、"."组成,并以字母开头,不能以数字开头,不支持字符“- ”“_ ”、运算符、中文、空格等特殊字符。
注:名称长度最好不要超过8个字符。
如果要做相关性分析需要提前准备好样本的临床指标、生理生化指标,并将每个样本的具体测得的指标数值填写到样本信息单里。
如果对科研分析不太熟悉,不知道还能提取出哪些有用的分组信息,可以将具体的研究目的、实验方案详细写在备注里,分析人员会根据您的信息给出相应的指导意见和分析方案建议。可以提供一个纸质和电子版的样本信息单。
•样本检查
样本送样前要对样本和运输条件做检查,取样管是否拧紧,是否有漏液情况,样本不受环境污染和干扰,检查样本个数是否能核对的上,在寄样前要在快递箱上附带一张送样信息的纸条,包含以下内容:
寄样单位或联系人:xxx
寄样日期:xxx
样本个数:xxx
实验室接收到样本后会跟送样信息单进行核对,如果样本个数和信息能核对上,则继续对样本进行实验上机,如果样本个数或信息核对不上,会跟客户沟通,核对信息。
小 结
客户在做好实验方案设计和样本收集的前期准备工作以后,后续的实验和测序分析工作就交给我们来完成吧,从收到样本到科研分析报告的出具,周期一般在6~10天左右(16S v4); 15-20天(16S V3V4);15-20天(宏基因组)。
实验室在收到样本以后会先核对信息,然后进行样本DNA提取,质检,建库,测序上机。等测序数据下机以后,对原始数据拆分,质控,然后就进行科研数据分析阶段。
分析思路:
1.先了解不同分组样本都由哪些微生物构成,并计算丰富度,做α多样性分析;
2.比较不同分组微生物群落整体是否有差异,做β多样性分析;
3.进一步找出不同分组之间微生物群落的差异菌属,关键菌属;
4.根据关键菌属可以作为biomarker用于疾病诊断模型构建;
5.找出菌属与临床理化指标的相关性;
6.根据物种构成预测菌属代谢途径,基因功能预测,找出组间差异功能预测,查看菌属是怎么运行宿主的
7.将数据结果整合起来,找出不同疾病环境分组条件下,菌属的差异是否跟疾病相关,并影响宿主。
最终根据科研分析报告的研究方向和侧重科研选择不同的分析方法,并做图像化展示。
差异分析方法:
•Tukey检验
•非参数检验
•基于矩阵的Anosim检验、Adonis检验
•LEfSe分析
•随机森林和ROC曲线
相关性分析方法:
pearson相关系数
spearman相关系数
相关性网络图、相关性热图、线性回归图
功能分析:
PICRUSt2、FAPROTAX、BugBase
PCA、PCoA、NMDS
ROC、RDA
Venn图、花瓣图、Upset图
物种构成柱状图、热图、差异箱型图
GraPhlan物种进化树
metagenomeSeq
Random Forest随机森林
ROC曲线图
graphlan图
Gephi复杂网络图
三元相图
谷禾近期合作发表示例文章:
Hu Y, Li J, Ni F, et al. CAR-T cell therapy-related cytokine release syndrome and therapeutic response is modulated by the gut microbiome in hematologic malignancies[J]. Nature communications, 2022, 13(1): 1-14.
Lou M, Cao A, Jin C, et al. Deviated and early unsustainable stunted development of gut microbiota in children with autism spectrum disorder [J]. Gut, 2021 Dec 20:gutjnl-2021-325115.
Li R, Liu R, Chen L, et al. Microbiota from Exercise Mice Counteracts High-Fat High-Cholesterol Diet-Induced Cognitive Impairment in C57BL/6 Mice[J]. Oxid Med Cell Longev. 2023, 20:2766250.
Xiao W, Zhang Q, Zhao S, et al. Citric acid secretion from rice roots contributes to reduction and immobilization of Cr(VI) by driving microbial sulfur and iron cycle in paddy soil [J]. Sci Total Environ. 2023, 16:158832.
Wang X, Weng Y, Geng S, et al. Maternal procymidone exposure has lasting effects on murine gut-liver axis and glucolipid metabolism in offspring [J]. Food Chem Toxicol. 2023, 174:113657.
Liao J, Dou Y, Yang X, et al. Soil microbial community and their functional genes during grassland restoration [J]. J Environ Manage. 2023, Jan 1;325(Pt A):116488.