环境DNA(environmental DNA, eDNA)领域发展迅速,但人类eDNA的应用仍未得到充分利用和重视。eDNA分析的广泛应用将为病原体监测、生物多样性监测、濒危和入侵物种检测以及群体遗传学带来许多公认的好处。
佛罗里达大学野生动物疾病基因组学教授David Duffy带领的研究团队对这种广泛存在的人类DNA进行了测序,相关研究成果于2023年5月15日最新发表在《Nature Ecology & Evolution》,题目为“Inadvertent human genomic bycatch and intentional capture raise beneficial applications and ethical concerns with environmental DNA”。本研究结果表明,这些广泛存在的eDNA质量非常高,可以让科学家识别与疾病相关的突变,并确定附近人群的遗传血统。
J Farrel和Sean Goggin在圣奥古斯丁收集水样。
图片:Todd Osbourne
期刊:Nature Ecology & Evolution
影响因子:19.1
DOI:10.1038/s41559-023-02056-2
文章概述
美国佛罗里达大学的一个研究团队发现,eDNA测序可能会意外地收集到人类基因组信息,即“人类基因副产品(HGB)”。该研究团队分析了一些样本,从中识别出了人类遗传物质,并通过对额外样本的分析来定量HGB的水平。这些样本来自各个远离或接近人类活动的水域。在所有eDNA样本中,该团队都识别出了HGB。有些样本的质量足以识别出身份信息,例如祖先和疾病易感性。研究人员指出,由于HGB带来了eDNA研究的伦理和隐私问题,该领域的研究可能需要更严格的审查。
图1 样本类型和来源
主要结果
对野生动物和病原体监测产生的水和沙子eDNA进行宏基因组深度测序,在所有样本中都检测到与人类匹配的reads(图1b)。此外,在一些野生(非康复水箱)水样中,检测到的人类测序数据的水平几乎与主要研究物种绿海龟一样高。正如预期的那样,修复砂和水箱水样品中海龟的eDNA含量高于人类的eDNA。由于研究地点并不直接毗邻人类密集居住地区(即城市或城镇),因此从野生样本中提取的人类eDNA的高比率尤为重要。
在这些复杂的宏基因组eDNA测序样本中,人类Y染色体可以被用于确认真正的人类reads的存在。在所有样本中均检测到人类Y染色体基因组副产品,河口样本的人类Y染色体RPTM值往往高于海洋样本。
用于人类eDNA定量的物种特异性qPCR分析显示,人类DNA很容易从位于城镇附近的水位点重建(图1c和图2)。同时研究人员还前往一个人迹罕至的偏远岛屿,未检测到人类DNA,但从志愿者在沙滩上的脚印中可提取到人类DNA(图2b)。此外,研究人员从一家兽医院收集了室内空气样本,并找到了与工作人员、动物和常见动物病毒相匹配的DNA(图2c)。
图1 从现场样本中回收人类eDNA
图2 对来自的佛罗里达水、沙和空气样本中人类eDNA的物种特异性qPCR定量分析
通过qPCR对每个样本中的人类eDNA水平进行定量后,选择了7个样本进行MinION测序,以确认人类基因组信息可以来源于有意识的人类。用6个有意识的人类eDNA样本(收集于2022年)和旅程时间最长的(旅程超过904 km)的水阴性现场对照样本进行的。在没有任何富集的情况下,水、人类足迹沙子和室内空气中的人类eDNA样本返回了数千个与人类一致的reads,而现场对照组水样和无人类足迹沙子eDNA样本只有2到26个与人类匹配的reads。结果显示,eDNA不一定是片段化的DNA,因为即使没有采用高分子量提取方法或长读文库制备方案,研究人员也恢复了长达148,969 bp的人类eDNA单reads(空气eDNA;水120,998 bp;沙子39,229 bp)(图3b)。
图3 eDNA样本宏基因组测序结果
为了证明人类eDNA可以用于不仅仅是定量的应用,研究进一步检查了eDNA数据中已知的人类遗传变异,以确定基于eDNA的祖先和疾病易感性应用是否可行。在gnomAD(v.2.1)中注释的缺失变异可以在所有三种人类阳性eDNA样本中检测到,主要在水中,但在沙子和空气样本中也有较小程度的缺失变异(图4a)。在单条read中检测到的最长缺失突变为40,738 bp,这是欧洲和拉丁美洲人群中常见的拷贝数多态性,位于人类2号染色体上。
接下来,研究人员评估了在水和沙质eDNA样本上进行人类外显子组富集的可行性。5个eDNA样品富集了人类外显子组,然后再通过高通量二代测序。结果表明,外显子组富集增加了人类对齐reads的比例(图4b)。外显子组富集后,水eDNA样本有48%的测序reads与人类基因组对齐(207.2亿人类对齐碱基),代表了目标人类外显子组区域的473x覆盖度(图4b)。
然后,研究人员检测了在eDNA样本中存在的人类群体-基因组水平的分辨率。检测到的缺失突变(图4a)在不同的人群中以不同的等位基因频率发生。该研究还对所有有意测序的人类eDNA阳性样本进行了单倍群和单倍型分析。每个评估的eDNA样本都可以进行群体基因组分析,不同样本之间特定单倍群和单倍型的比例不同(图4c)。每个样本还包含了复杂的微生物混合数据,证明了eDNA(包括空气eDNA)在同时检测人类、动物和微生物方面的实用性。
图4 鸟枪和外显子组富集的eDNA样本的突变和遗传祖先分析
总结
本研究结果表明,从环境当中可以很容易获得人类的eDNA,并且这些eDNA的完整性与高品质足以进行分析和测序,可用于识别与疾病相关的变异,并确定生活在这些地区的人的遗传来源。然而,检测人类eDNA可能会对个人信息安全造成威胁。因此,研究人员建议,为了适当地应用eDNA技术和处理这些信息的道德问题,决策者、科学界和其他相关利益方需要小心谨慎,并对在伦理上如何处理人类eDNA展开更深入的讨论。
参考文献
Inadvertent human genomic bycatch and intentional capture raise beneficial applications and ethical concerns with environmental DNA. Nature Ecology & Evolution, 2023.