2023年4月,由西北工业大学联合复旦大学等院校在Science China Life Sciences上发表题为“Genome-wide DNA methylation landscape of four Chinese populations and epigenetic variation linked to Tibetan high altitude adaptation”的文章,该研究通过对32个中国个体进行了双链亚硫酸氢盐测序(DSBS),揭示了中国汉、藏、蒙、壮四个民族群体中的遗传变异、DNA甲基化变异及两者间的区别与关联,并通过比较藏族与其他低海拔人群的甲基化水平,发现表观遗传可能在藏族人高原适应过程发挥作用。
01 研究背景
DNA甲基化(DNAm)是人类主要的表观遗传机制之一,在多种细胞过程中具有重要作用,DNAm在人群中的变异与遗传因素和环境因素都有关。中国是世界上人口最多的国家,有56个民族,每个民族分布在不同的地理位置,有不同的生活习惯,典型的例子是藏族人民对青藏高原高海拔、低氧浓度和强紫外线辐射的适应。然而,目前还没有中国不同民族群体中DNA甲基化的表观遗传图谱,也没有数据来分析DNAm在藏族人群适应青藏高原中发挥的作用。
02 研究结果
一. 双链亚硫酸氢盐测序(DSBS)揭示了四个中国民族的遗传结构
作者提取了来自中国四个民族,汉族、壮族、蒙古族和藏族32个人的外周血液样本(图1.A),采用新开发的全基因组DSBS技术,可以同时准确识别单核苷酸变异(SNVs)和DNA甲基化。虽然在不同的种族比较中,SNP的数量和位点并不一致,但这些SNP在不同基因组区域的分布比例是相似的(图1.B),进化树结果显示种群SNP可以很好地将四个种族群体划分为不同的亚支(图1.C),PCA的结果也支持四个种族群体在遗传水平上的差异(图1.D),进一步分析四个民族的遗传结构,发现当K=4时,四组无法进行区分(图1.E),表明基因混合可能在这四个种族群体中比较常见。
图1.双链亚硫酸氢盐测序(DSBS)揭示了四个中国民族的遗传结构的增加。
二. 四个民族群体的CpG甲基化变异景观
为了检测DNAm的种族特异性,作者使用非参数Kruskal-Wallis(K-W)检验来确定四个种族人群中差异甲基化的CpG位点,只有一小部分CpG受到种族差异的影响(图2.A),基于种族特异性甲基化位点的层次聚类(图2.B)和PCA分析(图2.C)可以很好地区分4个民族。为了评估这些种族特异性的CpG位点对整体甲基化变异的贡献,作者计算了32个个体中每个CpG的方差,并选择了方差最大的前10%位点,值得注意的是,在KW显著性(P<0.05)的位点和前10%的CpG位点之间只有一小部分的重叠(图2.D),表明大多数种族特异性CpG并没有导致人群中DNAm的巨大变异,但他们在基因组上的分布是显著相关的(图2.E),在不同基因组上的比例也与总的CpG位点是相似的(图2.F)。另外作者还发现在大部分基因组区域,方差最大的前10%CpG位点的甲基化水平低于KW显著的位点和总的CpG位点(图2.G)。这些数据表明,在全基因组范围内,种族差异只能解释DNAm变异的一小部分,而且许多大部分改变的位点与种族差异没有明确的联系,而是倾向于分布在低甲基化的位点。
图2.四个民族群体的CpG甲基化变异景观
三. 非种族特异性CpG的DNAm变异与遗传变异的相关性大于种族特异的CpG
为了评估中国群体的表观遗传差异,作者计算了Pst,即群体间的表型分化,四个民族的平均甲基化水平随着Pst值的降低而降低,在高Pst范围内,蒙古族和壮族的甲基化水平高于汉族和藏族(图3.A),接下来作者利用Pst值最大的前200个CpG,研究了遗传距离与CpG甲基化曼哈顿距离的相关性,发现二者存在显著的相关性(图3.B),Pst较低的CpG也与遗传距离相关,甚至更显著(图3.C)。这种种族特异性的CpG是由于遗传因素还是环境因素引起的目前尚不清楚,因此,作者将DNAm距离与遗传距离的比较分为民族间和民族内比较,并分别计算两种类型的相关性,在两项比较中,Pst较大的CpG的相关性并不显著,但对于Pst较低的CpG在种族间更显著(图3.D、E),可能是由于在这些种族间的DNAm距离明显大于种族内的DNAm距离(图3.F),这种差异在遗传距离上也是一致的(图3.G),另外这种差异不仅在Pst最高的CpG上很明显,而且在Pst最低的CpG上也很显著(图3.H),说明民族特异的甲基化变化可能主要取决于民族间的环境差异而非遗传差异。
图3.CpG的种族特异性及DNAm距离与遗传距离的关系
四. 不同种族群体间的DNA甲基化差异
接下来作者分析了四个种族群体中的差异甲基化胞嘧啶(DMCs)和差异甲基化区域(DMRs)。与其他三个民族相比,藏族人的DMR(图4.A)和DMC(图4.B)下调的比例更高,这表明藏族人的基因组发生了低甲基化的变化。在不同的种族群体比较中,大多数DMRs的长度较短,差异较小,DMR长度与甲基化差异之间存在微弱的正相关关系(图4.C),虽然在这些比较中,DMR或DMC的数量不同,但它们在不同基因组区域的分布比例相似(图4.D、E)。为了探讨DNAm变异对中国群体基因功能的可能影响,作者又分析了不同种族比较中发现的共同或不同的DMR相关基因(图4.F),并对至少两次比较中存在的DMR基因进行了KEGG(图4.G)和GO(图4.H)富集分析,发现这些基因分布在不同的生物过程中。这些结果表明,中国种群的DNAm变异可能与人类疾病、生境和生理差异等方面的许多基因有关。
图4.DMR和DMC在不同种族群体之间的差异
五. 藏族的DNA甲基化改变与高温适应有关
为了探究DNAm差异与藏族群体高原适应特征的潜在关联,作者分析了藏族和其他民族群体之间的DMR基因,发现与高海拔适应相关的通路显著富集,比如低氧胁迫效应(表格1),另外已知的与高海拔适应相关的基因(图5.A),比如ARNT(图5.B)、EPAS1(图5.C)和 EGLN1 基因(图5.D)区域,在藏族群体与其他民族群体比较中存在显著的甲基化差异。这表明DNAm差异可能与藏族人对高原适应的遗传特征相关联。
表格1藏族和其他三个民族之间的DMR-基因在高海拔适应途径中富集
图5.藏族人的DNA甲基化改变与高海拔适应有关
03 研究结论
该研究通过对32个中国个体进行了双链亚硫酸氢盐测序(DSBS),包括汉族、藏族、壮族和蒙古族,发现基于DNAm的表观遗传结构不同于群体的遗传结构,种族差异仅部分解释了DNAm的变异,在不同的生物过程中发现了差异甲基化区域(DMRs),其中,藏族和非藏族人之间的DMR基因在EPAS1和EGLN1等高海拔基因中富集,表明DNAm的改变在高海拔适应中起着重要作用。该研究结果首次揭示了中国群体的表观遗传图谱,并证明了表观遗传变化与藏族人的高海拔适应之间的联系。
-
原文链接:https://link.springer.com/article/10.1007/s11427-022-2284-8