Nature -- 人类首个 “泛基因组”旨在编目人类遗传多样性

news2025/1/10 12:54:43

在人类基因组项目发布第一个人类基因组草图的20多年后,研究人员发布了人类“泛基因组”草图——这预示着一种新的参考基因组的出现,它能捕获到更多的人类遗传多样性信息。

9b64ddc45e94247d48237b6d70f13010.jpeg

泛基因组变异图由两个元素组成:序列图,其ode表示定向DNA链,双向边表示连通性关系;嵌入的单倍型路径(彩色线条)代表单个的组合。

这就像从黑白电视跳到1080p,”加州大学圣地亚哥分校的基因组科学家Keolu Fox说。

“这是我们所有人都一直在等待的事情,”比利时列日大学和刚果民主共和国金沙萨大学的遗传学家Aimé Lumaka说。“当前的参考基因组不仅缺少部分基因组信息,而且最重要的是缺乏多样性,”他说。

该泛基因组草图于510日发表在《Nature》,是由人类泛基因组参考联盟(The pangenome consortium)完成的。该国际项目成立于2019,旨在绘制人类遗传变异的整体分布图,以便遗传学家能够将其他序列与之比较。这样的参考基因组将有助于研究基因与疾病之间的潜在联系。

6fd368386bf067e0bbe01d147836420c.png

继2022年发表的第一套完整的人类基因组序列之后, 泛基因组草图填补了人类基因组项目留下的空白。但与原始的人类基因组草图及其后继者不同,前者主要来自一个人的DNA,泛基因组草图代表了来自非洲、美洲、亚洲和欧洲的47人的DNA序列集合。

e60c19edaa65975e75ca8c3227606dd7.png

纽约市西奈山 (Mount Sinai)医学院的遗传学家Eimear Kenny和她的同事通过计算机对所有这些序列进行了比对,形成了一个“泛基因组图”——在概念上类似于伦敦地铁图,其中的分支路径表示遗传变异。研究人员发现,泛基因组使他们能够在每人身上识别出两倍于使用原始线性参考基因组可能识别出的结构变异——大的基因组改变,如基因重复或缺失。该团队将于2024年中期完成350人的序列分析。(MP长篇综述 | 植物泛基因组及其应用)

泛基因组的新发现

泛基因组增加了1.19亿个DNA碱基,这些DNA碱基在现有的人类基因组(参考基因组)中不存在。大部分DNA位于之前未知的基因组部分, 其中包含与DNA其他区域重复的多个基因拷贝。

这些重复部分的变化速度快于基因组的非重复部分,华盛顿大学的人类遗传学家Evan Eichler说,他是人类泛基因组参考联盟的领导者之一。Eichler和同事研究这些重复区域产生的变异类型时发现,"一个非常强烈的信号表明正在发生的变异本质上不同于基因组其余部分的变异,"他说。

这些重复区域的部分区域与人类相对于其他物种的大脑以及与其他灵长类动物区分开来的特征有关。其他一些区域与某些特征或疾病有关。

泛基因组是如何构建的?

大约20年前的人类参考基因组主要来自一个人,但它最终是由60多人的DNA测序拼凑起来的(SN:3/4/21)。这些年来一直在重编和添加,但仍有漏洞。

去年,第一个完整的人类基因组被发布(SN:3/31/22)。这个基因组包含每个人类染色体从端粒到端粒的所有DNA。只是这个基因组不是来自一个完整的个体。它来自一种称为滋养细胞胞瘤的肿瘤。这些异常肿瘤的产生是由一个人的精子与一个空卵结合,父本的染色体被重复。

这样的肿瘤遗传信息"甚至不代表一个个体。它只来自一个个体的一半,"马里兰大学医学院的人类遗传学家Timothy O’Connor 说。他未参与这两个项目中的任何一个。

新的泛基因组草图来自实际的个体,包含来自世界不同地区的47个匿名人的近乎完整的DNA。这个多样性很重要,"因为它帮助我们理解我们自己作为一个单一的人类物种," O’Connor说。

过去的遗传学研究因过度依赖欧洲血统的DNA而受到批评。仅研究一个人群可能意味着错过特定人群产生的遗传变异, O’Connor说。"拥有泛基因组参考序列使我们以更细致的方式评估不同人群的特异性变异。希望这将带来对个体生物学更深入的研究。"

泛基因组对人类健康的重要性如何?

对人类遗传多样性有更全面地了解,可以帮助研究人员揭示各种疾病和紊乱的遗传基础。

3fee97db46e69d206b5a22dfce02c43c.png

研究人员使用泛基因组图谱追踪染色体如何折叠进而使不同部位彼此接调控。科学家可以看到结构变异中的一些折叠和化学标记,可能会影响基因的开启和关闭。这可能会影响性状或健康。Eichler的团队还绘制了一个基因转换(将另一个拷贝转换为自己的图像)的泛基因组版本。这些基因转换意外地普遍,平均每个人拥有超过2000个这样的转换实例。

随着对人类遗传学更为细致和复杂的认识,基因医学有望得到改善。但Eichler表示,泛基因组在医疗诊所产生影响可能还需要一段时间。

研究人员希望泛基因组能帮助他们更容易诊断导致罕见疾病的基因变化,并找到常见疾病的治疗方法。一旦实现这一目标,临床医生可能会开始将泛基因组数据纳入自己的临床试验。

伦理道德的挑战

在新闻发布会上,Kenny和泛基因组联盟的其他研究人员称,该项目将确保遗传数据在伦理道德允许的范围内收集和使用。Kenny表示,该联盟已承诺样本将不包括本土部落或其他正式政策禁止提供样本的群体的成员。

然而, 包括Fox在内的研究人员担心该项目重复使用其他大规模遗传多样性项目的样本会存在伦理问题的风险(许多正在分析的样本来自2008年启动的1000基因组项目(1000 Genomes Project,该项目旨在绘制26个不同人群的遗传变异图)的参与者。)。例如,20世纪90年代的“the Human Genome Diversity Project”和正在进行的“All of Us Research Program”项目因未能与其抽样DNA所属的社区成员进行充分沟通而受到批评。

“当然,我们将使用新的数据集和新工具进一步推进对人类基因组结构变异的认识。我们应该努力实现从最基本的层面上公平地将代表人数不足的社区纳入这项工作,”亚利桑那州立大学的遗传流行病学家和生物伦理学家Krystal Tsosie说。Tsosie也是以美国原住民科学家和部落成员为主导的非营利研究机构Native BioData Consortium的共同创始人。“如果研究首要的不是使各社区受益,那么我们做的就是根本错误的事情,”她说。

Fox同意Tsosie的看法。他担心人类泛基因组参考项目的数据可能被制药行业用于商业目的而不会给研究参与者或他们的社区带来实实在在的好处。

重新审查知情同意

华盛顿特区的霍华德大学遗传学家Latifa Jackson指出,1000基因组项目部分依靠许多年前收集的样本。我担心许多参与泛基因组的地区有在20世纪80年代根据不同的政治和社会结构收集的样本,”她说。我们需要重新审视在30-40年前在不同的政治结构下收集样本的知情同意书。

“我们认识到这项工作处在基因组研究的最前沿,具有特定特征,包括开放数据访问,这需要大量考虑,其应用也会提出伦理、法律和社会问题,”Kenny在新闻发布会上说。“我们不仅依靠自己的专业知识,而且在世界各地的学者和组织的工作基础上,注意到许多陷阱,并系统地审查,汲取教训,并把这些教训带入这个新计划。”

09ee71c30eb5bafe8b717ce6053d7a07.png

人类全基因组参考联盟(Human Pangenome Reference Consortium)在此呈现了人类全基因组参考序列的初步草图。该全基因组由来自基因多样化个体队列的47个单体型的二倍体组装构成。这些组装涵盖了每个基因组预期序列的99%以上,并且在结构和碱基水平上的准确性超过99%。基于这些组装的比对,我们生成了一个全基因组草图,其中包含已知变异和单倍型,并揭示了结构复杂位点的新等位基因。此外,与现有参考基因组GRCh38相比,我们还增加了1.19亿个碱基的常染色体多态性序列和1,115个重复基因。其中大约有9000万个碱基来自结构变异。使用我们的全基因组草图来分析短读长测序数据,与参考GRCh38的工作流程相比,可使低频变异发现的错误降率低34%,并且每个单倍型检测到的结构变异数量增加了104%,这使得我们能够对每个样本中的大多数结构变异等位基因进行分型。

访问Github获取组装资源:https://github.com/human-pangenomics/hpp_pangenome_resources

adcdf07a2f8996ae47d31449d01019fc.png

阅读原文内容:

  1. 1.     https://www.sciencenews.org/article/new-human-pangenome-biology-dna-diversity

  2. 2.     https://www.nature.com/articles/d41586-023-01576-y

查看原文信息:

https://www.nature.com/articles/s41586-023-05896-x

往期精品(点击图片直达文字对应教程)

29c3520940b1895115294ed5d7643e1f.jpeg

2fe696c4f5d8127203543950e04f3f11.jpeg

6a2fb0b2a3b1c15407b70c615e164c72.jpeg

f43623c75e7b9a8f9a8e37a39ac028d0.jpeg

a3c301ebbaf7671566a5083f0560e860.jpeg

622a57546d9c9ebfa4ddd7c938d2783b.jpeg

8efae219f8e9a65188d6d8fedd331d56.jpeg

e7f92d02e6a37eb45b540e147cbbaec1.jpeg

283c163d6ac299fa46b04166f3b30cb3.jpeg

4272591f33c47fe7a88da293f4f0898c.jpeg

139d36af7f7d7780c952b350e2ed7f5a.jpeg

e2c383d99c6d934033a3ece3e2391f3f.jpeg

3a99ce78f5a800e2dc691a1472dee199.png

b62b6b4798ca97a66d81036f52ee0619.png

6fac129399cc1a60350f39e5b527e076.png

87ec19f87ceaef9c260a941ba40b7694.png

b30a1f35d104c501f9e2a55b323d2c6d.jpeg

b5d1a7955675242adce2081beb3276d6.jpeg

faf743d747fc8e62c086ae4ea03a1711.jpeg

f4f2a79a01900460b0573e0beac2437c.jpeg

8d8caf3884fede0735d399e0a93c8110.png

12b015ee9f5f9ba764615584fa1253e7.png

950ee55ebbc5265552b3001da8fec905.jpeg

509f2e10131d8ac5636eaab603ab7f41.png

7b2d0d58a78ffdc8b7c7b523723d60d4.png

6ff5db7e7e2f77d6a956cea85a76e18f.jpeg

c1dcf4dcae788cfde47e4d69f645bf33.png

556c607bff242997587d51d317c56d9c.png

机器学习

后台回复“生信宝典福利第一波”或点击阅读原文获取教程合集

94ad6c27f784594399b7d4d14acaefd5.jpeg

df058331c4b29c3827069762b9787d3c.jpeg

1eb9030ef603141ea24c486302a10155.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/561795.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

学系统集成项目管理工程师(中项)系列25_计算机网络知识

1. OSI七层协议 1.1. 物理层 1.1.1. RS232、V.35、RJ-45、FDDI 1.2. 数据链路层 1.2.1. 【21上选17】 1.2.2. IEEE802.3/.2、HDLC、PPP、ATM 1.3. 网络层 1.3.1. IP、ICMP、IGMP、IPX、ARP 1.3.2. 路由选择 1.3.2.1. 【20下选17】 1.4. 传输层 1.4.1. TCP、UDP、SPX…

越小越好: Q8-Chat,在英特尔至强 CPU 上体验高效的生成式 AI

大语言模型 (LLM) 正在席卷整个机器学习世界。得益于其 transformer 架构,LLM 拥有从大量非结构化数据 (如文本、图像、视频或音频) 中学习的不可思议的能力。它们在 多种任务类型 上表现非常出色,无论是文本分类之类的抽取任务 (extractive task) 还是文…

又一批令人惊艳的 AI 工具,诞生了!

公众号关注 “GitHubDaily” 设为 “星标”,每天带你逛 GitHub! 自 ChatGPT 发布以后,AIGC 行业的热度也一直在持续发酵。几个月过去了,对比之前,各类 AI 工具的热度不减反增,各行各业的人都早开始拥抱 AIG…

SAP工具箱 MR22自定义BAPI

点击蓝字 关注我们 一 前言 标准事务代码MR22 通过调整金额影响物料的成本价,前台界面中单个凭证中允许输入多行物料, 但是对应的BAPI函数仅支持输入单行物料 BAPI_MATVAL_DEBIT_CREDIT 正常库存BAPI_SALESORDSTCK_DEBIT_CREDIT 销售订单库存 这种情况 婶可忍叔不可忍 (感谢用户…

Python 闭包装饰器和多任务--闭包,装饰器,进程,线程

1.闭包案例 在函数嵌套的前提下,内部函数使用了外部函数的变量,并且外部函数返回了内部函数,我们把这个使用外部函数变量的内部函数称为闭包. 外层函数: config_name(),外层函数中的变量是 name 内层函数: inner(),inner()使用了外层函数的变…

34从零开始学Java之构造方法都有哪些特性?

作者:孙玉昌,昵称【一一哥】,另外【壹壹哥】也是我哦 千锋教育高级教研员、CSDN博客专家、万粉博主、阿里云专家博主、掘金优质作者 前言 在前面的几篇文章中,壹哥给大家介绍了不少关于方法的内容,这些内容是我们日常…

zabbix监控之javasnmp自定义监控

1、客户端开启 java jmxremote 远程监控功能 上传 tomcat 软件包到 /opt 目录中 cd /opt tar zxvf apache-tomcat-9.0.16.tar.gz mv apache-tomcat-9.0.16 /usr/local/tomcat #配置 java jmxremote 远程监控功能 vim /usr/local/tomcat/bin/catalina.sh ...... #位置在 cygw…

嵌入式音视频开发面试过程遇到的问题!

前言: 今天继续给大家分享音视频面试过程会被常问到的一些问题! 面试的具体题目: 1、说一下播放器的设计过程: 这里的话主要分以下几步完成: 开启一个线程进行解封装操作 , 这包括:读取音频、视频的压缩数据…

chatgpt赋能Python-python_ps图片

Python PS图片的SEO指南 Python在数字图像处理中广泛应用。其中,Photoshop文件(psd)是一种常见的图像文件格式。但是,如何在搜索引擎上优化Python PS图片并提高其排名仍然是一个挑战。 什么是Python PS图片? Python…

数据结构和算法基础学习1

​​​​​​​ 网址第01周b--1.1数据结构研究_哔哩哔哩_bilibili

学C的第十九天【实用调试技巧:1. 调试;2. Windows环境调试介绍;3. 一些调试的实例;4. 一些调试的实例】

相关代码gitee自取:C语言学习日记: 加油努力 (gitee.com) 接上期:学C的第十八天【指针初阶:5. 指针和数组、6. 二级指针、7. 指针数组;初识结构体:1. 结构体的声明、2. 结构体成员的访问、3. 结构体传参&#xff1b…

java中的栈、堆、方法区

栈(stack) Java栈与堆不同每一个线程都有一个stack,栈的区域非常小,大概只有1M左右,但是存储速度非常快,所以我们把快速执行的任务存储在stack。 特点:自动分配,连续空间&#xff0…

如何从文档中提取结构化数据?parsio.io

parsio.io 产品名:Parsio电子邮件解析器 技术:采用人工智能技术的电子邮件解析器。 支持多种格式: 可以解析电子邮件和附件中的数据,包括PDF、HTML、XLSX(Excel)、CSV、DOCX、XML、TXT等格式。 提取模版&am…

FANUC机器人作为EtherCAT通信从站的相关配置方法

FANUC机器人作为EtherCAT通信从站的相关配置方法 基本介绍: 前提条件: 硬件部分: 机器人需要使用EtherCAT从站板卡 A20B-8101-0821。使用带屏蔽层的网线连接板卡和PLC的网口。 本例中使用的网络接口为EC-IN(CD38Y) 软件部分: 机器人需要安装软件:1A05B-2600-J743! Et…

NLog使用

Nlog 日志组件的使用 这个博文关注 .net framework下的NLog日志组件的使用. 在项目中需要将日志写到日志文件中, 另外一些重要信息要显示在界面上. 使用 NLog 可以轻松做到这点.NLog wiki 页面 nuget 安装两个主要组件 NLogNLog.Windows.Forms 使用总结 日志文件 layout 按照 j…

程序员的 Windows 工具箱「GitHub 热点速览」

作者:HelloGitHub-小鱼干 如何精简 Windows 并快速配置开发环境呢?本周特推的 winutil 是一个程序员的 Windows 工具箱,它提供了开发工具的一键安装以及减少系统垃圾的功能,一切为了简洁、高效。同样高效的还有 C 日志库 spdlog&a…

对讲机亚音是什么?有什么作用?

一、对讲机亚音是什么? 对讲机亚音又被称为亚音频。是比音频信号频率更低的一种特殊信号,目的在于检查信号是否合法,是否对信号进行响应。 亚音是一种特殊的振幅信号,人耳无法感觉也无法听闻到这些信号,所以对于无线…

mac mongodb 安装及配置

1.官网下载地址:MongoDB: The Developer Data Platform | MongoDB 2.下载好压缩包,解压后放在想放的地方,例如: /Users/xiaokeai/environment/mongodb-macos-x86_64-5.0.18 3.打开终端后,在家目录中打开.bash_profil…

Linux系统编程学习 NO.4 ——基础指令学习、操作系统时间的概念、文件压缩包的概念

1.时间相关的概念以及指令 1.1.时间相关的指令 1.1.1.date指令 date可以指定时间显示的格式:date 指定格式 选项 %H:小时 %M:分钟 %S:秒数 %Y:年份 %m:月份 %d:日 %F:相当于%Y-%m-%d %X:相当…

java网络编程从0到1快速上手

目录 网络编程概述 网络基础 网络编程的目的 网络通信要素概述 通信要素1:ip地址及端口号 IP 地址:InetAddress 端口号 InetAddress类 通信要素2:网络协议 网络协议概述 TCP/IP协议簇 TCP 和 UDP ​Socket Socket类的常用构造…