基因组学系列3:基因分型Phasing与单倍型参考序列HRC

news2024/12/25 13:03:47

1. 基因分型Phasing概念

基因分型,也称为基因定相、单倍体分型、单倍体构建等,即将一个二倍体(或多倍体)基因组上的等位基因(或杂合位点)正确定位到父亲或母亲的染色体上,最终使得来自同一亲本的等位基因能排列在同一条染色体上

二代测序是将序列混在一起进行测序,通过比对到参考基因组,检测存在哪些变异以及变异的基因型(Genotype),但无法直接区分序列是母源还是父源,只有通过基因分型才能判断亲本来源。

2. 基因分型的方法

家系分型和LD分型常用的工具有BeagleShapeit,都包含了家系分型和LD分型模块。

2.1 家系分型

家系分型是目前构建单倍型最准确的方法,家系样本越多,分型效果越好,缺点就是需要家系Trio样本,对于无法获取家系样本时则无法完成分型,并对于父亲、母亲和子女都是杂合的位点无法进行分型(大约占总变异位点的1/5)。

2.2 LD分型

利用群体中大量无血缘关系的个体,根据LD(连锁不平衡)原理和数据模型,推断群体中每个个体的单倍型方法。通过人群频率大于5%的变异存在的LD block(Tajima’s D > 0.5)长度大多为50kbp-60kbp,block的长度在不同人种中不相同,非洲人由于更古老因此姐妹染色单体发生重组的次数会更多,LD block相比于其他人种长度更短。由于LD block的存在,因此可以利用数学模型(如HMM算法)反推出个体的单倍型。

LD分型精度受到群体的影响,对于常见变异分型效果很好,但对于罕见变异和低频变异(<1%)的效果较差,因此很难获得个体完整的单倍型。

2.3 物理分型

一条reads/一对reads或克隆上存在的碱基必定来自同一条染色体,每个片段就是单倍体的局部,将局部连接为整体即可完成Phasing。物理分型不需要家系数据,无需借助LD关系,仅依赖自身的测序数据,就可以完成Phasing。物理分型依赖于reads上的杂合SNP位点作为区分标记,由于人类基因组杂合SNP之间的距离大约为1.5kpb,因此需要长序列的测序技术(三代PacBio、ONT和华大Long Fragment Read-LFR等)获取测序数据。

3. 遗传解读中的应用

在遗传解读时,需要获取基因突变位点的相位后,才能更好地判断突变是否会产生对应的表型。当一个等位基因的一个拷贝发生了变异(例如LOF,功能缺失或缺失等),由于存在另一个拷贝,基因表达可能不会受到影响,从而不具有表型,只有当两个拷贝都发生变异时,才影响基因的表达从而产生表型。

4. 人类单倍型参考序列Reference Consortium(HRC)

**基因型推断(Imputation)**需要单倍型参考序列集作为基础数据,在GAWS中是必要的环节,参考基因序列的质量直接影响了后续基因型-表型关联分析的结果。

HRC是一个大型的人类单倍型参考序列,合并了多个项目的测序数据。全基因组SNP微阵列芯片获得样本基因型后,可使用该单倍型参考基因组进行基因型的推断(或称为填充)和定相,GWAS研究中运用较为常见。截止到2024年7月,HRC包含了64,976个人类单倍型和39,235,157个SNP。相比于1000G、UK10K数据库,采用HRC单倍型数据库基因型填充的准确率更高

准确率比较

目前提供网页版的免费的基因型推断和定相服务-Sanger Imputation,网址如下:
https://www.sanger.ac.uk/tool/sanger-imputation-service/

基因型推断的工具网站:
https://imputation.sanger.ac.uk/

sanger网站需要上传VCF或23andMe格式的GWAS数据,预定相可选择EAGLE2或SHAPEIT 2,基因型推断PBWT算法,参考panels可选择1000 Genomes Phase 3, UK10K和 the Haplotype Reference Consortium。

https://imputationserver.sph.umich.edu/

Imputation

HRC 只公开了部分数据提供下载,通过Request Access下载,链接如下:

https://ega-archive.org/datasets/EGAD00001002729

HRC DATA

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1892671.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

HMI 的 UI 风格成就经典

HMI 的 UI 风格成就经典

【自动驾驶仿真在做什么——初学者总结(陆续补充)】

文章目录 基础概念自动驾驶级别再稍提一下ODD是什么&#xff1f; 自动驾驶仿真分类软件在环仿真硬件仿真 仿真究竟难在哪&#xff1f;一些名词解释 最近也是学习自动驾驶仿真相关知识&#xff0c;习惯去总结一下&#xff0c;方便自己回顾和总结&#xff0c;主要包括了自动驾驶框…

登 Cell 子刊!清华大学张强锋课题组开发 SPACE 算法,组织模块发现能力领先同类工具

多细胞生物中的细胞尽管共享相同的基因组&#xff0c;但因其内部基因调控网络的差异以及与周围微环境中相邻细胞的外部信号交流&#xff0c;使得它们在形态、基因表达和功能上展现出显著的多样性。为了将细胞类型信息与其在组织内的空间位置相关联&#xff0c;空间转录组学 (Sp…

OpenLCA、GREET、R语言的生命周期评价方法、模型构建

原文链接&#xff1a;OpenLCA、GREET、R语言的生命周期评价方法、模型构建教程https://mp.weixin.qq.com/s?__bizMzUzNTczMDMxMg&mid2247608240&idx6&sn1b5758206d500399fe7cc69e800f61fe&chksmfa826657cdf5ef413d31557941a1c5db5cc84bba8d0f408c469e05a4118c…

软考的报名详细流程

2024年软考的考试时间已经公布&#xff0c;分别为5月25日至28日和11月9日至12日。准备参加2024年软考的朋友们&#xff0c;一定要提前关注官方发布的考试安排。 本文将详细介绍软考报考的整个流程。准备报考的朋友们&#xff0c;阅读本文就足够啦&#xff01;软考的报考流程大致…

Vant Design - VUE 时间区间限制

效果图&#xff0c;限制7天 实现代码 <a-range-picker v-model"dateTime" style"width: 100%" :disabled-date"disabledDate" format"YYYY-MM-DD HH:mm:ss" :showTime"true" :placeholder"[开始时间, 结束时间]&quo…

Vue 解决报错 VM6290:1 Uncaught SyntaxError: Unexpected identifier ‘Promise‘

Vue 报错 VM6290:1 Uncaught SyntaxError: Unexpected identifier ‘Promise’ 排查 控制台报了一个错误 , Uncaught SyntaxError: Unexpected identifier ‘Promise’&#xff0c;网上查到的方法是 缺少符号&#xff0c;语法写法错误&#xff0c;但这些都没有解决我的问题&am…

Simulink 模型生成 C 代码(三):将模型参数配置为全局变量以在运行时调整

默认情况下&#xff0c;代码生成优化可避免存储不参与入口函数接口的模型参数和大多数信号。要使参数可调和相关信号可访问&#xff0c;请通过显式配置方式来标识它们。 在模型 RollAxisAutopilot 的 BasicRollMode 子系统中&#xff0c;将 PID 控制参数配置为在代码中显示为可…

VMware Workstation桥接模式无法上网

问题背景 我之前创建过一个虚拟机&#xff0c;当时虚拟机的网络模式使用的是桥接模式&#xff0c;配置好了固定ip地址&#xff0c;是可以正常上网的&#xff0c;中间没有做任何网络上面的配置。但是今天再打开这台虚拟机时&#xff0c;发现竟然不能上网了。 物理主机的ip信息配…

构造函数深入理解

目录 构造函数构造函数体赋值初始化列表初始化列表格式初始化列表的意义以及注意点const修饰的成员变量初始化对象成员具体初始化的地方缺省值存在的意义例子1例子2 初始化与赋值引用成员变量的初始化注意点1注意点2我的疑惑 自定义类型成员初始化例子1例子2例子3例子4 初始化列…

JAVA小知识31:多线程篇2

一、等待唤醒机制 生产者和消费者&#xff0c;也叫等待唤醒机制。他是一个十分经典的多线程协作的模式。我们来讲一个小故事&#xff1a; 在一个繁忙的工厂里&#xff0c;有一个生产线&#xff0c;我们称之为“共享资源”。这个生产线一次只能生产一个产品&#xff0c;而且需要…

Stable Diffusion【基础篇】:降噪强度(denoising strength)

提到降噪强度&#xff08;denoising strength&#xff09;&#xff0c;大家一定不会陌生&#xff0c;这个参数是图生图中最关键的参数之一。今天在Stable Diffusion Art网站看到一篇介绍降噪强度&#xff08;denoising strength&#xff09;的文章&#xff08;地址&#xff1a;…

HMI 的 UI 风格创新无限

HMI 的 UI 风格创新无限

「实战应用」如何用图表控件LightningChart JS创建SQL仪表板应用(三)

LightningChart JS是Web上性能特高的图表库&#xff0c;具有出色的执行性能 - 使用高数据速率同时监控数十个数据源。 GPU加速和WebGL渲染确保您的设备的图形处理器得到有效利用&#xff0c;从而实现高刷新率和流畅的动画&#xff0c;常用于贸易&#xff0c;工程&#xff0c;航…

从零开始:AI产品经理的入门路线图

引言&#xff1a; 想象这样一个场景&#xff1a;早晨的阳光穿透窗帘&#xff0c;投射在新一代智能机器人上&#xff0c;它正静静等待着你的第一个命令开始全新的一天。这样的场景听起来像是科幻小说里的情节&#xff0c;但实际上&#xff0c;这正是AI产品经理们工作的成果。如…

数字人直播源码开发全攻略揭秘:如何搭建自己的数字人直播平台?

当前&#xff0c;数字人直播逐渐成为众多中小型企业线上带货和品牌宣传的不二之选&#xff0c;而艾媒研究数据也显示&#xff0c;超五成以上的被调查群体的企业使用过虚拟人技术&#xff0c;超三成被调查群体的企业计划使用虚拟人技术。在此背景下&#xff0c;越来越多的创业者…

js 使用 lodash-es 检测某个值是否是函数

import { isFunction } from lodash-eslet isA isFunction(() > {}) console.log(isA) //true https://www.lodashjs.com/docs/lodash.isFunction#_isfunctionvalue https://lodash.com/docs/4.17.15#isFunction 人工智能学习网站 https://chat.xutongbao.top

mmaction2版本适配(Linux)

从cuda到mmcv保姆式教程 &#xff08;数十年踩坑经验&#xff0c;跟着我做&#xff0c;版本不会错~&#xff09; 如果有补充&#xff0c;请评论区评论&#xff0c;后续填坑&#xff01; cuda11.3 下载安装包 wget https://developer.download.nvidia.com/compute/cuda/11.3…

10计算机视觉—物体检测算法

目录 1.R-CNN(区域卷积神经网络)2014兴趣区域(RoI)池化层Fast RCNN 2015Faster R-CNN 2015Mask R-CNN 2017总结2. SSD(单发多框检测)2016SSD模型总结3.YOLO(你只看一次)快!很重要4.目标检测算法性能对比5.SSD代码实现 使用很少,比不上yolo多尺度锚框实现SSD代码实现训练…

我在高职教STM32——时钟系统与延时控制(2)

大家好&#xff0c;我是老耿&#xff0c;高职青椒一枚&#xff0c;一直从事单片机、嵌入式、物联网等课程的教学。对于高职的学生层次&#xff0c;同行应该都懂的&#xff0c;老师在课堂上教学几乎是没什么成就感的。正因如此&#xff0c;才有了借助 CSDN 平台寻求认同感和成就…