【基于R语言群体遗传学】-15-溯祖理论coalescence

news2024/9/29 7:16:59

在群体遗传学中,一个非常重要的概念是关注谱系的汇聚(遗传线索的汇合),当我们回溯过去几代人口时。在之前的博客中,我们几乎只处理了随时间推移基因变化的“正向”模拟。

群体遗传学_tRNA做科研的博客-CSDN博客


然而,通过时间逆向建模等位基因频率变化不仅是一个有趣的视角,当你知道当前种群内等位基因分布并想知道它是如何达到这一点时;在计算上,它也可以比编码随机向前变化快得多。为了澄清这个观点,让我们更多地思考一下遗传在一个种群中的工作方式。下图所示的模拟显示了在一个小种群中,等位基因是如何从前几代的父母那里随机继承的。在第一代,所有等位基因都被单独指定(这可能对应也可能不对应实际的等位基因差异)。因为在这个简单模型中我们没有突变,一旦一个等位基因由于没有被偶然采样而丢失,它就不能再被获得。同祖遗传(IBD,源自单一祖先拷贝的等位基因)在每一代中积累。 重要的是,我们不需要追踪个体。这里重要的是追踪等位基因拷贝。当我们按IBD对等位基因进行排序时,遗传漂移的过程更容易可视化。

正如预测的那样,遗传多样性(杂合性值,图右侧)或多或少地下降,直到它达到零,所有个体都含有来自单一初始拷贝的等位基因。请注意,等位基因拷贝在种群中固定下来,尽管它减少到单个拷贝,并且在第4、10和11代几乎丢失。 最后一代的所有等位基因都是第11代单个拷贝的后代大多数等位基因不是后代的祖先,尽管大多数等位基因确实在紧接着的几代中留下了后代拷贝。这是遗传线索在一个种群的位点上的工作方式的一个令人惊讶和普遍的特性。当模拟遗传漂移时,最后一个见解——大多数等位基因没有最终重要的后代(在群体遗传学的意义上)——意味着我们不需要追踪整个种群。我们所需要做的就是追踪那些汇聚到一个共同祖先的祖先线索(这种谱系的汇聚被称为coalescence)。事实上,我们不需要追踪一个谱系中的所有个体步骤,我们只需要知道世代之间的距离。 在这个共祖谱系中,几个共同的特性是显而易见的。节点(共祖事件)之间的长度越深入过去就越大。相反,在最后几代中有许多共祖事件。大多数共祖事件是随时间向前发展的二分叉——一个单一的谱系分裂成两个谱系。然而,在最后一代中有两个三分叉(分裂成三个)甚至一个四分叉,这在非常小的种群中经常被预测到,比如这个。

让我们来可视化两个谱系的汇聚过程。汇聚过程可以在连续时间内用指数分布近似,其速率参数为1/(2N)(每代汇聚的概率)。我们可以写出两个谱系在时间t汇聚的概率的近似值:

指数分布的平均值是速率参数的倒数——以世代为单位的时间按种群大小进行缩放,由于谱系可供选择的副本数量,这会影响每一代的联合速率。我们通过R进行模拟:

# 生成一个包含1000个指数分布随机数的向量,其中参数rate为1/2
exps <- rexp(1000, 1/2)

# 绘制exps的直方图
hist(exps)

# 在直方图上添加一条垂直线,表示exps的平均值,颜色设为蓝色,线型设为虚线
abline(v = mean(exps), col = "blue", lty = 2)

# 创建一个从0到exps最大值的序列,长度为1000
q <- seq(0, max(exps), length = 1000)

# 根据指数分布的概率密度函数计算序列q上的概率密度值,参数rate同样为1/2
z <- dexp(q, 1/2)

# 在当前图形设备上开启一个新的绘图区域,不覆盖原有图形
par(new = TRUE)

# 在新的绘图区域绘制q与z的关系图,线宽设为1,不显示坐标轴、注释,线条颜色设为红色
plot(q, z, lwd = 1, axes = F, ann = F, col = "red")

# 在右侧添加一个颜色为红色的y轴,标签方向设置为水平
axis(4, las = 1, col = "red")

指数分布具有较大的方差:速率参数倒数的平方,在这种情况下为(2N)²。我们可以对分布进行积分,以找到95%的联合事件可能发生的点。

换句话说,由于两个谱系的遗传漂变,预计95%的溯祖事件将发生在6N代内(在种群大小恒定等情况下)。那么超过两个谱系呢?如果我们增加第三个谱系,第一次联合发生的机会就更多了,因为在基因谱系中,随着时间的推移,种群中有更多的谱系可以相互碰撞。事实上,有三种联合方式:A与B、B与C或A与C。因此,第一次事件的速率是原来的三倍。

这种事件发生之前的平均时间是速率的倒数,即(2/3)N代。然后,剩下的两个谱系平均需要再经过2N代才能联合

你可以猜到接下来会发生什么。对于四个谱系,我们有六种方式进行首次联合,所以速率是6,平均时间是2N/6代,这时我们剩下三个谱系:

在这里,事情开始以另一种方式变得复杂。根据哪两个谱系首先联合以及它们与第二次联合的谱系的关系,存在两种不同的拓扑结构。比较上面的图形(拓扑概率为2/3)和下面的图形(概率为1/3)。

每次额外的时间步长之间联合事件的预期时间遵循以下模式:

  • 对于两个谱系,预期时间为2N代。
  • 对于三个谱系,第一个联合事件的预期时间为(2/3)N代,之后剩下两个谱系,再经过2N代才可能发生下一次联合。
  • 对于四个谱系,第一个联合事件的预期时间为(2/6)N代,之后剩下三个谱系,再经过(2/3)N代才可能发生下一次联合。

其中n是在任何给定时间可以联合的谱系数量。n(n − 1)/2是成对比较的数量,也称为三角数。

 当种群规模较大时,我们做一个简化的假设,即只发生二分叉,并且在每个时间段只发生一次溯组事件。从这些例子中,你可以开始看到,增加样本量往往会在树的末端添加短分支,而不是深入到基因谱系中的长分支。在所有谱系联合及其对遗传变异的影响方面,时间上存在很大的方差。

想象一下,随着时间的推移,种群大小的变化,比如10倍的扩张或收缩。这可能会如何影响基因组中回溯事件的分布?当我们讨论中性测试时,我们将回到这个问题。 回溯的概念可以用来推导群体遗传学中的一些基本预期。认识到向后的联合等同于向前的遗传漂变是有帮助的。考虑漂变-突变平衡;一个种群的预期杂合度是多少?如果每个突变在一个位点上产生一个新的等位基因(无限等位基因模型),每代谱系对的突变率是2𝜇。每代谱系对的联合率是1/(2N)。在平衡状态下,平均杂合度预期为两种速率的总和之外的突变率:

而𝜃 = 4Nμ

如果我们考虑到,平均而言,两个DNA序列副本在2N代前溯祖到一个共同祖先,因为每一代溯祖的概率是1/(2N),那么这两个副本之间的总距离是4N代(从一步后退到祖先,然后再后退2N代到另一个副本)。当我们应用每代突变率并假设每个突变发生在DNA序列的一个新的碱基对位置(无限位点模型)时,这两个副本之间平均有4N𝜇次突变。我们得到:

Fst可以通过考虑每代谱系对的联合率作为谱系迁移到种群的总速率的一部分来推导,每次两对,以及漂变:

其中m是每代迁移比例(如果你绘制这个图,你可以看到,在每一代中,只有少量的迁移个体Nm,可以快速使种群同质化)。最后,溯祖可以用来推导一个共同的祖先,然后是一个FST的隔离模型:

其中g代表自隔离以来的世代数。

有趣的是,如果这两个FST模型(具有非常不同的假设)被设置为相等并简化,我们得到m = 1/g。联合强调了非平衡共享祖先与隔离和漂变相对于持续迁移-漂变平衡对预期FST的反作用,仅凭FST无法区分它们。 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1913819.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

揭秘小红书矩阵系统:源码助力一键自动发布,多平台管理,效率飙升!

在数字化时代&#xff0c;社交媒体已成为品牌和个人展示自我、推广产品的重要舞台。小红书&#xff0c;作为备受年轻人喜爱的社交平台&#xff0c;其影响力不容小觑。然而&#xff0c;面对日益激烈的竞争&#xff0c;如何高效地在小红书上发布内容、管理多平台账号&#xff0c;…

Linux操作系统上用到的磁盘分区管理工具

parted磁盘分区工具 磁盘格式&#xff1a;MBR, GPT, 这两种名称分别是硬盘里面分区表两种格式的称呼&#xff0c; 第一种MBR格式的分区表最大支持2TB的容量&#xff0c; 磁盘的三种分区主分区&#xff0c;扩展分区&#xff0c;逻辑分区&#xff0c;主分区扩展分区<4 第…

Unity WebGL 嵌入前端网页并通信

1. 前言 最近在做项目时遇到需要将 UnityWebGL 嵌入到网页中去&#xff0c;且需要点击网页中的按钮 UnityWebGL 可以做出响应。新建项目部分直接略过 2. 最终效果 3. 基础设置 设置导出平台为WebGL 在Player Settings -> Publishing Settings 中勾选 Data Caching 和Deco…

NesT : 嵌套层次Transformer

探讨了在不重叠的图像块上嵌套基本局部变换的思想,并以分层的方式对它们进行聚合。发现块聚合功能在实现跨块非局部信息通信中起着至关重要的作用。 这个观察结果引导我们设计一个简化的体系结构,它需要在原始视觉转换器上进行少量的代码更改。所提出的明智选择的设计有三个好…

Dify中的weaviate向量数据库操作

一.安装weaviate客户端 1.Dify 0.6.9中weaviate信息 在Dify 0.6.9版本中weaviate容器信息如下: # The Weaviate vector store. weaviate:image: semitechnologies/weaviate:1.19.0restart: alwaysvolumes:# Mount the Weaviate data directory to the container.- ./volume…

精简库存,避免售罄 零售商常见错误及策略

减少库存是库存管理中最容易被误解和管理不善的策略之一。但如果正确执行&#xff0c;精简运营可以大幅降低成本&#xff0c;同时减少缺货和新鲜产品的损坏。 问题是什么&#xff1f;太多企业在尝试精简库存时陷入了同样的陷阱。不依赖过剩库存的库存规划能够提供所需的灵活性…

室内精准定位是什么?室内精准定位的方式有哪些?

说到室内精准定位很多人可能会比较陌生&#xff0c;因为这一说法并没有大范围推广&#xff0c;又或者说只是很多相关行业的人才知道这样的说法。但是定位这一问题大家都知道吧&#xff1f;尤其是要到一个地方去&#xff0c;都会进行定位导航。那么这一般都是户外定位&#xff0…

智能车载防窒息系统设计

摘要 随着汽车行业的快速发展&#xff0c;车辆安全问题越来越受到人们的关注。其中&#xff0c;车载防窒息系统是一项重要的安全设备。本论文基于STM32单片机&#xff0c;设计了一种智能车载防窒息系统。该系统主要包括氧气浓度检测模块、温湿度检测模块、声音检测模块、光线检…

应用在灯带Type-C接口上的PD SINK协议芯片ECP5701/ECP5702获取充电器的5V、9V、12V、15V、20V供电

方案背景 近日&#xff0c;欧盟就统一充电器接口的提案达成了一项政治协议&#xff0c;其中规定了在欧盟地区销售的所有手机或其他便携式中小型电子设备必须采用统一的USB Type-C接口。这项决定意味着未来将会有更多的产品强制性地使用TYPE-C充电接口。 在这个背景下&#xf…

qq通讯录如何关闭?一键操作,让通讯录的人看不到我

在当今社交网络盛行的时代&#xff0c;qq通讯录是我们与朋友、家人和同事保持联系的重要工具之一。然而&#xff0c;有时我们可能希望保持一些隐私&#xff0c;不希望所有人都能看到我们的动态或在线状态。针对这种情况&#xff0c;QQ提供了关闭通讯录的功能&#xff0c;使得我…

WPF界面设计-更改按钮样式 自定义字体图标

一、下载图标文件 iconfont-阿里巴巴矢量图标库 二、xaml界面代码编辑 文件结构 &#xe653; 对应的图标代码 Fonts/#iconfont 对应文件位置 <Window.Resources><ControlTemplate TargetType"Button" x:Key"CloseButtonTemplate"…

[Python自动化办公]--从网页登录网易邮箱进行邮件搜索并下载邮件附件

[Python自动化办公]–从网页登录网易邮箱进行邮件搜索并下载邮件附件 使用说明 ​ 本文使用Python的selenium库进行操作邮箱登录、固定名称搜索邮件并下载附件&#xff0c;Python版本&#xff1a;3.9.16, selenium版本&#xff1a;4.19.0&#xff0c;EdgeBrowser版本:126.0.2…

【ARM】MDK安装ARM_compiler5无法打开安装程序

【更多软件使用问题请点击亿道电子官方网站】 1、 文档目标 在客户安装了最新版本的MDK5.37及后续更新版本&#xff0c;但原工程使用ARM_Compiler_5.06进行编译和调试&#xff0c;需安装ARM_Compiler_5.06的编译器版本&#xff0c;但在解压缩的过程中后续无法打开ARM_Compiler…

图像分割-编码解码网络的训练-kreas实现

一、数据集加载&#xff1a; 纯手工打造一个函数用来加载数据&#xff0c;数据分别为image和mask 我们所需要的类型&#xff1a;&#xff08;B数量&#xff0c;长&#xff0c;宽&#xff0c;通道数&#xff09;&#xff0c;只要将数据加载成这样并mask和image对应就行。 第一步…

【抢先体验】Win11 22H2/23H2七月更新补丁KB5040442!

系统之家于7月10日发出最新报道&#xff0c;微软为Win11 22H2/23H2用户发布了七月的更新补丁KB5040442&#xff0c;用户更新系统后&#xff0c;可以发现版本号升至22621.3880和22631.3880。此次更新针对远程身份验证拨入用户服务协议与MD5冲突等多个问题进行修复。接下来跟随小…

视频怎么压缩变小?最佳视频压缩器

即使在云存储和廉价硬盘空间时代&#xff0c;大视频文件使用起来仍然不方便。无论是存储、发送到电子邮件帐户还是刻录到 DVD&#xff0c;拥有最好的免费压缩软件可以确保您快速缩小文件大小&#xff0c;而不必担心视频质量下降。继续阅读以探索一些顶级最佳 免费视频压缩器选项…

springboot通江银耳销售管理系统-计算机毕业设计源码15998

摘要 随着人们健康意识的增强&#xff0c;银耳这种传统的中药食材备受关注。而通江银耳是四川省通江县特产&#xff0c;中国国家地理标志产品。四川省通江县是银耳的发源地&#xff0c;中国银耳之乡&#xff0c;通江银耳因主产于此而得名&#xff0c;以其独到的质厚、肉嫩、易炖…

哪些行业更需要TPM管理咨询公司?

当下&#xff0c;TPM&#xff08;全面生产维护&#xff09;作为一种旨在提高设备效率、降低维护成本的管理理念&#xff0c;已经被越来越多的行业所认可和采纳。然而&#xff0c;不同行业因其特性和需求的不同&#xff0c;对TPM管理咨询公司的需求也各有侧重。下面将探讨哪些行…

selenium采集招标网站公告

selenium采集招标网站公告 一、项目介绍二、采集过程三、完整代码一、项目介绍 本次数据采集以某市建设工程交易服务中心数据为例,网址为“http://www.shcpe.cn/jyfw/xxfw/u1ai51.html”,网站首页如下图所示: 采集到的字段如下图所示: 二、采集过程 本次数据采集使用的…

sdwan是硬件还是网络协议?

SD-WAN&#xff08;Software-Defined Wide Area Network&#xff0c;软件定义广域网&#xff09;并不是一个硬件产品或单一的网络协议&#xff0c;而是结合了软件、硬件和网络技术的一种解决方案。SD-WAN的核心在于其软件定义的特性&#xff0c;它通过软件来控制和管理广域网的…