【基于R语言群体遗传学】-13-群体差异量化-Fst

news2025/1/11 4:09:54

在前几篇博客中,我们深度学习讨论了适应性进化的问题,从本篇博客开始,我们关注群体差异的问题,建议大家可以先看之前的博客:群体遗传学_tRNA做科研的博客-CSDN博客


一些新名词

Meta-population:An interconnected group of smaller populations.

亚种群:一个由较小的种群相互连接组成的群体。

Deme:Asingle population within a meta-population.

局域种群:亚种群内的单个种群。

Sub-population:A group of individuals within a population that are more likely to breed with each other than members of other sub-populations.

子种群:种群中的一组个体,它们彼此之间比其他子种群的成员更有可能进行繁殖。

分化的量化(quantifying divergence)-Fst

群体遗传学的一个共同关注点是量化可识别种群之间的差异。衡量种群间差异的一个关键指标是FST,它已经被反复定义和重新定义。FST是由Sewall Wright推导出的F统计量之一(更多信息请参见Weir 2012),广义上是对两个相关种群之间遗传差异的量化,通常在从零(无差异)到一(完全差异)的范围内变化

从概念上讲,FST可以被理解为一种度量,它告诉我们相对于整个种群的总多样性,不同亚种群之间缺失了多少多样性。换句话说,如果FST的值接近1,这意味着亚种群之间的遗传差异很大,每个亚种群可能具有独特的遗传特征;而如果FST的值接近0,则意味着亚种群之间的遗传差异很小,它们在遗传上是相似的。

FST的计算通常涉及到比较种群内的遗传变异与种群间的遗传变异。一个高的FST值表明种群间的遗传变异占总体遗传变异的比例较高,即种群间的差异较大;而一个低的FST值则表明种群内的遗传变异占主导,种群间的差异较小。


根据哈代-温伯格定律,我们知道当有等位基因频率时,我们可以预期的多样性(即杂合子)的数量是2p(1-p)。如果我们有多个亚种群的等位基因频率测量,我们可以说我们总的预期杂合性(HT)是:

其中p是所有亚种群的平均等位基因频率。我们可以将这个值与我们在每个亚种群内观察到的杂合性水平(HS)的平均值进行对比,如果我们有两个亚种群,那么HS将是 :

其中p1是亚种群1中的等位基因频率,p2是亚种群2中的等位基因频率,H1和H2是每个亚种群内杂合性的相应度量。

我们可以可视化Hs与Ht:

# 定义两个群体的等位基因频率
p1 <- 0.15 # 第一个群体的等位基因频率
p2 <- 0.7  # 第二个群体的等位基因频率

# 计算每个群体的杂合子比例(遗传多样性)
h1 <- 2*p1*(1-p1) # 第一个群体的杂合子比例
h2 <- 2*p2*(1-p2) # 第二个群体的杂合子比例

# 计算两个群体等位基因频率的平均值
p_ave <- (p1+p2)/2 # 平均等位基因频率

# 计算在平均等位基因频率下的杂合子比例(总体遗传多样性)
ht <- 2*p_ave*(1-p_ave) # 总体的杂合子比例

# 计算两个群体杂合子比例的平均值(种群的遗传多样性)
hs <- (h1 + h2)/2 # 种群的杂合子比例

# 绘制等位基因频率与杂合子数量的曲线图
curve(2*x*(1-x), from=0, to=1, xlab="Allele frequency", # x轴为等位基因频率,y轴为杂合子数量
      ylab="Heterozygotes", lwd=2) # 线条宽度为2

# 在图中标出两个群体的具体点
points(c(p1,p2), c(h1,h2), cex=2, pch=16) # 使用大小为2的点,形状为16

# 标出平均等位基因频率下的种群和总体杂合子比例
points(c(p_ave,p_ave), c(hs,ht), cex=2) # 使用大小为2的点

# 在图中添加文本标签
text(x=p1, y=h1-0.03, "H1") # 在第一个群体杂合子比例下方添加标签H1
text(x=p2, y=h2-0.03,"H2") # 在第二个群体杂合子比例下方添加标签H2
text(x=p_ave, y=hs-0.03,"Hs") # 在种群杂合子比例下方添加标签Hs
text(x=p_ave+0.03, y=ht-0.03, "Ht") # 在总体杂合子比例下方添加标签Ht

# 添加连接线
lines(c(p1,p2), c(h1,h2), lty=2) # 连接两个群体杂合子比例的虚线
lines(c(p_ave,p_ave), c(hs,ht)) # 连接种群和总体杂合子比例的实线

我们可以观察到预期杂合度(heterozygosity)的2p(1-p)曲线呈向下凹的形状。这种曲线的特性意味着,当两个群体具有不同的等位基因频率,从而有不同的预期杂合度(如图中的H1和H2所示)时,它们之间的组合中点(即图中虚线上的HS)总是低于预期的总杂合度(HT)。 这个现象揭示了群体遗传学中的一个重要原理:当考虑多个群体的遗传多样性时,简单地取其等位基因频率的算术平均值并不能准确反映整体的遗传多样性。实际上,由于2p(1-p)曲线的凹性质,两个群体等位基因频率的平均值所对应的杂合度(HS)会低于这两个群体合并后的实际总杂合度(HT)。换句话说,合并群体的总遗传多样性高于基于各自群体等位基因频率平均值预测的遗传多样性。 这一发现对于理解不同群体间的遗传交流、保护生物多样性以及制定合理的保护策略具有重要意义。它提示我们在评估和比较不同群体的遗传多样性时,不能仅仅依赖于等位基因频率的简单平均值,而应该综合考虑各群体的实际遗传构成。


Fst是一个衡量群体间遗传分化的指标,它描述的是群体内与群体间遗传变异的比例。具体来说,Fst测量的是在HS(种群内平均杂合度)与HT(总体杂合度)之间“缺失”的杂合度部分,并且这个差值是通过HT来标准化的:

在群体遗传学中,衡量两个群体间等位基因频率差异的最大情况是一个群体为100%,另一个群体为0%。在这种情况下,不存在杂合子,因此我们的H1和H2测量值都将是零。根据FST的计算公式,FST = 1 - (HS/HT),在这种极端情况下,HS(种群内平均杂合度)为0,HT(总体杂合度)为0.5,所以FST = 1 - (0/0.5) = 1。这表明两个群体间存在完全的遗传分化,没有任何遗传物质的交流。 另一方面,如果两个亚群体之间的等位基因频率测量值完全相同,那么H1和H2也将完全相同。无论我们如何计算平均值,H1 = H2 = HS = HT,这意味着(HS/HT)将等于1,从而使得FST = 0。这表示两个群体间没有遗传分化,它们在遗传上是相同的。 FST的这种性质使其成为衡量群体间遗传差异的一个非常有用的工具。FST值为1表明群体间完全隔离,没有任何基因流;而FST值为0则表示群体间完全混合,遗传上没有区别。

实际FST值通常介于0和1之间,反映了不同程度的遗传分化。我们使用之前的例子来说明:

library(popgenr)
data(snp)
h_exp <- 2*snp$p*(1-snp$p)
fst <- (h_exp-snp$het) / h_exp
mean(fst)

FST是一个衡量群体间遗传分化的指标,它量化了不同群体之间的遗传差异,但本身并不提供这些差异产生的原因。群体间的遗传差异可能由多种因素造成,例如迁移率较低并伴有遗传漂变、近期的共同祖先后发生隔离和漂变、或者某些位点上强烈的选择作用导致不同地点的适应性变化等。 FST值的高低可以反映出群体间遗传结构的差异程度,但它并不直接说明这些差异是如何形成的。例如,一个较高的FST值可能指示群体间存在较少的基因流动,但这并不一定意味着迁移率低是唯一的原因。同样,群体间共享的近期祖先历史也可能导致遗传分化,而这种分化并不一定与迁移率直接相关。此外,如果某些基因位点受到强烈的选择压力,而这些位点在不同地理位置的适应性有所不同,那么这也可能导致FST值升高,尽管这种选择作用并不是由迁移率直接引起的。 因此,虽然FST是一个有用的工具来量化群体间的遗传差异,但要理解这些差异背后的生物学过程和机制,通常需要结合其他遗传学、生态学和进化生物学的研究方法和数据。这可能包括对迁移模式的直接研究、对群体历史的推断分析,以及对自然选择作用的检测等。通过这些综合的方法,研究者可以更全面地揭示导致群体遗传分化的复杂因素。

下一篇博客将讨论种群回溯祖先相关内容。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1912284.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

4:表单和通用视图

表单和通用视图 1、编写一个简单的表单&#xff08;1&#xff09;更新polls/detail.html文件 使其包含一个html < form > 元素&#xff08;2&#xff09;创建一个Django视图来处理提交的数据&#xff08;3&#xff09;当有人对 Question 进行投票后&#xff0c;vote()视图…

Proteus + Keil单片机仿真教程(五)多位LED数码管的静态显示

Proteus + Keil单片机仿真教程(五)多位LED数码管 上一章节讲解了单个数码管的静态和动态显示,这一章节将对多个数码管的静态显示进行学习,本章节主要难点: 1.锁存器的理解和使用; 2.多个数码管的接线封装方式; 3.Proteus 快速接头的使用。 第一个多位数码管示例 元件…

谷歌云 | Gemini 大模型赋能 BigQuery 情感分析:解码客户评论,洞悉市场风向

情感分析是企业洞察客户需求和改进产品服务的重要工具。近年来&#xff0c;随着自然语言处理 (NLP) 技术的飞速发展&#xff0c;情感分析变得更加精准高效。Google 推出的 Gemini 模型&#xff0c;作为大型语言模型 (LLM) 的代表&#xff0c;拥有强大的文本处理能力&#xff0c…

共生与变革:AI在开发者世界的角色深度剖析

在科技日新月异的今天&#xff0c;人工智能&#xff08;AI&#xff09;已不再是遥不可及的概念&#xff0c;而是逐步渗透到我们工作与生活的每一个角落。对于开发者这一群体而言&#xff0c;AI的崛起既带来了前所未有的机遇&#xff0c;也引发了关于其角色定位的深刻讨论——AI…

electron在VSCode和IDEA及webStrom等编辑器控制台打印日志乱码

window10环境下设置 1.打开Windows设置 2.打开时间和语言&#xff0c;选择语言菜单、如何点击管理语言设置 3.打开之后选择管理&#xff0c;选择更改系统区域设置&#xff0c;把Beta版&#xff1a;使用Unicode UTF-8提供全球语言支持 勾上&#xff0c;点击确定&#xff0c;…

氛围感视频素材高级感的去哪里找啊?带氛围感的素材网站库分享

亲爱的创作者们&#xff0c;大家好&#xff01;今天我们来聊聊视频创作中至关重要的一点——氛围感。一个好的视频&#xff0c;不仅要有视觉冲击力&#xff0c;还要能够触动观众的情感。那我们应该去哪里寻找这些充满氛围感且高级的视频素材呢&#xff1f;别急&#xff0c;我这…

isaac sim 与 WLS2 ros2实现通信

Omniverse以及isaac还是windows下使用顺手一点&#xff0c;但是做跟ros相关的开发时候&#xff0c;基本就得迁移到ubuntu下了&#xff0c;windows下ros安装还是过于复杂&#xff0c;那不想用双系统或者ubuntu或者虚拟机&#xff0c;有啥别的好方法呢&#xff1f;这里想到了wind…

希喂、鲜朗和牧野奇迹主食冻干怎么样?第一次喂冻干哪款更好

我是个宠物医生&#xff0c;每天很长时间都在跟猫猫狗狗打交道&#xff0c;送到店里来的猫猫状态几乎是一眼就能看出来&#xff0c;肥胖、肝损伤真是现在大部分家养猫正面临的&#xff0c;靠送医治疗只能减缓无法根治&#xff0c;根本在于铲屎官的喂养方式。 从业这几年&#…

打开ps提示dll文件丢失如何解决?教你几种靠谱的方法

在日常使用电脑过程中&#xff0c;由于不当操作&#xff0c;dll文件丢失是一种常见现象。当dll文件丢失时&#xff0c;程序将无法正常运行&#xff0c;比如ps&#xff0c;pr等待软件。此时&#xff0c;我们需要对其进行修复以恢复其功能&#xff0c;下面我们一起来了解一下出现…

EtherCAT总线冗余让制造更安全更可靠更智能

冗余定义 什么是总线冗余功能&#xff1f;我们都知道&#xff0c;EtherCAT现场总线具有灵活的拓扑结构&#xff0c;设备间支持线型、星型、树型的连接方式&#xff0c;其中线型结构简单、传输效率高&#xff0c;大多数的现场应用中也是使用这种连接方式&#xff0c;如下图所示…

MiniGPT-Med 通用医学视觉大模型:生成医学报告 + 视觉问答 + 医学疾病识别

MiniGPT-Med 通用医学视觉大模型&#xff1a;生成医学报告 视觉问答 医学疾病识别 提出背景解法拆解 论文&#xff1a;https://arxiv.org/pdf/2407.04106 代码&#xff1a;https://github.com/Vision-CAIR/MiniGPT-Med 提出背景 近年来&#xff0c;人工智能&#xff08;AI…

单链表(C语言详细版)

1. 链表的概念及结构 概念&#xff1a;链表是一种物理存储结构上非连续、非顺序的存储结构&#xff0c;数据元素的逻辑顺序是通过链表中的指针链接次序实现的。 链表的结构跟火车车厢相似&#xff0c;淡季时车次的车厢会相应减少&#xff0c;旺季时车次的车厢会额外增加几节。…

Java面试八股之描述一下MySQL使用索引查询数据的过程

描述一下MySQL使用索引查询数据的过程 1.解析查询语句与查询优化 用户提交一个 SQL 查询语句&#xff0c;MySQL 的查询解析器对其进行词法分析和语法分析&#xff0c;生成解析树。 查询优化器根据解析树、表结构信息、统计信息以及索引信息&#xff0c;决定是否使用 B树索引…

解锁AI大模型潜能:预训练、迁移学习与中间件编程的协同艺术

在人工智能的浩瀚星空中&#xff0c;大型预训练模型&#xff08;Large Language Models, LLMs&#xff09;犹如璀璨的星辰&#xff0c;引领着技术革新的浪潮。这些模型通过海量数据的滋养&#xff0c;学会了理解语言、生成文本乃至执行复杂任务的能力。然而&#xff0c;要让这些…

符号同步、定时同步和载波同步

符号同步、定时同步和载波同步是通信系统中重要的同步技术&#xff0c;它们各自承担着不同的功能和作用。以下是对这三种同步技术的详细解释&#xff1a; 符号同步 定义&#xff1a; 符号同步&#xff0c;也称为定时恢复或时钟恢复&#xff0c;是指在数字通信系统中&#xff…

mysql 5.7.44 32位 zip安装

前言 因为研究别人代码&#xff0c;他使用了5.7的 32位 mysql &#xff0c;同时最新的 8.4 64位 mysql 不能用官方lib连接。所以安装这个版本使用&#xff0c;期间有些坑&#xff0c;在这里记录一下。 下载路径 mysql官方路径&#xff1a;https://downloads.mysql.com/archi…

更深入了解汽车与航空电子等安全关键型应用的IP核考量因素

作者&#xff1a;Philipp Jacobsohn&#xff0c;SmartDV高级应用工程师 中国已经连续十多年成为全球第一大汽车产销国&#xff0c;智能化也成为了汽车行业发展的一个重要方向&#xff0c;同时越来越多的制造商正在考虑进入无人机和飞行汽车等低空设备&#xff0c;而所有的这些…

一周IT资讯 | B站、小红书等应用崩溃,系阿里云服务器异常所致;余承东回西工大演讲,网友:“史上最强招生guang告”

4.B站、小红书等应用崩溃&#xff0c;系阿里云服务器异常所致 7月2日上午&#xff0c;“B站崩了”“小红书崩了”等话题登上热搜。B站APP无法使用浏览历史关注等内容&#xff0c;消息界面、更新界面、客服界面均不可用&#xff0c;用户也无法评论和发弹幕&#xff0c;视频评论…

React+TS前台项目实战(二十六)-- 高性能可配置Echarts图表组件封装

文章目录 前言CommonChart组件1. 功能分析2. 代码详细注释3. 使用到的全局hook代码4. 使用方式5. 效果展示 总结 前言 Echarts图表在项目中经常用到&#xff0c;然而&#xff0c;重复编写初始化&#xff0c;更新&#xff0c;以及清除实例等动作对于开发人员来说是一种浪费时间…

浏览器开发者视角及CSS表达式选择元素

点击想要查看的接口&#xff0c;然后点击检查&#xff0c;便可以切换到该接口对应的html代码 如果F12不起作用的话&#xff0c;点击更多工具&#xff0c;然后选择开发者工具即可 ctrlF可以去查阅相关的CSS表达式选择元素 如果没有加#t1&#xff0c;那么表示的是选择所有的p 使用…