XP-CLR分析学习笔记

news2024/9/25 7:18:00

XP-CLR分析笔记

生物信息学和遗传学是相互交织的两个学科,共同致力于解读生物体内复杂的基因信息。这些信息有助于理解物种的演化,疾病的起因,以及个体差异等方面。

XP-CLR(Cross Population Composite Likelihood Ratio)分析是其中一个重要的分析方法,主要用于检测不同种群间由于自然选择而产生的基因频率变化。

本文将介绍XP-CLR分析的基本概念,原理,方法,以及其在生物信息学与遗传学中的应用,给给出XP-CLR分析的具体操作步骤教程。


下图是近日发表在The Plant Cell上的一篇文章中关于XP-CLR分析的结果,展示了中美两国小麦育种靶标的异同,发现约15%的基因组区域受到了选择,在这些受选择的区域中包含诸多控制株型、产量、品质和抗病等的已知基因。 alt

基本概念

XP-CLR是一个统计方法,用于比较两个或更多的种群以识别自然选择的迹象,自然选择是进化的主要动力,能够改变种群内基因的频率分布。通过XP-CLR分析,可以找出可能受到强烈自然选择压力的基因区域。

原理和方法

XP-CLR 原理

XP-CLR的主要思想是使用复合似然比(Composite Likelihood Ratio)来评估种群间不同基因座的频率变化。具体来说包含了两个因素:

  • 等位基因频率差异: 在不同种群间,被选中的基因通常会显示出明显的等位基因频率差异。

  • 连锁不平衡(简称LD)模式的变化:自然选择会影响基因与其邻近基因间的连锁不平衡模式。

XP-CLR 方法

XP-CLR分析通常包括以下几个步骤:

数据准备:获取两个或多个种群的基因型数据。

窗口划分:将基因组划分为多个窗口(通常以数百个碱基对为单位)。

估计参数:在每个窗口内,使用复合似然比来估计等位基因频率差异和连锁不平衡。

统计检验:通过模拟或其他统计方法来评估每个窗口内的复合似然比是否显著。

结果解释:显著的窗口通常被认为是受到自然选择影响的候选区域。

XP-CLR 是一种是基于选择扫荡(selective sweeep)的似然方法。选择扫荡可以增加群体之间的遗传分化,导致等位基因频率偏离中性条件下的预期值。

XP-CLR 利用了两个群体之间的多基因座等位基因频率差异(multilocus allele frequency differentiation)建立模型,使用布朗运动来模拟中性下的遗传漂移,并使用确定性模型来近似地对附近的单核苷酸多态性(SNPs)进行选择性扫描

实际应用领域

种群遗传学:通过比较不同种群,可以识别出可能与适应性特质有关的基因。

疾病研究:识别与疾病相关的自然选择信号,有助于理解疾病的遗传基础。

农业研究:在作物和家畜的品种改良中,XP-CLR可以帮助找出与某些有用性状相关的基因。

人类进化研究:XP-CLR可以揭示与人类进化和迁移有关的基因。

操作步骤与分析教程

接下来将详细演示如何使用XP-CLR进行自然选择的检测。以下示例以两个假设的种群(种群A和种群B)为例,每个种群有100个个体,并假设我们有关于10个SNP(单核苷酸多态性)的信息。

前期准备工作

安装XP-CLR软件:您可以在这里找到源代码和安装指南→【https://github.com/hardingnj/xpclr】

若使用conda安装,按如下步骤

conda create -n xpclr   -c bioconda xpclr

准备输入文件:通常需要VCF(Variant Call Format)或其他格式的基因型。

输入文件

文件populationA.vcfpopulationB.vcf分别包含种群A和种群B的基因型。

分析流程

第一步:数据准备

首先,我们需要准备一个输入文件。以下是种群A和种群B的VCF文件的一个简化例子。

populationA.vcf 信息如下:
#CHROM  POS     ID      REF     ALT     QUAL    FILTER  INFO    FORMAT  Sample1 Sample2 ... Sample100
chr1    1001    .       A       T       .       .       .       GT      0/1     1/1     ... 0/1
chr1    2002    .       C       G       .       .       .       GT      0/0     1/1     ... 1/1
...
populationB.vcf 信息如下:
#CHROM  POS     ID      REF     ALT     QUAL    FILTER  INFO    FORMAT  Sample1 Sample2 ... Sample100
chr1    1001    .       A       T       .       .       .       GT      0/1     0/0     ... 1/1
chr1    2002    .       C       G       .       .       .       GT      1/1     0/1     ... 0/0
...

第二步:运行XP-CLR

假设XP-CLR已经安装并可以从命令行访问,以下是一个基本的命令行示例:

xpclr -xpclr \
   populationA.vcf populationB.vcf \
   output.xpclr --format vcf

这将比较populationA.vcfpopulationB.vcf中的数据,并将结果保存到output.xpclr

第三步:结果解析

输出文件output.xpclr包括以下几列:

  • 染色体名
  • SNP位置
  • XP-CLR得分
  • output.xpclr
#chr   pos     xpclr_score
chr1   1001    2.5
chr1   2002    1.1
...

XP-CLR得分高通常表示该区域可能受到了强烈的自然选择影响

结果解释

在上面的例子中,chr1:1001的XP-CLR得分是2.5,这可能意味着这一区域在种群A和种群B之间受到了不同程度的自然选择。可以进一步用基因注释信息来解释这一区域可能涉及哪些生物学过程或适应性特质。

总结

XP-CLR分析是一种强大的工具,用于检测和解释由自然选择引起的基因频率变化。通过对等位基因频率和连锁不平衡的综合评估,它能够揭示自然选择在种群间如何起作用,从而为生物信息学和遗传学的多个子领域提供重要的洞见。

行文至此,今天的笔记分享完成,希望这篇文章能帮助您了解XP-CLR分析的基础知识和应用。

参考资料

https://huans.github.io/2019/11/04/XP-CLR/
https://www.cnblogs.com/shiyanhe/p/13080823.html
https://zhuanlan.zhihu.com/p/146496118
https://www.jianshu.com/p/9c827a0be66d

本文由 mdnice 多平台发布

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/958067.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

《Linux从练气到飞升》No.19 进程等待

🕺作者: 主页 我的专栏C语言从0到1探秘C数据结构从0到1探秘Linux菜鸟刷题集 😘欢迎关注:👍点赞🙌收藏✍️留言 🏇码字不易,你的👍点赞🙌收藏❤️关注对我真的…

【python爬虫】6.爬虫实操(带参数请求数据)

文章目录 前言项目:狂热粉丝分析过程什么是带参数请求数据如何带参数请求数据 代码实现被隐藏的歌曲清单什么是Request Headers如何添加Request Headers 复习 前言 先来复习一下上一关的主要知识吧,先热个身。 Network能够记录浏览器的所有请求。我们最…

钡铼技术BL120PN Profinet和Profibus DP转Modbus网关介绍

​ 编辑切换为居中 添加图片注释,不超过 140 字(可选) BL120PN是一款Profinet、Profibus D转Modbus网关。 BL120PN下行采集支持:Profinet、Profibus D。 BL120PN上行支持:Modbus RTU、Modbus TCP协议。 BL120PN采…

实现微信H5的方法!(非官方产品)

实现微信H5的方法!(非官方产品) WAP支付也叫H5支付,均指的是手机页面支付, 微信称之为H5支付,支付宝则称为WAP支付。 那H5也叫WAP支付是可以应用手机页面支付和APP支付的, 不限制包名可跨平台调…

元素周期表-背诵元素周期表更简单

元素周期表是一款极其炫酷、简约的记忆和查看周期表元素的软件。 【软件特点】: ●有趣谐音速记:软 件内有按周期、化合价、元素符号分类使用谐音速记的小技巧。 ●3D元素周期表:用户可以选择按表面、球体、螺旋、网格来3D炫酷的展示元素周期…

【技术】视频云存储/安防监控视频/智能分析网关V3裸土未覆盖/苫盖算法详解

随着经济的发展和建筑工地的增多,对于土堆的裸露情况实时监测和管理变得尤为重要。为了解决这一问题,TSINGSEEE青犀AI智能分析网关V3的裸土未苫盖算法就能很好地解决。 AI算法模型可以实时识别路面/建筑工地中的土堆是否裸露,将工地、道路等…

煤矿监管电子封条算法

煤矿监管电子封条算法基于yolov5网络模型深度学习框架,先进技术的创新举措,煤矿监管电子封条算法通过在现场运料运人井口、回风井口、车辆出入口等关键位置进行人员进出、人数变化和设备开停等情况的识别和分析。YOLO检测速度非常快。标准版本的YOLO可以…

特斯拉新款Model3曝光:搭载HW3.5硬件,雷达已移除,今日上市?

根据最新的消息,特斯拉新款 Model 3 将有一些令人瞩目的变化和改进。首先,前脸的设计仍然采用封闭式造型,但新车的前保险杠进行了微调,并且换装了全新款式的大灯。 这些改变使新款 Model 3 在外观上与现款车型有了明显的差异&…

【数据结构回顾】

数据结构回顾 一、单链表二、单循环链表 一、单链表 #include <stdio.h> #include <stdlib.h>typedef struct Node {int data;Node *next; }Node;Node* initList() {Node *list (Node*)malloc(sizeof(Node));list->data 0;list->next NULL;return list; }…

基于pytorch LSTM 的股票预测

学习记录于《PyTorch深度学习项目实战100例》 https://weibaohang.blog.csdn.net/article/details/127365867?ydrefereraHR0cHM6Ly9ibG9nLmNzZG4ubmV0L20wXzQ3MjU2MTYyL2NhdGVnb3J5XzEyMDM2MTg5Lmh0bWw%2Fc3BtPTEwMDEuMjAxNC4zMDAxLjU0ODI%3D 1.tushare Tushare是一个免费、…

C++项目:网络版本在线五子棋对战

目录 1.项目介绍 2.开发环境 3.核心技术 4. 环境搭建 5.websocketpp 5.1原理解析 5.2报文格式 5.3websocketpp常用接口介绍 5.4websocket服务器 6.JsonCpp使用 6.1Json数据格式 6.2JsonCpp介绍 7.MySQL API 7.1MySQL API介绍 7.2MySQL API使用 7.3实现增删改查…

lnmp架构-mysql2

4.mysql 组复制集群 首先对所有的节点重新初始化 因为对节点的数据一致性要求非常高 主从复制的时候 slave只会复制master的binlog日志 就是二进制日志 不会复制relay_log 在server1上 根据实际情况修改主机名和网段 log_slave_updateON 意思就是 当slave的sql线程做完之后…

深度学习基础篇 第一章:卷积

dummy老弟这几天在复习啊我也跟着他重新复习一轮。 这次打算学的细一点&#xff0c;虽然对工作没什么帮助&#xff0c;但是理论知识也能更扎实吧&#xff01; 从0开始的深度学习大冒险。 参考教程&#xff1a; https://www.zhihu.com/question/22298352 https://zhuanlan.zhih…

k8s 启动和删除pod

k8s创建pod pod的启动流程 流程图 运维人员向kube-apiserver发出指令&#xff08;我想干什么&#xff0c;我期望事情是什么状态&#xff09; api响应命令,通过一系列认证授权,把pod数据存储到etcd,创建deployment资源并初始化。(期望状态&#xff09; controller通过list-wa…

C++信息学奥赛1184:明明的随机数

#include <bits/stdc.h> using namespace std; int main() {int n; // 数组长度cin >> n; // 输入数组长度int arr[n]; // 定义整数数组&#xff0c;用于存储输入的整数// 输入数组元素for (int i 0; i < n; i){cin >> arr[i];}int e 0; // 计数器&…

长胜证券:政策暖风不断 静待春暖花开

长胜证券指出&#xff0c;经济数据的逐步企稳上升&#xff0c;能够提振商场对经济复苏的决心&#xff0c;同时弱复苏布景下&#xff0c;政策的刺激力度也将为商场走强供给良好的土壤。暖风持续发布下&#xff0c;多方力量也在悄然间发生变化&#xff0c;重视权重、金融板块回暖…

docker命令学习

docker vscode插件出现的问题 docker命令 docker images &#xff08;查看所有的镜像&#xff09; docker ps -a &#xff08;查看所有的容器&#xff09; docker ps &#xff08;查看运行的容器&#xff09; docker run imageID docker run --gpus all --shm-size8g -it imag…

什么是数字孪生?

推荐&#xff1a;使用 NSDT场景编辑器 快速搭建3D应用场景 走进一家汽车装配厂。看到工人将螺母逐渐减少到螺栓上。听到气动工具的嗡嗡声。观看原始的车身沿着生产线滑行&#xff0c;机器人卷起零件。 现在&#xff0c;在线启动其 3D 数字孪生。看到动画数字人类在完全相同但数…

大数据学习:kafkaManager功能详解

kafkaManager功能详解 一.添加集群 1.1 常用参数说明 下面已常用的选项作说明 1&#xff09;Enable JMX Polling 是否开启 JMX 轮训&#xff0c;该部分直接影响部分 kafka broker 和 topic 监控指标指标的获取&#xff08;生效的前提是 kafka 启动时开启了 JMX_PORT。主要影…

Vue基础1:生命周期汇总(vue2)

Description 生命周期图&#xff1a; 可以理解vue生命周期就是指vue实例从创建到销毁的过程&#xff0c;在vue中分为9个阶段&#xff1a;创建前/后&#xff0c;载入前/后&#xff0c;更新前/后&#xff0c;销毁前/后&#xff0c;其他&#xff1b;常用的有&#xff1a;created&…