QQ plot 的解读

news2025/1/18 9:54:09

QQ plot全称是Quantile-Quantile Plot,分位数-分位数图是通过比较两个概率分布的分位数对这两个概率分布进行比较的概率图方法

这个图形的形式非常简单,有点类似RNA-seq中评价两个样本相关性的散点图(图1)。这类图形为什么那么相似呢?因为它们本质上就是做两组数据的比较,判断它们是否基本一致。

以样本重复性散点图为例(图1b),如果某个基因的表达量在样本C1和C2两个生物学重复中相同或相近,那么这个基因在这个散点图中X和Y轴坐标应该是相同或相近的,即这个点应该位于这个图形的45°对角线上。如果大部分基因(红点)位于对角线上,说明这两组值基本一致,即两个样本的重复性良好。
图1 QQ plot 和样本重复散点图
*

图1 QQ plot 和样本重复散点图

QQ plot到底是做什么比较呢?

它比较的是P value观测值(Y轴)和p value期望值的一致性,在GWAS分析的文献中几乎总是和曼哈顿图同时出现。

1. P value的期望值分布

在统计检验中,P value代表的是我们观测值偏离期望值的概率。例如,假设观测值符合标准正态分布(即期望值为0,方差为1),那么我们观测值≥1的概率是多少?应该是15.9%。这就是标准正态分布下的离群概率。当我们观测次数越大,出现极端观测值(偏离期望值更加剧烈)的概率也越大。例如,在标准正态分布下,观测值≥3的概率约为0.14%(概率更小,需要更多的观测次数才易于出现)。
图2 标准正态分布
*

图2 标准正态分布

换个直观的说法就是:如果真实值是0,我们观测的时候总会有一定的概率犯错。而且检测次数多了,就越可能观测到偏离真实值非常离谱的数值。如果观测1000次,那应该会获得1000个观测值,那么这些观测值的分布就应该符合图2的正态分布(normal distribution)。如果这些样本点并不符合正态分布,那么画出来的QQplot中的点就不呈一条直线分布

如果这1000个观测值符合正态分布,那么这1000个观测值对应的离群概率(P value)符合什么分布呢?应该符合均匀分布(Uniform Distribution),即P value分布在0—1之间的各个区段的概率是相同的。如图3,P value在0—0.1和0.9—1都是100次,概率是相同的。
在这里插入图片描述

*

图3 P value值符合均匀分布

实际上,对于大部分统计方法,P value应该都符合以上的均匀分布。如果我们的数值符合某一种统计模型,那么当我们统计若干次后,得到的P value的分布是可以预期的,其应该符合均匀分布——这就是P value的期望分布。

2. QQ plot的图形解读

如同上文我们提到的,QQ plot也是两组数值的比较。这两组数值分布是期望的P value和观测到的P value。如果我们的统计模型正确,两组P value值应该是一致的。那么,两组值(取-log10)从小到大排列后绘制在散点图上,所有点应该位于45°对角线上。所以QQ plot的直观解读就是:判断图形中点的分布是否合理(是否位于对角线上),进而推断目前的统计模型获得的P 值是否符合期望值以及统计模型是否合理。

QQplot可以用来判断样本点是否符合任意一种概率分布,其方法就是和前面所讲正态分布的例子一样,如果怀疑样本点符合某种分布,那么就找出从这样一个分布中抽取相同数目随机数时期望得到的数值,将这些数值与实际的样本点的值放在QQplot中进行比较,如果点的分布接近一条直线就说明,样本点的分布和猜测的分布相同,反之则不同

那么QQ-plot在GWAS分析结果中有什么应用呢?下面我们举几个例子来解释这个问题。
图4 GWAS 常见的QQ plot 的4种情况
*

图4 GWAS 常见的QQ plot 的4种情况

图4(a)中P value观察值和期望值重合(相同)
说明分析模型是合理的。但所有的P value观测值都没有明显超过期望值,说明分析结果没有找到(与性状)显著关联的位点,可能原因包括:性状由微效多基因控制,效应太弱;群体大小不够等。

图4(b)是我们最期望看到的结果类型
散点图的左下角是显著性低的位点,即确定与性状不关联的位点,这些位点的P value观测值应该与期望值一致。而图中这些点位于对角线上,说明分析模型是合理的。而在图形的右上角则是显著性较高的位点,是潜在与性状相关的候选位点。这些点位于对角线的上方,即位点的P value观测值超过了期望值,说明这些位点的效应超过了随机效应,进而说明这些位点是与性状显著相关的。小结了一下:这个图形的左下角说明了模型的合理性,右上角则说明找了关联位点,所以这是最理想的结果。(备注:在有显著关联位点的情况下,结合曼哈顿图进行展示,会更加醒目)

图4(c)是大部分点位于对角线的下方
说明大部分位点的P value观察值小于期望值。主要原因包括两种情况:(1)模型不合理,P value被过度校正,导致P value显著性过低;(2)群体中大量SNP位点间存在连锁不平衡,有效位点数(相互间不存在连锁不平衡的位点)明显低于实际位点数,所以P value的期望值被低估了(即期望值的-log10(P value)被高估了),也会出现这种情况。

图4(d)是大部分点位于对角线的上方
说明大部分位点的P value观察值超过期望值。按照统计学的逻辑推导,就是大部分位点与某个性状显著相关。这显然是不符合生物学逻辑的,那么这只有一种可能:分析模型不合理,数据的假阳性过大,P value观测值的显著性被高估了

凡是出现图4(c)和图4(d)的情况,则需要检查分析模型是否有问题,群体中是否有某些干扰因素没被考虑到分析模型中(例如,群体结构、系谱关系、性别等),在重建分析模型后重新分析。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/32856.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Java小技能:多级菜单排序并返回树结构菜单列表

文章目录 引言I 生成树形结构菜单列表1.1 获取全部菜单1.2 获取一级菜单,递归获取子节点。1.3 实体1.4 DtoII 常见问题2.1 no instance(s) of type variable(s) R exist so that void conforms to R,2.2 集合filter过滤Integer数值为空问题解决方案引言 需求: 服务商角色配置…

面试官:说说你了解的分布式 ID 生成方案

为什么需要分布式 ID 对于单体系统来说,主键 ID 常用主键自动的方式进行设置。这种 ID 生成方法在单体项目是可行的,但是对于分布式系统,分库分表之后就不适应了。比如订单表数据量太大了,分成了多个库,如果还采用数据…

创业可以做什么项目,六个轻资产创业项目推荐

​2022年已经接近尾声了,你有为下一年做好计划嘛,今年并不是平静的一年,口罩总是反反复复的出现,很多人萌生了创业的想法,那有没有不怕口罩的创业项目呢?虽然创业并不容易,但当你有了正确的方向…

【优化充电】粒子群算法电动汽车充电动态优化策略【含Matlab源码 2163期】

⛄一、粒子群算法电动汽车充电优化 1 电动汽车充电负荷估算 电动汽车的充电负荷主要与电动汽车起始充电时刻和充电时长相关,而起始充电时刻是由电动汽车用户的到家时间决定的,充电时长主要与电动汽车的行驶里程和充电倍率相关。 目前电动汽车还没有大规模运营, 只能通过统计燃…

笔试强训day1

一、选择题 第一题&#xff1a; 题解&#xff1a;y123返回值为123&#xff0c;是非零数&#xff0c;所以y123总是正确&#xff0c;因此循环条件由x<4控制&#xff0c;答案 为C 第二题&#xff1a; %5表示输出总共占据了五列&#xff0c;%.3表示只取字符串左边三个字符并且…

傻白入门芯片设计,wafer/die/chip/cell(一)

1.wafer&#xff1a; 晶圆&#xff0c;指一整个圆形的晶圆硅片。如果问及CPU的原料是什么&#xff0c;大家都会轻而易举的给出答案—是硅。这是不假&#xff0c;但硅又来自哪里呢&#xff1f;其实就是那些最不起眼的沙子。不过不是随便抓一把沙子就可以做原料的&#xff0c;一定…

HTTP 协议

1 HTTP 协议的介绍 HTTP&#xff08;Hyper Transfer Protocol&#xff09;&#xff1a;超文本传输协议HTTP 协议是基于 TCP/IP 协议的超文本&#xff1a;比普通文本更加强大传输协议&#xff1a;客户端和服务器的通信规则&#xff08;握手规则&#xff09; 注意&#xff1a; J…

【计算机毕业设计】21.二手拍卖系统maven源码

一、系统截图&#xff08;需要演示视频可以私聊&#xff09; 引言 近年来&#xff0c;电子商务发展的愈趋成熟使得人们的消费方式以及消费观念发生巨大改变&#xff0c;网上竞拍的拍卖模式随之发展起来。大学拍卖网旨在为湘大学生提供一个线上拍卖的交易平台。平台展示的商品大…

STM32CubeMX时钟树(72MHZ主频配置)

目录 一些基础概念 时钟树配置图 第一步 第二步 这里我只是配置常用的72MHZ主频&#xff0c;很多时候新手都在时钟树这里被劝退了。其实不知道没关系&#xff0c;我用STM32这么久了&#xff0c;也只知道大概。我们绝大多数时候不需要配置这个时钟&#xff0c;记住72MHZ主频…

LeetCode-795-区间子数组个数

1、双指针 根据题意&#xff0c;我们可以将数组中的数分为这三类&#xff1a;1、小于leftleftleft的数&#xff1b;2、大于等于leftleftleft且小于等于rightrightright的数&#xff1b;3、大于rightrightright的数。因此若我们使用双指针来维护区间[last2,last1][last2,last1]…

Nacos与Eureka中的高性能读写并发架构设计

Nacos、Eureka都是微服务领域内熟知、常用的注册中心组件。只不过呢&#xff0c;Nacos还多了个功能身份就是配置中心。从目前流行与随着Spring Cloud Alibaba发展来看&#xff0c;Nacos使用得更加多&#xff0c;也是趋势所在。 注册中心原理 注册中心原理其实很简单&#xff…

【18】Java常见的面试题汇总(Spring/Spring MVC)

目录 1. 为什么要使用 spring&#xff1f; 2. 解释一下什么是 aop&#xff1f; 3. 解释一下什么是 ioc&#xff1f; 4. spring 有哪些主要模块&#xff1f; 5. spring 常用的注入方式有哪些&#xff1f; 6. spring 中的 bean 是线程安全的吗&#xff1f; 7. spring 支持…

【Java八股文总结】之外卖平台项目整理

文章目录一、项目介绍1.1 项目整体介绍1.2 主要模块介绍二、项目开发2.1 后台管理系统开发2.1.1 员工管理employee1、员工后台登录2、员工退出3、过滤器4、新增员工5、员工信息分页查询↑&#xff08;参加上面&#xff09;6、修改员工信息7、根据id查询员工信息&#xff0c;回显…

后台开发的学习日记

后台开发的学习日记 Java后台开发的日记&#xff1a;Push一下自己每天都要学习后台 后台开发学习日志-Day1后台开发的学习日记Day1: 路线及资料的汇总一、应该选择什么语言&#xff1f;二、学习路线的规划及资料的汇总整理Day1: 路线及资料的汇总 第一天主要是路线的准备及资料…

Pytorch学习笔记(二)官方60min入门教程之自动微分

目录 一.相关包及函数介绍 二.雅各比向量积 三.练习代码 一.相关包及函数介绍 autograd 包是 PyTorch 中所有神经网络的核心。首先让我们简要地介绍它&#xff0c;然后我们将会去训练我们的第一个神经网络。该 autograd 软件包为 Tensors 上的所有操作提供自动微分。它是一…

显卡天梯图2022年11月新版 显卡性能排行榜天梯图

1 RTX 3090Ti 2 RTX 3090 3 RX 6900 XT水冷版 我用的显卡就是活动时8折抢购的太划算了 http://www.adiannao.cn/dq 4 RTX 3080 Ti 5 RX 6900 XT 6 Titan RTX 7 RTX 3080 8 RX 6800 XT 9 RX 6800 10 RTX 3070 Ti

C++数据结构X篇_01_数据结构的基本概念

从本篇开始学习数据结构相关概念。 数据结构的基本概念1 数据结构的相关概念1.1 为什么要学习数据结构1.2 数据结构中的基本概念2 算法2.1 算法的概念2.2 算法和数据结构的区别2.3 算法特性2.4 算法效率的度量2.4.1 事后统计法2.4.2 事前分析估算2.4.3 大O表示法2.4.3.1采用大O…

从事先进计算的工程师对此都有什么感想?

电子计算机最初诞生于二十世纪&#xff0c;体积庞大的初代机型运算能力有限&#xff0c;随着计算技术的升级完善&#xff0c;现在多样小巧的计算机及手机的计算能力呈指数级增长&#xff0c;更是成为人们生活密不可分的综合性助手。 先进计算是在计算的基础上诞生的全新概念&a…

Python3安装及基础语法

Python 官网&#xff1a;Welcome to Python.org Python安装&#xff1a;进入官网Download找到对应版本安装包&#xff0c;下载后双击安装&#xff0c;一直下一步即可&#xff1b;注意&#xff1a;安装最后一步勾选&#xff08;Add Python to PATH&#xff09;&#xff0c;默认…

用nginx作反向代理时,请求头中含波浪线无法转发请求的解决方法

请求头如下 POST /CDGServer3/s/rs/uni HTTP/1.1 Content-Type: text/html; charsetUTF-8 method~name: upgradePatchService user~userId: admin.local user~clientId: 343834353230344334424431 user~SessionID: 0 data~packageNo: 618 data~packageState: 1 User-Agent: Ra…