共定位数据和环境准备

news2025/1/20 12:04:14

共定位数据和环境准备

一、数据准备
如果需要做eqtl-GWAS的共定位,则需要按照药靶教程中,将eqtl数据放在smr目录内
如果是纯GWAS-GWAS的共定位,涉及到本地数据的,需要将其整理成模板SNP的格式,并且需要chr,pos,samplesize

在线数据的GWAS会用ieugwasr和gwasglue包进行处理

本地数据如果在下载下来后没有samplesize列,可以使用以下代码进行添加

为本地数据添加samplesize

add_samplesize("文件名.txt", 10000)



二、R包环境准备
MendelR升级到6.0以上后,可以使用prepare_colocalization()方法来准备相关的R包
主要是:
snpStats (用于分析snp的数据)
coloc(共定位主要R包,使用贝叶斯的方法)
locuscomparer(可视化包)
ieugwasr(从mrbase数据库提取数据的接口)
gwasglue(在线ieu数据的处理)

 

 

prepare_colocalization()#准备共定位相关的包


MendelR包集成了上面两种方法的数据预处理,以及各种边界条件的判断和提示,使用时如果有本地数据,则准备好数据在工作目录,然后使用一行代码即可分析出想要的结果

具体使用方法,请移步:

 eQTL-GWAS一键分析

mr_coloc_eqtl2gwas("HMGCR", "ieu-a-300")

        

     一、数据准备

       1.eqtl数据,存放在smr目录

       2.gwas数据,分为在线和本地,

        在线数据不用做任何处理,代码已经做了兼容

        本地数据需要按照模板SNP的格式整理,并且需要有chr,pos,samplesize

流程:

1.从eqtl数据或者这部分基因SNP

2.根据这部分SNP,获取在线数据或者本地数据对应范围的SNP

3.整理数据成coloc的格式

4.进行coloc分析,可视化

三、参数解释

?mr_coloc_eqtl2gwas

使用方法:和smr一键分析的代码类似

特别需要注意的:

gwas_type : gwas表型的类型 cc为分类变量,quant为连续变量

gwas_s: 代表case/samplesize的比值,比如 case1000,samplesize200000,s=1000/200000=0.005

eqtl_samplesize: eqtl数据的样本量,默认eqtlGen 31864



三、共定位引用
locuscomparer画图:
https://github.com/boxiangliu/locuscomparer
If you use locuscompare, please cite the following paper: Abundant associations with gene expression complicate GWAS follow-up | Nature Genetics
Boxiang Liu, Michael J. Gloudemans, Abhiram S. Rao, Erik Ingelsson & Stephen B. Montgomery (2019) Abundant associations with gene expression complicate GWAS follow-up, Nature Genetics

coloc
https://github.com/chr1swallace/coloc

四、图例说明

image.png


左侧的图代表SNP在GWAS和QTL中-log10(p)的分布情况,p值越小越在Y轴上方
右侧两个各自分表代表QTL和GWAS自己的分布情况(横坐标是snp的pos位点位置)
纵坐标代表着SNP在该GWAS/QTL数据中的-log10(p)值,越高代表p值越小,lead SNP是在最顶。
R2为该数据在相应人群中某SNP与lead SNP之间的连锁程度。
主要展示数据中SNP的连锁不平衡情况
标出来的SNP,则是两个数据中PPH4最大的数值,具体每个SNP都有对应H1~H4的数据,查看结果中的共定位数据

标注出来的rsid,是两个数据中pval相加最小的值,即leadSNP

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/895706.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

CASAIM与哈尔滨工业大学达成航空航天关键零部件自动化智能测量系统合作,助力航空航天特种复合新材料性能分析

近期,CASAIM与哈尔滨工业大学在航空航天关键零部件自动化智能测量系统展开全面合作,为后续进行航空航天特种复合新材料性能分析提供可靠的试验数据。 哈尔滨工业大学是隶属于工业和信息化部的全国重点大学,是国家“985工程”“211工程”“双…

【Ubuntu】从Graylog到Grafana Loki:构建更强大的网络设备管理和监控系统

在将Graylog部署到生产环境时,我们遇到了一些问题,其中最主要的是无法安装MongoDB并且无法随时重启机器去修改BIOS设置来修复问题 【WARNING: MongoDB 5.0 requires a CPU with AVX support, and your current system does not appear to have that! 】。…

云服务 Ubuntu 20.04 版本 使用 Nginx 配置SSL证书和nginx从HTTP跳转到HTTPS

1.云服务申请免费的SSL证书 2.从云服务SSL证书下载到本地解压上传到服务器 3.配置Nginx下的 nginx.cof 文件 4.开放安全组,内部与外部 5.测试配置与跳转是否成功 1.云服务申请免费的SSL证书 1.1.登录云平台找到SSL证书 注意:博主这里是腾讯云&#x…

程序员如何利用公网远程访问查询本地硬盘【内网穿透】

🎬 鸽芷咕:个人主页 🔥 个人专栏: 《高效编程技巧》《cpolar》 ⛺️生活的理想,就是为了理想的生活! 公网远程访问本地硬盘文件【内网穿透】 文章目录 公网远程访问本地硬盘文件【内网穿透】前言1. 下载cpolar和Everything软件1.…

OJ练习第151题——克隆图

克隆图 力扣链接:133. 克隆图 题目描述 给你无向 连通 图中一个节点的引用,请你返回该图的 深拷贝(克隆)。 示例 分析 对于一张图而言,它的深拷贝即构建一张与原图结构,值均一样的图,但是…

光伏发电系统的并网接入点选择及接入方案

1.并网方式及接入点选择 (1))并网点与接入点定义 1)并网点。对于有升压站的分布式电源,并网点为分布式电源升压站中压侧母线或节点,对于无升压站的分布式电源,并网点为分布式电源的输出汇总点。图1中所示A1、B1点分别为分布式电源A、B的并网…

工业视觉相机镜头选型方法

一、相机选型 1、首先,根据检测需求确定选用黑白/彩色、面阵/线阵相机,接口类型一般选择GigE 2、确定检测精度要求(最小特征尺寸mm)、视野范围,一个测量精度对应几个像素数(一般取3-5) 3、计…

【山河送书第七期】:《强化学习:原理与Python实战》揭秘大模型核心技术RLHF!

《强化学习:原理与Python实战》揭秘大模型核心技术RLHF! 一图书简介二RLHF是什么?三RLHF适用于哪些任务?四RLHF和其他构造奖励模型的方法相比有何优劣?五什么样的人类反馈才是好反馈?六如何减小人类反馈带来…

Matplotlib数据可视化(四)

1.在绘图中显示公式 在Matplotlib中可以使用LaTex的命令来编辑公式,只需要在字符串前面加一个r即可。 示例1: import numpy as np import matplotlib.pyplot as plt plt.xlim([1,4]) plt.ylim([1,3]) plt.text(2,2,r$ \alpha \beta \pi \lambda \omeg…

新榜 | CityWalk本地生活商业价值洞察报告

如果说现在有人问,最新的网络热词是什么? “CityWalk”,这可能是大多数人的答案。 近段时间,“CityWalk”刷屏了各种社交媒体,给网友们带来了一场“城市漫步”之旅。 脱离群体狂欢,这个在社交媒体引发热议的词汇背后又…

【leetcode】232. 用栈实现队列

1.使用两个栈结构构建队列 我们需要自定义栈及其相关操作 栈结构遵循后入先出的原则,队列结构遵循先入先出的原则 构建具有两个栈结构的队列,栈pushST用于数据的插入,栈popST用于数据的删除 为栈结构动态开辟空间并初始化栈结构 //定义一个具…

object获取的两种方式/Object.keys使用/解构赋值

object获取的两种方式: data() {return {abj: {aa: {A: 1}}}},created() {console.log(this.abj.aa) //第一种console.log(this.abj["aa"]) //第二种}, Object.keys使用/解构赋值: return {footList: [],abj: {aa: {A: 12,AA:22},bb: {…

macOS系统安装python3

官网下载 官网:https://www.python.org/ 选择最新版本下载 双击安装包 点击继续 点击继续 点击同意 点击安装 终端执行 python3 --version

九、Linux下,如何在命令行进入文本编辑页面?

1、文本编辑基础 说到文本编辑页面,那就必须提到vi和vim,两者都是Linux系统中,常用的文本编辑器 2、三种工作模式 3、使用方法 (1)在进入Linux系统,在输入vim text.txt之后,会进入文本编辑中&…

【JS】for 与 forEach 分别如何跳出循环

for 循环 在 for 循环中&#xff0c;退出循环的两种方式&#xff1a; break; 退出整个循环continue; 退出当次循环 let array [1, 2, 3, 4, 5, 6, 7, 8, 9]; for (let i 0; i < array.length; i) {if (array[i] 6) {// break; // 退出整改循环&#xff0c;continue; /…

高并发内存池(centralcache)[2]

Central cache threadcache是每个线程独享&#xff0c;而centralcache是多线程共享&#xff0c;需要加锁&#xff08;桶锁&#xff09;一个桶一个锁 解决外碎片问题&#xff1a;内碎片&#xff1a;申请大小超过实际大小&#xff1b;外碎片&#xff1a;空间碎片不连续&#x…

能耗分析在医院节能中的管理

摘要&#xff1a;医院作为特殊的公共建筑&#xff0c;能耗较大且逐年攀升&#xff0c;具有较大的节能潜力。结合天津市某医院的用能概况、智慧管理平台的建设和使用&#xff0c;对大量能耗数据进行了研究和分析&#xff0c;通过将能源管理系统、数据分析与节能工作相结合&#…

在Visual Studio中使用 //TODO注释

在软件开发过程中&#xff0c;注释是非常重要的&#xff0c;它们可以帮助开发者理解代码的功能和逻辑。​有时候我们只需要标记出一些临时性的、需要后续处理的代码片段。这时候&#xff0c;我们可以使用一种特殊的注释&#xff1a;//TODO注释。 //TODO注释是一种轻量级的注释…

【项目实践】基于LSTM的一维数据扩展与预测

基于LSTM的一维数据拟合扩展 一、引(fei)言(hua) 我在做Sri Lanka生态系统服务价值计算时&#xff0c;中间遇到了一点小问题。从世界粮农组织(FAO)上获得Sri Lanka主要农作物产量和价格数据时&#xff0c;其中的主要作物Sorghum仅有2001-2006年的数据&#xff0c;而Millet只有…