共定位数据和环境准备
一、数据准备
如果需要做eqtl-GWAS的共定位,则需要按照药靶教程中,将eqtl数据放在smr目录内
如果是纯GWAS-GWAS的共定位,涉及到本地数据的,需要将其整理成模板SNP的格式,并且需要chr,pos,samplesize
在线数据的GWAS会用ieugwasr和gwasglue包进行处理
本地数据如果在下载下来后没有samplesize列,可以使用以下代码进行添加
为本地数据添加samplesize
add_samplesize("文件名.txt", 10000)
二、R包环境准备
MendelR升级到6.0以上后,可以使用prepare_colocalization()方法来准备相关的R包
主要是:
snpStats (用于分析snp的数据)
coloc(共定位主要R包,使用贝叶斯的方法)
locuscomparer(可视化包)
ieugwasr(从mrbase数据库提取数据的接口)
gwasglue(在线ieu数据的处理)
prepare_colocalization()#准备共定位相关的包
MendelR包集成了上面两种方法的数据预处理,以及各种边界条件的判断和提示,使用时如果有本地数据,则准备好数据在工作目录,然后使用一行代码即可分析出想要的结果
具体使用方法,请移步:
eQTL-GWAS一键分析
mr_coloc_eqtl2gwas("HMGCR", "ieu-a-300")
一、数据准备
1.eqtl数据,存放在smr目录
2.gwas数据,分为在线和本地,
在线数据不用做任何处理,代码已经做了兼容
本地数据需要按照模板SNP的格式整理,并且需要有chr,pos,samplesize
流程:
1.从eqtl数据或者这部分基因SNP
2.根据这部分SNP,获取在线数据或者本地数据对应范围的SNP
3.整理数据成coloc的格式
4.进行coloc分析,可视化
三、参数解释
?mr_coloc_eqtl2gwas
使用方法:和smr一键分析的代码类似
特别需要注意的:
gwas_type : gwas表型的类型 cc为分类变量,quant为连续变量
gwas_s: 代表case/samplesize的比值,比如 case1000,samplesize200000,s=1000/200000=0.005
eqtl_samplesize: eqtl数据的样本量,默认eqtlGen 31864
三、共定位引用
locuscomparer画图:
https://github.com/boxiangliu/locuscomparer
If you use locuscompare, please cite the following paper: Abundant associations with gene expression complicate GWAS follow-up | Nature Genetics
Boxiang Liu, Michael J. Gloudemans, Abhiram S. Rao, Erik Ingelsson & Stephen B. Montgomery (2019) Abundant associations with gene expression complicate GWAS follow-up, Nature Genetics
coloc
https://github.com/chr1swallace/coloc
四、图例说明
左侧的图代表SNP在GWAS和QTL中-log10(p)的分布情况,p值越小越在Y轴上方
右侧两个各自分表代表QTL和GWAS自己的分布情况(横坐标是snp的pos位点位置)
纵坐标代表着SNP在该GWAS/QTL数据中的-log10(p)值,越高代表p值越小,lead SNP是在最顶。
R2为该数据在相应人群中某SNP与lead SNP之间的连锁程度。
主要展示数据中SNP的连锁不平衡情况
标出来的SNP,则是两个数据中PPH4最大的数值,具体每个SNP都有对应H1~H4的数据,查看结果中的共定位数据
标注出来的rsid,是两个数据中pval相加最小的值,即leadSNP