GWAS 分析模型 | FaST-LMM

news2025/1/15 12:43:06

GWAS 分析模型 | FaST-LMM

FaST-LMM (Factored Spectrally Transformed Linear Mixed Models) 是一个用于进行全基因组关联分析(GWAS)的模型。与标准混合线性模型相比,FaST-LMM 通过对遗传相似性矩阵进行单次谱分解来减少计算资源消耗并提升运行速度,因此特别适用于超大型数据集的 GWAS 分析。

alt

扫码关注微信公众号【生信F3】获取更多生物信息学最新知识。

ShengXinF3_QRcode
ShengXinF3_QRcode

安装

FaST-LMM 提供了供直接运行的预编译版本(FastLmmC v2.07.20140723),下载后即可使用:

https://www.microsoft.com/en-us/download/details.aspx?id=52588

./fastlmmc

用法

FaST-LMM 需要四个输入文件(ASCII 编码),包含

  1. SNP 数据
  2. 用于计算个体间遗传相似性(亲缘关系矩阵)的 SNP 数据(可以与1不同)
  3. 表型数据
  4. 一组协变量(可选)

仅计算遗传相似性矩阵:

./fastlmmc -runGwasType NORUN \
 -pheno Trait1.plink.txt -missingPhenotype NA \
 -fileSim test \
 -simOut test.sim

-runGwasType

计算遗传相似矩阵的谱分解后,运行 GWAS 或退出。使用 NORUN,缓存谱分解。默认值:RUN。

运行 GWAS:

./fastlmmc
-tfile test
-pheno Trait1.plink.txt
-tfileSim test
-simOut out.sim
-out test_fastlmm.out.txt
-missingPhenotype NA -maxChromosomeValue 1000000 -maxThreads 5

常用选项

1. 基因型

输入文件 SNP 数据应该为 PLINK 格式(ped/map, tped/tfam, bed/bim/fam, or fam/dat/map)。使用依赖 SNP 排序的二进制格式可以获得最快的速度。这些文件中的表型条目必须被设置为虚值并将被忽略(FaST-LMM 软件使用单独的表型文件)。性别应该被编码为一个数字。缺失的 SNP 值将被按均值填补。

注意:该软件只能接受整数或字符串形式(X、Y、XY 或 MT)的染色体编号,因此对于非模式物种,建议在 SNP 标识符中包含染色体 ID,并将染色体 ID 列全部以数字 0 填充。

-file basefilename

.map.ped 格式的文件基名

-bfile basefilename

​ 二进制 .bed, .fam.bin 格式的文件基名

-tfile basefilename

​ 转置后 .tfam.tped 格式的文件基名

2. 亲缘关系

-tfileSim basefilename

​ 用于构建遗传相似度(亲缘关系)的转置后 .tfam.tped 格式的文件基名(可与基因型数据保持一致)

-simOut filename

​ 指定将遗传相似度写入此文件

3. 表型

-pheno filename 表型文件名

-missingPhenotype

缺失值的标识符。如果一个个体的表型缺失,那么该个体就会被忽略。如果一个个体的协变量值缺失,则以平均值估算。默认值为 -9。

包含表型数据的文件使用 PLINK 的表型格式。其至少包含三列:familyID、individualID 和任意数量的表型值。列间以制表符或空格分隔。默认仅测试第一列表型值,缺失值默认以 -9 表示,但一般建议以 -missingPhenotype 选项来指定缺失值。第一列 familyID 与第二列 individualID 相连接从而为个体创建唯一的标识符,并与上述 PLINK 文件中的个体条目相匹配。例如:

cid0P0 cid0P0 0.4853395139922632
cid1P0 cid1P0 -0.2076984565752155
cid2P0 cid2P0 1.4909084058931985
cid3P0 cid3P0 -1.2128996652683697
cid4P0 cid4P0 0.4293203431508744
4. 其它

-maxThreads <int>

该选项被传递给 MKL 数学库(Intel)以 "建议" 使用的并行程度。指定一个大于计算机上核心数的数字可能会导致程序运行得更慢。指定一个小于核心数的数字可能会使计算机在运行 FastLmmC 时不会在程序的不同阶段消耗所有的 CPU 资源。在使用 ACML 数学库(AMD)时,MaxThreads 选项将被忽略

-covar filename

包含协变量的可选文件

结果输出

-out filename

输出文件的名称。默认值是 [basefilename].out.txt。如果使用扩展名是 .csv,输出文件将以逗号分隔。否则将以制表符分隔。

默认输出文件如下所示:

alt

每列含义如下:

  1. SNP:SNP 标识符。
  2. Chromosome:SNP 的染色体标识符,取自 PLINK 文件。
  3. Genetic Distance:SNP 的遗传距离,未知则为 0。
  4. Position:SNP 的物理位置。
  5. Pvalue:计算所得 P 值。
  6. Qvalue:使用 Benjamini-Hochberg 校正 p 值后所得的 q 值
  7. N:用于分析的个体数量
  8. NullLogLike
  9. AltLogLike
  10. SNPWeight
  11. SNPWeightSE
  12. OddsRatio
  13. WaldStat
  14. NullLogDelta
  15. NullGeneticVar
  16. NullResidualVar
  17. NullBias

扫码关注微信公众号【生信F3】获取更多生物信息学最新知识。

ShengXinF3_QRcode
ShengXinF3_QRcode

本文由 mdnice 多平台发布

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1259380.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

智慧城市交通大屏|助力解决城市交通问题

2017年起&#xff0c;数字孪生连续三年被Gartner列入“未来科技十大趋势”&#xff0c;由此可见数字孪生技术正屹立在数字化发展的风口之中。 数字孪生作为物理世界的数字映射&#xff0c;将流程、物体的信息利用数字技术实时映射到系统中&#xff0c;可以对某个设备、某个企业…

vivado产生报告阅读分析25-复杂性报告

对于顶层设计和 / 或包含 1000 个以上叶节点单元的层级单元 &#xff0c; 复杂性报告会显示每个叶节点单元类型的“ Rent Exponent” &#xff08; Rent 指数 &#xff09; 、“ Average Fanout ” &#xff08; 平均扇出 &#xff09; 和分布。 Rent 指数是指在使用最小割 …

Ubuntu+Tesla V100环境配置

系统基本信息 nvidia-smi’ nvidia-smi 470.182.03 driver version:470.182.03 cuda version: 11.4 查看系统体系结构 uname -aUTC 2023 x86_64 x86_64 x86_64 GNU/Linux 下载miniconda https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/?CM&OA https://mi…

无效的目标发行版: 21 和springboot爆错

目录 问题描述 原因分析&#xff1a; 问题描述 springboot爆红 调整一下这个&#xff1a;把这里的version调低一点应该就可以了 无效的目标发行版: 21 调整一下这个把这里的Java version调整一下&#xff0c;我是调整到1.8&#xff08;其他没有试过&#xff09; 原因分析&a…

数据结构 / day05 作业

1. 双向循环链表作图 双向循环链表节点创建 双向循环链表节点头部插入 双向循环链表节点尾插 双向循环链表节点头部删除 双向循环链表节点尾部删除 2.思维导图

入侵redis之准备---VMware安装部署kail镜像服务器【详细包含云盘镜像】

入侵redis之准备—VMware安装部署kail镜像服务器【详细包含云盘镜像】 kail是一个很好玩的操作系统&#xff0c;不多说了哈 下载kail镜像 kail官网:https://www.kali.org/get-kali/#kali-platforms 百度云盘下载&#xff1a; 链接&#xff1a;https://pan.baidu.com/s/1PRjo…

用Zoho Projects项目管理系统进行直播管理的策略与方法

使用Zoho Projects项目管理系统进行直播管理。优化团队直播流程&#xff0c;明确职责&#xff0c;增进默契&#xff01;助力团队一丝不苟&#xff0c;确保无懈可击的直播效果。汲取经验&#xff0c;固化流程&#xff0c;多角度剖析关键数据&#xff0c;深入复盘&#xff0c;便于…

C++标准模板库 STL 简介(standard template library)

在 C 语言中&#xff0c;很多东西都是由我们自己去实现的&#xff0c;例如自定义数组&#xff0c;线程文件操作&#xff0c;排序算法等等&#xff0c;有些复杂的东西实现不好很容易留下不易发现的 bug。而 C为使用者提供了一套标准模板库 STL,其中封装了很多实用的容器&#xf…

任意文件上传漏洞挖掘(getshell)

任意文件上传漏洞挖掘(getshell) 1.在漏洞挖掘过程中进行找到该子域名页面&#xff0c; 2.没有内容就扫目录&#xff0c;成功发现filemanager/&#xff0c;点击访问 看到upload页面感觉有惊喜&#xff0c; 果然有上传功能&#xff0c;点击上传抓包&#xff0c;经测试发现普通j…

【第六节:微信小程序 小程序UI组件C】微信小程序入门,以思维导图的方式展开6

如果图文字看不清&#xff0c;可以私信我给发大图哈。 6、小程序UI组件C 导航(Navigation) navigator 应用链接 url String 应用内的跳转链接 open-type String navigate 可选值 navigate、redirect、switchTab、reLaunch&#…

RAM++(recognize anything++)—— 论文详解

一、概述 1、是什么 RAM&#xff08;RAM plus plus&#xff09;论文全称 《Open-Set Image Tagging with Multi-Grained Text Supervision》。区别于图像领域常见的分类、检测、分割&#xff0c;他是标记任务——多标签分类任务&#xff08;一张图片命中一个类别&#xff09;&…

【我的创作纪念日】

机缘 大家好&#xff0c;我是圥忈ゼ&#xff0c; 2023 年 07 月 20 日&#xff0c;我撰写了第 1 篇技术博客&#xff1a;《我的编程未来规划》&#xff0c;也是由于我高考后的专业选择&#xff0c;和就业方向的选择&#xff0c;加上想立志成为一名专业 IT 作者&#xff0c;我结…

Docker | Docker部署MySQL

Docker | Docker部署MySQL ✅作者简介&#xff1a;大家好&#xff0c;我是Leo&#xff0c;热爱Java后端开发者&#xff0c;一个想要与大家共同进步的男人&#x1f609;&#x1f609; &#x1f34e;个人主页&#xff1a;Leo的博客 &#x1f49e;当前专栏&#xff1a;Docker系列…

Python交互式解释器及用法

为了让开发者能快速学习、测试 Python 的各种功能&#xff0c;Python 提供的“python”命令不仅能用于运行 Python 程序&#xff0c;也可作为一个交互式解释器一一开发者逐行输入 Python 代码&#xff0c;它逐行解释执行。 当输入“python”命令时&#xff0c;可以看到如下输出…

IDEA的安装与删除插件

不小心安装了一个英文转中文的插件&#xff0c;看不习惯&#xff0c;决定重新变回英文 先点击这个settings的安装 然后就看到这个下面这张图了 如果是安装就点install&#xff0c;不用了就和我一样把这个勾给去掉

计算计能力挑战赛选择题真题(2020、2021、2022)

2020 1.关于联合体和结构体错误的是&#xff08;a) a.联合体union的存放顺序是所有成员都从高地址开始存放的(x) (ps:联合体union的存放顺序是所有成员都从低地址开始存放的) b.联合体中可以定义多个成员&#xff0c;联合体的大小由最大的成员的大小决定。 c.可以使用匿名…

ChatGLM2详细安装部署(chatglm2大模型安装步骤三)

ChatGLM2安装部署 1.服务器配置 服务器系统:Centos7.9 x64 显卡:RTX3090 (24G) 虚拟环境:Miniconda3 2.安装部署 2.1 ChatGLM2下载 输入命令:git clone https://github.moeyy.xyz/https://github.com/THUDM/ChatGLM2-6B.git 输入命令:cd ChatGLM2-6B 注:https://g…

瓶盖内的条码需要注意哪些?,才能帮助企业有效搭建与消费者沟通~

在不断发展的消费品领域&#xff0c;特别是饮料行业&#xff0c;组织不断寻求创造性的方法来扩大客户参与度、增强品牌忠诚度并消除假冒产品。一种获得认可的新兴方法是在瓶盖和瓶盖上实施DataMatrix 条形码扫描。这种创新方法提供了许多好处&#xff0c;从改善消费者互动到强化…

idea 旧项目替换成新项目(项目名称,模块,代码)

文章目录 修改项目名替换模块、文件前缀全局替换包名局部替换xml、yml等其他文件 修改项目名 右击项目名称->Refactor->Rename(shiftF6) ctrlaltshifts 替换模块、文件前缀 git bash执行如下脚本 #/bin/bash # 单目录替换 for f in old-prefix*; do mv "$f…

用java实现王者荣耀

第一步是创建项目 项目名自拟 第二部创建个包名 来规范class 然后是创建类 GameFrame 运行类 package com.sxt; import java.awt.Graphics; import java.awt.Image; import java.awt.Toolkit; import java.awt.event.ActionEvent; import java.awt.event.ActionListener; impo…