SNP过滤标准的确定

news2024/11/15 11:52:07

--------各项指标的计算-------- 

vcf=xxx.vcf.gz

out=xxx   # 计算完的文件会自动生成文件后缀

# 1.计算每个个体的SNP的平均测序深度
vcftools --gzvcf $vcf --depth --out $out
# 2.计算每个SNP位点的测序深度
vcftools --gzvcf $vcf --site-mean-depth --out $out
# 3.计算每个SNP位点的质量
vcftools --gzvcf $vcf --site-quality --out $out
# 4.计算每个个体包含缺失位点的比例
vcftools --gzvcf $vcf --missing-indv --out $out
# 5.计算每个SNP位点的在所有个体缺失位点的比例
vcftools --gzvcf $vcf --missing-site --out $out
# 6.计算每个个体的杂合度和近交系数(判断是否有离群样本)
vcftools --gzvcf $vcf --het --out $out

引用参考自:四、重测序数据分析之变异识别与过滤


--------预览生成的各个文件的结构-------- 

此步可以省略,后续在R中导入后也可以看到。

图1  每个个体的SNP的平均测序深度

图2  每个个体的杂合度和近交系数

图3  每个个体包含缺失位点的比例

图4  每个SNP位点的在所有个体缺失位点的比例

图5  每个SNP位点的测序深度

图6  每个SNP位点的质量


--------R ggplot绘制密度图-------- 

请先确保R软件和ggplot包已安装。 

# 1. 导入ggplot2绘图包
library(ggplot2)

# 2. 导入文件
raw_idepth <- read.table("H:/filterbasis/final_chr01a_snp01_depth.idepth", header = TRUE) 
# 读取文件时,不指定 sep 参数,让它自动检测分隔符;
# 指定header参数为TRUE,自动识别第一列为列名;
# 导入后,检查一下行列是否被正确识别。

# 3. 根据已知的列名,将该列进行数值化
raw_idepth$MEAN_DEPTH <- as.numeric(raw_idepth$MEAN_DEPTH)
# 如果不知道列名,可以用以下命令查看
print(colnames(raw_idepth))

# 4. 绘图
ggplot(raw_idepth, aes(x = MEAN_DEPTH)) +  # 指定文件和列
  geom_density(fill = "red", alpha = 0.5) +  # 指定填充颜色和透明度
  labs(title = "个体平均测序深度", x = "MEAN_DEPTH", y = "Density") # 设置表头和坐标轴

绘制完成后如图7所示,可根据这个图来确定大部分数据所在范围,从而选择后续过滤最合适的参数。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1861235.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

3D网格细分与变形

这篇文章探讨了整个细分和变形过程中出现的各种问题的解决方案。然后&#xff0c;它将其扩展为完整的管道&#xff0c;用于变形和操纵 3D 网格&#xff0c;并计算着色和位移的精确法线。 1、简单细分 在 3D 渲染中&#xff0c;所有网格都由三角形组成。当模型从 Blender 或任…

关于window的安装

&#x1f4d1;打牌 &#xff1a; da pai ge的个人主页 &#x1f324;️个人专栏 &#xff1a; da pai ge的博客专栏 ☁️宝剑锋从磨砺出&#xff0c;梅花香自苦寒来 第一windows的分类 旗舰版 个人版…

赶快收藏!全网最佳 WebSocket 封装:完美支持断网重连、自动心跳!

文章目录 一、WebSocket 基础WebSocket 的基本使用 二、封装 WebSocket 客户端WebSocketClient 类使用 WebSocketClient 类解释代码实现 三、总结优点未来改进 &#x1f389;欢迎来到SpringBoot框架学习专栏~ ☆* o(≧▽≦)o *☆嗨~我是IT陈寒&#x1f379;✨博客主页&#xff…

找不到mfc140u.dll怎么修复,mfc140u.dll丢失的多种修复方法

计算机丢失mfc140u.dll文件会导致依赖该文件的软件无法正常运行。mfc140u.dll是Microsoft Visual C 2015的可再发行组件之一&#xff0c;它属于Microsoft Foundation Class (MFC) 库&#xff0c;许多使用MFC开发的程序需要这个DLL文件来正确执行。丢失了mfc140u.dll文件。会导致…

论文阅读--《FourierGNN:从纯图的角度重新思考多元时间序列预测》

Yi K, Zhang Q, Fan W, et al. FourierGNN: Rethinking multivariate time series forecasting from a pure graph perspective[J]. Advances in Neural Information Processing Systems, 2024, 36. 本次介绍的文章来自NeurIPS 2023&#xff0c;关于多变量时间序列的预测 摘要…

以创新赋能引领鸿蒙应用开发,凡泰极客亮相华为HDC2024

6月21日至23日&#xff0c;华为开发者大会2024在松山湖举行。大会现场&#xff0c;华为发布了HarmonyOS、盘古大模型等方面最新进展。国内外众多企业齐聚一堂&#xff0c;共迎新商机、共创新技术、共享新体验。 凡泰极客作为鸿蒙生态的重要战略合作伙伴&#xff0c;同时也是鸿…

【 IM 服务】开通全量消息路由服务

前提条件 在生产环境中&#xff0c;仅 IM 旗舰版、IM 尊享版可开通该服务。 操作说明 控制台 - 应用配置 - IM 服务管理 页面开通 可自助配置&#xff08;配置名&#xff1a;多设备消息同步&#xff09;收费配置&#xff08;开发环境下免费&#xff09; image1575645 48.4 K…

安达发|生产计划排产软件推动制造业的高质量发展

在全球经济一体化的大背景下&#xff0c;制造业正面临着前所未有的挑战与机遇。随着智能化技术的不断进步&#xff0c;生产计划排产软件作为推动制造业高质量发展的重要工具&#xff0c;已经成为行业转型升级的关键。 制造业作为国民经济的重要支柱&#xff0c;其发展水平直接关…

2024年全国VUE考试中心大全!

大家好&#xff0c;华为HCIA、HCIP、HCIE的笔试部分&#xff0c;都需要在VUE考试中心进行预约。但是很多同学都不知道当地VUE考试中心在哪里&#xff01; 为了解决大家的问题&#xff0c;这边整理了全国各大城市的VUE考试中心名称和详细地址。需要的小伙伴们可以来看看&#x…

项目实训-vue(十一)

项目实训-vue&#xff08;十一&#xff09; 文章目录 项目实训-vue&#xff08;十一&#xff09;1.概述2.页顶导航栏3.导航信息4.总结 1.概述 本篇博客将记录我在图片上传页面中的工作。 2.页顶导航栏 <divstyle"display: flex;justify-content: space-between;alig…

2732. 找到矩阵中的好子集

题目 给你一个下标从 0 开始大小为 m x n 的二进制矩阵 grid。 从原矩阵中选出若干行构成一个行的非空子集&#xff0c;如果子集中任何一列的和至多为子集大小的一半&#xff0c;那么我们称这个子集是好子集。 更正式的&#xff0c;如果选出来的行子集大小&#xff08;即行的…

考研数学|线代零基础,听谁的课比较合适?

线性代数是数学的一个重要分支&#xff0c;对于考研的学生来说&#xff0c;掌握好这门课程是非常关键的。由于你之前没有听过线性代数课&#xff0c;选择一个合适的课程和老师就显得尤为重要。 以下是一些建议&#xff0c;希望能帮助你找到合适的课程资源。 首先&#xff0c;…

迁移方案详解|使用YMP从异构数据库迁移到YashanDB

数据迁移简介 01典型场景与需求 在国产化浪潮下&#xff0c;数据库系统的国产化替代成为了一个日益重要的议题&#xff0c;有助于企业降低对外依赖&#xff0c;提升信息安全和自主性。 以Oracle、MySQL为代表的传统关系型数据库管理系统&#xff0c;在企业应用中占据了重要的…

食品供应链管理商城系统的设计、实现和代码

上线食品供应链管理商城系统的设计与实现是一项复杂且重要的任务&#xff0c;它不仅涉及到技术层面的具体实现&#xff0c;还包括业务流程的优化和用户体验的提升。本文将从系统设计、功能模块、技术选型以及实现步骤等方面进行详细探讨。 ### 系统设计 在设计食品供应链管理…

cad转换pdf怎么转换?介绍四个转换方法

cad转换pdf怎么转换&#xff1f;在数字化办公日益盛行的今天&#xff0c;CAD图纸的转换与处理成为许多专业人士不可或缺的技能。特别是在需要将CAD图纸转换为PDF格式时&#xff0c;一款功能强大的软件能够大大提高工作效率。今天&#xff0c;就为大家推荐四款CAD转PDF的神器&am…

Docker 安装Nginx部署网站 防火墙端口 数据卷挂载

拉取镜像 docker pull nginx#不写版本号 表示最新版本查看是否拉取成功 docker images#成功 nginx latest 605c77e624dd 2 years ago 141MB mysql 8.0 3218b38490ce 2 years ago 516MB mysql latest 3218b38490ce 2 years ago 5…

【乐吾乐2D可视化组态编辑器】水位随数据动态变化

External Player - 哔哩哔哩嵌入式外链播放器 示例&#xff1a;进度条&#xff0c;通常用来展示水位变化 乐吾乐2D可视化组态编辑器demo&#xff1a;https://2d.le5le.com/ 示例&#xff1a;乐吾乐2D可视化 (le5le.com)

项目实训-vue(十三)

项目实训-vue&#xff08;十三&#xff09; 文章目录 项目实训-vue&#xff08;十三&#xff09;1.概述2.处理按钮 1.概述 本篇博客将记录我在图片上传页面中的工作。 2.处理按钮 实现了图片的上传之后&#xff0c;还需要设置具体的上传按钮。 这段代码使用 Element UI 的 …

使用API有效率地管理Dynadot域名,为文件夹中的域名进行域名停放

关于Dynadot Dynadot是通过ICANN认证的域名注册商&#xff0c;自2002年成立以来&#xff0c;服务于全球108个国家和地区的客户&#xff0c;为数以万计的客户提供简洁&#xff0c;优惠&#xff0c;安全的域名注册以及管理服务。 Dynadot平台操作教程索引&#xff08;包括域名邮…

探讨数字化背景下VSM(价值流程图)的挑战和机遇

在信息化、数字化飞速发展的今天&#xff0c;各行各业都面临着前所未有的挑战与机遇。作为源自丰田生产模式的VSM&#xff08;价值流程图&#xff09;&#xff0c;这一曾经引领制造业革命的工具&#xff0c;在数字化背景下又将如何乘风破浪&#xff0c;应对新的市场格局和技术变…