生信软件25 - 三代测序数据灵敏比对工具ngmlr

news2024/9/17 8:24:10

1. ngmlr简介

CoNvex Gap-cost Ments for Long Reads(ngmlr)是一种长reads比对工具,可以将PacBio或Oxford Nanopore灵敏地与(大)参考基因组(比如人类参考基因组)对齐,能快速和正确地比对reads,包括那些跨越(复杂)结构变异的reads。

Ngmlr使用结构变异(SV)感知的k-mer搜索来找到reads的近似映射位置,然后使用Smith-Waterman比对算法来计算最终比对。Ngmlr使用凸间隙成本模型(convex gap cost model),该模型对较长间隙的间隙扩展的罚分小于较短间隙的间隙扩展,以计算精确的比对。

差距模型允许ngmlr同时考虑测序误差和真实的基因组变异,并使其在更精确地鉴定源于结构变异的断裂点的位置方面特别有效。k-mer搜索有助于检测和拆分不能线性比对的reads,使ngmlr能够可靠地将读段与广泛的不同结构变异(包括嵌套SV)(例如侧翼缺失的倒位)进行比对。

NGMLR和Sniffles可以自动过滤错误事件并对低覆盖率数据,从而降低了阻碍长reads在临床和研究环境中应用的高成本

参考文献:
Accurate detection of complex structural variations using single-molecule sequencing
https://www.nature.com/articles/s41592-018-0001-7

文献

2. ngmlr安装

# 下载安装包
wget https://github.com/philres/ngmlr/releases/download/v0.2.7/ngmlr-0.2.7-linux-x86_64.tar.gz

# 解压
tar xvzf ngmlr-0.2.7-linux-x86_64.tar.gz

cd ngmlr-0.2.7/


3. PacBio数据运行

三代fastq数据质控参考:三代测序PacBio&ONT reads过滤和修剪-Chooper和NanoFilt

结构变异Calling参考: 三代测序结构变异分析 - 单样本Germline SV calling和多样本SV Calling

# 数据质控
gunzip -c sample.fastq.gz | NanoFilt -q 10 -l 1000 > sample.clean.fastq

# 比对
ngmlr -t 4 -r reference.fasta \
-q sample.clean.fastq -o sample.sam
# -t: 线程数
# -r: 参考基因组fasta路径
# -q: clean fastq路径
# -o: 比对输出sam文件路径

# Sam2bam
samtools view -bS sample.sam > sample.bam

# 排序
samtools sort sample.bam -o sample.sorted.bam
samtools index sample.sorted.bam

# 查看bam
samtools view sample.sorted.bam|less -S

4. Oxford Nanopore运行

gunzip -c sample.fastq.gz | NanoFilt -q 10 -l 1000 > sample.clean.fastq

# 参数-x: 三代数据类型,默认PacBio
ngmlr -t 4 -r reference.fasta \
-q sample.clean.fastq -o test.sam -x ont


# Sam2bam
samtools view -bS sample.sam > sample.bam

# 排序
samtools sort sample.bam -o sample.sorted.bam
samtools index sample.sorted.bam

# 查看bam
samtools view sample.sorted.bam|less -S

主要参数说明

Usage: ngmlr [options] -r <reference> -q <reads> [-o <output>]

Input/Output:
    -r <file>,  --reference <file>
        (required)  Path to the reference genome (FASTA/Q, can be gzipped)
    -q <file>,  --query <file>
        Path to the read file (FASTA/Q) [/dev/stdin]
    -o <string>,  --output <string>
        Path to output file [stdout]
    --skip-write
        Don't write reference index to disk [false]
    --bam-fix
        Report reads with > 64k CIGAR operations as unmapped. Required to be compatible with the BAM format [false]
    --rg-id <string>
        Adds RG:Z:<string> to all alignments in SAM/BAM [none]
    --rg-sm <string>
        RG header: Sample [none]
    --rg-lb <string>
        RG header: Library [none]
    --rg-pl <string>
        RG header: Platform [none]
    --rg-ds <string>
        RG header: Description [none]
    --rg-dt <string>
        RG header: Date (format: YYYY-MM-DD) [none]
    --rg-pu <string>
        RG header: Platform unit [none]
    --rg-pi <string>
        RG header: Median insert size [none]
    --rg-pg <string>
        RG header: Programs [none]
    --rg-cn <string>
        RG header: sequencing center [none]
    --rg-fo <string>
        RG header: Flow order [none]
    --rg-ks <string>
        RG header: Key sequence [none]

General:
    -t <int>,  --threads <int>
        Number of threads [1]
    -x <pacbio, ont>,  --presets <pacbio, ont>
        Parameter presets for different sequencing technologies [pacbio]
    -i <0-1>,  --min-identity <0-1>
        Alignments with an identity lower than this threshold will be discarded [0.65]
    -R <int/float>,  --min-residues <int/float>
        Alignments containing less than <int> or (<float> * read length) residues will be discarded [0.25]
    --no-smallinv
        Don't detect small inversions [false]
    --no-lowqualitysplit
        Split alignments with poor quality [false]
    --verbose
        Debug output [false]
    --no-progress
        Don't print progress info while mapping [false]

生信软件文章推荐

生信软件1 - 测序下机文件比对结果可视化工具 visNano

生信软件2 - 下游比对数据的统计工具 picard

生信软件3 - mapping比对bam文件质量评估工具 qualimap

生信软件4 - 拷贝数变异CNV分析软件 WisecondorX

生信软件5 - RIdeogram包绘制染色体密度图

生信软件6 - bcftools查找指定区域的变异位点信息

生信软件7 - 多线程并行运行Linux效率工具Parallel

生信软件8 - bedtools进行窗口划分、窗口GC含量、窗口测序深度和窗口SNP统计

生信软件9 - 多公共数据库数据下载软件Kingfisher

生信软件10 - DNA/RNA/蛋白多序列比对图R包ggmsa

生信软件11 - 基于ACMG的CNV注释工具ClassifyCNV

生信软件12 - 基于Symbol和ENTREZID查询基因注释的R包(easyConvert )

生信软件13 - 基于sambamba 窗口reads计数和平均覆盖度统计

生信软件14 - bcftools提取和注释VCF文件关键信息

生信软件15 - 生信NGS数据分析强大的工具集ngs-bits

生信软件16 - 常规探针设计软件mrbait

生信软件17 - 基于fasta文件的捕获探针设计工具catch

生信软件18 - 基于docker部署Web版 Visual Studio Code

生信软件19 - vcftools高级用法技巧合辑

生信软件20 - seqkit+awk+sed+grep高级用法技巧合辑

生信软件21 - 多线程拆分NCBI-SRA文件工具pfastq-dump

生信软件22 - 测序数据5‘和3‘端reads修剪工具sickle

生信软件23 - Samtools和GATK去除PCR重复方法汇总

生信软件24 - 查询物种分类学信息和下载基因组TaxonKit和ncbi-genome-download

更多内容请关注公众号【生信与基因组学】,定期更新生信算法和编程、基因组学、统计学、分子生物学、临床检测和深度学习等内容。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1918258.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

OpenSSH Server远程代码执行漏洞 (CVE-2024-6387)|centos7升级到最新版本OpenSSH-9.8.p1

一、漏洞概述 漏洞名称 OpenSSH Server远程代码执行漏洞 CVE ID CVE-2024-6387 漏洞类型 竞争条件 发现时间 2024-07-01 漏洞评分 暂无 漏洞等级 高危 攻击向量 网络 所需权限 无 利用难度 高 用户交互 无 PoC/EXP 未公开 在野利用 未发现 OpenS…

MechMind结构光相机 采图SDK python调用

测试效果 Mech-Mind结构光相机 Mech Mind&#xff08;梅卡曼德&#xff09;的结构光相机&#xff0c;特别是Mech-Eye系列&#xff0c;是工业级的高精度3D相机&#xff0c;广泛应用于工业自动化、机器人导航、质量检测等多个领域。以下是对Mech Mind结构光相机的详细解析&#…

阿里巴巴国际站携手NBA传奇托尼·帕克,中国卖家又一波利好!

在全球化浪潮日益汹涌的今天&#xff0c;跨界合作已成为推动品牌国际化进程的重要力量。近日&#xff0c;阿里巴巴国际站宣布了一项震撼业界的合作——正式签约NBA&#xff08;美国职业篮球联赛&#xff09;传奇控球后卫托尼帕克&#xff08;Tony Parker&#xff09;作为其全球…

2024年10款免费的项目管理软件推荐

本文向大家推荐10款2024年免费使用的项目管理软件&#xff0c;其中包括桌面应用和基于Web平台的多种产品&#xff0c;同时还涵盖了一些优秀的开源软件。 1.禅道开源项目管理软件 禅道是一款开源的、基于Web的项目管理软件&#xff0c;其功能丰富且操作简便&#xff0c;为团队提…

生产管理系统功能全拆解:哪些功能是企业真正需要的?

制造业的伙伴经常听到“生产管理”&#xff0c;但很多人可能只是模糊地知道它与工厂、生产线有关。那么&#xff0c;到底什么是生产管理呢&#xff1f;它的重要性又体现在哪里呢&#xff1f;接下来&#xff0c;我就以轻松的方式&#xff0c;带大家走进生产管理的世界&#xff0…

笔记:Qt开发之工程的多模块设计(pri)

目标&#xff1a;对于功能模块较多的Qt项目&#xff0c;使用pri文件管理模块文件&#xff0c;降低工程复杂度&#xff0c;提高软件模块的封装性和重用性。 一、知识储备 1.1 pro与pri文件 对于模块化编程&#xff0c;Qt提供了pro和pri&#xff0c;pro管理项目&#xff0c;pri…

算法 —— 模拟

目录 替换所有的问号 提莫攻击 Z字形变换 外观数列 各位读者有听说过“建模”一词吗&#xff1f;所谓“建模”&#xff0c;就是把事物进行抽象&#xff0c;根据实际问题来建立对应的数学模型。“抽象”并不意味着晦涩难懂&#xff1b;相反&#xff0c;它提供了大量的便利。…

新兴商业模式如何破局?市场策划专家的实战指南

在这个融合了传统市场、互联网和信息技术的大潮中&#xff0c;想要在市场营销策划上玩得转&#xff0c;咱们得有超凡的全局思维和跨界的协作精神。 下面&#xff0c;我就来和大家聊聊如何在这样一个复杂环境下搞定市场营销策划&#xff0c;让你在竞争激烈的市场中脱颖而出。 …

Ubuntu编译PX4固件

目录 前言 准备编译参考 前言 要想自己编译PX4固件需要交叉编译器&#xff0c;交叉编译器可以将 x86架构 平台上写好程序编译出来&#xff0c;而编译出来的可执行文件是能用到 arm架构 的平台上。 本次编译是以 px4 v1.13.2 为例。 我的配置如下&#xff1a; 虚拟机 Ubuntu 18…

微气象仪的工作原理

型号推荐&#xff1a;云境天合TH-WQX5】风力发电传感器在风力发电系统中起着至关重要的作用&#xff0c;它们能够实时监测和记录各种关键参数&#xff0c;为风力发电机组的控制提供数据支持&#xff0c;从而确保风力发电系统的安全、高效运行。以下是对风力发电传感器的详细解析…

喜讯|华院计算法律大模型入围《2024大模型典型示范应用案例集》

2024年世界人工智能大会&#xff08;WAIC&#xff09;举办期间&#xff0c;中国信通院正式发布了《2024大模型典型示范应用案例集》&#xff08;以下简称《案例集》&#xff09;。该案例集由中国信通院华东分院、上海人工智能实验室主导&#xff0c;以产业化为导向&#xff0c;…

Vue从零到实战第一天

&#x1f49d;&#x1f49d;&#x1f49d;欢迎来到我的博客&#xff0c;很高兴能够在这里和您见面&#xff01;希望您在这里可以感受到一份轻松愉快的氛围&#xff0c;不仅可以获得有趣的内容和知识&#xff0c;也可以畅所欲言、分享您的想法和见解。 非常期待和您一起在这个小…

免费分享:中国冬小麦地图数据集(附下载方法)

小麦按播种和收获季节的不同&#xff0c;可分为春小麦和冬小麦两种。春小麦颗粒长而大&#xff0c;皮厚色泽深&#xff0c;蛋白质含量高&#xff0c;但筋力较差&#xff0c;出粉率低&#xff0c;吸水率高;冬小麦颗粒小&#xff0c;吸水率低&#xff0c;蛋白质含量较春小麦少&am…

element-plus 按需导入问题 404等问题

场景 新开一个项目&#xff0c;需要用element-plus这个ui库&#xff0c;使用按需引入。 这是我项目的一些版本号 "element-plus": "^2.7.6","vue": "^3.2.13","vue-router": "^4.0.3",过程&#xff08;看解决方法…

电商、物流必备神器!容联七陌OCR精准识别、一键复制关键信息!

随着大模型、AI技术的快速发展及落地运用&#xff0c;传统的数据处理方式难以满足企业、行业需求&#xff0c;例如一字一句输入效率低、文字复制方式繁琐且容易出错、截图关键信息提取的准确性和高效性、缺乏信息智能识别能力等。 OCR识别技术能够快速准确地将图片中的文字信息…

【Linux】进程的基本概念(以及进程地址空间的初步了解)

目录 一.什么是进程 进程和程序的区别 Linux查看进程 进程的信息 fork函数 二.进程状态 操作系统上进程状态的概念 运行 阻塞 挂起 Linux中的进程状态 R状态 S状态和D状态 T状态 t状态 X状态 Z状态 三.进程的优先级 修改进程优先级 四.环境变量 常见的环境变量 PATH HOME PW…

行列视(RCV)报表是如何产生的?

首先看一下对于生产型企业来说&#xff0c;生产数据特点是什么样的&#xff1a; 生产数据可以理解为是生产制造企业&#xff0c;在生产过程中从车间现场设备上通过自动化传感器采集到的全面感知数据。这类数据一般包括设备状态、设备管道运行参数、各种仪表参数等。具有持续、…

【Linux操作系统-测试】第三节.Linux 系统、网络信息、用户权限命令总结

文章目录 前言一、Linux 系统相关信息命令 1.1 df 命令--查看磁盘剩余 1.2 ps 命令--查看进程 1.3 top 命令--显示进程运行状态 1.4 kill 命令说明 -- 杀死进程二、Linux 网络信息命令 2.1 ping 命令--检查网络是否连通 2.1 ifconfig--显示网络设…

便携式(手持)气象仪:野外气象监测的得力助手

在气象监测领域&#xff0c;随着科技的不断发展&#xff0c;一种新型的便携式&#xff08;手持&#xff09;气象仪正在逐渐崭露头角。便携式&#xff08;手持&#xff09;气象仪以其高度集成、低功耗、可快速安装以及便于野外使用的特性&#xff0c;成为了气象观测领域的一颗新…

微信小程序切换商户号

1.登录微信公众平台小程序 2.功能->微信支付 3.关联成功后会志一关联商户号列表显示 4.登录你需要切换的商户号 在下面选择你需要开通的产品服务 5.切换到账户中心的api安全里面 只需要改变当前下面的配置即可切换小程序的收款商户号 申请API证书按照官方的指引即可解…