使用Sentieon加速甲基化WGBS数据分析

news2024/11/25 14:58:22

全基因组甲基化测序(WGBS)是一种研究DNA甲基化的方法,以全面了解在基因组水平上的表观遗传变化。在进行WGBS数据分析时,通常需要使用专门的比对工具,因为这些工具需要能够处理亚硫酸盐转化后的数据。

以下是四个不同的WGBS比对分析流程:

  • Bismark:Bismark是一个基于Bowtie2或HISAT2比对器的流行WGBS分析工具。它允许处理双链亚硫酸盐转化测序数据,并提供甲基化位点的检测和分析。
  • BitmapperBS:BitmapperBS是一个专门为亚硫酸盐转化测序数据设计的高效比对器。它可以处理双链测序数据,并提供甲基化位点的检测和分析功能。
  • BSseeker2:BSseeker2是一个用于WGBS数据分析的比对工具。它可以处理单链和双链亚硫酸盐转化测序数据,并支持Bowtie, Bowtie2和SOAPaligner作为比对器。BSseeker2提供了甲基化位点检测和甲基化水平计算等功能。
  • BWA-Meth:BWA-Meth是一个基于BWA的比对工具,专门用于处理WGBS数据。它提供了处理双链亚硫酸盐转化测序数据的功能,并可以进行甲基化位点检测。
    这四种分析流程各自具有不同的特点和优势,选择哪个流程取决于研究需求、计算资源以及期望的分析速度和准确性。实际应用中,可以尝试比较这些流程的结果,以找到最适合您需求的解决方案。

WGBS甲基化分析流程加速方案

Sentieon BWA + MethyDackel
在甲基化分析中,Sentieon软件可以与其他工具结合使用以提高分析速度和准确性。在这种情况下,Sentieon BWA被用来替换原始的BWA-mem,与MethyDackel结合,建立起Sentieon BWA-Meth流程。

在这个流程中,Sentieon BWA首先负责处理亚硫酸盐转化后的测序数据进行高效的序列比对。由于Sentieon BWA的优化,比对速度和准确性得到了提高,同时减少了计算资源的消耗。

接下来,MethyDackel被用于从Sentieon BWA的比对结果中提取甲基化信息。MethyDackel能够检测甲基化位点,计算甲基化水平,并生成甲基化状态的统计和可视化结果。

通过结合Sentieon BWA和MethyDackel,Sentieon BWA-Meth流程能够为全基因组甲基化分析提供一个高效且准确的解决方案。这使得研究人员可以更快地分析甲基化数据,更有效地挖掘潜在的生物学意义。

具体加速流程

Sentieon处理甲基化数据的过程可以概括如下:

  1. Sentieon甲基化分析流程:
    WGBS分析流程

    • 使用EpiQC研究中的全基因组甲基化测序数据(doi:https://doi.org/10.1101/2020.12.14.421529)。
    • 数据预处理:读取修剪、质量控制。
    • 使用四种不同的分析流程进行比对,包括Bismark、BitmapperBS、BSseeker2和BWAMeth。
    • 使用Sentieon BWA替换原始的BWA-mem,并与MethyDackel结合,建立Sentieon BWAMeth流程。
    • 比对后处理:使用不同的模块进行甲基化位点调用和CpG甲基化水平识别。
  2. 甲基化映射速度比较:
    不同甲基化比对流程性能

    • 每次比较中,使用相同的随机种子对一百万对读取进行随机抽样。
    • 在24个CPU线程的服务器上使用各软件的默认参数运行比对。
    • 记录每个重复实验的性能时间。
    • Sentieon BWA-Meth比原始的BWA-Meth速度提高了2.5倍,与BitMaperBS的速度相似。
  3. 甲基化映射准确性比较:
    不同比对工具的精度比较

    • 比较不同甲基组文库制备中的流程映射准确性;使用Samtools stats和Qualimap生成后比对统计数据。
    • 显示库总读取的参考映射结果分布。
    • Sentieon BWA-meth具有最高的主要映射率和最低的未映射率。
  4. CpG位点读取覆盖率比较:
    不同工具的CpG位点读取覆盖率比较

    • 计算14个库和4个分析流程中识别出的CpG位点的测序覆盖率。
    • 与其他测试工具相比,Sentieon BWA-Meth在CpG位点提供了更高的测序覆盖率。
  5. Sentieon甲基化分析流程结论:

    • Sentieon BWA-Meth与BWA-Meth提供相同的结果。
    • Sentieon BWA-Meth流程显示出最高的处理速度,比开源流程快约2倍。
    • Sentieon BWA-Meth具有最高的主要映射率和最高的CpG位点读取覆盖率。
  6. 应用说明 - 安装

    • 安装bwa-meth
# Prerequisites: samtools # these 4 lines are only needed if you don't have toolshed installed 
wget https://pypi.python.org/packages/source/t/toolshed/toolshed-0.4.0.tar.gz 
tar xzvf toolshed-0.4.0.tar.gz 
cd toolshed-0.4.0 sudo 
python setup.py install

wget https://github.com/brentp/bwa-meth/archive/master.zip 
unzip master.zip 
cd bwa-meth-master
sudo python setup.py install
  • 安装MethylDackel
# Prerequisites: htslib and libBigWig
git clone https://github.com/dpryan79/MethylDackel.git 
cd MethylDackel 
make LIBBIGWIG="/some/path/to/libBigWig.a" 
make install prefix=/some/installation/path
  • 安装BWA(开源)
# Only used for indexing reference genome. 
git clone https://github.com/lh3/bwa.git 
cd bwa; make
  1. 准备测试数据

    • 从bwa-meth下载测试数据并使用开源BWA对参考基因组进行索引。
wget https://github.com/brentp/bwa-meth/raw/master/example/ref.fa 
wget https://github.com/brentp/bwa-meth/raw/master/example/t_R1.fastq.gz 
wget https://github.com/brentp/bwa-meth/raw/master/example/t_R2.fastq.gz
  • 使用开源BWA构建index索引
bwameth.py index $REF #Indexes with BWA-MEM (default)
  • 确保安装了开源的BWA在$PATH下,而不是Sentieon BWA
    image.png
  1. 读取比对:

    • 使用Sentieon BWA进行读取比对。

    • 将Sentieon bin文件夹添加到$PATH。

export PATH=<PATH_TO_SENTIEON>/sentieon-genomics-202112.05/bin:$PATH
*   运行bwa-meth,通过sentieon util sort进行排序。 
bwameth.py --threads 16 \
        --reference $REFERENCE \
        $FQ1 $FQ2 | \
sentieon util sort -i - –sam2bam –o output.bam
  • 确保屏幕输出以下内容。否则,bwa-meth将使用开源bwa。
This software is licensed to [xxxxx@xxxx.xxx] by Sentieon Inc. 
version: sentieon-genomics-202112.06

image.png

  1. 制表:

    • 使用开源工具MethylDackel。
MethylDackel extract ref.fa output.bam

image.png

  • 输出结果为bedGraph文件,第4列表示在给定位置有甲基化C的证据的读取/读取对数,第5列表示未甲基化C的等价值。
    image.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/424256.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ADIDAS阿里纳斯励志广告语

系列文章目录 精选优美英文短文1——Dear Basketball&#xff08;亲爱的篮球&#xff09;精选优美英文短文2——Here’s to the Crazy Ones&#xff08;致疯狂的人&#xff09;“我祝你不幸并痛苦”——约翰罗伯茨毕业致辞“亲爱的波特兰——CJ麦科勒姆告别信” Hi, I’m Gilb…

七、Django进阶:第三方库Django-extensions的开发使用技巧详解(附源码)

Django-extensions是 Django 的扩展应用&#xff0c;给django开发者提供了许多便捷的扩展工具(extensions)&#xff0c;它提供了许多有用的工具和命令行工具&#xff0c;帮助 Django 开发者更高效地进行开发和调试。它的作用包括&#xff1a; - 提供了更多的Django命令&#x…

循环依赖详解及解决方案

介绍 上图就是循环依赖的三种情况,虽然方式不同,但是循环依赖的本质是一样的,就A的完整创建要依赖与B,B的完整创建要依赖于A,相互依赖导致没办法完整创建造成失败. 循环依赖代码演示 public class Demo {public static void main(String[] args) {new Demo1();} }class Demo1…

电子信息工程有哪些SCI期刊推荐? - 易智编译EaseEditing

以下是电子信息工程领域的一些SCI期刊推荐&#xff1a; IEEE Transactions on Information Theory&#xff1a; 该期刊由IEEE出版&#xff0c;专注于信息理论领域的研究&#xff0c;包括编码理论、信道编码、信息传输、信息论应用等方面的研究。 IEEE Transactions on Signal…

Apache网页与安全优化

系列文章目录 文章目录系列文章目录一、1.构建虚拟web主机2.一、基于域名的虚拟主机二、Apache 日志分割1.三、Apache的网页优化总结一、 1.构建虚拟web主机 虚拟Web主机指的是在同一台服务器中运行多个Web站点&#xff0c;其中每一个站点实际上并不独立占用整个服务器&#…

天选姬 - 桌面宠物

天选姬 - 桌面宠物前言下载使用更新设置右键菜单人机交互系统状态闹钟壁纸前言 桌面宠物顾名思义指在电脑桌面的宠物&#xff0c;可以是各种动物或Q版人物。可以进行交互并拥有各种各样的功能&#xff0c;本文介绍一款适用于各种电脑的桌面宠物&#xff0c;天选姬&#xff0c;…

【Redis-面试题及持久化方案】Redis相关面试题(缓存穿透、缓存击穿、缓存血崩) Redis两种持久化方案详情对比(RDB、AOF)

【Redis-面试题及持久化方案】Redis相关面试题&#xff08;缓存穿透、缓存击穿、缓存血崩&#xff09; & Redis两种持久化方案详情对比&#xff08;RDB、AOF&#xff09;1&#xff09;Redis 面试题1.1.高频面试题&#xff1a;缓存穿透、缓存击穿、缓存血崩1.2.低频面试题&a…

电脑0X000000D1蓝屏错误U盘重新安装系统教学

电脑0X000000D1蓝屏错误U盘重新安装系统教学。最近有用户遇到了电脑桌面变成了0X000000D1错误代码的蓝屏界面了&#xff0c;无法继续操作使用。那么这个问题怎么去进行系统U盘重装呢&#xff1f;来看看以下的详细解决方法吧。 准备工作&#xff1a; 1、U盘一个&#xff08;尽量…

智慧城市我国发展现状怎样?

智慧城市从概念提出到落地实践&#xff0c;历经十多年的建设与发展&#xff0c;我国智慧城市建设数量持续增长。我国智慧城市整体建设和发展情况总结如下。 北京智汇云舟科技有限公司成立于2012年&#xff0c;专注于创新性的“视频孪生(实时实景数字孪生)”技术研发与应用。目前…

江南爱窗帘十大品牌,怎么合理的搭配窗帘配色

窗帘行业圈&#xff1a;窗帘行业内部交流圈&#xff0c;窗帘从业者的交流内部圈。 当阳光照进房间的那一刻&#xff0c; 光线给空间带来了无限的可能。 窗边的帘帐既是美丽的风景 又是可爱的魔术师。 在光影变幻的时空里 让你的生活布满温馨和奇幻。 1.窗帘材质怎么选 窗帘的材…

DataSecurity Plus如何阻止数据泄露

随着互联网的发展&#xff0c;数据泄露事件时有发生&#xff0c;给个人和企业造成了巨大的损失。为了保护数据安全&#xff0c;企业需要采取一系列的安全措施&#xff0c;而其中一项重要的措施就是使用数据安全工具。DataSecurity Plus 是一款功能强大的数据安全工具&#xff0…

苹果AirPods耳机推送新固件更新,TWS耳机与Find My可实现智能防丢

苹果推送 iOS / iPadOS 16.5 Beta 2 更新的同时&#xff0c;原本还为 AirPods 耳机推送了固件更新 5E133。苹果在临时撤回之后&#xff0c;再次向用户推送了本次更新&#xff0c; 苹果官方表示当你的 AirPods 在充电且在 iPhone、iPad 或 Mac 的蓝牙通信范围内时&#xff0c;…

【LeetCode:(每日一题1023. 驼峰式匹配) -> 剑指 Offer II 097. 子序列的数目 | 暴力递归=>记忆化搜索=>动态规划】

&#x1f34e;作者简介&#xff1a;硕风和炜&#xff0c;CSDN-Java领域新星创作者&#x1f3c6;&#xff0c;保研|国家奖学金|高中学习JAVA|大学完善JAVA开发技术栈|面试刷题|面经八股文|经验分享|好用的网站工具分享&#x1f48e;&#x1f48e;&#x1f48e; &#x1f34e;座右…

iOS 吸顶效果

项目中&#xff0c;在列表向上滚动时&#xff0c;有时需要将某个控件置顶&#xff0c;这就是我们常见的吸顶效果。 1. UITableView 吸顶效果 UITableView是自带吸顶效果&#xff0c;我们把需要置顶的控件设置为SectionHeaderView&#xff0c;这样在滚动时&#xff0c;该控件会…

360城市全景,开启全新城市探索方式

引言 360城市全景技术的出现和发展&#xff0c;让我们的生活方式和观念发生了革命性的变化。在过去&#xff0c;我们只能通过实地旅行、图片和视频来了解不同城市的文化、建筑和风景。现在&#xff0c;通过360城市全景技术&#xff0c;我们可以像亲临现场一样&#xff0c;透过…

Vue实现自动化平台(四)--接口管理页面的实现

上一章&#xff1a; Vue实现自动化平台&#xff08;三&#xff09;_做测试的喵酱的博客-CSDN博客 github地址&#xff1a;https://github.com/18713341733/vuemiaotest 这个目前只是用来练手的&#xff0c;项目还没成型。等以后我写完了&#xff0c;再更新一下项目链接。 …

软件测试——概念篇

目录 一、软件的生命周期 二、瀑布模型&#xff08;Waterfall Model&#xff09; 优点&#xff1a; 缺点&#xff1a; 三、螺旋模型&#xff08;Spiral Model&#xff09; ​编辑优点&#xff1a; 缺点&#xff1a; 四、增量、迭代 区别&#xff1a; 五、敏捷 scrum…

windows下如何搭建属于自己的git服务器

前一阵子公司需要&#xff0c;领导让我给我们技术部搭建一个git服务器。以前看过教程&#xff0c;但自己没动手做过&#xff0c;开始按照网上的教程来&#xff0c;但搭建过程中发现还是不够详细&#xff0c;今天给大家一个比较详细的&#xff0c;希望对大家有帮助。 高能预警&…

DB2安装指导文档

操作系统windowsXP 版本&#xff1a;9.1.7 一&#xff1a;db2安装 用户为当前操作系统得用户 域为空 二&#xff1a;添加许可证&#xff0c;因为当前系统得试用期已到&#xff0c;所以必须输入有效的序列号&#xff0c;在安装数据库的过程中有时候也会莫名的死掉&#xff0c…

【LeetCode: 剑指 Offer II 099. 最小路径之和 | 暴力递归 | DFS =>记忆化搜索=>动态规划】

&#x1f34e;作者简介&#xff1a;硕风和炜&#xff0c;CSDN-Java领域新星创作者&#x1f3c6;&#xff0c;保研|国家奖学金|高中学习JAVA|大学完善JAVA开发技术栈|面试刷题|面经八股文|经验分享|好用的网站工具分享&#x1f48e;&#x1f48e;&#x1f48e; &#x1f34e;座右…