宏基因组学中如何计算分箱结果bins(基因组)的丰度?

news2024/9/23 15:27:06

1、基于metawrap环境计算bin丰度(推荐)

MetaWRAp(Metagenomic Workflow for Assembly, binning, and annotation)是一个用于处理宏基因组学数据的工具,包括元组装、分箱(binning)、基因组注释等功能。要基于 MetaWRAp 计算宏基因组分箱结果的丰度,你可以按照以下步骤进行:

  1. 安装 MetaWRAp:首先确保已经安装了 MetaWRAp 工具。你可以通过官方的 GitHub 页面(https://github.com/bxlab/metaWRAP)或者相关文档找到安装说明。

  2. 准备输入数据:准备你的宏基因组学数据,包括原始测序数据(fastq 或者 fasta 格式)以及进行元组装得到的 contigs 或 scaffolds。

  3. 运行 MetaWRAp:使用 MetaWRAp 中的相应工具来计算 bins 的丰度。在 MetaWRAp 中,你可以使用 metabat2_wfmaxbin2_wf 等工作流来执行分箱操作,并获得 bins 的丰度信息。

示例命令(以 MetaBAT2 为例):

source activate metawrap

#示例:
metawrap metabat2_wf -o output_directory -t num_threads assembly.fasta reads_1.fastq,reads_2.fastq

metawrap quant_bins \
    -t 32 \
    -o Bin_quant/ \
    -b Bin/ \
    -a final.contigs.fa \
    Clean_data/H*.fastq

# 参数:
# -t # 线程
# -o # 输出文件夹(自动创建)
# -b # Bin所在文件夹
# -a # contig组装结果
# 最后是fastq/a(初始数据)文件所在文件夹

其中:

  • -o output_directory:指定输出目录。
  • -t num_threads:指定线程数。
  • assembly.fasta:是你的组装后的 contigs 或 scaffolds 文件。
  • reads_1.fastq,reads_2.fastq:是原始测序数据(paired-end reads)。

这个挺好的就是直接出图了,相应数据结果直接在bin_quant文件夹。

2、基于coverm环境计算bins丰度

CoverM 是一个用于基因组学和宏基因组学研究的工具,用于评估基因组或分箱(bins)的覆盖度和丰度。以下是使用 CoverM 计算 bins 丰度的一般步骤:

  1. 安装 CoverM:首先需要安装 CoverM 工具及其相关依赖。你可以从 CoverM 的官方 GitHub 页面(https://github.com/wwood/CoverM)获取安装说明。

  2. 准备输入数据:准备输入数据,这通常是包含基因组组装结果的 FASTA 格式文件。这可能是来自于元组装工具(如MetaBAT、MaxBin、CONCOCT等)输出的 bins。

  3. 运行 CoverM:使用 CoverM 来计算 bins 的丰度。下面是一个示例命令:

coverm contig \
  --genome-fasta input_bins.fasta \
  --min-read-aligned-percent 95 \
  --min-read-aligned-length 1000 \
  --min-covered-fraction 0.5 \
  --min-base-quality 0 \
  --min-read-length 100 \
  --reference-fasta reference_sequences.fasta \
  --output-dir output_directory

 这里的参数解释如下:

  • --genome-fasta:指定输入的 bins 文件。
  • --min-read-aligned-percent:指定至少需要覆盖的 reads 百分比。
  • --min-read-aligned-length:指定最小的 reads 长度。
  • --min-covered-fraction:指定一个 contig 被认为是被覆盖的最小比例。
  • --min-base-quality:指定 reads 的最小质量。
  • --min-read-length:指定最小的 reads 长度。
  • --reference-fasta:可选参数,用于提供参考序列。
  • --output-dir:指定输出目录。

同样超级简单,直接上代码:

mamba activate coverm

# 建议sh脚本,采用nohup运行,这个还是要耗点时间的
for i in $(ls bins); \
do \
    coverm genome \
    -d $i/metabat2_bins \
    -x fa \
    -t 80 \
    -c read_qc/${i}/*.fastq \
    > coverm/${i}.mtbt2.bins.out ;\
done

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1311276.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Python:五种算法RFO、GWO、DBO、HHO、SSA求解23个测试函数

一、五种算法介绍 (1)红狐优化算法(Red fox optimization,RFO) (2)灰狼优化算法(Grey Wolf Optimizer,GWO) (3)蜣螂优化算法(Dung beetle opti…

maui 开发音乐播放APP 优化 用fastapi_amis_admin创建后台及接口(5)

相关的models from datetime import datetime from typing import List, Optional import sqlmodel from fastapi_amis_admin.amis.components import ColumnImage, InputImage, InputRichText from fastapi_amis_admin.models.enums import IntegerChoices from fastapi_amis…

VSCode 配置自动生成头文件

相关文章 VSCode 开发C/C实用插件分享——codegeex VSCode 开发C/C实用插件分享——koroFileHeader VSCode 配置自动生成头文件 一、snippets二、配置步骤三、效果展示 一、snippets 相信大家对C、C都头文件都不陌生,都会发现每个头文件都会包括下面的这些格式&…

引迈信息-JNPF平台怎么样?值得入手吗?

目录 1.前言 2.引迈低代码怎么样? 3.平台亮点展示 4.引迈产品特点 5.引迈产品技术栈: 1.前言 低代码是近几年比较火的一种应用程序快速开发方式,它能帮助用户在开发软件的过程中大幅减少手工编码量,并通过可视化组件加速应用…

【基于卷积神经网络的疲劳检测与预警系统的设计与实现】

基于卷积神经网络的疲劳检测与预警系统的设计与实现 引言数据集介绍技术与工具1. OpenCV2. TensorFlow3. 卷积神经网络(CNN) 系统功能模块1. 视频采集模块2. 图像预处理模块3. 人脸识别模块4. 疲劳程度判别模块5. 报警模块 系统设计创新点1. 实时监测与预…

GAN的原理分析与实例

为了便于理解,可以先玩一玩这个网站:GAN Lab: Play with Generative Adversarial Networks in Your Browser! GAN的本质:枯叶蝶和鸟。生成器的目标:让枯叶蝶进化,变得像枯叶,不被鸟准确识别。判别器的目标&…

Spring Boot之自定义starter

🥳🥳Welcome Huihuis Code World ! !🥳🥳 接下来看看由辉辉所写的关于Spring Boot的相关操作吧 目录 🥳🥳Welcome Huihuis Code World ! !🥳🥳 一. starter是什么 二.为什么要使…

什么是 API 代理?

API 代理就像您的计算机和互联网上的特殊服务之间的有用中间人。这有点像将翻译、保安和信使合而为一。 什么是 API 代理? API 代理就像您和在线服务之间的有用中间人。当您的计算机需要从特殊在线服务(API)获取某些内容时,API 代…

计算机网络:物理层(奈氏准则和香农定理,含例题)

带你速通计算机网络期末 文章目录 一、码元和带宽 1、什么是码元 2、数字通信系统数据传输速率的两种表示方法 2.1、码元传输速率 2.2、信息传输速率 3、例题 3.1、例题1 3.2、例题2 4、带宽 二、奈氏准则(奈奎斯特定理) 1、奈氏准则简介 2、…

leetcode做题笔记2132. 用邮票贴满网格图

给你一个 m x n 的二进制矩阵 grid ,每个格子要么为 0 (空)要么为 1 (被占据)。 给你邮票的尺寸为 stampHeight x stampWidth 。我们想将邮票贴进二进制矩阵中,且满足以下 限制 和 要求 : 覆盖…

VUE中如果让全局组件在某一页面不显示

目录 前言 方法一 1.在全局组件中添加一个变量用于控制显示与隐藏。 2.在全局组件的模板中使用 v-if 条件来决定是否显示该组件 3.在不需要显示全局组件的页面中,修改 showGlobalComponent 变量的值为 false,以隐藏全局组件。 4.在需要隐藏全局组…

dockerfile---创建镜像

dockerfile创建镜像:创建自定义镜像。 包扩配置文件的创建,挂载点,对外暴露的端口。设置环境变量。 docker镜像的方式: 1、基于官方源进行创建 根据官方提供的镜像源,创建镜像,然后拉起容器。是一个白板&#xff0c…

国产猫粮推荐排行榜有哪些牌子?国产主食冻干猫粮品牌十大排行

近年来,冻干猫粮作为热门的高品质猫粮,受到了许多追求纯天然、健康食品的铲屎官的关注。萌新铲屎官就很疑惑了冻干猫粮可以代替猫粮作为主食吗?冻干猫粮真就那么好吗? 作为一个猫咖店长,这几年我至少给猫挑选了20几款…

智能故障诊断期刊推荐【中文期刊】

控制与决策 http://kzyjc.alljournals.cn/kzyjc/home 兵工学报 http://www.co-journal.com/CN/1000-1093/home.shtml 计算机集成制造系统 http://jsjjc.soripan.net/ 机械工程学报 http://www.cjmenet.com.cn/CN/0577-6686/home.shtml 太阳能学报 https://www.tynxb.org.c…

Windows ❀ 关闭Google的自动更新功能

文章目录 1. 故障问题2. 解决方法 1. 故障问题 如何关闭掉Google的自动更新功能? 2. 解决方法 修改更新域名本地hosts为环回地址即可。 # 禁止google自动更新 127.0.0.1 update.googleapis.com备注: mac路径:/etc/hostswindows路径&…

SpringBoot之数组,集合,日期参数的详细解析

1.4 数组集合参数 数组集合参数的使用场景:在HTML的表单中,有一个表单项是支持多选的(复选框),可以提交选择的多个值。 多个值是怎么提交的呢?其实多个值也是一个一个的提交。 后端程序接收上述多个值的方式有两种: 数…

EM的理论基础

1 EM定义​ 电迁移(Electro-Migration)是指在外加电场下,电子和金属原子之间的动量转移导致材料的运动。这种动量传递导致金属原子(比如Cu原子)从其原始位置移位,如图7-1。这种效应随着导线中电流密度的增加而增加,并且在更高的温度下,动量传递变得更加严重。因此,在先…

2023全球开发者生态调研:84%的开发者表示他们在工作中正积极使用生成式AI工具

今年JetBrains首次在一年一度的开发者生态调研中,增加了人工智能方向的问题。在全球26348名开发者参与的调研中,总体对人工智能的发展持乐观态度。特别是生成式AI在软件开发和编程环节中的应用,84%的开发者表示他们在工作中正在积极使用生成式…

【STM32CubeMX】F103 BxCAN

F103&BxCAN bxCAN总体描述 有一个增强的过滤机制来处理各种类型的报文此外,应用层任务需要更多CPU时间,因此报文接收所需的实时响应程度需要减轻。 接收FIFO的方案允许,CPU花很长时间处理应用层任务而不会丢失报文。 构筑在底层CAN驱动程…

MySQL增量备份与恢复

实验环境 某学校近期在进行期中考试,要求数据库管理员负责一班,二班学生的考试成绩录入,为保证数据的可靠性,数据库管理员在录入学生成绩后均要做数据库备份,并且为了测试备份数据是否可 用,模拟数据丢失故…