metaMIC:无参考错误组装识别和校正宏基因组组装

news2025/1/24 13:54:01

#环境很重要!!!!!!!!!!!!!
conda create -n metaMIC
conda activate metaMIC
mamba install python=3.8
mamba install -c conda-forge pandas=1.4.4   
mamba install -c conda-forge numpy=1.19.5
pip install pysam==0.22.1
mamba install scikit-learn=0.22.0 joblib requests
mamba install -c conda-forge biopython=1.78
mamba install -c bioconda samtools=1.9 bwa=0.7.17 jellyfish  
git clone https://github.com/ZhaoXM-Lab/metaMIC.git
cd metaMIC
python setup.py install
metaMIC -h

# downloading models
metaMIC download_model
#我这样下载失败了
#根据源代码提示https://github.com/ZhaoXM-Lab/metaMIC/blob/main/metaMIC/metaMIC.py
#手动到下面的网页下载文件
mkdir model
cd model
#md5 0c759a28d0ba3490eeba098395c88586
https://zenodo.org/record/5768805/files/metaSPAdes.tar.gz
#md5 9f6835d3033a177055343ecaa78889bc
https://zenodo.org/record/4781819/files/IDBA_UD.tar.gz
#md5 da9038af3582eea04288775a72003e6b
https://zenodo.org/record/4781819/files/MEGAHIT.tar.gz
#检查文件完整性
md5sum 上面的每个文件
#解压缩
tar -xzvf metaSPAdes.tar.gz
tar -xzvf IDBA_UD.tar.gz
tar -xzvf MEGAHIT.tar.gz
#把解压后文件夹移动到mamba环境中的文件夹
~/mambaforge/envs/metaMIC/lib/python3.8/site-packages/metaMIC-0.0.0-py3.8.egg/metaMIC/model/
#解压每个文件夹里面的pkl.gz
gunzip *

 使用

software="/home/zhongpei/hard_disk_sda2/zhongpei/Software"
assembly="/home/zhongpei/diarrhoea/xjs_FJ_metagenomic/assembly_result"
path=$(pwd)
mkdir metaMIC_contigs
#!/bin/bash
source /home/zhongpei/miniconda3/bin/activate metaMIC
cd ${assembly}
for i in *_megahit_contigs.fa
do 
	num=${i%%_megahit_contigs.fa}
	cd ${path}
	${software}/bwa-mem2/bwa-mem2 index ${assembly}/${i}
	${software}/bwa-mem2/bwa-mem2 mem -a -t 180 ${assembly}/${i} ${num}_clean_1.fastq.gz ${num}_clean_2.fastq.gz > ${num}_aligen.sam
	samtools view -h -q 10 -m 50 -F 4 -b -@ 180 ${num}_aligen.sam | samtools sort -@ 180 > ${num}_mem2.bam
	samtools mpileup -C 50 -A -f ${i} ${num}_mem2.bam |  awk '$3 != "N"' > ${num}_pileup_file
	rm *.fa.*
	rm ${num}_aligen.sam
	metaMIC extract_feature --bam ${num}_mem2.bam -c ${assembly}/${i} -o ${num}_metaMIC --pileup ${num}_pileup_file -m meta -t 180
	metaMIC predict -c ${assembly}/${i} -o ${num}_metaMIC -a MEGAHIT -m meta
	cd ${num}_metaMIC
	mv metaMIC_corrected_contigs.fa ${path}/metaMIC_contigs/${num}_metaMIC.fa
	cd ${path}
	#rm -rf ${num}_metaMIC
	rm ${num}_mem2.bam
	#rm ${num}_pileup_file
	cd assembly
done
conda deactivate
conda deactivate

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1688571.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

redis核心面试题二(实战优化)

文章目录 10. redis配置mysql实战优化[重要]11. redis之缓存击穿、缓存穿透、缓存雪崩12. redis实现分布式session 10. redis配置mysql实战优化[重要] // 最初实现OverrideTransactionalpublic Product createProduct(Product product) {productRepo.saveAndFlush(product);je…

变量命名的艺术:从蛇形到驼峰

新书上架~👇全国包邮奥~ python实用小工具开发教程http://pythontoolsteach.com/3 欢迎关注我👆,收藏下次不迷路┗|`O′|┛ 嗷~~ 目录 一、蛇形命名法的魅力 二、类名和模块名的特殊规则 三、驼峰命名法的魅力与挑战 四、保持…

FFmpeg操作命令 - 精简版

PS:(因为我只需要简单的操作,所以我整理出了这份笔记) 原网址:30分钟带你入门,20个 FFmpeg操作命令,包你学会 - 知乎 大佬零声Github整理库整理的笔记非常的全面,想看完整版去上面…

MySQL主从复制(五):读写分离

一主多从架构主要应用场景:读写分离。读写分离的主要目标是分摊主库的压力。 读写分离架构 读写分离架构一 架构一结构图: 这种结构模式下,一般会把数据库的连接信息放在客户端的连接层,由客户端主动做负载均衡。也就是说由客户…

ROS | Gmapping进行Slam建图

launch文件 GMapping参数设置: 修改参数:

笔记 | 《css权威指南》

网络安全色 URL text-indent line-height & vertical-align 字体 font-weight 400 normal 700 bold background-attachment

【C++】c++入门(下 )

c入门 1.内联函数1.1 概念1.2 特性 2.auto关键字(C11)2.1 简介2.2 auto的使用2.3 auto不能推导的场景2.4 typedef取别名也能产生和auto的效果,为什么不使用? 3.基于范围的for循环(C11)3.1 9.1 范围for的语法3.2 范围for的使用条件 4.指针空值nullptr(C11…

寻找峰值 ---- 二分查找

题目链接 题目: 分析: 因为题目中要找的是任意一个峰值即可, 所以和<山脉数组的峰值索引>这道题差不多因为峰值左右都小于峰值, 所以具有"二段性", 可以使用二分查找算法如果nums[mid] < nums[mid 1], mid一定不是峰值, 所以left mid 1如果nums[mid] &…

【大模型部署】在C# Winform中使用文心一言ERNIE-3.5 4K 聊天模型

【大模型部署】在C# Winform中使用文心一言ERNIE-3.5 4K 聊天模型 前言 今天来写一个简单的ernie-c#的例子&#xff0c;主要参考了百度智能云的例子&#xff0c;然后自己改了改&#xff0c;学习了ERNIE模型的鉴权方式&#xff0c;数据流的格式和简单的数据解析&#xff0c;实…

电商平台的消费增值模式革新

在当今的电商市场&#xff0c;用户留存和粘性是各大平台竞相追求的目标。而消费增值模式&#xff0c;以其独特的激励机制&#xff0c;正逐渐成为电商平台吸引和留住用户的新策略。 一、消费即投资&#xff1a;创新的返利机制 在传统的电商消费中&#xff0c;消费者完成交易后&…

基于QEMU-aarch64学习UEFI(EDK2)-7Print打印函数

1 基于QEMU-aarch64学习UEFI(EDK2)-7Print打印函数 文章目录 1 基于QEMU-aarch64学习UEFI(EDK2)-7Print打印函数1.1 Print打印函数输出字符串1.2 Print打印函数其他用法程序开发我们以 edk2-stable202302版本为准。 1.1 Print打印函数输出字符串 我们把edk2/MdeModulePkg/App…

Upstream最新发布2024年汽车网络安全报告-百度网盘下载

Upstream最新发布2024年汽车网络安全报告-百度网盘下载 2024年2月7日&#xff0c;Upstream Security发布了2024年Upstream《GLOBAL AUTOMOTIVE CYBERSECURITY REPORT》。这份报告的第六版着重介绍了汽车网络安全的拐点&#xff1a;从实验性的黑客攻击发展到规模庞大的攻击&…

springboot 两个相同类型的Bean使用@Resouce加载

问题描述 有两个相同类型的Bean 使用Service等注解注入或者Bean注入启动以后报错&#xff1a; qualifying bean of type com.fasterxml.jackson.databind.ObjectMapper available: expected single matching bean but found 2提示有相同的类型两个。 解决 * 每个Bean Resour…

AI预测福彩3D采取888=3策略+杀断组+杀和尾缩水测试5月24日预测第1弹

哈喽&#xff0c;各位亲爱的小伙伴&#xff0c;在发布本期预测结果之前&#xff0c;先对最近的这套算法测试做一下总结。 最近的一套算法采用了88723的容差策略&#xff0c;关于容差策略相信大家都比较清楚&#xff1a;容差可以最大限度的保证初始大底中包含中奖号码&#xff0…

「网络流浅谈」网络流的概念

更好的阅读体验 通常做题思路&#xff1a;问题转化为流网络&#xff0c;再通过最大流 / 最小割 / 费用流与问题之间的数量关系&#xff0c;求解出原问题。 网络流于其他算法不同&#xff0c;概念定理需要熟记于心&#xff0c;否则后面做题会有很大的障碍。 1. 流网络 一个流…

鸿蒙开发ArkUI-X基础知识:【ArkUI代码工程及构建介绍】

代码工程及构建介绍 背景 ArkUI作为OpenHarmony的默认开发框架&#xff0c;在本项目&#xff08;ArkUI-X&#xff09;中需要做到一套代码同时支持多平台构建&#xff0c;所以会采取共仓开发的方式&#xff0c;部分仓直接指向OpenHarmony相关开源仓。 代码结构及仓库结构 代…

css左右滚动互不影响

想实现左右都可以滚动&#xff0c;且互不影响。 只需要再左边的css里面 .threedlist {cursor: pointer;width: 280px;position: fixed;height: 100vh; /* 定义父容器高度 */overflow-y: auto; /* 只有在内容超过父容器高度时才出现滚动条 */} 如果想取消滚动条样式 .threedli…

windows docker desktop 更换镜像存储目录

windows docker desktop 更换镜像存储目录 方法&#xff1a;如图&#xff0c;Browse浏览一个新的目录并选中&#xff0c;确定后&#xff0c;程序会开始stop&#xff0c;在stop完成前&#xff0c;会持续迁移原有镜像到新的位置&#xff0c;你会发现目标位置的磁盘占用空间越来越…

2024最新 Jenkins + Docker 实战教程(五)- 配置Gitee Webhooks实现自动构建部署

&#x1f604; 19年之后由于某些原因断更了三年&#xff0c;23年重新扬帆起航&#xff0c;推出更多优质博文&#xff0c;希望大家多多支持&#xff5e; &#x1f337; 古之立大事者&#xff0c;不惟有超世之才&#xff0c;亦必有坚忍不拔之志 &#x1f390; 个人CSND主页——Mi…

Matlab:音频处理

用Matlab绘制一段音频信号在时域上的波形图&#xff0c;然后用低通滤波器滤掉噪音并再次绘制 1、导入音频文件 filename X:\1.mp3; % 替换为你的音频文件路径 [x, Fs] audioread(filename); 2、获取音频信号长度 len length(x); 3、计算时间轴 t (0:len-1) / Fs; 4、…