基于Singularity 安装 AmpliconSuite-pipeline

news2024/10/6 8:31:38

基于Singularity 安装 AmpliconSuite-pipeline

按照AmpliconSuite-pipeline官网的Singularity安装方法遇到不少问题,好在都一一解决了,写个文档记录一下我基于Singularity 安装 AmpliconSuite-pipeline的过程。

step1 获取 Singularity镜像

镜像地址:Singularity Container Services | Artifacts: jluebeck/ampliconsuite-pipeline/ampliconsuite-pipeline/ (sylabs.io)

image-20230822095832001

singularity build ampliconsuite-pipeline.sif library://jluebeck/ampliconsuite-pipeline/ampliconsuite-pipeline:1.0.0

image-20230822100020102

镜像下载速度比较慢,平均200kb,建议在晚上网络稳定的时候下载,总共用时6-7h。

step2 获取 执行镜像的脚本并且配置AA_DATA_REPO的路径

git clone https://github.com/AmpliconSuite/AmpliconSuite-pipeline/archive/refs/tags/v1.0.0.tar.gz
cd AmpliconSuite-pipeline
# Can use ./install.sh -h to see help before installing
source ./install.sh --finalize_only

#执行source ./install.sh --finalize_only命令后会检查samtools,bwa,还有R等软件是否安装,并且在$HOME目录下创建mosek,data_repo等文件夹

8b44d06e4ceab34e23674b2967abd4e

检查一下AA_DATA_REPO的环境变量有没有配好,执行$AA_DATA_REPO,输出不为空就是正确的。

如果没有配好,执行下述命令:

cd $HOME/data_repo
echo export AA_DATA_REPO=$PWD >> ~/.bashrc
touch coverage.stats && chmod a+r coverage.stats
source ~/.bashrc

step3 获取mosek.lic证书

获取证书文件 mosek.lic (https://www.mosek.com/products/academic-licenses/). 用学校或者科研单位的邮箱地址进行注册就可以免费获得证书。

将文件放置在 $HOME/mosek/文件夹下 (i.e, the mosek/ folder that now exists in your home directory).

也可以放在你自己的文件夹,但是要设置相应的环境变量 :If you are not able to place the license in the default location, you can set a custom location by exporting the bash variable MOSEKLM_LICENSE_FILE=/custom/path/.

step4 下载参考基因组数据:

datasets.genepattern.org/?prefix=data/module_support_files/AmpliconArchitect/

image-20230822102052334我选择的GRCh38_indexed.tar.gz

下载命令:

cd $AA_DATA_REPO
wget https://datasets.genepattern.org/data/module_support_files/AmpliconArchitect/GRCh38_indexed.tar.gz
tar zxf GRCh38_indexed.tar.gz
rm GRCh38_indexed.tar.gz

step5:配置AA_SRC路径

Github source code:

Note: In the rest of this document, we will refer to the path of the parent directory AmpliconArchitect/src as $AA_SRC

git clone https://github.com/jluebeck/AmpliconArchitect.git
cd AmpliconArchitect
echo export AA_SRC=$PWD/src >> ~/.bashrc

step6: 对bam文件进行去重复序列和排序

如果你的输入文件是bam文件,需要进行去重复序列和排序的操作

参考命令如下:

nohup time java -jar picard.jar MarkDuplicates REMOVE_DUPLICATES=true I=../alignment/bam/P368T.sorted.bam O=../alignment/bam/P368T.sorted.rmdup.bam M=../alignment/bam/P368T.rmdup_metrics.txt > ../alignment/log/P368T.rmdup.log 2>&1 &
samtools index -@ 20 P368T.sorted.markdup.bam

step7 : 执行命令

python AmpliconSuite-pipeline-1.0.0/singularity/run_paa_singularity.py --sif /home/chentao/project/ecDNA/ -o /home/chentao/project/ecDNA/output/ -s P368 -t 8 --bam /home/chentao/project/mutation_calling/alignment/bam/P368T.sorted.rmdup.bam --run_AA --run_AC

注意:–sif 的路径只需要精确到ampliconsuite-pipeline.sif的目录即可,镜像的名称一定要是ampliconsuite-pipeline.sif。

这是作者在run_paa_singularity.py 设置镜像路径的代码:

image-20230822105233185

执行结果:

日志:

88f20f288fe202c079cd8d0db8fa7d8

image-20230822105441444

output:

image-20230822105543462

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/913417.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

如何截掉图片中的一部分?

如何截掉图片中的一部分?在社交媒体的热潮下,我们常常需要将自己生活中的照片或者美景图片分享到互联网或者自己的朋友圈中。然而,有时候我们会发现照片中存在一些不需要的元素,这可能会降低照片的美观程度。针对这种情况&#xf…

分布式核心知识以及常见微服务框架

分布式中的远程调用 在微服务架构中,通常存在多个服务之间的远程调用的需求。远程调用通常包含两个部分:序列化和通信协议。常见的序列化协议包括json、xml、 hession、 protobuf、thrift、text、 bytes等,目前主流的远程调用技术有基于HTTP…

C语言刷题训练DAY.10

1.空心正方形图案 解题思路&#xff1a; 这里我们只把四条边的内容打印成*&#xff0c;其他内容打印成空格即可。 解题代码&#xff1a; #include <stdio.h> int main() {int n 0;while (scanf("%d", &n) ! EOF){int i 0;for (i 0; i < n; i) //外…

Stream流报错Duplicate key

目录 1、场景2、问题3、解决办法4、完整代码 1、场景 有一个客户列表&#xff0c;每个item里有客户id、name、客户开的公司。 现在根据客户id分组&#xff0c;以客户id为key&#xff0c;把id相同的放到value里&#xff0c;构建一个Map。 这样可以快速根据id&#xff0c;获取相…

LLM赋能产业数智化业务系统升级的思考

1概述 2022年是人工智能的一个分水岭&#xff0c;ChatGPT&#xff0c;DALL E[ DALL E&#xff1a;是一款可以根据文本描述创建图像的AI工具。]和Lensa[ Lensa&#xff1a;是一款AI美图软件。]等几个面向消费者的应用程序发布了&#xff0c;它们的共同主题是使用生成式人工智能&…

【日常积累】Cookie和Session的区别

背景 会话&#xff08;Session&#xff09;跟踪是Web程序中常用的技术&#xff0c;用来跟踪用户的整个会话。常用的会话跟踪技术是Cookie与Session。Cookie通过在客户端记录信息确定用户身份&#xff0c;Session通过在服务器端记录信息确定用户身份。 本章将分享一些关于Cooki…

【高危】MarkText<=0.17.1 存在DOM型XSS漏洞 (CVE-2023-2318)

漏洞描述 MarkText 是热门的开源Markdown编辑器&#xff0c;覆盖Windows/Linux/MacOS平台。 MarkText 0.17.1及之前版本中的 pasteCtrl 类未对用户可控的 HTML 内容进行过滤&#xff0c;当用户将攻击者可控的 HTML 代码粘贴至 MarkText 编辑器中时&#xff0c;攻击者可利用DO…

鸿蒙应用开发之基础组件

一、组件简介 组件&#xff08;Component&#xff09;是界面搭建与显示的最小单位&#xff0c;HarmonyOS ArkUI声明式开发范式为开发者提供了丰富多样的UI组件&#xff0c;我们可以使用这些组件轻松的编写出更加丰富、漂亮的界面。 组件根据功能可以分为以下五大类&#xff1…

Leetcode---359周赛

题目列表 2828. 判别首字母缩略词 2829. k-avoiding 数组的最小总和 2830. 销售利润最大化 2831. 找出最长等值子数组 一、判断首字母缩略词 纯模拟&#xff0c;代码如下 class Solution { public:bool isAcronym(vector<string>& words, string s) {string tmp…

如何将pdf文件转换成word文档?

如何将pdf文件转换成word文档&#xff1f;PDF文档是我们日常办公中最为常用的电子文档格式的文件&#xff0c;也是在会议、教育培训以及商业营销中经常使用的文档格式。所以说PDF文档的功能较强&#xff0c;且应用场景较多。但是也有例外的时候&#xff0c;比如我们需要将PDF文…

vue项目中使用ts的枚举类型

vue项目中要使用ts的枚举类型需要为script标签的lang属性添加ts属性值 <script lang"ts" setup> </script > 声明枚举类型&#xff1a; //语法 /* enum 枚举名称 {可能的值 }*/ enum scenic_status {"正常" 1,"审核中","暂停…

Prometheus 监控系统---你值得拥有

目录 一&#xff1a;Prometheus 1、Prometheus 概述 2、应用场景 3、Prometheus 的特点 4、Prometheus 的生态组件 &#xff08;1&#xff09;Prometheus server&#xff1a;服务核心组件 &#xff08;2&#xff09;Client Library: 客户端库 &#xff08;3&#xff0…

c语言(12)

第一题 容易下意识认为这个判断是ASCII码值在0到9之间&#xff01; 第二题 第三题 第四题 第五题 第六题 用递归很容易就解决了 第七题

合规试制“精准狙击”秘籍——趣味浅析16949五大质量管理工具

在极其重视产品质量的汽车行业&#xff0c;如何制造出一件合格的产品进而获得主机厂的青睐&#xff0c;就像狙击手射出的子弹是否能命中目标&#xff0c;“百发百中”是每一个汽配供应商的最终梦想。 目前&#xff0c;汽配零部件企业必须通过质量管理体系的认证&#xff0c;才有…

“MyBatis入门及环境搭建“

目录 引言1. 什么是MyBatis2.MyBatis的优势与特点3. MyBatis环境搭建3.1 安装 Java 开发工具包 &#xff08;JDK&#xff09;3.2 下载我的MyBatis插件3.3 创建 MyBatis项目3.4 MyBatis的配置文件 4. MyBatis基本操作5. MyBatis增删改查测试类 6. MyBatis总结 引言 在现代的软件…

网络安全在医疗行业中的重要性

不可否认&#xff0c;现代世界见证了技术和医疗行业的交织&#xff0c;塑造了我们诊断、治疗和管理健康状况的新方式。随着电子健康记录取代纸质文件&#xff0c;远程医疗缩短了患者和医疗服务提供者之间的距离&#xff0c;数字化转型既是福音&#xff0c;也是挑战。最近的全球…

【正点原子STM32连载】第十九章 通用定时器输入捕获实验 摘自【正点原子】APM32F407最小系统板使用指南

1&#xff09;实验平台&#xff1a;正点原子stm32f103战舰开发板V4 2&#xff09;平台购买地址&#xff1a;https://detail.tmall.com/item.htm?id609294757420 3&#xff09;全套实验源码手册视频下载地址&#xff1a; http://www.openedv.com/thread-340252-1-1.html# 第十…

一个例子看懂IO模型

1.用户态和内核态 现代操作系统将空间划分为用户空间和内核空间。 用户态&#xff1a;一般都是些应用程序&#xff0c;不能直接的访问内核空间和硬盘。 内核态&#xff1a;操作系统的核心&#xff0c;只有切换到内核态才能操作磁盘。 2.同步、异步、阻塞、非阻塞 我们使用前后…

Java请求webservice踩过的坑

最近项目对接过程中&#xff0c;因为对方系统比较旧&#xff0c;我们和对方进行交互使用webservice方式进行&#xff0c;对方给出相关文档&#xff0c; 接口地址&#xff1a;http://ip:port/abc/def/xxxService?wsdl 接口名称&#xff1a;methodA 1-springboot配合CXF使用 …

智慧水务建设项目可研报告-222页【可研报告】

导读&#xff1a;原文《智慧水务建设项目可研报告-222页【可研报告】》&#xff08;获取来源见文尾&#xff09;&#xff0c;本文精选其中精华及架构部分&#xff0c;逻辑清晰、内容完整&#xff0c;为快速形成售前方案提供参考。 部分内容&#xff1a; 业务需求分析 3.3.1业…