生信软件17 - 基于fasta文件的捕获探针设计工具catch

news2024/11/27 12:46:39

catch是broad研究所开发的一款用于设计捕获探针的python软件。

1. 软件安装

适用于Linux / windows等,安装要求Python≥3.8 | NumPy≥1.22 | SciPy≥1.8.0

# github安装
git clone https://github.com/broadinstitute/catch.git
cd catch
pip install -e .


# coonda安装
conda install -c bioconda catch

2. 基本用法

catch默认输出探针为fasta格式文件

design.py [dataset] [dataset ...] -o OUTPUT
dataset参数可以是以下2中输入格式:

1. Fasta文件路径
2. NCBI taxonomy ID, catch会自动根据ID下载对应fasta序列,输入格式为: download:TAXID

2.1 主要参数:
-pl/--probe-length PROBE_LENGTH/-ps/--probe-stride PROBE_STRIDE: 
将探针设计为PROBE_LENGTH nt长(即设计探针长度),并使用PROBE_STRIDE nt的步幅生成候选探针。 
(默认值:100和50。)

-m/--mismatches MISMATCHES:
允许的错配碱基数,值越大,探测越少。此值会显著影响运行时间,值越大,运行时间越短。

 -c/--coverage COVERAGE:
 确保探针至少捕获每个靶基因组的覆盖率,其中覆盖率是基因组的一部分或核苷酸的数量。 
 值越高,探测越多。(默认值:1.0,全基因组)。

-e/--cover-extension COVER_EXTENSION:
假设探针将捕获与其杂交的序列区域以及其两侧的COVER_EXTENSION nt。因为文库片段通常比捕获探针长,并且其值可以取决于文库片段长度。 
较高的值导致较少的探针,而较低的值在建模捕获中更严格。 通常使用50左右的值,并且在实践中效果良好。 (默认值:0。)


3. fasta文件作为输入运行示例

# 默认探针设计长度100bp
design.py design.fasta -o design.probes.fasta

4. taxonomy ID作为输入运行示例

软件运行时间较长,大约需要1小时左右。

# 运行测试案例,自动下载64320 taxonomy ID fasta序列
# 设计探针长度75nt, 最多2错配,探针与靶中间最长相同碱基至少60nt
# -o 输出文件
# --verbose 显示详细内容
design.py download:64320 -pl 75 -m 2 -l 60 -e 50 \
-o zika-probes.fasta --verbose


# 查看输出probes fasta文件
less -S zika-probes.fasta

zika-probes.fasta

6. 多taxonomy ID作为输入运行示例

输入更大、多种物种的taxonomy ID

# 将下载寨卡病毒(NCBI分类ID64320)和登革热病毒(NCBI分类ID12637)的全基因组
# 设计探针,并将探针保存到zika-and-dengue-probes.fasta
design_large.py download:64320 download:12637 \
-o zika-and-dengue-probes.fasta --verbose

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1659560.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

react项目中封装一个通用的边界Boundary

# Boundary 通用的边界,同时是一个Suspense 和一个 ErrorBoundary 正常情况不直接用,使用一下几个封装好的: -Boundary.FullSizeLoading: 占满父容器全部高度,居中显示等待动画; -Boundary.Loading: 占满一行,显示一个普通尺寸的等待动画; -Boundary.Blank: 什么都不显示…

未来编码探索:揭秘Java的进化之旅与技术革新!

Java是一种广泛使用的编程语言,自1995年问世以来,它在企业级应用、移动应用开发、大数据处理等领域都有着广泛的应用。随着时间的推移,Java也在不断发展和进化,以满足不断变化的技术需求和市场趋势。本文将全面详细地探讨Java的未…

Linux 用户进程启动与Systemd

Linux用户空间的启动 我们都知道,Linux在内核的初始化自身的流程结束后,就会将程序流的运行转到用户态,也就是进入init进程流之后,他会按照这个流程进行初始化: init进程初始化 基础的底层服务:比如说ude…

视频号小店怎么开通优选联盟?开通之后有什么好处?

大家好,我是电商糖果 糖果做视频号小店已经快两年时间了,这期间也一直坚持在网上分享自己做店的经验。 这里糖果就来给大家分享一下,视频号小店怎么开通优选联盟,店铺开通之后会有什么好处? 首先我们要知道优选联盟是…

20240509解决Protel99se导入philips.ddb出现File is not recognized的问题

20240509解决Protel99se导入philips.ddb出现File is not recognized的问题 2024/5/9 16:25 缘起:最近需要用到/画PCB,想到十年前用过Protel99SE。 使用的系统:WIN10/WIN11都会出错。WIN7没有测试! 从115网盘的角落里找到七集视频…

Objective-C的对象复制与拷贝选项

对象复制与拷贝 文章目录 对象复制与拷贝copy与mutablecopycopy与mutablecopy的简介示例:不可变对象的复制可变对象的复制 NSCopying和NSMutableCopying协议深复刻和浅复刻浅拷贝(Shallow Copy):深拷贝(Deep Copy&…

【python】将json内解码失败的中文修改为英文(‘utf-8‘ codec can‘t decode,labelme标注时文件名未中文)

出现问题的场景: 语义分割数据集,使用labelme工具进行标注,然后标注图片存在中文名,导致json标签文件写入中文图片名,从而解析失败。 代码解析json文件时,出现报错: python脚本需求&#x…

Java 7大排序

🐵本篇文章将对数据结构中7大排序的知识进行讲解 一、插入排序 有一组待排序的数据array,以升序为例,从第二个数据开始(用tmp表示)依次遍历整组数据,每遍历到一个数据都再从tmp的前一个数据开始&#xff0…

论文解读--High-resolution Automotive Radar Point Cloud Imaging and Processing

高分辨汽车雷达点云成像和处理 摘要 汽车雷达具有体积小、硬件成本低、全天候工作、高分辨率等公认的优点,是高级驾驶辅助系统(ADAS)必不可少的一类重要传感器。然而,低角度分辨率和低成像性能的限制很难满足下一阶段ADAS的需要。新兴的4D成像雷达采用多…

【随笔】Git 高级篇 -- 不带 source 参数的命令 git fetch git push(三十九)

💌 所属专栏:【Git】 😀 作  者:我是夜阑的狗🐶 🚀 个人简介:一个正在努力学技术的CV工程师,专注基础和实战分享 ,欢迎咨询! 💖 欢迎大…

【工具】如何提取一个mp4文件的关键帧

文章目录 怎么做如何安装ffmepgUbuntu 或 DebianCentOS 或 FedoramacOSWindows其他 Linux 发行版 实践什么是关键帧 怎么做 你可以使用ffmpeg这个强大的多媒体处理工具来提取mp4文件中的关键帧。以下是一个示例命令,可以使用ffmpeg从mp4文件中提取关键帧&#xff1…

一款免费的PDF转换工具分享

最近在吾爱上发现一款PDF免费转换工具,支持多种格式转换,试了一下,还不错 最重要的是免费,不用开会员转换,也没有限制(文末有工具地址) ps:转换完成后看一下是否符合,可能会有些许…

哇哦,一个超级牛逼的图片格式!!使用它之后我们系统加载图片快了一倍!!! 图片格式转换webp学习!

什么是webp格式? WebP 格式是一种图像文件格式。 它是由谷歌开发的,旨在提供一种高效的图像压缩方式,同时保持较好的图像质量。WebP 格式具有较小的文件体积,能够在一定程度上减少网络传输的数据量,提升网页加载速度…

网工常用工具——Xshell

今天给各位介绍一下,Xshell工具 Xshell是一款功能强大的终端模拟器,主要用于Windows操作系统,用于远程访问和管理服务器,允许用户通过SSH(Secure Shell)协议安全地连接到远程Linux/Unix服务器或其他支持SS…

DenseCLIP论文讲解

文章目录 简介方法总体框架 (Language-Guided Dense Prediction)上下文感知提示 (Context-Aware Prompting)应用实例 论文:DenseCLIP: Language-Guided Dense Prediction with Context-Aware Prompting 代码&#xff1…

Spring与AI结合-spring boot3整合AI组件

⛰️个人主页: 蒾酒 🔥系列专栏:《spring boot实战》 目录 写在前面 spring ai简介 单独整合al接口 整合Spring AI组件 起步条件 ​编辑 进行必要配置 写在最后 写在前面 本文介绍了springboot开发后端服务中,AI组件(Spring A…

淘宝扭蛋机小程序:开启惊喜购物的新纪元

一、引言 随着科技的飞速发展,我们的购物方式也在不断地更新换代。淘宝,作为国内领先的电商平台,始终致力于为用户提供更加便捷、有趣的购物体验。为了满足广大用户对于新鲜、刺激购物体验的追求,淘宝特别推出了扭蛋机小程序&…

[C++] const 成员函数

标题:[C] this指针 & const 成员函数 水墨不写bug 正文开始: 目录 (一)Cpp的面向对象编程 (二)this指针 (三)const修饰的成员函数 在正式讲解const修饰成员函数之前&#x…

实测ChatGPT插件真香用法!视频一键变脑图,高数作业轻松拿捏

Sam Altman诚不我欺: ChatGPT插件和联网功能终于在这两天向尊贵的Plus用户全面开放了。 像之前预告的一样,联网可以直接获取2021年9月之后的消息,插件也安排了70多个,购物订餐订机票等日常功能应有尽有,更专业的数学、…

网站未部署证书有何影响,如何解决?

如果您的网站没有ssl证书会有以下风险 1 浏览器标记为不安全 未安装证书的网站在访问时会有不安全的提示弹窗或者在网址栏直接显示不安全 2 影响企业信誉 当用户访问网站时看到不安全提示,会对网站的真实性和安全性产生怀疑,不敢轻易与该企业合作&…