1.前言
diamond是一款用于蛋白质和翻译后DNA搜索的序列比对工具,专为大规模序列数据的高性能分析设计。其主要特点包括:
- 与BLAST相比,蛋白质和翻译后DNA的成对比对速度快100倍至10000倍。
2. 参考
https://github.com/bbuchfink/diamond #参考github
http://www.diamondsearch.org #软件开发官网
3.安装
wget -c https://github.com/bbuchfink/diamond/releases/download/v2.1.8/diamond-linux64.tar.gz #下载
tar -zxvf diamond-linux64.tar.gz #解压
4.常见参数使用
语法:diamond 命令 [选项]
命令:
makedb 从FASTA文件构建DIAMOND数据库
prepdb 为Diamond使用准备BLAST数据库
blastp 将氨基酸查询序列与蛋白质参考数据库对齐
blastx 将DNA查询序列与蛋白质参考数据库对齐
cluster 聚类蛋白序列
linclust 线性时间内聚类蛋白序列
realign 重新对齐聚类序列与它们的中心点
recluster 重新计算聚类以修复错误
reassign 重新分配聚类序列到最近的中心点
view 查看DIAMOND对齐档案(DAA)格式的文件
merge-daa 合并DAA文件
help 生成帮助信息
version 显示版本信息
getseq 从DIAMOND数据库文件检索序列
dbinfo 打印关于DIAMOND数据库文件的信息
test 运行回归测试
makeidx 制作数据库索引
greedy-vertex-cover 计算贪心顶点覆盖
5.示例
##比对使用diamond
## 构建diamond数据库
diamond makedb --in Ft.pep.fasta --db Ft.pep.fasta
diamond makedb --in Ath.pep.fasta --db Ath.pep.fasta
## 使用diamond blastp进行比对
diamond blastp --query Ath.pep.fasta --db Ft.pep.fasta \
--out tmp.Ath_Ft.blast \
--outfmt 6 \
--max-target-seqs 5 \
--evalue 1e-10
diamond blastp --query Ft.pep.fasta --db Ath.pep.fasta \
--out tmp.Ft_Ath.blast \
--outfmt 6 \
--max-target-seqs 5 \
--evalue 1e-10
##查看比对结果
cat tmp.*.blast > Ft-Ath.blast