安装
Home · eggnogdb/eggnog-mapper Wiki · GitHub
git clone https://github.com/eggnogdb/eggnog-mapper.git
cd eggnog-mapper
python setup.py install
# 如果您的 eggnog-mapper 路径是/home/user/eggnog-mapper
export PATH=/home/user/eggnog-mapper:/home/user/eggnog-mapper/eggnogmapper/bin:"$PATH"
# 设置database安装路径
export EGGNOG_DATA_DIR=/home/user/eggnog-mapper-data
# 下载数据库(我这里下载了hmmer的病毒数据库加上默认数据库)
# 更多可见 http://eggnog5.embl.de/#/app/downloads 和 查看download_eggnog_data.py --help
download_eggnog_data.py -y -P -H -d 10239 --dbname Viruses
# 顺便把hmmer的其他几个关键数据库下载了
nohup download_eggnog_data.py -y -H -d 2 --dbname Bacteria
nohup download_eggnog_data.py -y -H -d 2759 --dbname Eukaryota
nohup download_eggnog_data.py -y -H -d 2157 --dbname Archaea
使用
python ~/Software/eggnog-mapper/emapper.py -i A4.2.1_wanzheng.faa -o 13 --cpu 90 --usemem --override --evalue 1e-5 --score 50
-i A4.2.1_wanzheng.faa
:输入文件,应为一个包含蛋白质序列的FASTA文件。-o 13
:输出文件的前缀,这里是13
。EggNOG-mapper会生成多个输出文件,如13.emapper.annotations
。--cpu 90
:使用的CPU核心数,这里是90。--usemem
:这个参数表示在搜索过程中使用尽可能多的内存。--override
:如果输出文件已经存在,这个参数会让EggNOG-mapper覆盖它们。--evalue 1e-5
:设置E值阈值,这里是1e-5。E值越小,表示匹配结果的可信度越高。--score 50
:设置比对得分阈值,这里是50。得分越高,表示匹配结果的相似度越高。