brief
总有一些朋友丢给我一些抗体蛋白序列,希望我把抗体的框架区和高变区标识出来。
然后ANARCI 可以对抗蛋白序列的氨基酸进行编号和allign。
所以我想ANARCI可以解决这个问题。
安装
github开源软件:
https://github.com/oxpig/ANARCI
也有网页版的:
https://opig.stats.ox.ac.uk/webapps/sabdab-sabpred/sabpred/anarci/
conda install biopython
conda install hmmer
python3 setup.py install
ANARCI -h
使用
head ./cut.seq.fa
ANARCI -i ./cut.seq.fa --scheme imgt --csv -o 20230823 # 产生一个 20230823_H.csv文件
# 根据编号将Framework & CDR 分开
python3 ./user_script/print_H.py ./20230823_H.csv > ./result.cut.txt
cat ./user_script/print_H.py
#!/public/home/djs/miniconda3/bin/python
# DATE:20230302
# AUTHOR:JiangshanDai
import sys
file = sys.argv[1]
name = []
FW1 = []
CDR1 = []
FW2 =