本文介绍如何在自己本地机器上安装AlphaFold 3。
在10月份,Google DeepMind的首席执行官Demis Hassabis和高级研究科学家John M. Jumper所领导的团队,利用AI技术成功预测了几乎所有已知蛋白质的结构,开发出备受赞誉的AlphaFold,并因此荣获诺贝尔化学奖,
诺贝尔化学奖授予:AI+蛋白质设计/预测方向诺贝尔化学奖授予:AI+蛋白质设计/预测方向https://mp.weixin.qq.com/s?__biz=MzUwOTg0MjczNw==&mid=2247530919&idx=1&sn=d92429f19cd85628a090932bdf553414&chksm=f90e3df9ce79b4efec6792bd3ebc4479066118077caf328516e6eea011a2b6e049495430ae7d&token=1414917553&lang=zh_CN#rd
11月11日,Google DeepMind公司宣布,科学家们现在可以下载AlphaFold 3代码部署在自己机器上,并在非商业用途中使用这款AI工具,截止2024年11月13日,github已经斩获3.5k stars,
以下是正文。
AlphaFold 3只支持Linux操作系统。
安装时,需要约1TB的磁盘空间来存储数据库(建议使用SSD存储)。需要一块拥有计算能力8.0或更高的NVIDIA GPU(具有更大显存的GPU可以预测更大的蛋白质结构)。
第1步,安装Docker
第2步,为A100安装NVIDIA驱动程序
docker run --rm --gpus all nvidia/cuda:12.6.0-base-ubuntu22.04 nvidia-smi
显示类似结果说明前两步的操作正确无误,
第3步,下载AlphaFold 3源代码
git clone https://github.com/google-deepmind/alphafold3.git
第4步,下载依赖数据库
AlphaFold 3依赖大量蛋白和RNA数据库,包括“BFD small”、“MGnify”、“PDB”、“PDB seqres”、“UniProt”、“UniRef90”、“NT”、“RFam”和“RNACentral”数据库。 通过alphafold3/fetch_databases.py下载和设置这些数据库,
cd alphafold3 #alphafold3是上文步骤3的文件夹
python3 fetch_databases.py --download_destination=<DATABASES_DIR>
注意:
- <DATABASES_DIR>不能是alphafold3下的一个文件夹,否则影响后续AlphaFold3 Docker image的build;
- 整个数据库解压后多达630 GB,需要足够的存储空间,为了防止下载过程断开,建议使用screen或者tmux;
- 确保<DATABASES_DIR>有755权限,否则会报permissions的错误。
下载成功后,<DATABASES_DIR>文件夹下包含以下问价,
pdb_2022_09_28_mmcif_files.tar # ~200k PDB mmCIF files in this tar.
bfd-first_non_consensus_sequences.fasta
mgy_clusters_2022_05.fa
nt_rna_2023_02_23_clust_seq_id_90_cov_80_rep_seq.fasta
pdb_seqres_2022_09_28.fasta
rfam_14_9_clust_seq_id_90_cov_80_rep_seq.fasta
rnacentral_active_seq_id_90_cov_80_linclust.fasta
uniprot_all_2021_04.fa
uniref90_2022_05.fa
第5步,获取模型参数
AlphaFold 3的模型参数需要向Google DeepMind申请,获得权限后不能转手、不能商用、输出结果只能自己用......
如果要将结果发表,要遵守一大堆规则(一句话,你不能为所欲为......),
第6步,构建AlphaFold3 Docker容器
构建AlphaFold3 Docker容器,
docker build -t alphafold3 -f docker/Dockerfile .
现在可以使用AlphaFold 3了,
docker run -it \
--volume $HOME/af_input:/root/af_input \
--volume $HOME/af_output:/root/af_output \
--volume <MODEL_PARAMETERS_DIR>:/root/models \
--volume <DATABASES_DIR>:/root/public_databases \
--gpus all \
alphafold3 \
python run_alphafold.py \
--json_path=/root/af_input/fold_input.json \
--model_dir=/root/models \
--output_dir=/root/af_output
当然也可以使用Singularity替代Docker。
从0在自己机器上部署AlphaFold 3本文介绍如何在自己本地机器上安装AlphaFold 3。https://mp.weixin.qq.com/s/gLq_SESkmoL5k7XaGlLEpQ