速度vs精度:在AutoDock Vina中,不同对接盒子Box Size 、 Exhaustiveness对配体姿势精度的影响
介绍:
在Autodock Vina的中,用户需要提供两个关键的相关参数:
1)盒子大小(Box Size),即对接搜索空间的大小;
2)Exhaustiveness,即从随机配体结构开始的独立运行的数量(每一次运行都由连续的局部优化步骤组成,其中包括对评分函数及其在位置-方向-扭矩坐标中的导数的许多评估)。Exhaustiveness通常直接与运行时间相关。Exhaustiveness越低对接速度越快,Exhaustiveness越高搜索空间更全面。
我们使用Autodock Vina对PDBbind v2017 refine数据集进行了对接探索Exhaustiveness对对接能力的影响。对于所有的盒子大小,Exhaustiveness=1始终表现最差,当对接盒子越大越差。不断增加的Exhaustiveness显著提高了所有盒子大小的对接能力,但对于更大的搜索盒子尤其如此。当Exhaustiveness大于25时,mRMSD值变化最小。
实验设置:
本研究使用的PDBbind v2017 refined数据集由蛋白质数据库(PDB)中可用的4154个实验确定的蛋白质-配体复合物结构组成。受体和配体使用*AutoDockTools (prepare ligand4.py和prepare receptor4.py)*转换为PDBQT格式。使用了5种不同的Exhaustiveness:1、8、25、50、75、100,其余参数设置为Autodock Vina中的默认值,对接使用AutoDock Vina 1.1.2完成。
PDBbind含有不同大小的蛋白质,具有不同的口袋体积。对于每个复合物,**将搜索框的中心设置为结晶配体的几何中心。**每个蛋白质的对接盒子大小使用两个标准来选择:1)(配体实验一)无论配体大小如何,边缘设置为15,20,25,30 Å;2)(配体实验二)作为使用eBoxsize计算的结晶配体的旋转半径(Rg)的因子(即根据配体大小固定对接盒子)。使用边为X和两倍X (2X)的立方盒。所有的计算都用不同的种子进行了三次。利用OpenBabel中的obrms模块计算配体的重原子均方根偏差(RMSD)。
实验结果:
1、对于特定的box size,增加Exhaustiveness会得到更准确的配体姿势,
2、增加box size增大了搜索空间,因此需要更大的Exhaustiveness。
3、对于配体实验一,Exhaustiveness最大可以设为25,此时对接能力已收敛,超过25mRMSD不再有显著变化。
4、使用eBoxsize工具根据配体尺寸定义box size,该工具旨在计算最佳对接box size,以最大限度地提高绑定位姿预测的准确性。该工具生成的盒子只大到足以包含晶体配体口袋,因此由于可用搜索空间小,提供了非常高的对接能力。虽然这种方法并不意味着用于真实世界的化学文库虚拟筛选,以识别潜在的类药物分子,但我们已经使用它来标准化基于配体大小的盒子大小。由于上述原因,
如果box size较小(X),从6到40 Å,Exhaustiveness值对mRMSD的影响较小。
然而,对于更大的盒子(2X), mRMSD值分别为5.4 Å, 2.2 Å和1.6 Å,在耗尽性为1,8和25时,影响是严重的。在25岁之后mRMSD略有下降,并似乎在耗尽性50时趋于一致。总的来说,使用这两种盒子大小方法的结果是相似的。
5、在三个种子/独立运行中(random seed),所有结果都是一致的。
在低Exhaustiveness对接中,Exhaustiveness和准确性之间的权衡会严重损害准确性,同样,运行Exhaustiveness> 25的值基本上是没有用的。总的来说,Autodock Vina中的默认Exhaustiveness=8表现良好(即,当使用RMSD < 2.0 Å的截止值时),但使用25的值会导致稍微更好的结果。因此,本研究建议Autodock Vina用户选择耗尽性值为8,如果计算资源可用,也可以选择25。