介绍一个蛋白质-蛋白质结合位点预测的新工具——Spatom,这是一个图神经网络框架。其发布在brief in bioinformatics上面。
Paper and tool links
文章,网页工具和github链接如下
paper link: Spatom: a graph neural network for structure-based protein–protein interaction site prediction
Web server link: http://118.190.151.48/Spatom/server.
网页工具提供了user-friendly的使用界面,和两种使用mode。如果你希望得到更准确的结果,请预先run blast得到蛋白质序列的PSSM矩阵文件,然后运行standard mode。如果你希望进行一个sketching prediction,或者just for fun,你可以直接使用fast mode,这允许用户只提交蛋白质pdf。
运行后,可以得到三位可交互的位点可视化展示,和具体的预测分数。
github link: https://github.com/Wu-Haonan/Spatom
Why Spatom
在之前的蛋白质位点结合问题中,无论trainning or testing,蛋白质样本均来自结合构象中抽取的单体。但是我们知道,蛋白质在结合发生前后,自身构象会发生不同程度的改变。所以,structure-based方法利用这样的结合后的三位结构进行预测并不能完全的接近真实情况下用户的使用场景。所以我们在工具上的第一个贡献是,我们训练和测试完全采用free structure,而不是bounded structure来作为数据。
第二个问题是,蛋白质结合并不一定是两个单链蛋白质的相互作用,也有可能是两个多链复合物的interaction。但是,seq-based方法,或者传统的ML/DL的模型很难对多链复合物提取特征。在Spatom中,由于我们将蛋白质视为图,其中以氨基酸为节点,空间距离小于阈值的节点进行连边,这样无论有多少链,我们都可以容纳在我们的模型中。所以,我们的Spatom工具允许输入多链。
Innovations
- 采用图神经网络进行训练。
- 我们使用了注意力机制,并且设计了连续性指标CI,来检测注意力机制的效果。
- 我们使用了带权有向图,更细腻的刻画了节点之间的相互影响,同时允许节点之间的拥有不对称的影响力。
更多的方法细节可以移步文章原文Spatom: a graph neural network for structure-based protein–protein interaction site prediction.