前言
配体的结合需要疏水作用,通常来说,疏水性空腔(开口小、肚子大、能容纳一定体积的分子结构)更有可能成为口袋。当我们复现网络药理学文章时可能经过前面的筛选,依旧有数个乃至数十个蛋白需要做分子对接验证。此时如果我们能预测蛋白口袋,那么可以大大加速后续的分子对接过程。
那么我们该如何去预测一个蛋白是否有潜在的蛋白口袋呢?
这里我们以PUB ID
为5T01的蛋白来做预测。
预测蛋白口袋网站地址总览:
- pocasa:
https://g6altair.sci.hokudai.ac.jp/g6/service/pocasa/
- proteins.plus:
https://proteins.plus/
https://open.playmolecule.org/landing
Pocasa预测蛋白口袋
在这里介绍一个网站叫pocasa
(刚进去会提示有风险,选择继续进入即可)
https://g6altair.sci.hokudai.ac.jp/g6/service/pocasa/
网站首页如下:
Chain ID
默认为NULL
,表示选择蛋白文件的第一条链。
我们将PUB ID
输入进去,然后直接点击Get Pockets and Cavities
即可开始预测。
然后页面如下:
我们首先看右边的Rank Order
的部分,是空的,意味着它预测出来A链上是没有口袋的。
相应的,左边Output files
的部分,如果有口袋的话,会存在一个5T01_TopN_pockets.pdb
的文件。
我们点击页面左下角的Back
返回或者直接浏览器后退返回(推荐后者,因为前者的话会将表单所有输入清空,后者会保留)
将 Chain ID
改为B
,表示选择蛋白文件的第二条链,再次预测,如下:
这次我们看到了Rank order
中有值了。
POCASA
这个网站告诉了我们一共生成了多少个Pocket,每个Pocket都有自己的编号,按照体积排序,依次是Rank 1、2、3……通常,体积最大的Pocket最有可能是真正的蛋白口袋,但体积太大也有可能是假口袋。最保险的做法是进行可视化分析。这里我们知道了在B链上可能存在一个编号为23,体积为41的口袋。
我们再看到左边Output files
的部分,一般都将xxx.pdb
文件和xxx_TopN_pockets.pdb
的文件下载下来。
接着我们再预测C链和D链,预测出来口袋都是0。
接着我们把如上两个文件放进pymol可视化分子,以cartoon形式显示蛋白B链,以spheres形式显示pockets并且为红色,如下:可以看到这个口袋实际上和B链只接触了一点点,一点都不像一个口袋,它应该是个假口袋。所以我们排除这个蛋白,不去做分子对接。
proteins.plus预测蛋白口袋
我们也可以用protein.plus
这个网站去预测(进入较慢,可能需要外网环境)
https://g6altair.sci.hokudai.ac.jp/g6/service/pocasa/
刚进入时首页如下:
可以看到其支持直接输入PDB ID
,或者上传PDB
文件或SDF
文件来搜索。
在这里我们输入5T01
,点击搜索后的界面如下:
最上面显示当前搜索的蛋白是哪个。左边是在线预览区域,右边我们主要关注DoGSiteScorer
,点击DoGSiteScorer
随后出现以下页面:
主要关注Chain
区域,支持全部搜索,也支持搜索口袋在蛋白具体哪条链上,这里我们直接点击Calculate
(可能要等一会)
随后可以看到它预测了五个口袋,点击眼睛可以以对应的颜色展示在左边预览区。
最后我们点击Download
,下载下来一个文件夹,解压后如下:
最主要关注里面的两个文件夹,pockets
里面是预测的五个口袋的ccp4
格式文件的压缩包,可以用UCSF Chimera
(也就是常说的奇美拉,主要用于分子接口模拟)软件打开。
而residues
文件夹里则是五个口袋的pdb
格式文件,主要用来看它的氨基酸序列。
DeepSite预测蛋白口袋
DeepSite网站:https://open.playmolecule.org/tools/deepsite
这个网站需要谷歌邮箱登陆,可能需要外网环境。
现在新版的网站支持传输自己的预测蛋白口袋的算法模型了,想要的话可以在Deepsite model
那选择CLEAR
,就能把网站自己提供的算法模型取消掉,然后上传自己的。
可以看到也是支持上传PDB
格式文件或者直接输入PDB ID
。
建议选择前者,输入PDB ID
的方式可能会显示Invalid Input
(因为这个网站服务有时候有点问题,没办法通过你的PDB ID
拉取蛋白结构)
点击SUBMIT
后可以看到预测任务正在进行中。当前任务队列的状态(Queue Status
)是比较繁忙的。
SwissModel预测蛋白口袋
还不是很会用,Sorryyy,放个图占位