后AlphaFold时代的蛋白质结构预测

news2024/11/20 4:48:23

最新一届的蛋白质结构预测奥林匹克大赛,即15届CASP比赛(CASP15),在日前拉下了帷幕。这正值谷歌团队AlphaFold2在上一届CASP大赛给该领域带来革命性冲击后两周年。两年后,该领域的状况如何,蛋白质结构预测该何去何从?为此,Nature杂志发表了Ewen Callaway博士关于CASP15的专题文章。该文章对CASP大赛的组织者John Moult博士,以及蛋白质结构预测专家Yang Zhang(张阳)教授,Mohammed AlQuraishi博士,Arne Elofsson教授和 CASP大赛的评审员Ezgi Karaca博士进行了采访。

  

后AlphaFold时代的蛋白质结构预测

两年前,计算生物学家John Moult博士宣布:“从某种意义上说,问题已经解决了。”总部位于伦敦的公司 DeepMind 刚刚横扫了由Moult共同创立的两年一度的竞赛。该竞赛测试了各代表团队预测蛋白质结构的能力,这是生物学中最重大的挑战之一。其中DeepMind的AlphaFold凭借其革命性的人工智能 (AI) 算法在该项比赛独占鳌头。

两年后,Moult 的竞赛,结构预测的关键评估(CASP),仍然走在 AlphaFold 的长长阴影中。今年即本周末在土耳其安塔利亚举办的CASP15的结果表明,目前由氨基酸序列预测蛋白质结构的最成功方法都可以看到AlphaFold的影子。“每个人都在使用 AlphaFold,”安娜堡密歇根大学的计算生物学家张阳教授说。

然而,AlphaFold 的进展也为蛋白质结构预测领域带来了新的挑战。超越现有蛋白质结构预测的精度需要新的技术和算法。“唾手可得的果实已经摘下,”纽约市哥伦比亚大学的计算生物学家 Mohammed AlQuraishi博士说。“接下来的一些问题会更难。”

DeepMind团队2021年在Nature上发表的AlphaFold2 算法流程图

挑战AlphaFold

CASP大赛始于 1994 年,旨在为蛋白质结构预测领域带来最为严谨的评估,以此来推动计算生物学领域加速理解细胞构建模块和推进药物发现的努力。在每次比赛的过程中,各个计算预测团队的任务是使用计算工具来预测已使用 X 射线晶体学和低温电子显微镜等实验方法确定但尚未发布的蛋白质结构。然后,由独立的评审科学家团队,通过把计算机预测模型和实验结构直接比较,来对各预测团队的模型进行评估打分。上届CASP14的结果表明,许多蛋白质的计算机预测结构和实验解出的结构没有多大差别。这是CASP比赛历史上第一次达到这样的准确性。

自从CASP14之后,AlphaFold 在生命科学研究中变得无所不在。DeepMind在 2021 年发布了该软件的底层代码,以便任何人都可以运行该程序。今年更新的 AlphaFold 数据库保存了基因组数据库中代表的几乎所有生物体的几乎每一种蛋白质的预测结构。虽然预测质量参差不齐,但是其结构总数超过 2 亿条蛋白质。

AlphaFold 的成功和新发现的普遍性对马里兰大学的John Moult博士和他的同事们提出了挑战。他们正在计划今年的 CASP15。“人们说,'哦,我们不再需要 CASP,问题已经解决了。' 我认为这是完全错误的方式。”Moult博士说。

在 CASP15 上,最成功的团队是那些以各种方式采用和推广AlphaFold算法的团队,同时也取得了相当不错的精度提高。“但是AlphaFold的准确度已经足够高,很难取得比它好很多的精度”,Moult博士说。

蛋白质复合物结构预测

为了使比赛在后 AlphaFold 世界中更具相关性,Moult博士 和他的团队增加了新的测试并调整了一些现有的测试范畴。新的测试包括确定蛋白质如何与药物等其他分子相互作用,以及预测某些蛋白质可能呈现的多种形状。Moult 说,在过去的十年中,CASP 已经包含了多种相互作用的蛋白质相互作用的“复合物”,但今年对准确预测此类分子的结构提出了更高的要求。

“这是正确的做法,”张阳教授说,“因为预测单个蛋白质或结构域的结构——过去 CASP 比赛的奶油和面包——很大程度上已经被 AlphaFold 解决了”。斯德哥尔摩大学蛋白质生物信息学家 Arne Elofsson 教授同意这种说法。 他说,“确定蛋白质复合物的形状尤其代表了该领域的一项重要新挑战,因为还有很大的改进空间。”

蛋白质复合物结构 

 

AlphaFold 最初设计的版本是用于预测单个蛋白质的形状。但是,在其公开发布的几天内,其他科学家表明该软件可以被改装,用来模拟蛋白质之间的相互作用。从此后的几个月里,研究人员想出了无数种方法来提高 AlphaFold 处理复合物的能力。考虑到这个目标,DeepMind 甚至发布了一个名为 AlphaFold-Multimer 的新版本。

这样的努力似乎得到了回报,因为与之前的比赛相比,CASP15 的准确复合物数量显着增加。这可能主要是由于采用了 AlphaFold 的方法。“这对我们来说是一个接近复合物实验精度的新游戏。” Moult博士说。“我们也有一些失败。”

例如,团队对由两种相同的交织蛋白质组成的功能未知的病毒分子做出了惊人准确的预测。土耳其伊兹密尔生物医学和基因组中心的计算结构生物学家 Ezgi Karaca 博士评估了蛋白质复合物结构的预测。“这种形状让 AlphaFold 之前的工具无所适从。” Karaca 博士说,“AlphaFold 的标准版本未能准确模拟一个巨大的 20 链细菌酶的形状,但一些参赛团队通过对AlphaFold的推广对这些蛋白质复合物产生了正确的预测模型

与此同时,这些团队努力预测涉及称为抗体的免疫分子的复合物——包括一些附着在 SARS-CoV-2 蛋白上的分子。 Karaca 博士说,“一些团队的预测已经取得了成功,这表明改编和推广AlphaFold 将有助于预测这些医学上重要的分子的形状。

下一步的方向

人们也注意到,DeepMind没有参加今年的 CASP 比赛。该公司没有说明不参与的原因,但在 CASP15 会议期间发布了一份简短声明,祝贺参赛的团队。与此同时,它预计推出对 AlphaFold2 更新的版本,以帮助研究人员根据新的算法进行基准测试。

其他研究人员表示,参加 CASP 比赛是一项非常耗时费力的努力,该公司可能觉得将这些时间花在其他科研挑战上会更加有益。“如果他们参与进来,对我们来说会很好,”Moult博士说。但他补充说,“因为这个算法已经非常精确,他们无法实现另一个大飞跃”。

研究人员表示,对 AlphaFold 进行重大改进需要时间,并且可能需要在机器学习和蛋白质结构预测方面进行新的创新。正在开发的一个领域是“语言模型”的应用,例如预测文本工具中使用的那些模型,以预测蛋白质结构。但是这些方法——包括由社交网络巨头 Meta 开发的方法——在 CASP15 上的表现,并不如基于 AlphaFold 的工具。

然而,此类工具可能有助于预测突变如何改变蛋白质的结构——这是由于 AlphaFold 的成功而出现的蛋白质结构预测中的几个关键挑战之一。AlQuraishi 博士说,由于这一点,该领域不再专注于单一目标。“有许多这样的问题值得研究。”

参考文献:

After AlphaFold: protein-folding contest seeks next big breakthrough

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/106574.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

数字化办公,就选流畅、清晰的华为云桌面

人工智能、大数据算法蓬勃发展的时代,企业的数字化发展与之关联密切,企业纷纷追求业务上云。 云上办公模式相较于线下办公模式而言,不再受到场地的限制、业务流程也加快很多,企业的成本得到一定的节省。在技术和成本的影响下&…

电视动画片的制作与发行

电视动画片的制作与发行 一、电视动画片的备案和公示 (一)电视动画片的备案和公示基本要求 电视动画片的拍摄制作实行备案公示制度。 国家广播电视总局负责全国拍摄制作电视动画片的公示。北京市广播电视局负责受理本行政区域内制作机构拍摄制作电视…

【LeetCode每日一题】——面试题 08.01.三步问题

文章目录一【题目类别】二【题目难度】三【题目编号】四【题目描述】五【题目示例】六【解题思路】七【题目提示】八【时间频度】九【代码实现】十【提交结果】一【题目类别】 动态规划 二【题目难度】 简单 三【题目编号】 面试题 08.01.三步问题 四【题目描述】 三步问…

Nacos2.2使用PostgreSQL数据源插件存储数据手把手教程

一、背景 Nacos2.2在2022年的12月份正式发布了,该版本可以让开发者开发支持PostgreSQL数据库的插件,从而实现将配置信息存储到PostgreSQL中。 本文基于自己开发的PostgreSQL数据源插件进行说明,希望可以帮助到大家。 数据源插件开源仓库地…

Go语言设计与实现 -- 接口

接口实际上是一个中间层,用于上下游的解耦,在框架和操作系统中,接口都随处可见,而Go语言将接口作为了内置类型,接下来,我们就来重点学习一下,Go语言的接口。 将实现接口的结构体实例赋值给接口结…

(三)汇编语言——DOSBox

本篇主要用来介绍我们的实验平台——DOSBox的使用与调试,主要就是改一下窗口大小以及挂载,并且作为学习汇编实验的汇总,不定期更新。 下载与安装 这个可以到官网去下载,然后安装也很简单,就不介绍了,而且一…

力扣(LeetCode)1753. 移除石子的最大得分(C++\C)

贪心模拟 贪心思路 : 循环从石子数量最多的两堆取石子,直到有两堆以上(含两堆)空石子,维护取子次数,即是答案。贪心的正确性,暂无数学证明。直觉来看,这么做是对的。 CPP class Solution { public:int maximumScore…

设计模式之观察者模式

Observer design pattern 观察者模式的概念、观察者模式的结构、观察者模式的优缺点、观察者模式的使用场景、观察者模式的实现示例、观察者模式的源码分析 1、观察者模式的概念 观察者模式,又称为发布-订阅模式,即它定义了一种对象间一对多的依赖关系&…

spark 运行自带样例SparkPi、spark-examples报错

报错时我使用的环境如下: windows10中运行,非linux虚拟机 使用微软的Terminal软件进入powershell环境 scala 2.12.10 spark-3.1.1-bin-hadoop3.2 没有单独安装hadoop环境 java 8 注意一:该spark-3.1.1-bin-hadoop3.2在centos 7、树莓派4b官方…

2小时上车AI作画_NovelAI (学会能做游戏mod)

最近在打牌(杀戮尖塔真好玩),玩着突发奇想: 能不能?把游戏原画,通过AI作画,替换为二次元风格? 试试就逝逝...简单复盘下 一、部署"NovelAI" 本地部署【需要本地显卡】 …

Linux C 链接模块

静态链接 Linux 下静态库的创建和使用 1.编译静态库源码&#xff1a;gcc -c lib.c -o lib.o 2.生成静态库文件&#xff1a;ar -q lib.a lib.o 2.使用静态库编译&#xff1a;gcc main.c lib.a -o main.out #20-1.c #include <stdio.h>extern char* name(); extern int a…

Python 自动化测试(三): pytest 参数化测试用例构建

在之前的文章中主要分享了 pytest 的实用特性&#xff0c;接下来讲 Pytest 参数化用例的构建。 如果待测试的输入与输出是一组数据&#xff0c;可以把测试数据组织起来用不同的测试数据调用相同的测试方法。参数化顾名思义就是把不同的参数&#xff0c;写到一个集合里&#xff…

Mentor-dft 学习笔记 day46-Graybox OverviewTessent On-Chip Clock Controller(1)

graybox功能简化了分层设计中的扫描插入和ATPG处理过程&#xff0c;允许对子模块执行扫描和ATPG操作&#xff0c;然后允许在以下情况下使用该子模块的简化灰箱表示在下一个更高层次执行扫描和ATPG操作。由于子模块的灰盒表示仅包含最小数量的互连电路&#xff0c;因此在大型分层…

Oracle-在线重定义dbms_redefinition.sync_interim_table增量同步引发TX行锁问题

前言: 近期处理了一起用户使用在线重定义dbms_redefinition增量同步操作引发TX行锁的问题&#xff0c;用户在使用dbms_redefinition.sync_interim_table进行数据增量同步时&#xff0c;在线重定义的原表SQL语句出现了TX行锁等待问题 后面经过分析&#xff0c;发现产生TX行锁问…

短链接业务解决方案(附源码项目)

开源地址 https://github.com/lcy19930619/short-link 一个单节点短链接项目&#xff0c;有需要的拿去改改就行了&#xff0c;如果方便&#xff0c;可以帮忙点点star 什么是短链接 蓝色部分就是短链接 为什么要用短链接&#xff1f; 因为短信是按照字符去计算条数的&#x…

12月21日 OpenCV 实战基础学习笔记——背景建模、光流估计

文章目录前言一、背景建模1、帧差法2、混合高斯模型二、光流估计前言 本文为12月21日 OpenCV 实战基础学习笔记&#xff0c;分为两个章节&#xff1a; 背景建模&#xff1b;光流估计。 一、背景建模 1、帧差法 由于场景中的目标在运动&#xff0c;目标的影像在不同图像帧中…

Redis哨兵机制以及发布订阅

Redis哨兵机制1 哨兵Sentinel机制2 哨兵架构原理3 搭建哨兵架构4 通过springboot操作哨兵Redis发布订阅1 哨兵Sentinel机制 Sentinel&#xff08;哨兵&#xff09;是Redis 的高可用性解决方案&#xff1a;由一个或多个Sentinel 实例组成的Sentinel 系统可以监视任意多个主服务…

海格里斯HEGERLS深度解析|重型四向穿梭车的轨道换向组件及轨道系统

随着自动化仓储物流系统的广泛应用&#xff0c;物流设备也更趋于多样化&#xff0c;比如在货架轨道上可四向行走的穿梭车应运而生&#xff0c;重型四向穿梭车作为一种新型的物流存储设备&#xff0c;通常在轨道平面上有行走方向相互垂直的两个行走系统&#xff0c;通过两个行走…

gRPC学习Go版(一)

文章目录微服务入门gRPC是什么proto 服务定义gRPC 优势gRPC入门简单使用一元RPC服务流RPC客户流RPC双工流RPCgRPC底层原理RPC流长度前缀的消息分帧请求消息响应信息通信模式下的消息流微服务入门 现在的软件很少是一个孤立的单体应用运行的&#xff0c;相反更多是通过互联网连接…

玩以太坊链上项目的必备技能(错误处理以及异常-Solidity之旅十四)

错误处理 作为开发者的我们知道&#xff0c;我们所编写出来的程序难免会出现 bug &#xff0c;而要做的是捕获异常&#xff0c;给用户抛出一个友好地错误提示。 而在 Solidity 中&#xff0c;根据状态恢复异常来处理错误&#xff0c;该异常将撤销在当前调用中对状态所做的所有…