AlphaFold的极限:高中生揭示人工智能在生物信息学挑战中的缺陷

news2024/9/25 15:21:42

人工智能程序AlphaFold (AlphaFold2开源了,不是土豪也不会编程的你怎么蹭一波?),通过预测蛋白质结构解决了结构生物信息学的核心问题。部分AlphaFold迷们声称“该程序已经掌握了终极蛋白质物理学,其工作能力已超越了最初的设计”。事实真是如此吗?Skoltech Bio的研究团队让 AlphaFold 预测单个突变对蛋白质稳定性的影响,结果与实验结果相矛盾,这表明该人工智能并非结构生物信息学的万能良药。该研究发表在《PLOS One》杂志。

a70da98eb6daae4160a8fec40d2d28d9.png

在Skoltech为高中生举办的生物信息学训练营上,人类和人工智能在科学领域中的较量迎来了新篇章。早前AlphaFold解决了结构生物信息学50年来的核心问题而一度被认为是结构生物信息学的万能药,而该程序在解决这个领域研究人员面临的其他问题时表现欠佳。

c21e3d49f0c46e4b3487348684a2a64d.png

该项目的海报来自于2021年由Skoltech在线上举办的分子与理论生物学学院中的“Playing With AlphaFold2”课程。图片来源:Dmitry Ivankov/Skoltech。

结构生物信息学是一门研究蛋白质、RNA、DNA及其与其他分子相互作用结构的科学分支。其核心问题是预测蛋白质的结构。也就是说,给定组成蛋白质的任意氨基酸序列,如何可靠地计算该蛋白质将在体内呈现什么样的三维结构,以及如何发挥功能。其研究结果为新药研发和具有新特性的蛋白质(例如在自然界中尚未发现的催化剂)的合成提供了基础。

这个里程碑式的成就引发了人们的猜测,即神经网络必须以某种方式将蛋白质的基本物理原理转变为内在的信息,并且能够实现超出其设计范围的任务。某些人,甚至在结构生物信息学界,预计该人工智能很快就会解决这一学科的剩余问题,并将其归入科学史。

“我们决定解决这个问题,并让AlphaFold处理结构生物信息学的另一个核心任务:预测单个突变对蛋白质稳定性的影响。对某个已知的蛋白质只引入一个突变,想知道所得到的突变体是更稳定还是更不稳定,及其程度如何。根据实验结果,AlphaFold明显无法实现此任务,其预测与已知的实验结果相矛盾。”该研究的主要负责人、Skoltech生物学助理教授Dmitry Ivankov评论道。

然而,在本次挑战中,AlphaFold无法预测单个突变对蛋白稳定性的影响,这意味着人工智能程序并未掌握蛋白质物理学的全部内容,不能成为结构生物信息学的万能药。高中生参与了该项目,他们参与了突变数据处理、编写处理预测结果的脚本、可视化AlphaFold指定的结构等任务。

028261b70317b3ff1b0e3daeffcac86d.png

65910adefb5da2944840cec98c00f215.png

伊万科夫强调AlphaFold的创建者实际上从未声称该人工智能适用于除了基于氨基酸序列预测蛋白质结构之外的其他任务。“但是一些机器学习爱好者很快预言了结构生物信息学的终点。因此,我们认为测试一下是个好主意,现在我们知道它不能预测单个突变对蛋白质稳定性的影响,”伊万科夫补充道。

在实际应用层面上,预测单个突变如何影响蛋白质稳定性有助于从众多突变中筛选出可能有用的位点。例如,如果想制造一种蛋白质添加剂,使其能够在更高温度下分解油脂、淀粉、纤维或其他蛋白质,那么这非常有用。此外,已知有一些甜味蛋白有望代替糖,但前提是它们能够承受一杯咖啡或茶的高温。

在基础研究层面上,这项研究结果表明,当今的人工智能并非万能药,虽然它可能在解决一个问题方面非常成功,但其他问题仍然存在,包括结构生物信息学面临的主要挑战。其中包括预测由蛋白质和小分子或DNA或RNA组成的复合物的结构,确定突变如何影响蛋白质与其他分子的键能(binding energy),设计具有赋予所需特性的蛋白质,例如能够催化本来不可能的反应,作为一个微小“分子工厂”的元素。

除了提醒人们即使在AlphaFold之后,该领域的科学家仍有一两件事情要做,该研究报告的作者还探讨了AI程序成功的原因是否来自其“学习过的物理学”,而不仅仅是内化了所有已知的蛋白质结构并巧妙地操纵它们。显然并非如此,如果熟悉相关的物理学知识,应该会相对容易地获得两个非常相似但不完全相同的结构在稳定性方面的差异,但这恰恰是AlphaFold没有完成的任务。

这与之前提出的两个关于对AI物理学“知识”保留意见的观点不谋而合。首先,AlphaFold预测了一些侧基团结构,表明锌离子与它们结合。然而,程序的输入仅限于蛋白质的氨基酸序列,因此“看不见的锌”之所以存在,是因为AI是在类似的蛋白质结构与该离子结合的基础上进行训练的。没有锌,预测的侧基团的定位与物理规律相矛盾。其次,AlphaFold可以预测出一种孤立的蛋白质结构,看起来像螺旋,确实准确无误,但前提是该结构与另外两条链相互交织。如果没有这两条链,预测结果就是不合理的。因此,程序不是依赖物理知识,而是简单地复制了从复合结构中分离出的一个形状。

4000cc8c5fe3f7fcb8977ba018e75402.png

蛋白质序列三维结构的预测,改变了结构生物学领域的现状。该里程碑甚至导致了蛋白质折叠问题已经“解决”的言论。然而,蛋白质折叠问题不仅仅是从序列进行结构预测。目前,尚不清楚AlphaFold引发的革命是否能够帮助解决与蛋白质折叠相关的其他问题。本文中,我们评估了AlphaFold预测单个突变对蛋白稳定性(ΔΔG)和功能影响的能力。为研究这个问题,我们从蛋白质中提取了AlphaFold预测中单个突变前后的pLDDT和指标,并将预测的变化与已知的实验ΔΔG值进行相关性分析。此外,我们使用大规模的GFP单个突变数据集将相同的AlphaFold pLDDT指标与单个突变对结构的影响以及实验测定的荧光强度进行了相关性分析。我们发现AlphaFold输出指标与蛋白稳定性或荧光变化之间存在非常弱或没有相关性。我们的结果表明,AlphaFold可能不适合立即应用于蛋白质折叠的其他问题或应用。

往期精品(点击图片直达文字对应教程)

dd7efd00fca4753ac5cc36c192f3b44d.jpeg

e83eabe3f0f5f1a7292a3748bb1a662a.jpeg

f18f1c304696e4fdd67838e407e37428.jpeg

d1c331ab1c02a66c5666584e71bdc5e0.jpeg

d9beb18f1db0b55c32310a3167f2133c.jpeg

f41f6d8efcba01b11d429cc0be1e6e48.jpeg

01282ffd7bbe4721924e08f06cfe0fc5.jpeg

cfa5b260124ecb3d1d82e2dfe27a1560.jpeg

082c55431f77f911bdd912ae1fe28937.jpeg

6dd9e71be33be8734dcf8f4dc13393d0.jpeg

507da36f1155ab6555b9624dd89c3656.jpeg

55b6aacccdaa5884d101e63e4237ad14.jpeg

682d873c8e6f81dfec5f5c18f1c91ed2.png

2a41894357b3229fb6b9485cf5cdf81d.png

91dba36c8bd1a15003c877cd3fed07b1.png

33dc017f1e1ea75bf2086499fac35973.png

360f19f812e60bbba095a17a0816f360.jpeg

f7c55a0559b95df72eba65990523f839.jpeg

b0cd95efb7a81d18b6b15bb06c8636fd.jpeg

236c3e5fff493e42ccd99ce76551602a.jpeg

fac556b0cb9b503d7e3d2507f9ac9805.png

ab63ad0e921f0d8bf3a55fdeee49cfdd.png

b6cd521eca54484b207b083ff4950e6e.jpeg

cea47ca16bb8cf9b7fac60bdd97edde9.png

429b3408aa5653f0588bae8f653fba22.png

e6db3d0a49861d2efcc5dfe1c0f9320f.jpeg

da8a9009796ac84494e3bc328e0bcf55.png

7bd4b5eb183a7c876244c5a2e72d8821.png

机器学习

后台回复“生信宝典福利第一波”或点击阅读原文获取教程合集

4b6444b73c20e47f86c5d5f3d2a35d15.jpeg

013d1105fffd34437cb515a6d50f40dc.jpeg

7deb06bbd105f17b8518e09f4d9903e0.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/497915.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Doc2Bot: 达摩院推出多类型文档对话数据集

一、概述 title:Doc2Bot: Accessing Heterogeneous Documents via Conversational Bots 论文地址:Doc2Bot: Accessing Heterogeneous Documents via Conversational Bots - ACL Anthology 数据地址(大概5千多轮开源数据)&#…

用 Spark 预测回头客

访问【WRITE-BUG数字空间】_[内附完整源码和文档] 至此“淘宝双 11 数据分析与预测课程案例”所需要的环境配置完成。另外实际操作中发现在案例教程中存在一些小问题,比如教程中 Eclipse 版本为 3.8,但是在配置 Tomcat Server 时又要求配置 v8.0 版本&a…

【分布式技术专题】「授权认证体系」OAuth2.0协议的入门到精通系列之授权码模式

这里写目录标题 OAuth2.0是什么OAuth2.0协议体系的Roles角色OAuth定义了四个角色资源所有者资源服务器客户端授权服务器 传统的客户机-服务器身份验证模型的问题 协议流程认证授权授权码 OAuth2.0是什么 OAuth 2.0是用于授权的行业标准协议。OAuth 2.0专注于简化客户端开发人员…

从【连接受限】看Android网络

从连接受限看Android网络 现象摸索从通知开始是Handler发的通知看看NetworkStateTrackerHandler NetworkMonitor做了什么NetworkMonitor是一个状态机CaptivePortalProbeResult从何而来连接受限的直接原因 嗅探是怎样进行的ProbeThread 回过头看看InternalHanderregisterNetwork…

GRE 隧道协议

1.GRE协议简介 GRE(General Routing Encapsulation ,通用路由封装)是对某些网络层协议(如IP和IPX)的数据报文进行封装,使这些被封装的报文能够在另一网络层协议(如IP)中传输。此外 GRE协议也可以作为VPN的第三层隧道协议连接两个…

ES6之迭代器

文章目录 前言迭代器1.原生具备Iterator接口的数据(可用for...of遍历)2.工作原理3.自定义遍历数据 总结 前言 迭代器(Iterator) for…of遍历 迭代器 迭代器是一种接口,为各种不同数据结构提供统一的访问机制。任何数…

c++ 11标准模板(STL) std::vector (八)

定义于头文件 <vector> template< class T, class Allocator std::allocator<T> > class vector;(1)namespace pmr { template <class T> using vector std::vector<T, std::pmr::polymorphic_allocator<T>>; }(2)(C17…

智慧工地烟火识别算法 opencv

智慧工地烟火识别系统应用pythonopencv深度学习算法模型技术分析前端视频信息&#xff0c;智慧工地烟火识别算法模型主动发现工地或者厂区现场区域内的烟雾和火灾苗头及时进行告警。OpenCV的全称是Open Source Computer Vision Library&#xff0c;是一个跨平台的计算机视觉处理…

前端三剑客 - HTML

前言 前面都是一些基础的铺垫&#xff0c;现在就正式进入到web开发环节了。 我们的目标就是通过学习 JavaEE初阶&#xff0c;搭建出一个网站出来。 一个网站分成两个部分&#xff1a; 前端&#xff08;客户端&#xff09; 后端&#xff08;服务器&#xff09; 通常这里的客户端…

ASP.NET Core Web API用户身份验证

一、JWT介绍 ASP.NET Core Web API用户身份验证的方法有很多&#xff0c;本文只介绍JWT方法。JWT实现了服务端无状态&#xff0c;在分布式服务、会话一致性、单点登录等方面凸显优势&#xff0c;不占用服务端资源。简单来说&#xff0c;JWT的验证过程如下所示&#xff1a; &a…

基于微服务架构的水果销售系统的设计与实现

访问【WRITE-BUG数字空间】_[内附完整源码和文档] 整体上为微服务架构&#xff0c;使用 SpringCloud 技术&#xff0c;每个独立的服务为一个单独的 SpringBoot 工程&#xff1b;数据库使用 MySQL 数据库&#xff1b;分布式缓存使用 Redis&#xff0c;消息队列使用 Kafka。包括…

基于matlab的相控阵系统仿真场景可视化

一、前言 此示例演示如何使用方案查看器可视化系统级仿真。 二、介绍 相控阵系统仿真通常包括许多移动物体。例如&#xff0c;阵列和目标都可以处于运动状态。此外&#xff0c;每个移动物体可能都有自己的方向&#xff0c;因此当模拟中出现更多玩家时&#xff0c;簿记变得越来越…

是人就能学会的Spring源码教学-Spring的简单使用

是人就能学会的Spring源码教学-Spring的简单使用 Spring的最简单入门使用第一步 创建项目第二步 配置项目第三步 启动项目 Spring的最简单入门使用 各位道友且跟我一道来学习Spring的最简单的入门使用&#xff0c;为了方便和简单&#xff0c;我使用了Spring Boot项目&#xff…

解决NixOS在Vmware中无法自适应显示缩放问题

解决NixOS在Vmware中无法自适应显示缩放问题 此方法同样适用于所有虚拟机&#xff0c;主要解决的是 虚拟机界面显示无法自适应操作虚拟机时&#xff0c;过渡动画卡顿看视频时&#xff0c;分辨率不高&#xff0c;伴随卡顿 起因 在为 NixOS安 装完 Vmware Tools 后&#xff0c;…

2023年最新水果DAW编曲软件fl studio21 macOS - 21.0.3.3036简体中文版免费下载支持苹果M1/M2处理器

一直梦想制作自己的音乐(无论是作为一名制作人还是艺术家)&#xff0c;你可能会想你出生在这个时代是你的幸运星。这个水果圈工作室和上一版之间的改进水平确实令人钦佩。这仅仅是FL Studio 21所提供的皮毛。你的音乐项目的选择真的会让你大吃一惊。你以前从未有过这样的多才多…

【LeetCode】《LeetCode 101》第七章:动态规划

文章目录 7.1 算法解释7.2 基本动态规划&#xff1a;一维70. 爬楼梯&#xff08;简单&#xff09;198.打家劫舍&#xff08;中等&#xff09;413. 等差数列划分&#xff08;中等&#xff09; 7.3 基本动态规划&#xff1a;二维64. 最小路径和&#xff08;中等&#xff09;542. …

【项目经理】论项目经理的自我修养

项目经理的非职权领导力 文章目录 项目经理的非职权领导力一、权利的类型二、构成权利的三要素三、沟通是实施影响力的重要手段3.1 沟通的主要类型3.2 沟通的内容和形式3.3 沟通的主要困难 四、综合沟通协调的技巧4.1 常见的负面反馈4.2 沟通技巧 五、论项目经理的自我修养5.1 …

PyCharm2023.1下载、安装、注册以及简单使用【全过程讲解】

在使用PyCharm IDE之前&#xff0c;请确保自己的计算机里面安装了Python解释器环境&#xff0c;若没有下载和安装可以看看我之前的文章>>>Python环境设置>>>或者还可以观看视频讲解。 注意&#xff1a;本文软件的配置方式仅供个人学习使用&#xff0c;如有侵…

如何将PDF文件转换为Excel表格?这两个方法方便实用!

如何将PDF文件转换为Excel表格&#xff1f; 很多人在编辑和处理表格内容时&#xff0c;需要将PDF文件转换为Excel表格&#xff0c;以更好地修改和排版。虽然PDF文件往往起到展示整体效果的作用&#xff0c;但是PDF转Excel也是办公中老生常谈的文档处理操作。如果您还不知道如何…

Java架构中VO、DTO、DO、BO的区别与联系(超详解)

VO、DTO、DO、BO的区别与联系 前言一、概念1、VO (View Object)2、DTO(Data Transfer Object)3、DO(Data Object)4、BO&#xff08;Business Object&#xff09; 二、为什么会存在Vo&#xff1f;三、总结 前言 本博主将用CSDN记录软件开发求学之路上亲身所得与所学的心得与知识…