背靠背 Nature 新方向 - 蛋白质结构家族图谱的“潘多拉魔盒”

news2024/11/24 3:32:28

NBT - Foldseek快速准确搜索结构相似的蛋白,AlphaFold蛋白质数据库提供了一个快速的搜索工具

AlphaFold的极限:高中生揭示人工智能在生物信息学挑战中的缺陷

AlphaFold2开源了,不是土豪也不会编程的你怎么蹭一波?


164e39ec9e7c7694802f6d7cc781b506.png

对蛋白结构的大规模分析揭示了蛋白质中前所未见的结构单元和蛋白蛋白之间出乎意料的关联关系。

Google DeepMind利用AlphaFold神经网络预测了几乎所有已知蛋白的结构(超过2亿条记录),并存储于数据库AlphaFoldDB (https://alphafold.ebi.ac.uk/)。两篇Nature工作对该数据库进行了深度挖掘,揭示了全新的蛋白质结构、蛋白质在生命机器中惊奇的连接关系以及其他在几年前难以想象的洞见。

“多亏了AlphaFold,我们现在可以探索之前一无所知的整个蛋白质家族。” 西班牙巴塞罗那Josep Carreras白血病研究所(IJC)的计算生物学家Eduard Porta Pardo说,他并未参与2023年9月13日在《Nature》(IF2022=64.8)杂志发表的两项研究[1,2]。

8c5477f04d427bef367556c9559ac3ab.png

去年Google DeepMind利用AlphaFold从具有基因组序列的物种中预测了几乎所有已知蛋白的结构,在AlphaFold数据库(AlphaFold Protein Structure Database)中积累了近2.14亿条结构信息。该数据库由位于英国欣克斯顿的欧洲分子生物学实验室欧洲生物信息学研究所(EMBL-EBI)托管。

结构簇(Sructure cluster)

首尔国立大学的计算生物学家Martin Steinegger表示,很快科学家们发现AlphaFold数据库资源的使用非常方便,但其中很多科学家仅关注单一的蛋白质结构或某一家族的蛋白结构。而Martin Steinegger则对绘制整个数据库中的蛋白质的关联关系非常感兴趣,他说:“我认为探索蛋白质的结构宇宙到底有多大将非常有趣。”

为此,由Steinegger和瑞士苏黎世联邦理工学院(ETH Zurich)的计算生物学家Pedro Beltrao领导的团队开发了基于结构相似性的蛋白质快速比对工具,实现了对AlphaFold数据库中的蛋白结构比对,并鉴定了超过2百万个结构相似的蛋白“簇”[1]。

研究人员通常利用蛋白的氨基酸序列进行结构的比对。但与结构相比,在进化过程中,氨基酸序列更易于改变,这就限制了寻找远源蛋白的能力。Steinegger等分析发现通过比对蛋白质的结构识别出的蛋白“簇”的数量是利用序列比对所得“簇”的数量的10倍。

尽管研究人员才刚刚开始探索蛋白“宇宙”中这些新发现的“星系”(galaxies),但他们已经发现了惊人的蛋白质连接关系。例如,他们发现,用于检测人类和其他复杂生物体内的病毒DNA且可引发快速免疫反应的蛋白质与来自单细胞的细菌和古菌的蛋白质属于同一个蛋白簇,这种蛋白关系以前从未被揭示,Steinegger说。

对于超过三分之一的蛋白质簇,目前几乎一无所知。“我真的希望生物学家能为这个未知领域的研究贡献一份力量,”斯坦格尔说道。

未知的结构(Never-before-seen shape)

另一个团队采用了略有不同的方法来揭示蛋白质宇宙中的“暗物质”。瑞士巴塞尔大学的计算生物学家Joana Pereira,Janani Durairaj,Torsten Schwede和SIB瑞士生物信息学研究所及其同事为AlphaFold数据库中超过5000万最准确预测的蛋白结构创建了一个关系网络。他们利用这些分组来鉴定蛋白宇宙中的神秘角落[2]。

52d3f711684a582b371c95d2df998dfe.png

蛋白质的β桶结构。来源:Laguna Design/Science Photo Library

令人惊喜的是,他们发现了一种新型蛋白结构。由于该结构包含了一系列的发卡翻转(这种发卡翻转结构在β桶(Beta-barrel)结构中也存在)类似于一朵花的花瓣,因此研究人员将其称为“β花”(Beta-flower)。具有“β花”结构的蛋白质之间亲缘关系疏远,目前对他们的功能尚不清楚,研究该结构的Pereira表示。

8707aaa0448acf878db3d1f0cfecb45c.png

蛋白质的β花结构。来源:Durairaj, J. et al.

“这项工作实际上打开了蛋白质研究的潘多拉魔盒,我们必须决定优先考虑哪些项目。” Pereira 补充道。她和她的同事期望其他研究人员能够利用他们创建的网络来分析他们最感兴趣的蛋白如何适应更广泛的分子宇宙。

伦敦大学学院的计算生物学家Christine Orengo很高兴有新的方法来探索蛋白质宇宙。但她提醒道,有些高度准确的AlphaFold预测结构不一定是研究人员感兴趣的功能蛋白或功能域。Orengo表示,抛开这些异常,该方法仍然为研究者提供了探索新的蛋白质家族的宝库,“这一点非常令人兴奋。”

Google DeepMindAlphaFold团队的负责人John Jumper尽管没有参与这两项研究,但他很高兴看到研究人员开发出新的方法来探索他和他的同事们所释放的宇宙。他认为这些研究标志着一个新的、前所未有的蛋白质结构领域的开始,“我希望我们将看到更深入的研究成果。”

参考文献

[1]. Barrio-Hernandez, I. et al. Nature(2023)

[2].  Durairaj, J. et al. Nature(2023).

阅读原文内容

https://doi.org/10.1038/d41586-023-02892-z

往期精品(点击图片直达文字对应教程)

0140260e6b20de9a89a37b8215743260.jpeg

19a5eee01eaa67817f412caed38a4f97.jpeg

fcdfd562d233cbf7d992c168405618a9.jpeg

54467fb9e983ccb93f42d051e921a3fb.jpeg

4a577377bfe00e1f37cad8a26d603dc2.jpeg

e5bb9d1e623a662c54343dfebedbac3d.jpeg

867656cc0475202f688decfd74e0a695.jpeg

4b7b091f63086419ce8793a0effdfb2b.jpeg

1cd26ee3e0d4ce9a47160b0650ce5ac8.jpeg

e85b4424bdab467a2692b254494f312f.jpeg

095f36891710caccf977e1a26efbd27a.jpeg

95970de2975ace76a82394b45e3d77c5.jpeg

459bbbddb6d6130bd73a76b1a9bbbcbc.png

e066707458b8e44c24c509d097662a64.png

8bc41592dbc88c8abb192e83dbc71ec3.png

2c351dd162f99752cdccfb60c8bedcc8.png

8e7090cb3799df445619f89bcaa53335.jpeg

6c88ec079ecc4a7cb1cf889aea8a86ad.jpeg

aa6568945243e43cd420da5a619794d9.jpeg

f2ff0a8d3c8b902656cf777c9ffe0a21.jpeg

948c92579edbb8fd5cdba285fb605595.png

fc87d8a6a769e2e3560824d94ce562d6.png

e74bf297b91de8a214eee9e3183237ca.jpeg

bf98f747b87948c7dbd9f9401f57e420.png

57d5cb252febd05d2bd178b84822cefa.png

41fec898fc4cc952700e6056c504ced7.jpeg

8f3cfd0aced3325805d3e7a35ec9fd50.png

146865dd00b13d1afb188cdc01194c52.png

机器学习

b23fa4c1bc4d4dcdf79772df33ff74e4.png

970c177e9fc29cc76a7024c5b8f84b95.jpeg

57553ae390ecd68c991291f2a7f56920.jpeg

f702cdac43507df706693bd74b292db4.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1021954.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

对抗网络爬虫:反爬虫技术与策略详解

💂 个人网站:【工具大全】【游戏大全】【神级源码资源网】🤟 前端学习课程:👉【28个案例趣学前端】【400个JS面试题】💅 寻找学习交流、摸鱼划水的小伙伴,请点击【摸鱼学习交流群】 在今天的互联网世界中&a…

机器学习入门与实践:从原理到代码

💂 个人网站:【工具大全】【游戏大全】【神级源码资源网】🤟 前端学习课程:👉【28个案例趣学前端】【400个JS面试题】💅 寻找学习交流、摸鱼划水的小伙伴,请点击【摸鱼学习交流群】 在本文中,我…

PDF编辑内容怎么做?这几个方法快来了解

PDF(便携式文档格式)是一种常用的文档格式,但有时我们需要对PDF文件进行编辑,那么小伙伴们知道PDF编辑内容怎么做吗?下面将介绍几种编辑PDF的方法以及注意事项。 1.使用手机编辑PDF文档 最近有个小伙伴说由于工作经常…

模拟实现C语言--strcpy函数

模拟实现C语言–strcpy函数 文章目录 模拟实现C语言--strcpy函数一、strcpy函数是什么?二、使用示例三、模拟实现 一、strcpy函数是什么? strcpy函数是将字符串中的内容复制到另一个字符串中使用的库函数 char* strcpy(char * destination, const char…

【LeetCode热题100】--15.三数之和

15.三数之和 注意:最后答案中不能包含重复的三元组 使用排序双指针 可以使用三重循环枚举三元组,但是需要哈希表进行去重操作,得到不包含重复三元组的最终答案,消耗量大量的时间和空间 对于不重复的本质,保持三重循环…

【Linux学习笔记】 - 常用指令学习及其验证(下)

前言:本文延续上一篇文章【Linux学习笔记】 - 常用指令学习及其验证(上)对常用的指令进行介绍和验证。 一、mv指令 (1)功能:用来移动文件或者将文件改名 (2)语法及验证&#xff1a…

【QT--使用百度地图API显示地图并绘制路线】

QT--使用百度地图API显示地图并绘制路线 前言准备工作申请百度地图密钥(AK)安装开发环境 开发过程新建项目ui界面GPSManager类主窗口Map 效果展示 前言 先吐槽一下下,本身qt学的就不咋滴,谁想到第一件事就是让写一个上位机工具,根据CAN总线传…

OJ练习第177题——打家劫舍 IV(二分查找)

打家劫舍 IV 力扣链接:2560. 打家劫舍 IV 题目描述 沿街有一排连续的房屋。每间房屋内都藏有一定的现金。现在有一位小偷计划从这些房屋中窃取现金。 由于相邻的房屋装有相互连通的防盗系统,所以小偷 不会窃取相邻的房屋 。 小偷的 窃取能力 定义为…

人脸修复祛马赛克算法CodeFormer——C++与Python模型部署

一、人脸修复算法 1.算法简介 CodeFormer是一种基于AI技术深度学习的人脸复原模型,由南洋理工大学和商汤科技联合研究中心联合开发,它能够接收模糊或马赛克图像作为输入,并生成更清晰的原始图像。算法源码地址:https://github.c…

同步 -- 互斥锁

本篇文章基于Linux-6.5源码 建议:搭配Linux源码观看更佳 struct mutex {atomic_long_t owner;spinlock_t wait_lock; //自旋锁,该自旋锁的作用是保护后面的等待队列的原子性struct list_head wait_list; //等待队列 }; API接口 mutex_init 互斥锁初…

C语言入门Day_22 初识指针

目录 前言: 1.内存地址 2.指针的定义 3.指针的使用 4.易错点 5.思维导图 前言: 之前我们学过变量可以用来存储数据,就像一个盒子里面可以放不同的球一样。 这是一个方便大家理解专业概念的比喻。 在计算机世界里面,数据实…

海外ASO优化之提高应用曝光度的技巧1

作为应用程序的开发者,如何使我们的应用在众多竞争对手中脱颖而出?如何应用在App Store搜索中排名更高,以确保它符合App Store搜索中的搜索意图?这些都是我们要重点考虑的。 1、做好应用程序描述。 在填写应用描述之前&#xff0…

直线模组的常用语

在工业生产中,直线模组的叫法有很多种,对于新手小白来说,很容易就会被绕晕,今天我们就来简单说一下直线模组的常用称呼吧! 1、直线模组:与直线滑台同义,基本可以相互互换。直线模组一般是指可以…

编译原理.龙书学习1

第一章: 编译器:将程序翻译成一种能够被计算机执行的形式 解释器:解释器直接利用用户提供的输入执行源程序中指定的操作 一个编译器的结构 编译器将源程序映射为语义上等价的目标程序,这个映射过程由两部分组成:分析…

ApiFox衔接前后端开发人员,提升沟通效率实践

1. 为什么不用Postman而要使用ApiFox 1.1. Postman的问题(不便) 多系统数据不互通 API设计者、前端开发、后端开发、测试人员大量重复工作。 效率低 可视化程度低、操作不友好。 无法团队协作 单机离线使用为主,成员之间无法实时同步数据,无法协作。 …

Unity实现简易太阳系

开发环境:Unity 2022.3.5f1c1 Visual Studio 2022 太阳系相关星体:太阳、八大行星、月球 模拟星系:太阳系、地月系 功能:支持行星以太阳为中心,任意轴进行公转,此处演示同一平面。 a1-a8为公转轴&#xff…

需要每日温习的java八股文基础

一、java (1)集合 1.list:LinkedList、ArrayList和Vector ArrayList、LinkedList和Vector的区别,场景和扩容机制源码 LinkedList 接口实现类, 链表, 插入删除, 没有同步, 线程不…

网站降权的康复办法(详解百度SEO数据分析)

随着搜索引擎算法的不断升级,很多网站在SEO优化过程中遭遇到降权的情况。如果您的网站也遭遇到了类似的问题,不必惊慌失措。本文将为您详细介绍网站降权恢复的方法,包括百度SEO数据分析、网站收录少的5个原因、网站被降权的6个因素以及百度SE…

什么是顶点颜色

在3D模型的渲染中,除了贴图属性外,顶点颜色也是一种常见的材质属性。顶点颜色是指通过给模型的顶点分配颜色值来定义模型表面的颜色。 顶点颜色通常以顶点数据的形式储存,并且与每个顶点的位置信息相对应。在渲染过程中,顶点颜色会…

【性能测试】JMeter:集合点,同步定时器的应用实例!

一、集合点的定义 在性能测试过程中,为了真实模拟多个用户同时进行操作以度量服务器的处理能力,可以考虑同步虚拟用户以便恰好在同一时刻执行操作或发送请求。 通过插入集合点可以较真实模拟多个用户并发操作。 (注意:虽然通过加入集合点可…