Nat Biotechnol -- 生成式AI进军更高效价抗体

news2024/11/24 22:46:12

类似于ChatGPT的语言模型已被应用于改进针对COVID-19、埃博拉和其他病毒的抗体疗法。

代码看不懂?ChatGPT 帮你解释,详细到爆!

658b86a9c3ba22d6604819d69fb6e647.png

单克隆抗体(Y形)与SARS-CoV-2病毒纤突蛋白(红色)上的结合位点(艺术家的创作)。来源:Juan Gaertner/Science Photo Library。

在疫情高峰期间,研究人员争分夺秒地开发了针对COVID-19的首批有效治疗“药物”:从康复者血液中分离出的抗体分子。

科学家已经证明,生成式人工智能(AI)可以快速获得效价更强的病毒(如SARS-CoV-2和埃博拉病毒)抗体序列,为耗时费力的抗体筛选提供了捷径。该成果发表在《Nature Biotechnology》杂志上,将类似于ChatGPT AI平台的"神经网络"应用于抗体设计,这是AI在蛋白质工程领域应用的一部分。

8e13981d95fe22794779cf4c88f6ebc3.png

每年包括乳腺癌和类风湿性关节炎在内的疾病抗体药物在全球销售额超过1000亿美元。研究人员希望,生成式AI(可以根据学习的模式创建文本、图像和其他内容的神经网络)将加速开发,促进对受传统设计方法所限的靶向抗体药物的研发。

“人们对发现和改造抗体以及如何使抗体效价更高有着浓厚的兴趣,”加利福尼亚州斯坦福大学的生物化学家Peter Kim说道,他是《Nature Biotechnology》论文的作者之一。

免疫武器(Immune weapons)

抗体是免疫系统对抗感染的关键武器之一。这些蛋白质备受生物技术产业的青睐,部分原因是它们可被设计改造为与几乎任何可以想象的蛋白质结合,以调控其活性。但是生成具有有效性能的抗体并在这些基础上进行改进涉及到“大量的低效且耗时的筛选”,斯坦福大学的计算生物学家Brian Hie说,他是这项研究的共同负责人。

为了探索生成式AI工具能否削减一些繁重的工作,Hie、Kim以及他们的同事使用了名为蛋白质语言模型的神经网络。这些模型类似于构成ChatGPT等工具基础的“大型语言模型”。但是,蛋白质语言模型不是被输入大量文本,而是在数千万个蛋白质序列上训练而得。

其他研究人员已经使用这样的模型设计了全新的蛋白质,并实现高精度地预测蛋白质的结构。Hie的团队使用了由位于纽约市的科技巨头Meta旗下的Meta AI的研究人员开发的蛋白质语言模型,为抗体序列推荐少量的突变。

这个模型学习了近1亿个蛋白质序列,只在其中几千个抗体序列中进行了训练。尽管如此,该模型计算得出的抗体序列中有出乎意料的高比例可以增强针对SARS-CoV-2、埃博拉和流感病毒的抗体与其目标的结合能力。

2697e0fa68c39900a20bacfdbf305fbe.png

对于已获批用于治疗埃博拉病毒的疗法和一种COVID-19治疗方法进行了改进,提高了这些抗体分子识别并阻止病毒用于感染细胞的蛋白质的能力。(这种针对COVID-19的抗体对Omicron及其子变异体无效,Hie说,AI引导的改变也不太可能恢复有效性。)

Kim表示,许多建议的抗体改变发生在与其靶标相互作用的蛋白质的区域之外,这通常是抗体工程努力的焦点。他补充说:“该模型正触及到一些信息,即使是抗体工程领域的专家通常也难以理解。对我来说,这是一个‘哇塞,这里到底发生了什么?’的时刻。”

全新蛋白质(Completely new proteins

“这是一个人们将用来改进他们的抗体的工具,”英国牛津大学的免疫信息学研究员Charlotte Deane说。“我认为这真的很酷。”但她补充说,许多研究人员希望生成式AI不仅能简单地改进现有的抗体,还能完全创造出新的抗体来结合既定的目标。

Nabla Bio的联合创始人Surge Biswas说,这种能力可以帮助研究人员开发针对其他抗体设计方法难以作用的分子靶点的药物。Nabla Bio是一家总部位于马萨诸塞州波士顿的公司,致力于解决这一挑战。

例如,AI可以帮助解决G蛋白偶联受体等一系列蛋白质的设计问题。G蛋白偶联受体是一类嵌入在细胞膜中的蛋白质家族,与神经系统疾病、心脏病和许多其他疾病有关。Biswas说,生成式AI也可以帮助设计能够结合多个靶点的抗体药物,如肿瘤蛋白和可以杀死这种肿瘤的免疫细胞。

斯坦福大学的生物工程师Possu Huang说,蛋白质语言模型非常强大,对现有蛋白质(包括抗体)的优化非常出色。但是,仅在蛋白质序列上训练的模型可能难以完全创造出可以识别指定蛋白质的全新抗体。

研究人员表示,他们正取得进展。华盛顿州温哥华的生物技术公司Absci于3月份在bioRxiv server上发布的预印本中报告称,他们已经取得了使用AI创造新抗体的第一步。通过结合蛋白质序列和实验数据的模型,他们为用于治疗乳腺癌的一种抗体药物的几个重要区域生成了新设计。

设计全新抗体的一个重要挑战是它们识别特定目标的能力依赖于抗体结构中的松弛环(floppy loops)。研究人员说,这些相互作用已经证明很难用AI来建模。

去年,Huang的团队开发了一个生成式AI工具,以创造出能够通过松弛环结构强烈结合指定目标的蛋白质(例如蛇毒)。Huang说,同样的方法可以帮助创造全新的抗体,但这可能需要比目前可获得的关于抗体与靶点的相互作用的数据更多。

“我认为没有人真正解决了这个问题,”Biswas补充道。

5078cc32b7c8ec747fd614c911b3f23f.png

自然进化必须探索大量可能的序列以获得具有有利但罕见突变的机制,这表明学习自然进化策略可能指导人工进化。在这项研究中,我们报告了常规的蛋白质语言模型能有效地通过建议演化可行的突变来进化人类抗体,尽管该模型没有提供任何关于目标抗原、结合特异性或蛋白质结构的信息。我们使用语言模型指导亲和力成熟化对七种抗体进行了进化,仅在两轮实验室进化中对每种抗体筛选获得了20个或更少的变体,将4种临床相关的高度成熟抗体的结合亲和力提高了7倍,将3种未成熟抗体的结合亲和力提高了160倍,同时许多设计还表现出有利的热稳定性和对埃博拉病毒和严重急性呼吸综合症冠状病毒2(SARS-CoV-2)假病毒的病毒中和活性。提高抗体结合的模型还可以指导在不同的蛋白质家族和选择压力下高效地进化,包括抗生素抗性和酶活性,表明这些结果具有广泛的适用性。

阅读原文内容

https://www.nature.com/articles/d41586-023-01516-w

查看原文信息

https://doi.org/10.1038/s41587-023-01763-2

往期精品(点击图片直达文字对应教程)

9717a2f5bf40505e159bf3a3d29c9394.jpeg

300ce917fd87ef53b2a1f99fc1ee9aef.jpeg

2f7397ed43af8819eb0437a0b0b37d3d.jpeg

c60986ffad8b5a13c67b83b0d76266e3.jpeg

59ed05f4799e331e3a48b18ca307b8d3.jpeg

915dcb3749cd0695b5a50e82c56a07cf.jpeg

90a67134441d4ca98d1b16ae01350abb.jpeg

90ebc6958ca2883ee8e81f9d4731258a.jpeg

45aa6c8afd95253c8358d272034f400f.jpeg

f1258bd65f86180321a0c798d8287925.jpeg

3fe67e0da2d3cf51a83579bc25a0e7a8.jpeg

e0d8e775389c2a4d1ed7a5dd7f75d9b7.jpeg

46729b23dad8f0a9ed9227c1047c2d79.png

c0ebad494808669c8f0d39addfbd0882.png

6ac8f4b593adcf4cb6f449a6f05c9bca.png

a1598a3f0504ca602f3dfa61fb998691.png

4bc9955f5eaaa7645b4d6e31333ce446.jpeg

3d8765a608cd00f23142412174f972c9.jpeg

e1dcddf314a1eee80affa6745cc908f3.jpeg

e0c413f31654e3c040d4a8ae1dbf9f90.jpeg

23d985bc619b84aa1300d9b3a076c348.png

a7835bb4217ec94c1ae36d6ce7cc40ab.png

caa1f2589d4fc78d270407fa92b7cbd6.jpeg

02665d05baf01662c5bff5baaa116d5f.png

f152b4b921615b76b852ed6fef8c30dc.png

e2fe45f4176248168bcb8064d2fcc924.jpeg

8d0c729de2199815587132c58a497987.png

aa5d63fe37554b21cd635e141a23abb0.png

机器学习

后台回复“生信宝典福利第一波”或点击阅读原文获取教程合集

0dc4ab609ec04c28e144670ea531a3b3.jpeg

9662111b20de7996af5ef61fe164ab25.jpeg

cae19d12eec779b64da56e45b97c7796.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/614740.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

长光程气体吸收池的真空压力精密控制解决方案

摘要:目前用于气体吸收池真空压力控制的压力控制器存在有残留气体和无法进行高真空测量的问题,无法进行微量气体的光谱分析。为此,本文提出了动态平衡法的解决方案,即采用两个高速真空低漏率的电子针阀分别调节进气和出气流量&…

02_类加载子系统

目录 1、Jvm内存结构概述二、类加载器与类的加载过程1、类加载器子系统的作用2、类的加载过程 三、类加载器的分类1、启动类加载器2、扩展类加载器3、应用程序类加载器4、用户自定义加载器5、获取ClassLoader的几种方式 五、双亲委派机制1、什么是双亲委派机制2、双亲委派机制的…

Windows上SVN迁移至Linux

1.从windows导出svn文件 bat脚本 echo offsvnadmin dump E:\Repositories\3goodsoft_carbon_admin > D:/test/3goodsoft_carbon_admin.dump svnadmin dump E:\Repositories\3goodsoft_android > D:/test/3goodsoft_android.dump svnadmin dump E:\Repositories\3g…

chatgpt赋能python:Python如何在指定目录下创建文件

Python如何在指定目录下创建文件 Python是一种流行的编程语言,因为它易于学习、易于使用和非常灵活。其中一个常见的任务是在指定目录下创建文件,这在编写应用程序或脚本时经常需要。在本文中,我们将介绍使用Python在指定目录下创建文件的方…

第05章 数组

一 数组的概述 1.1 为什么需要数组 需求分析1: 需要统计某公司50个员工的工资情况,例如计算平均工资、找到最高工资等。用之前知识,首先需要声明50个变量来分别记录每位员工的工资,这样会很麻烦。因此我们可以将所有的数据全部…

chatgpt赋能python:Python如何取消空格

Python如何取消空格 在Python编程中,取消字符串中的空格是一个常见的需求。特别是在进行字符串处理和数据清洗时,取消空格可以方便数据的分析和处理。在本次文章中,我们将介绍使用Python语言如何取消字符串中的空格,以及一些常见…

如何将会议录音转文字?你知道如何将会议录音转文字吗?

会议录音转文字的需求在现代工作和生活中变得越来越重要。随着会议的频繁举行,我们常常需要记录会议内容以便后续查阅和分析。而传统的手动记录方式效率低下且容易出错。幸运的是,现在有许多会议录音转文字的应用程序可供选择,它们可以将会议…

uniPush2.0踩坑实录

首先,按照下面链接,把预备工作做完,基本可以实现dcloud后台网页推送: uniPush2.0 消息推送_没有白天的CXY的博客-CSDN博客 第二步,走完本流程后,会遇到各种坑,一个一个来踩: 第一坑…

龙芯2K1000实战开发-处理器硬件接口测试(下)

文章目录 概要整体架构流程技术名词解释技术细节小结概要 提示:这里可以添加技术概要 龙芯 2K 集成了 USB、SATA、PCIE 等高速串行接口,在板级测试时需要按照相应的 规范发出测试波形。本文档对这些接口分别介绍了发出测试波形的方法 整体架构流程 提示:这里可以添加技术…

电子企业如何快速部署一套MES生产管理系统

电子企业如何快速部署一套MES生产管理系统 引言 在数字化时代,电子企业的发展离不开高效的生产管理。MES生产管理系统是生产管理的核心工具,可以帮助电子企业提升生产效率和产品质量。本文将介绍电子企业快速部署一套MES生产管理系统的步骤和优势&…

C++算法:排序之三(堆排序)

C算法:排序 排序之一(插入、冒泡、快速排序) 排序之二(归并、希尔、选择排序) 排序之三(堆排序) 排序之四(计数、基数、桶排序) 文章目录 C算法:排序二、比较…

全排列--回溯

1题目 给定一个不含重复数字的数组 nums ,返回其 所有可能的全排列 。你可以 按任意顺序 返回答案。 示例 1: 输入:nums [1,2,3] 输出:[[1,2,3],[1,3,2],[2,1,3],[2,3,1],[3,1,2],[3,2,1]]示例 2: 输入&#xff1a…

关于Spring中自带的@Schedule实现自动任务

SpringBoot中自带了一个能够实现定时任务的注解Schedule 如果定时任务比较简单,则可以使用SpringBoot中自带的Schedule,但是如果任务调度很复杂的话,就建议使用Quartz组件了。 说一下这个Schedule注解怎么用? 基本使用 第一步&a…

Centos8之系统升级

一、centos8系统简介 CentOS 8是一个基于Red Hat Enterprise Linux(RHEL)源代码构建的开源操作系统。它是一款稳定、可靠、安全的服务器操作系统,适合用于企业级应用和服务的部署。CentOS 8采用了最新的Linux内核和软件包管理系统&#xff0c…

chatgpt赋能python:Python如何分行——提高代码可读性和效率的必备技能

Python如何分行——提高代码可读性和效率的必备技能 什么是分行? 分行,即将一行长代码分为多行,使得代码更加易读、易维护、易修改。 Python作为一门高级编程语言,具有简洁、易读、高效的特点。但在实际编程过程中,…

Amazon Device EDI 数据库方案开源介绍

近期为了帮助广大用户更好地使用 EDI 系统,我们根据以往的项目实施经验,将成熟的 EDI 项目进行开源。用户安装好知行之桥EDI系统之后,只需要下载我们整理好的示例代码,并放置在知行之桥指定的工作区中,即可开始使用。 …

C++调python程序示例

背景 平台:Xavier nvidia AGX板子 编写c程序测试单目3D目标检测DEVIANT(https://blog.csdn.net/qq_39523365/article/details/130982966?spm1001.2014.3001.5501)python算法的过程。代码如下: 文件结构 具体代码: …

基于 prefetch 的 H5 离线包方案 | 京东云技术团队

前言 对于电商APP来讲,使用H5技术开发的页面占比很高。由于H5加载速度非常依赖网络环境,所以为了提高用户体验,针对H5加载速度的优化非常重要。离线包是最常用的优化技术,通过提前下载H5渲染需要的HTML/JS/CSS资源,加…

如何用Arcgis做一个地区的温度或降水量分布图

1.首先需要拥有一张shp格式的研究地区的矢量区域图(很多网站都可以下载到全国各地区县域或者省域界线的矢量图,比如小木虫),以山西省为例: 2.导入本研究区域样地或样点的经纬度、温度(或降水)的csv格式数据…

我与 InsCODE AI 创作助手的一次对话

本文由 大侠(AhcaoZhu)原创,转载请声明。 链接: https://blog.csdn.net/Ahcao2008 我与INDCODE AI 创作助手的一次对话 🧊摘要🧊前言🧊对话内容🧊结束语 🧊摘要 本文介绍了 CSDN 嵌入式INSCODE AI 创作助手…