登顶Nature 正刊!百度生物计算用AI首次实现mRNA领域重大进展

news2024/12/26 22:50:04

f9b74d1a572e580f661d80bb3f1efd6c.jpeg

1985年11月21日的《自然》封面,是一张来自中国的“地图”。这张地图是清代总兵陈伦炯所编撰《海国闻见录》中的插图,是中国人开始认知与探索世界的见证,而选用这张封面,是为了配合当期的特别文章《科技在中国》。

那时候,中国正处在改革开放的浪潮中,中国科技登陆国际视野还显得惊奇与稚嫩。

一转眼,38年过去,伴随着中国科技的飞速发展,越来越多的中国科研工作者、科研机构以第一作者的身份,登上被称作科学金字塔尖的《自然》。

5月2日,《自然》杂志正刊发表了百度在生物计算领域的突破性研究成果,并以“加速预览”(Accelerated Article Preview)形式最快发表。

4fd72fe9041f39cc5ad58f498332be87.png

在这篇题目为《Algorithm for Optimized mRNA Design Improves Stability and Immunogenicity》的文章中,提出了mRNA序列优化算法LinearDesign。其不仅开创了AI与生物、医疗等领域融合突破的诸多可能性,也为中国科技走向世界画上了新的一笔。

在这篇论文里,我们可以读到远超其成果本身的内容,比如AI的诸多可能性、一家科技企业的科学担当,以及中国科技走向世界的远大胸怀。

“出人意料”的生物计算

dfa1528fb31bbe6e13bfc47ce46c18ca.png

相信大家都知道,《自然》只收录那些在基础科学领域具有突破性与重大意义的研究。

或许可以说,百度在生物计算领域的探索,生动讲述了什么叫“永远不要低估AI的可能性”。

这件事要从新冠疫苗讲起,虽然疫情的阴霾已经悄悄过去,但这场疫情让全球看到了疫苗,尤其是mRNA疫苗在公共卫生事业的重要性。

所谓mRNA是一种天然分子,其可以产生靶标蛋白或免疫原,从而激活人体的特定免疫反应,以对抗各种病原体。并且其具有mRNA不带病毒成分、没有感染风险、研发周期短等重要优势,是人类对抗新冠疫情的杀手锏。

但如此重要的领域,在疫苗和药物研发中依旧有一些问题,比如如何才能高效设计出稳定、成药性更好的mRNA序列?

为了解决这个问题,百度基于在AI领域的积累“出人意料”地将AI技术与疫苗研发结合,研发出了登录《自然》杂志的LinearDesign算法。

这一算法运用自然语言处理中网格解析(Lattice Parsing)技术,对mRNA疫苗序列进行优化,从而提升疫苗的稳定性和有效性。

1684932989c1ab0529a623737ab7c35d.jpeg

(美国心脏病学家和基因组学家埃里克·托普(Eric J. Topol)在推特上分享百度LinearDesign算法)

这里划个重点,LinearDesign算法可以说是用语言学领域的知识去攻克了生物医疗上的难题。两个领域虽然不能说毫不相关,基本也是相隔万里,但是百度对AI技术的探索,却让二者完成了千里姻缘一线牵,LinearDesign算法由此诞生。

2020年5月,面对汹涌而来的疫情,百度研究院推出了全球首个mRNA疫苗基因序列设计算法LinearDesign,并宣布向全球疫苗研发机构及研究中心免费开放。LinearDesign能在16分钟完成新冠病毒的mRNA疫苗序列设计,极大加速新冠疫苗的研发效率。

以新冠病毒的Spike蛋白为例,若采用传统方法寻找一条稳定的mRNA序列,需要查看10632个mRNA序列,堪称天文数字,但用LinearDesign算法,却可以在11分钟之内找到最稳定的候选序列。

0f71c3b9780bf225db31fb3ed2c1fd43.png

2020年12月,百度凭借LinearFold和LinearDesign算法在新冠抗疫中的杰出贡献,荣获国际顶尖人工智能峰会The AI Summit举办的 AIconics奖项的首届“AI For Good(人工智能向善)”奖。

在应用价值之外,LinearDesign算法还展示了AI作为一种底层科学探索工具,在生物与医学领域的全新可能性。这种跨越学科的突破力,是《自然》杂志乃至全球科学界更为珍视的。

1264f07ddc869ec44c39397298196fdf.png

打开AI的深度与广度

为什么百度能把LinearDesign算法这种AI+生物计算研究做大做强?这可能是我们必须读懂的另一个关键信息。

其原因无他,千锤百炼而已。从2012年AI方兴未艾,到今天AI火爆全球,这期间百度对AI技术的坚持和探索是始终如一的。这种坚持,渗透到了AI技术的各方各面,包括基础设施研究、算法迭代,以及AI的跨学科融合。其中非常多的领域充满未知与挑战,也不符合传统意义上企业对短期利益的追求。但构建坚实的基础设施,探索前瞻性技术布局,却是一家企业赢得未来的关键。

4dcf9f5ce107297ebffba8877b600ff1.png

AI+生物计算,作为AI技术的延展性方向,更能体现出百度“淡化短期利益,着眼长期发展”的技术布局思路。生物计算可以解决蛋白质分析、新药研发等关键问题,其价值巨大,以新药研发为例,这个领域具有一种“3个10”特征,即10年、10亿美元、10万人才能研发出一种有效的新药,而如果用AI作为药物研发引擎,将可以极大程度改变新药研发的范式,带来难以估量的价值。

这条路价值虽大,但充满挑战,在短期内都难以实现商业回报,但百度依旧愿意依托AI技术与基础设施的优势,提前布局这条未来之路。早在2018年,百度就正式启动了计算生物方向的研究。几年过去,百度在这一领域已经构建了基础设施、算法、生态合围而成的立体创新版图,比如刚刚提到的LinearDesign算法、可以极大加快RNA结构预测速度的 LinearFold 算法,一系列创新开始勾勒出百度在生物计算算法层的差异化优势,而基于飞桨生态打造的生物计算平台-螺旋桨PaddleHelix,则开启了AI+生物计算底层开发工具的构建,为产学各界探索生物计算奠定了基础。面向产业生态,百度为产业提供了面向化合物分子、蛋白分子、基因组学信息等领域预训练大模型,将自身的技术优势积极投身到产学研协作当中。就像在AI基础设施层面,百度强调技术、生态与基础设施的并行,在生物计算领域,同样的战略落地方式也推动了百度自身与生物计算行业的积极发展。

企业进行跨学科探索与底层技术创新,强调长线程和重积累,只有构建出完整的技术序列、技术体系,才能在此基础上一鸣惊人。无论是在AI+生物计算领域,还是更为基础的AI技术上,长期主义,始终是百度的王牌。

这样的以重积累换取高效率的逻辑,展现在百度技术创新的方方面面。比如文心一言发布后的1个月内,完成了4次技术迭代,相较最初版本推理效率提升了10倍。这种技术迭代与产业化应用的效率从何而已?其中,飞桨支撑了文心一言从开发训练到推理部署的全流程,并且通过联合优化的方式,大幅提升了大模型的训练与推理。从中就可以看出,底层技术与工具链的长期积累,为新技术的高效率升级奠定了基础。

百度是如此打开AI技术的深度,中国科技也是如此打开走向世界的广度。

大国科技走向世界

91f1738c1a7decfc5c7e7ac9d6d08fdb.png

1985年11月,《自然》杂志探讨了中国当时在高能物理、空间探索、地震预测等领域的科研水平,向世界展示了一个具有蓬勃科研创新活力的中国。

2008年7月,《自然》借着北京奥运的机会发布了中国特刊,向世界介绍了“中国目前论文发表数量比除了美国以外的其他国家都要多”,确定了中国科研实力的地位与价值。

几十年来,《自然》里的“中国元素”,可谓与中国科技发展完美同频,比如在1997年时《自然》发表的原创科研论文中只有0.4%涉及中国作者,2017年已增至约15%。这个数字的变化,恰好佐证了中国科技走向全球的变迁。

在这个过程中,一个角色是不可或缺的,那就是科技企业在整体科研环境中扮演的角色。自信息革命以来,我们可以在欧美发达国家的科技版图中,看到很多重大创新都是由企业来完成。以AI+生物计算为例,DeepMind打造的AlphaFold2广受关注。而谷歌母公司Alphabet,已经在持续推动这一算法在医疗健康、新药研发等领域落地,打造了ChatGPT的OpenAI,也在AI疾病诊疗、AI蛋白质结构预测等领域进行着探索。

c3327982395a194c6d9edca7c35ad61f.png

从世界范围内的趋势来看,AI+生物计算这一重要领域,主要创新阵地应该在科技企业,并且需要以科技企业为核心,形成产学研互动的良性生态。而百度在生物计算领域的布局与进取态势,则在中国科技版图中补完了这一环节。

中国科技走向全球,走向科技自立自强,离不开企业科研能力的不断升级。从这个角度看,百度生物计算以第一完成单位身份在《自然》发表论文,可以看作一个新阶段的信号。1985年,是世界看到中国科技;2008年,中国综合科研能力跻身世界前列;今天,中国的科学家、学术机构、科技企业,都能作为第一作者登上《自然》,证明中国已经具备了多元化,立体化的科技能力。

中国科技的创新性和独特性,已经从学术界延伸到产业界,更具有世界眼光,更具有大国担当。

f103d90e1c9a08536c52c7e88902cfbe.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/490796.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

4 ROS2节点参数基础

4 ROS2节点参数基础 4.1 ROS2节点参数介绍4.2 使用C/C实现对节点参数的增删改查4.2.1 创建C/C节点参数的服务端4.2.2 创建C/C节点参数客户端 4.3 使用Python实现对节点参数的增删改查4.3.1 创建Python节点参数的服务端4.3.2 创建Python节点参数客户端 4.4 ROS2节点参数小结 其他…

2008-2020年上市公司能源消耗数据

2008-2020年上市公司能耗数据/上市公司能源消耗数据 1、时间:2008-2020年 2、指标包括:上市公司ID、证券代码、证券简称、资源名称、消耗量、单位 EndDate [统计截止日期] - YYYY-12-31 InstitutionID [上市公司ID] - null Symbol [证券代码] - 交易所…

[架构之路-187]-《软考-系统分析师》-5-数据库系统 - 操作型数据库OLTP与分析型数据库OLAP比较

OLAP与OLTP的区别? OLTP(Online transaction processing) 在线/联机事务处理。典型的OLTP类操作都比较简单,主要是对数据库中的数据进行增删改查,操作主体一般是产品的用户。 OLAP(Online analytical processing): 指联机分析处理。通过分…

Linux网络编程:三次握手 四次挥手

1. 三次握手 建立TCP可靠连接,只能是客户端先发起。 (1)SYN标志位为1,表示请求建立连接;ACK标志位为1,表示确认收到对方报文。 (2)seq为数据包序列号,ack为确认序列号。…

计算机视觉的应用4-目标检测任务:利用Faster R-cnn+Resnet50+FPN模型对目标进行预测

大家好,我是微学AI,今天给大家介绍一下计算机视觉的应用4-目标检测任务,利用Faster RcnnResnet50FPN模型对目标进行预测,目标检测是计算机视觉三大任务中应用较为广泛的,Faster R-CNN 是一个著名的目标检测网络&#x…

or-tools 应用案例分析:复杂作业车间调度问题

作业调度问题是常见的线性规划(整数规划)问题,其中多个作业在多台机器上处理。每个作业由一系列任务组成,这些任务必须按给定的顺序执行,并且每个任务都必须在特定的机器上处理。如何有效的利用所有的机器在最短的时间内完成所有的作业任务&a…

神经形态处理和自搜索存储如何降低联邦机构的网络风险

组织在边缘处理的信息量呈爆炸式增长。对于联邦机构和军队来说尤其如此,它们从设备、建筑物、船舶、飞机等中的移动设备和传感器生成大量数据。 寻找有效的方法来管理、使用和保护这些数据具有挑战性。但是有一个有效且具有成本效益的解决方案。神经形态处理和自搜…

c#笔记-数组

数组 声明数组 数组是一种可以声明多个同类型变量的数据结构,能替你声明多个变量。 并且其中的值可以通过索引动态访问,可以搭配循环批量处理这些值。 数组类型的写法是,在目标类型后加上一对中括号。 数组值没有字面量,需要构…

海天注塑机KEBA系统数据采集

本文章只针对海天注塑机的KEBA系统,因为其他注塑机厂家也用KEBA系统,他们的采集方式可能不太一样,所以后续有时间我将写其他文章来解释(默认你已经向海天采购了OPC组件)。 一、采集原理 采集软件(OPC cli…

electron+vue3全家桶+vite项目搭建【18】electron新建窗口时传递参数【url版】

文章目录 引入实现效果展示实现思路实现步骤1.调整主进程新建窗口的handle2.调整新建窗口函数3.封装url获取请求参数的工具 测试代码 引入 electronvue的项目中,我们通过传入页面路由来展开新的页面,就像vue-router的路由传参一样,我们可以利…

排序算法 — 桶排序

文章目录 桶排序介绍桶排序实现桶排序复杂度和稳定性桶排序复杂度桶排序稳定性 代码实现核心&总结 桶排序介绍 假设待排序的数组a中共有N个整数,并且已知数组a中数据的范围[0, MAX)。在桶排序时,创建容量为MAX的桶数组r,并将桶数组元素都…

【AUTOSAR】【通信安全】E2E

目录 一、概述 二、约束和假设 三、依赖模块 四、功能描述 4.1 开发错误 4.1.1 运行时错误 五、API接口 5.1 E2E Profile 接口 5.2 E2E其他接口 一、概述 该文档制定了PRS E2E协议的平台特定实现要求。这包括所使用的接口和数据类型。 E2E保护的概念假设在运行时应对…

探讨Redis缓存问题及解决方案:缓存穿透、缓存击穿、缓存雪崩与缓存预热(如何解决Redis缓存中的常见问题并提高应用性能)

Redis是一种非常流行的开源缓存系统,用于缓存数据以提高应用程序性能。但是,如果我们不注意一些缓存问题,Redis也可能会导致一些性能问题。在本文中,我们将探讨Redis中的一些常见缓存问题,并提供解决方案。 一、缓存穿…

云计算中的边缘计算技术及其应用

章节一:云计算和边缘计算的简介 随着互联网的发展,数据中心的规模不断扩大,云计算也成为了越来越受欢迎的计算模式。但是,云计算存在着一些问题,比如延迟较高,网络瓶颈,数据隐私和安全性等等。…

Canny边缘检测算法

文章目录 前言1、Canny边缘检测算法2、代码1函数 3、代码24、基于tensor数据的代码 前言 最近在向卷积神经网络里的数据预处理和数据增强部分加这个函数,记录一下。 1、Canny边缘检测算法 Canny边缘检测算法是一种经典的边缘检测算法,其基本原理如下&a…

榜单!直接式TPMS前装搭载率突破60%,哪些厂商在领跑

2016年,《乘用车轮胎气压监测系统的性能要求和试验方法》通过强制性国家标准技术审查;根据规定,自2020年1月1日起,所有中国市场在产乘用车将开始实施强制安装TPMS(胎压监测系统)的要求。 目前,…

vue项目前端解决跨域问题

在前后端分离项目中,跨域是一定会出现的问题,本文主要介绍跨域问题的解决思路,以及在vue项目中如何使用代理的方式在前端解决跨域问题,同时提供一个后段解决的方案。 1、产生原因 跨域问题产生的原因是浏览器的同源策略。浏览器同…

哪款蓝牙耳机便宜又好用?2023公认质量最好的蓝牙耳机推荐

哪款蓝牙耳机便宜又好用?现如今,市面上的蓝牙耳机越来越多,在选择增多的同时也有着不小的困惑,不知道哪款好用。针对这个问题,我来给大家推荐几款质量最好的蓝牙耳机,一起来看看吧。 一、南卡小音舱Lite2蓝…

安装kali虚拟机

1:kali是什么? kali 是由 Offensive Security 公司开发和维护的。它在安全领域是一家知名的、值得信赖的公司它甚至还有一些受人尊敬的认证,来对安全从业人员做资格认证。Kali 也是一个简便的安全解决方案。Kali 并不要求你自己去维护一个 Linux 系统&…

u盘中病毒文件被隐藏怎么恢复?看看这三种方法

U盘是我们日常生活中常用的存储设备,但是如果U盘被病毒感染,可能会导致文件被隐藏或丢失。被病毒隐藏的U盘文件给我们的生活、工作带来了很大的麻烦,因此必须马上采取行动来恢复这些文件。 而解决“u盘文件被病毒隐藏如何恢复正常”的问题原来…