生物医药是国家“十四五”规划中明确的战略性新兴产业之一。长三角地区是中国生物医药产业的排头兵,也是《“十四五”生物经济发展规划》的“生物经济先导区”之一。据《上海市生物医药产业投资指南》显示,2022 年上海市生物医药产业在 I 类国产创新药数量、生物医药领域上市企业数量、AI 制药企业落户数量上,均位居全国第一。近年来,上海、南京、杭州、苏州等多地政策支持进一步加码,推动生物医药产业高质量发展。
长三角地区也是我国人工智能发展的前沿。在 AI 大模型引领的新一轮科创浪潮中,人工智能科技与生物医药产业的融合创新不断加速。杭州立德百克生物医药科技有限责任公司、索智生物科技(浙江)有限公司等生物医药领域企业率先引入百度飞桨螺旋桨( PaddleHelix )和文心生物计算大模型的领先技术,攻坚业内痛点,打造出令人瞩目的标杆成果。
百度飞桨螺旋桨( PaddleHelix )是基于飞桨深度学习框架打造的“ AI+生物”计算平台,提供文心大模型-生物计算大模型能力,已开放多个算法模型,覆盖小分子药物筛选、多肽/蛋白药物设计、mRNA 疫苗/药物设计等技术,面向新药研发、疫苗设计、精准医疗等场景,为生物医药领域的创新药企、医药技术提供商、科研机构、生物科技公司等提供全面的算法工具和技术方案。
创新药企立德百克联合百度飞桨螺旋桨,提出了开发新机制的乳腺癌创新药的方法,运用大模型底座以及 HelixVS 等技术,已经找到具有潜力的 6 个活性小分子,未来有望开发出解决临床耐药性和副作用进一步降低的新型乳腺癌治疗药物。
索智生物是一家专注自身免疫疾病新药研发初创公司,通过 AI 技术实现差异化产品创新和研发效率提升。索智生物在多个领域与飞桨螺旋桨合作,其中 ADMET 性质预测大模型 HelixADMET ,已经整合到索智自身的 AI 药物发现平台( AIxMol®️),并成功应用于其所有在研项目,有效地帮助索智提升合成测试湿实验成功率,进而提高整体研发效率。HelixADMET 大模型可在 60 秒内计算 1000 个分子的 ADMET 相关指标。这对快速分子评估将起到重要的作用,这一重要药物性质评估平台有望给广大药企带来帮助。
高效锁定 6 个分子
为世界第一大癌症加速研发首创新药
根据世卫组织发布的数据,早在 2020 年,乳腺癌就在全球新发病例上超过肺癌,成为世界第一大癌症。我国是全球乳腺癌发病人数最多的国家,每年新发病例数接近 42 万。CDK4/6 抑制剂是目前治疗乳腺癌最为畅销的药物。但 CDK4/6 抑制剂在给广大患者带来福音的同时,也存在着“瑕疵”,比如难以避免的产生了不同程度的耐药性以及临床副作用,而且同质化竞争异常激烈。这就要求跳出赛道,研发全新的治疗药物。
立德百克聚焦于世界前沿的疾病模型和靶点药物开发领域,为创新药物的早期开发提供助力服务。针对现有乳腺癌药物的不足,立德百克联合百度飞桨螺旋桨提出了开发新机制的 CDK4/6 抑制剂乳腺癌药物的方法,另辟蹊径利用 CDK4/6 的激酶活性必须依赖于自身同 CCND(细胞周期素 D )形成复合物这一关键特性,开发出能阻断 CDK4/6-CCND 蛋白-蛋白相互作用( PPI )的小分子化合物,同样可以起到使 CDK4/6 激酶失去活性,并因此抑制乳腺癌细胞生长。目前已找到 6 个高潜力分子,为新药物的研发带来了曙光。
杭州立德百克生物医药总经理王紫壹介绍道,“百度拥有国内领先的 AI+药物研发的技术能力,特别是文心生物计算大模型在国内是非常领先的,运用这些技术能力,飞桨螺旋桨平台帮助我们更高效的找到苗头化合物分子,这大大提升了我们药物发现的效率。”
具体来说,文心生物计算大模型的虚拟筛选流程算法 HelixVS ,能高效实现千万/亿级别大规模的小分子虚拟筛选。对比传统分子对接工具,HelixVS 能够多找到 40% 以上的活性分子,同时在单机上运行的速度可提升 5 倍。在本次项目中,仅用一个 780 万的虚拟筛选库,就成功筛出了 110 个潜在的候选分子。
立德百克对筛选出的化合物进行活性检测,从 110 个分子中采购了 40 个进行湿实验检测,最后发现有 6 个高潜力分子,其中3个化合物能同时打断 CDK4/6-CCND 蛋白-蛋白相互作用,还有 3 个化合物能打断 CDK4-CCND 蛋白-蛋白相互作用。目前,双方团队正对这些化合物做更进一步的研究,创新药物有望在不久的将来问世。据介绍,相比于现有 CDK4/6 抑制剂,新型药物属于机制创新的首创新药,具备更优的特异性,并在耐药性与潜在副作用上进一步减弱,这将为广大乳腺癌患者带来福音。得益于这些优势,新型药物也将有望打开可观的市场空间。
60 秒计算 1000 个分子相关指标
化合物成药性预测迎利器
索智生物致力于融合 AI 技术和新药研发能力,在自身免疫疾病领域进行高效的差异化新药研发。索智生物特别强调化合物成药性预测。数据显示,40-45% 临床试验的失败归结于候选化合物的高毒性和低类药性。而 ADMET 正是衡量化合物成药性最重要的参考指标。
受到 ADMET 自身极高的复杂性、湿实验的高成本等因素影响,业内现有的解决方案很难构建一个具有丰富信息量的化合物表征模型。针对当前主流分子建模方法的局限,飞桨螺旋桨的化合物通用表征模型 HelixGEM ,在业界首次引入化合物三维空间信息,并引入预训练技术,利用大量无标注的化合物数据,通过自监督学习,构建化合物表征的底层能力,在 14 个化合物属性的基准数据集中取得了最佳表现。
索智生物创始人 CEO 许大强表示,“索智生物将飞桨螺旋桨基于文心 HelixGEM 构建的 ADMET 成药性预测模型( HelixADMET ),整合到索智 AI 药物发现平台 AIxMol®️ 上,应用在多个药物研发的实际产品管线中,加速发现候选药物和推进其管线进程。”
目前,该模型可在 60s 内计算 1000 个分子的 ADMET 相关指标。对比国内外多个知名的 ADMET 预测软件,模型有更高的准确率,计算的指标也更多,可以一次性预测超过 50 种 ADMET 相关指标,且综合效果超过竞品 4% 以上。该案例还入选了中国信通院 2022 年大模型优秀应用案例。
当 HelixADMET 预测模型应用于化合物优化/筛选阶段,能辅助决策优先进入临床的化合物,规避后期的可能风险,减少盲目实验的概率,就可省下大量的时间和资金投入,显著提高新药研发效率。
百度飞桨螺旋桨生物计算平台涵盖文心生物计算大模型技术,面向小分子、蛋白多肽、RNA 等场景提供服务。在长三角这片生物医药热土上,飞桨螺旋桨正与创新药企、医药技术提供商、科研机构、生物科技公司等不同类型的行业生态伙伴展开深入合作,涉及 AI 制药技术、AI 技术落地药物研发管线、交叉学科人才培养等方面,全面赋能产业发展。
而百度文心大模型也形成了系统化的大模型技术体系,包括自然语言处理、视觉、跨模态、生物计算等大模型,最近火爆的知识增强大语言模型文心一言就是其中一员。文心一言将会通过百度智能云对外提供服务,帮助企业构建自己的模型和应用。
在科研领域,百度与浙江大学上海高等研究院合作,借助 AI 技术加速分子动力学模拟和化合物的逆合成,打造完整的药物研发从生成到合成的全链条工作。百度还和斯微生物开展关于 mRNA 疫苗序列设计算法 LinearDesign 的生物实验研究,充分验证了该算法的有效性与产业应用价值,该成果在国际顶级学术期刊《 Nature 》正刊发表。在技术落地应用方面,百度运用在 AI 药物研发领域的技术优势,帮助多家 Biotech 公司成功找到多个高活性的苗头化合物,推进癌症及自身免疫性相关的疾病的药物的研发。
未来,百度飞桨螺旋桨平台与文心生物计算大模型,将继续夯实生物医药产业智能化的基座,通过技术赋能产业,“深耕长三角、服务全国、面向世界”,助推生物医药这项关系国计民生的朝阳产业高质量发展。