国药集团动物保健股份有限公司(简称“国药动保”)是专业从事动物保健产品研发、生产和销售的国家高新技术企业,是国内少数几家具备新产品原创能力的动物保健企业。其中,猪圆环病毒灭活疫苗等市场份额位居行业前列。
“猪圆环病毒类疫苗是我们的拳头产品,疫苗的上市速度、有效性及普惠的价格得到了市场的认可,市场份额位居行业前列。”国药动保营销中心总经理介绍到。
在新疫苗研发工作中,蛋白质结构解析被视作先决条件。传统解析蛋白质结构的方法主要有三种:即核磁共振、X射线衍射学、冷冻电镜三维重构。但这三种方法,往往依赖大量试错和昂贵的设备,不仅对实验人员的技能、设备精准度要求极高,而且检测时间也需要耗费数月甚至数年。其高额的投入制约了新型疫苗的研发速度和结构疫苗学的发展。
近年来,人工智能技术不断深入科学领域,极大提高了人们对自然现象进行建模和解析的能力。自2020年起,AI技术逐步被应用于蛋白质三维结构解析,其分析精度达到了结构生物学实验的测量精度。
“传统的冷冻电镜方式,我们获得蛋白质结构主要需要经过生物制样、样品冷冻、电镜拍摄、数据分析几个关键环节,进行一次完整的流程,至少需要耗费十多天,并且还是每个环节都顺利进行的情况;此外,一个疫苗环节的研发过程中,需要反复多次这样的环节。对比AI技术的引入后,蛋白质的结构可通过AI技术进行解析,关键环节压缩到基因测序、蛋白质预测两个环节。我们在动物疫苗的研制中引入AI技术,希望使用业界一流的AI平台,高效的进行疫苗的研发。” 国药动保研发中心主任表示。
自2022年下半年开始,国药动保就陆续与相关的供应商进行了接触与交流,希望能够找到一个既满足企业当前的需求、同时又具有良好经济性的解决方案。通过多方了解和比较,“思符(SiFold)蛋白质结构预测平台”(简称“思符”)进入国药动保选择的范围。
“思符”是华为与武汉伯生科技基于昇腾AI联合研发,推出的可应用于生物医药研发的AI蛋白质结构预测平台。该平台依托于昇腾AI,实现了一键式蛋白质结构预测功能,在支持超长序列结构预测的同时,提供多序列结构预测、AI预测功能合作定制、进化的AI预测体系等服务。在武汉人工智能计算中心、昇腾AI异构计算架构CANN的支持下,思符已成功实现3800+蛋白质氨基酸长度的预测。而自然界已知的蛋白质氨基酸长度基本不超过3000,因此可满足绝大多数场景需求。以典型长度(900蛋白质氨基酸长度)为例,预测精度与AlphaFold2模型持平,预测效率相较业界同类方案提升两倍多。
经过综合考量,国药动保最终选择思符平台进行新一代猪圆环病毒疫苗的研发。在对猪圆环病毒蛋白质结构的解析中,思符依托武汉人工计算中心获取澎湃算力,大幅提升分析的能力和效率:
- 位于中间层的昇腾AI异构计算架构CANN,为模型推理提供了加速引擎,在算子融合方面实现网络中计算单元的优化整合;
- 在内存优化方面完成模型特征图的有效内存排布;
- 在混合精度计算方面实现不同精度的计算分配。
多种技术创新充分释放硬件算力,不断优化AI模型性能,极大提升了AI蛋白质结构预测模型的效率。
(基于昇腾平台的蛋白质结构预测效果)
(金色为真值,粉色为预测效果)
抗原结构优化环节实现了降本增效,疫苗研究步伐得以加快。在降低成本方面,此前蛋白质取样费用至少需要1.5万元,累计费用超过数十万,但应用该平台后,预测费用可以下降100倍以上。在效率提升方面,从蛋白表达、蛋白纯化等步骤到使用冷冻电镜解析蛋白质结构,至少需要13天,但使用AI预测蛋白质结构,则可以压缩到1天以内,结构分析效率平均提升超10倍。
“对于使用AI技术进行预测的效果是有预期的,但是思符平台给我们带来的是惊喜,不仅在时间上显著的缩短了蛋白质结构预测的时间,并且在准确性方面也超出了我们的预期,难得的是思符平台的易用性对于我们疫苗研发人员非常友好,半天学习时间后就可以熟练的运用。”对于使用思符后的结果国药动保基础研究部经理表达了欣喜。
基于思符在猪圆环病毒疫苗抗原结构优化环节中的出色表现,国药动保下一步将在圆环类疫苗和其他病毒样颗粒疫苗的研发中进行推广使用。不仅如此,双方通过深入的交流,希望依托现有的蛋白质结构预测AI技术平台,在诸如抗原表位及其强度预测、抗体从头设计及亲和力成熟等应用领域作出探索研究,加速动物保护疫苗研发的数智进程。