说起医疗与生命科学行业,许多人可能都会想到一句俗语——“治病如救火”,可见其分秒必争的时效性。
然而,如果与日新月异的科技行业相比,医疗与生命科学行业在研发上的速度则慢得惊人。来自《自然》杂志的数据显示,一款新药研发的时间往往耗时超过10年,研发成本超过20亿美金,而最终成功上市的成功率却还不到10%,因而被业内人士笑称“121”挑战。
一边是病患在心急火燎地等待着新药,另一边则是新药研发令人尴尬的“121”挑战,这两者的对比形成了极其鲜明的反差。那么有没有什么办法,可以缓解甚至消除这对尖锐的矛盾呢?
对于这个问题,亚马逊云科技大中华区战略业务发展部总经理顾凡给出的答案是“云技术”。
医疗与生命科学行业的三大挑战
“亚马逊云科技在医疗和生命科学行业的愿景,是‘致力于赋能我们的客户加速从实验室到真实世界的数字化之旅’,简单说就是帮助客户更快地发现更具性价比、更加精准的医疗解决方案。而这个更快、更具性价比、更精准,就是我们的价值。”顾凡向趣味科技介绍道。
顾凡指出,从2013年开始,亚马逊云科技就在全球成立了专业的医疗及生命科学行业团队。在过去的十年里,亚马逊云科技服务了包括辉瑞、拜尔、罗氏、默沙东、飞利浦等头部企业在内的全球超过4200家医疗及生命科学行业客户,涵盖了全球前十大药企中的九家。包括在中国市场,亚马逊云科技也拥有数十家本地合作伙伴和数百家客户。
在与客户的沟通交流当中,亚马逊云科技听取了来自新药研发、基因分析、行业规划等各个领域的声音,发现整个行业面临着一些共同的挑战,并将其归纳为三个方面:
1、数据挑战:海量数据的激增,也带来了洞察力挑战。譬如科学家发现自然界里可能成为药物的分子个数有10的60次方,而太阳系的原子个数才只有10的50次方,可以想见数据量之庞大。
2、算力挑战:在1990年的时候,需要耗费13年的时间才能完成一个人的基因测序。然而如今一天就可以测完60个人,而每个人的测序成本更是降到了90年代的百万分之一。然而在大规模的基因测序背后,则需要调用数万台虚拟服务器同时运行。
3、体验挑战:许多医疗机构迫切地需要不用具备专业的计算机背景,就可以开箱即用的解决方案。譬如医院用的医疗信息软件可能有近100种,常用的就有大约20种,这都需要亚马逊云科技及其合作伙伴提供相应的解决方案。
携手合作伙伴打造解决方案
围绕医疗与生命科学行业在数据、算力、体验上的三大挑战,亚马逊云科技及其合作伙伴又是如何帮助客户解决难题的呢?
1、日益增长的海量数据
顾凡表示,《自然》杂志预估到2025年,全球会有超过6000万人采用基因测序来诊断疾病,每一年的基因数据增长将超过40EB,远远超过许多互联网企业的数据量;科学家需要在10的60次方已知化合物里找到可能成药的化合物,一人一次的CT图片数据量超过30MB,一家综合医院一天的CT数据增量往往都要超过10GB……这一系列数据的爆炸式增长,也给数据的存储和快速自动化分析带来了极为严苛的挑战。
以基因数据为例,亚马逊云科技提供了基因测序领域的数据全生命周期管理解决方案, 涵盖了数据上传、数据分析、数据共享、数据备份及存档等全生命周期,能够为基因分析不同阶段的生物信息学数据的存储、调用和分析,提供更好的性价比和更高的可用性。譬如Amazon S3对象存储可提供高达八层的存储层级,其自动分层功能可以更高效地存储数据和节约成本。同时亚马逊云科技还将自动分层功能扩展至Amazon Elastic File System (Amazon EFS)云原生文件存储之中,进一步降低数据管理的难度。
在2022年的re:Invent全球大会上,亚马逊云科技还发布了Amazon Omics服务,可用于存储、分析和阐述基因组学、转录组学和其他组学数据的托管,能兼顾具体应用场景下的智能存储与调度需求,并内置了两种开源的基因测序的分析算法,让客户可以更快地进行基因分析研究,加速新药研发、疾病诊断和治疗等领域的进展。
2、持续而迅速的算力需求
“对于新药研发所面临的‘121’挑战,亚马逊云科技也给出了相应的解决途径,那就是通过采用亚马逊云科技的云上HPC、机器学习、量子计算等方式,来有效地加快新药研发速度、降低试错成本、提高成功率。”顾凡说道。
伴随着医疗与生命科学行业对算力的需求日益水涨船高,HPC高性能计算在该行业的应用也愈发广泛。亚马逊云科技提供基于高性能计算(HPC)的人工智能新药研发服务解决方案,使得研究人员可以在亚马逊云科技上组建数百万个vCPU的高性能计算平台,以开展数十亿蛋白质分子规模的药物发现研究。
譬如在计算机药物研发的流程中,有一个关键步骤叫做“虚拟筛选”,也就是在数亿种已知化合物里通过与病毒蛋白质(靶点)的结合分析,测试某些化合物是否有机会成为药物。通常这个过程需要筛选10亿种化合物与目标蛋白质去做模拟结合,如果使用一台单核服务器,大约需要475年才能完成计算。然而如果在亚马逊云科技的平台上同时调用数万核的虚拟服务器,那么在24小时之内就能完成对10亿种化合物的虚拟筛选。
除此以外,亚马逊云科技还针对云上高性能计算的应用打造了一系列创新服务,譬如针对HPC高性能计算优化过的EC2计算实例,高达400Gbps的EFA的高性能网络,支持毫秒级传输的Amazon FSx for Lustre系统,集群调度管理工具Amazon ParallelCluster,可支持数万个任务并发处理的云原生批处理调度器Amazon Batch等等。
3、快速构建适合行业用户体验的创新解决方案
针对医疗和生命科学行业用户想要快速获取开箱即用的解决方案,而不是自己从头构建的需求特点,亚马逊云科技的行业专家团队与众多合作伙伴携手合作,深入探索医疗行业应用场景,结合丰富的云上应用开发实践,通过提供适合构建者、使用者、管理者个性化体验的行业解决方案,全面覆盖了研究设计、临床实验、生产制造、上市推广、上市后监控和支持等所有环节的全流程价值链,以全方位满足行业客户的数字化创新需求。
顾凡表示,在亚马逊云科技及其合作伙伴提供的解决方案中,既包括了Amazon Omics托管服务、Amazon HealthLake Imaging医疗成像服务、Amazon Comprehend Medical自然语言处理 (NLP) 服务等专门构建的行业解决方案,也包括了亚马逊云科技与合作伙伴共同打造的合作伙伴解决方案、生命科学工作负载解决方案等等。譬如亚马逊云科技合作伙伴益体康打造的远程心电诊疗平台,就是构建在亚马逊云科技的机器学习服务Amazon SageMaker上,使得原本需要半年才能推出的AI模型,只需3个月便可完成从训练到部署上线的全过程,极大地加速了应用迭代,并且能够基于云的能力轻松支持十倍以上数据规模的模型训练场景。
安全合规与生成式AI
俗话说“人命关天”,我们不难想见安全合规在医疗与生命科学行业的重要性。而从涉足医疗与生命科学行业的第一天开始,亚马逊云科技就高度重视安全合规。
截至目前为止,亚马逊云科技已经通过了全球百项安全合规认证,符合全球超过50项医疗生命科学合规要求,符合包括美国健康保险流通新人责任法案HIPAA, 欧盟通用数据保护条例GDPR,英、法、日、韩、加拿大等国家医疗数据安全合规,以及中国网络安全三级等保和中国人类遗传资源中方单位认证等多项行业安全合规要求。尤为值得一提的是,在保证自身的云安全合规的同时,亚马逊云科技还携手合作伙伴,帮助客户保证云上应用与数据在本地和全球的安全合规,并为其提供专业的技术指导与最佳实践。
而谈到时下大火的生成式AI时,顾凡表示,我们既不应该去高估AIGC大模型的力量,但是也不能低估AIGC大模型会重塑大量行业客户的体验。过去20多年里,人工智能和机器学习一直都是亚马逊关注的焦点,无论是对外的服务还是对内部的运营,都随处可见人工智能与机器学习的身影。亚马逊云科技在生成式AI方面的使命,就是要让各种技能水平的开发人员和各种组织都有机会使用生成式AI进行创新。为此亚马逊云科技推出了四项重要创新:
1、Amazon Bedrock:客户可以通过API访问亚马逊云科技的大模型Amazon Titan,以及第三方的预训练LLM基础模型,同时结合客户的定制化数据,进行定制化模型开发。
2、两个Amazon Titan的生成式大型语言模型:一个是文本生成,一个是把文字数字化,将其转换成向量。
3、Amazon EC2 Trn1n和Amazon EC2 Inf2正式可用:打造最具性价比的生成式AI的基础设施。
4、Amazon CodeWhisperer:一款可以实时生成代码建议的AI编程助手。
除此之外,亚马逊云科技还与APN合作伙伴网络成员联手为各种创新场景提供所需的解决方案,包括在Amazon Marketplace上推出各种可以快速使用的工具和服务;开放涵盖生命科学、基因、肿瘤以及新冠等重要领域的96种生命科学公开数据集;在上海设立生命健康数字化赋能中心IDAC;推出“云创计划”加速扶持初创公司高速成长等等。
“云计算作为一个数字化底座,可以让科学家把更多的时间和精力专注在自己的专业领域,在药物研发上做出突破,而不是去操心什么高性能计算集群和模型开发训练,从而真正实现跨越式的性能提升。这其实也是云服务商的价值所在。”顾凡说道。