当数字技术成为整个社会运行的底座,生物科学也能借力云计算从诸多繁琐重复的工作中解放出来,专注于生物设计与创新。来看看亚马逊云科技如何与TIBCAS合作,推动合成生物学的发展。
明确核心需求,选择合作伙伴
TIBCAS选择与亚马逊云科技合作,一是亚马逊云科技针对科研领域提供了具有行业深度的解决方案,在云服务上能够满足不同业务场景的需求,并具备典型的成功案例。同时,亚马逊云科技有丰富工业生物行业经验,能够理解TIBCAS行业应用场景,并提供有深度的指导意见;二是亚马逊云科技Serverless技术成熟,多项创新托管服务极大简化了行业应用创新难度;三是亚马逊云科技专业服务团队提供全生命周期技术支持,能加速项目落地;四是通过亚马逊云科技创新研究资助计划,可以对TIBCAS科研项目提供支持。
亚马逊云科技的多项服务
助力TIBCAS实现行业应用创新
● 基于Serverless架构开发AutoESD云平台,实现自动化和高通量的编辑序列设计
Serverless服务轻量化且易于使用,与生物工程真实的业务场景结合,能更便捷地实现复杂的工作流编排和异常处理,提供轻量化且足够弹性的算力需求,能够进行模块化封装和复用的组件等需求。为此,TIBCAS通过对遗传操作技术的模块化解构与标准化处理,结合亚马逊云科技提供的Serverless服务,实现了全流程、自动化和高通量的编辑序列设计,开发出云平台AutoESD。该平台支持多种基于筛选标记的同源重组技术变种,理论上支持所有基因组序列已知的微生物,并可以在单批次任务中处理针对不同目标序列(CDS或基因间区域)的多种类型的遗传操作(敲除、插入和替换)。
此外,TIBCAS开发的IMODB、BioTools等工具也采用同样的底层架构,由Amazon Simple Storage Service (Amazon S3)和Amazon DynamoDB分别为静态资源和动态资源的存储提供支持,Amazon API Gateway实现API接口,后端通过Amazon Lambda和Amazon Batch来承载不同算力需求的任务,Amazon Step Functions能够帮助工程师更好地管理序列设计工作流,以及处理工作流中复杂的任务依赖关系。在部署上,基础架构部分都通过CDK完成基础架构代码化,能够实现自动化部署和版本管理,在业务层面如页面前端、后端复杂计算过程,通过CI/CD实现自动化集成和部署。
● 借助Amazon Neptune设计ERMer,探索完整的大肠杆菌调控知识图谱
在“开发核心数据库”时,TIBCAS联合亚马逊云科技针对微生物领域真实业务场景需求,基于Amazon Neptune图数据库、无服务器架构和图形可视化引擎,设计出一款存储和分析高连接数据的新框架,实现了有效的交互式检索和可视化,该框架具有很好的通用性和扩展性,可以非常方便地延伸到生物学多个应用领域和物种的研究中。利用该框架,TIBCAS开发了目前第一个基于图数据库的大肠杆菌调控知识图谱ERMer。ERMer实现了多种复杂调控级联或模式的快速检索和可视化,让科研人员能够以交互式、无需编程的方法探索完整的大肠杆菌调控图谱。
为了进一步发挥知识图谱的价值,TIBCAS还采用了Amazon Neptune ML来训练模型,通过使用图谱神经网络技术,实现了转录因子预测和转录因子靶点预测等功能。