DeepBIO: an automated and interpretable deep-learning platform for high-throughput biological sequence prediction, functional annotation and visualization analysis
期刊:Nucleic Acids Research
中科院分区:2区
影像因子:19.16
出版时间:2023年2月17号
摘要
在这里,我们介绍了DeepBIO,这是首个用于高通量生物序列功能分析的自动化和可解释深度学习平台。DeepBIO是一个一站式的网络服务,使研究人员能够开发新的深度学习架构来回答任何生物学问题。具体来说,对于任何生物序列数据,DeepBIO支持总共42种最先进的深度学习算法,用于全自动管道中的模型训练、比较、优化和评估。DeepBIO为预测模型提供了全面的结果可视化分析,涵盖了模型可解释性、特征分析和功能序列区域发现等几个方面。此外,DeepBIO使用深度学习架构支持9个基本级别的功能注释任务,具有全面的解释和图形可视化,以验证注释站点的可靠性。在高性能计算机的支持下,DeepBIO可以在几个小时内对高达百万级的序列数据进行超快速预测,展示其在实际应用场景中的可用性。案例研究结果表明,DeepBIO提供了准确、稳健和可解释的预测,展示了深度学习在生物序列功能分析中的强大功能。总体而言,我们希望DeepBIO能够确保深度学习生物序列分析的可重复性,减轻生物学家的编程和硬件负担,并在序列水平和碱基水平上提供有意义的功能见解。
介绍
优点总结
iii)两个预测模块。DeepBIO是第一个不仅支持任何生物序列数据的序列级功能预测的平台,而且还允许使用预训练的深度学习架构进行9个基本级功能注释任务,包括DNA甲基化,RNA甲基化和蛋白质结合特异性。此外,我们还对模型预测结果与实验数据进行了深入的对比分析,以验证预测结果的可靠性。值得注意的是,在高性能计算机的支持下,我们证明了DeepBIO支持高达百万级序列数据的快速预测,证明了其在实际应用场景中的可用性。(四)综合结果可视化分析。
MATERIALS AND METHODS
流程图
步骤分析
Step 1. Data pre-processing
四个部分来预处理输入数据:
(i)序列合法性测试;
(ii)序列相似性设置;
(iii)数据处理不平衡;
(iv)数据增强。
Step 2.Model construction
Step 3. Model evaluation.
Step 4. Visualization analysis.