欢迎关注我的CSDN:https://spike.blog.csdn.net/
本文地址:https://blog.csdn.net/caroline_wendy/article/details/130752004
AlphaFold2 是基于深度学习的方法,可以根据氨基酸序列,预测蛋白质的三维结构。在 2020 年的 CASP14 竞赛中,展示了惊人的准确性,达到了原子级别的精度。AlphaFold2 的核心思想是利用多序列比对(MSA)和进化信息来构建蛋白质的特征表示,然后,使用一个Transformer模型来预测残基之间的距离和角度,最后,使用一个结构模块来优化和输出三维坐标。AlphaFold2 的创新之处在于它能够端到端地训练和预测蛋白质结构,同时融合了物理和生物学的知识。AlphaFold2为蛋白质科学和生命科学领域,带来了新的机遇和挑战。
构建测试集合,主要包括 2 个不同类型的测试样本,即 MSA 数量较少的单链 (T1104-D1_A117
)、MSA数量较多的单链 (T1109-D1_A214
),已完成 MSA 的搜索过程。
序列如下:
T1104-D1_A117.fasta
的 FASTA 文件如下: