汇总内容来自 Open-Source Machine Learning in Computational Chemistry 中表格涉及的内容
文章目录
- 1.DeepKa
- 2.Machine learning meets pKa
1.DeepKa
预测蛋白质的 pka,文章是 Basis for Accurate Protein p Ka Prediction with Machine Learning 和 Protein pK(a) Prediction with Machine Learning,后者提出 DeepKa,使用的数据是 continuous constant-pH molecular dynamics (CpHMD) 计算得到的。代码是 DeepKa,下面是代码分析:
- 仓库里的 data 和 datasets 文件夹可以看 Data 介绍
- pka_process 文件夹可以看 pka_process 介绍,主要作用是把 cleaned_source_data 中的初始数据处理成 model_input 中的可供模型读入的数据
- pka_predict 文件夹可以看 pka_predict 介绍
由于主要是关于蛋白质的 pka 预测,和小分子 pka 预测不同,暂时不再详细分析代码
2.Machine learning meets pKa
预测单解离中心小分子的 pka,文章是 Machine learning meets pKa,代码是 Machine-learning-meets-pKa,下面是代码分析:
- datasets 文件夹可以看 Datasets 介绍
- scripts 文件夹包含了一些处理脚本
- predict_sdf 利用训练好的模型预测 pka,介绍看 Prediction tool
- run_pipeline 预处理数据,介绍看 Preparation pipeline
- train_model 训练模型,介绍看 Prediction tool
- Modelling 是模型对比