智能计算模拟: DFT+MD+ML 深度融合及科研实践应用
第一 部分
DFT+MD+ML基础
1. 理论内容: 理论内容:
1.1. 计算模拟发展:MD, MC, DFT三大部分
1.2. 人工智能时代背景: 大数据与大模型对模拟计算的影响
1.3. 人工智能加入给传统模拟计算带来的哪些变化?
① 模型建构的新趋势
② 力场开发中的机器学习应用
③ AI 在模拟过程优化与加速中的作用
④ 数据后处理技术的发展与智能化
1.4. 统计物理基本理论(系综、边界条件、温度的定义、控温与热浴等)
2. 实例操作
2.1. 软件环境搭建与安装: conda配置虚拟环境,安装GPUMD、LAMMPS、ASE、Phono3PY、PyNEP、 OVITO、VMD、ATOMSK等软件
2.2. 力场参数生成与MD模拟操作: 综合使用MS软件+MSI2LMP快速生成任意有机分子的PCFF/CVFF力场参数文件,并使用LAMMPS软件执行分子动力学模拟
2.3. MS软件的基本介绍与LAMMPS结合使用
a. MSI2LMP 与 PCFF /CVFF 力场的简介
b. LAMMPS 入门与经验势使用
c. 简单的分子动力学计算
2.4. 高精度量化数据集 获取与机器学习融入MD模拟
a. VASP 计算静态与 AIMD 的参数设置
b. 简单的力场计算实践、LAMMPS 的基本使用(机器学习势)
c. LAMMPS 与机器学习势函数结合的 MD 模拟
d. 机器学习模型的加载和使用要点
2.5. 数据后处理技术与可视化分析
a. 使用 OVITOs 的相关代码分析处理数据,包括 AIMD 和机器学习分子模拟的 RDF, MSD, 扩散系数以及键角和二面角的分布情况
b. OVITO 软件的基本使用
c. 键角和二面角分布的统计与绘图实现,以及 python 画图和 origin画图的双示例
第二部分
机器学习力场学习与实践
3. 理论内容:
3.1. 机器学习力场的重要工作
3.2. 机器学习、神经网络核心原理和训练过程
3.3. 机器学习力场构建流程、应用与优势
3.4. 图神经网络和图卷积网络
a. GNN/GCN 概述、SchNet 模型特点与实现
b. 消息传递神经网络框架
c. GAP、MTP、ACE、DP、NEP 模型深入探讨与对比
3.5. DeePMD在国内的研究与应用现状
3.6. 高性能机器学习力场模型介绍
3.7. NEP+GPUMD系列研究解读
4. 实例操作( NEP+GPUMD 集成实战:全流程模型构建与模拟):
4.1. 数据格式转换与数据集构建: 使用公开代码工具转化数据格式,并生成训练,验证和测试数据集
4.2. NEP模型超参数设定与理解
4.3. NEP模型全流程操作:安装、准备数据集、训练、验证和测试
4.4. 使用LAMMPS和GPUMD模型执行高精度、高效率、大规模分子动力学模拟
4.5. 4.5. 机器学习力场驱动的模拟数据后处理与分析
第三部分
机器学习力场等变模型系列及领域热点
5. 理论内容
5.1. MACE模型:融合ACE、消息传递与等变性的创新
5.2. 方法的完备性,效率和系列演进
5.3. 适用于大规模GPU并行框架的NEP模型
5.4. 主流机器学习力场模型的详析与对比
- 实例操作:(以石墨烯等二维材料为例,深度探究 MACE 及其他 ML 力场模型的实践应用)
6.1. NequIP或MACE模型超参数设置与实际应用
6.2. 结合LAMMPS或ASE使用MACE模型构建势函数
6.3. MACE与DeePMD、NEP的精度、数据效率对比
6.4. 计算RDF、MSD、扩散系数等物性并重现文献结果
6.5. 构建及对比DP、NEP、ACE等多种ML力场模型
第四部分
数据收集方法与应用
7. 理论部分
7.1. 公开数据集资源
7.2. 数据增强技术
a. 主动学习技术
b. AIMD+微扰等数据集扩充手段
c. 数据集数据集精简与筛选策略
d. 模型微调技术
8. : 实例操作:( ( 主动学习 与模型微调在计算模拟中的实践 – 液态水、 SiO2、 、 MOF的完全演示案例) )
8.1. ASE 环境下主动学习实现与代码解析
8.2. 多 GPU 并行或单 GPU 多任务并行与资源优化
8.3. 自主设计主动学习方案
8.4. 预训练模型微调实践
8.5. 微调与从头训练效果对比
8.6. 不同模型(如金属、团簇、孪晶结构、多晶石墨烯)的构建实例
S 其他备选内容
S1. 其他机器学习内容拓展应用,DNN、DT、XGBoost 在计算模拟领域的应用,以多晶石墨烯为例
S2. PFC 相场方法建立多晶石墨烯、石墨烯晶界描述符的选取、深度神经网络的训练(与其他机器学习方法对比)、预测
S3. VMD 与 OVITO 等输出高质量的分子结构视觉化效果