【2025 Nature】AI 生成材料算法 MatterGen 文章要点

news2025/2/13 6:23:05

文章目录

  • 1. MatterGen 框架
  • 2. 评价基础模型生成能力的指标
  • 3. MatterGen 基础生成能力表现
  • 4. MatterGen 定向生成能力表现
    • i. 指定晶体化学式
    • ii. 指定标量性质
      • 1. 每个性质微调一次。
      • 2. 两个性质联合微调
  • 5. 实验合成
  • 6. 模型细节

这篇文档简单介绍 MatterGen 论文亮点。
标题:A generative model for inorganic materials design
代码

1. MatterGen 框架

i. 基于扩散,引入等变神经网络,对原子坐标、原子元素种类和晶格常数进行去噪。此为基础模型。
ii. 通过添加 adapter 模块,对基础模型进行微调,能够实现无条件引导器的定向生成。
iii. 支持的引导类型:化学式、对称性、目标标量性质

2. 评价基础模型生成能力的指标

i. S.U.N. 指标:分别代表 Stable, Unique, Novel,即,稳定的,唯一的,新颖的,晶体结构。是一个百分比。
ii. Stable, Unique, Novel 具体定义细节在 SI 中,作者还设计了新的评测工具。
iii. RMSD 指标:表示,模型生成结构和 DFT 几何优化后的结构,二者之间的误差。

3. MatterGen 基础生成能力表现

i. 在同一训练集下,MatterGen 比先前 SOTA 表现高 1.5 倍。如果扩充训练集,MatterGen 能力能够进一步提高。
在这里插入图片描述

ii. 在小批量生成时,唯一性较高,直到 10w 量级以后才出现下降。
[图片]

4. MatterGen 定向生成能力表现

i. 指定晶体化学式

  • MatterGen 基础模型在含有 化学式 Adapter 模块下进行微调 和 Substitution 和 RSS (random structure search), 以及最大的数据库 Alex-MP-ICSD (比训练集多一些 disordered 的结构)进行比对
  • 由于训练集在不同元素上,分布有所差异,因此,作者在设计实验时,将其分为了,充分探索过的、部分探索过的、没有探索过的。三个类型。
  • 同时,设计了 3元、4元、5元,三个生成任务。 使用 S.U.N. 指标 和 Structures combined hull (稳定性)进行评估,结果如下:
    在这里插入图片描述

ii. 指定标量性质

1. 每个性质微调一次。

  • MatterGen 基础模型在部分含有特殊标量性质的数据集下,以及 Adapter 模块下进行微调。
  • 使用 DFT 和 MLFF 对生成结果进行打分,和训练集分布进行对比

[图片]

  • 给定 DFT 计算次数的预算,从 MatterGen 定向生成结果中进行筛选,与两种策略进行对比:a. 训练集中符合条件的总数,b. 训练集外,未被标注的数据,使用 ML 进行打分,并使用 DFT 预算对高分结构进行筛选

[图片]

2. 两个性质联合微调

  • 高磁强度的结构(Magnetic density 高),同时具有,低供应链成本(HHI score低)
  • 对比训练集数据,以及,仅对 Magnetic density 微调的 MatterGen 模型进行对比
    [图片]

5. 实验合成

  • 使用 MatterGen 定向生成具有指定 体积模量 的晶体。
  • 作者使用 DFT 进行了多指标多轮筛选,在 200 体积模量的定向引导下,最终获得了 75 个 promising 数据,其中挑出了 4 个供实验合成。其中一个被成功合成出,并进行了结构表征。
  • 该实验结构一个在化学成分上是无序的,但其结构框架仍然是 MatterGen 预测的有序结构的变体。

6. 模型细节

  • 起始学习率 1e-4,当训练损失在 100 个 epoch 内没有减少时,以 0.6 的因子逐步降低,最低降至 1e-6。
  • 批次大小 512
  • float32 精度
  • MatterGen 包含 46.8M 个参数
  • 在一个训练 epoch 中,大约 60 万个训练样本在 8 个 NVIDIA A100 GPU 上大约需要 6 分钟。
  • 使用单个 NVIDIA V100 GPU 采样 500 结构每小时。
  • 下图为训练集和测试集
    [图片]

训练集 Alex-MP-20(607,683 个) 和 MP-20 的比较,20 指单胞中最多含有 20 个原子
[图片]

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2297207.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

时间序列分析(三)——白噪声检验

此前篇章: 时间序列分析(一)——基础概念篇 时间序列分析(二)——平稳性检验 一、相关知识点 白噪声的定义:白噪声序列是一种在统计学和信号处理中常见的随机过程,由一系列相互独立、具有相同…

[前端] axios网络请求二次封装

一、场景描述 为什么要对axios网络请求进行二次封装? 解决代码的复用,提高可维护性。 —这个有两个方案:一个是二次封装一个是实例化。(设置一些公共的参数,然后进行请求) 为什么可以解决代码的复用: 这是…

【学术投稿-2025年计算机视觉研究进展与应用国际学术会议 (ACVRA 2025)】CSS样式解析:行内、内部与外部样式的区别与优先级分析

简介 2025年计算机视觉研究进展与应用(ACVRA 2025)将于2025年2月28-3月2日在中国广州召开,会议将汇聚世界各地的顶尖学者、研究人员和行业专家,聚焦计算机视觉领域的最新研究动态与应用成就。本次会议将探讨前沿技术,…

麒麟信安系统隔核后iperf网络测试影响说明

1、背景介绍 采用麒麟信安系统,在飞腾平台(X86平台类似)上进行了系统核隔离,修改了grub.cfg配置文件中的启动项增加isolcpus2-63 操作,隔核后发现40G网络iperf测试存在影响。 测试命令 taskset -c 16-23 iperf -s -…

WPF进阶 | WPF 资源管理与本地化:多语言支持与资源复用

WPF进阶 | WPF 资源管理与本地化:多语言支持与资源复用 前言一、WPF 资源管理基础1.1 什么是 WPF 资源1.2 资源的定义与存储位置1.3 资源的引用方式 二、资源字典的深入应用2.1 创建资源字典2.2 在应用程序中合并资源字典2.3 资源字典的层级结构与合并顺序 三、WPF …

数据结构与算法-动态规划-区间dp(石子合并,环形石子合并,凸多边形的划分,加分二叉树,棋盘分割)

概念 区间动态规划(Interval Dynamic Programming)是动态规划的一个分支,它在处理一些与区间相关的最优解问题上非常有效。以下从基本概念、解题步骤、经典例题、优缺点等方面为你详细介绍: 基本概念:区间 DP 的核心…

32单片机学习记录4之串口通信

32单片机学习记录4之串口通信 前置 STM32的GPIO口有通用模式,复用模式,模拟模式三种,加上输入输出就是有6中对应的模式。 我学习了通用模式,会使用GPIO口使用一些简单外设,如LED,独立按键,红外…

开源、免费项目管理工具比较:2025最新整理30款

好用的开源、免费版项目管理系统有:1.Redmine;2. Taiga;3. OpenProject; 4.ProjectLibre; 5.GanttProject; 6.Tuleap; 7.Trac;8. Phabricator; 9.Notion; 10.…

Android10 音频参数导出合并

A10 设备录音时底噪过大,让音频同事校准了下,然后把校准好的参数需要导出来,集成到项目中,然后出包,导出方式在此记录 设备安装debug系统版本调试好后, adb root adb remount adb shell 进入设备目录 导…

在 Azure 上部署 DeepSeek 并集成 Open WebUI

DeepSeek 是杭州深度求索人工智能基础技术研究有限公司发布的开源大模型,最近是持续火爆,使得官方服务经常不可用。网上各种本地部署和私有部署的文章已经很多,这里我们提供一个全部基于 Azure 的私有部署方案。 使用 Azure AI Foundry 部署…

Springboot整合支付宝支付

支付宝支付功能 步骤一:沙箱配置支付宝沙箱配置 步骤二:使用内网穿透步骤三:开始对接SDK配置文件支付 步骤一:沙箱配置 支付宝沙箱配置 需要有支付宝沙箱:提供一个虚拟的支付环境,用于测验调试&#xff0…

deepseek+kimi一键生成PPT

1、deepseek生成大纲内容 访问deepseek官方网站:https://www.deepseek.com/ 将你想要编写的PPT内容输入到对话框,点击【蓝色】发送按钮,让deepseek生成内容大纲,并以markdown形式输出。 等待deepseek生成内容完毕后&#xff0c…

基于ssm的超市订单管理系统

一、系统架构 前端:jsp | web components | jquery | css | ajax 后端:spring | springmvc | mybatis 环境:jdk1.8 | mysql | maven | tomcat 二、代码及数据 三、功能介绍 01. 登录 02. 首页 03. 订单管理 04. 供应…

AnyPlace:学习机器人操作的泛化目标放置

25年2月来自多伦多大学、Vector Inst、上海交大等机构的论文“AnyPlace: Learning Generalized Object Placement for Robot Manipulation”。 由于目标几何形状和放置的配置多种多样,因此在机器人任务中放置目标本身就具有挑战性。为了解决这个问题,An…

【DeepSeek】在本地计算机上部署DeepSeek-R1大模型实战(完整版)

【作者主页】Francek Chen 【专栏介绍】 ⌈ ⌈ ⌈人工智能与大模型应用 ⌋ ⌋ ⌋ 人工智能(AI)通过算法模拟人类智能,利用机器学习、深度学习等技术驱动医疗、金融等领域的智能化。大模型是千亿参数的深度神经网络(如ChatGPT&…

基于全志T507的边缘计算机,推动光伏电站向智能运维转型

智能监控与维护 光伏电站通常分布在广阔的地域内,传统的监控方式往往需要大量的人力物力进行现场检查和数据采集。采用全志T507为核心的嵌入式工控机或边缘计算控制器可以实现光伏电站的实时监测,通过连接传感器网络收集电站各个组件的工作状态信息&…

用户认证练习实验

一.拓扑 二.sw2配置 三.ip配置 四.dhcp分配IP地址 五.安全区域配置 六.防火墙地址组信息 七.管理员 创建管理员角色 创建管理员 启动tenlnet 八.用户认证配置 认证策略 九.安全策略配置

【登录认证】

目录 一. 会话技术1.1 cookie1.2 session1.3 令牌方案 二. JWT令牌三. 过滤器Filter四. 拦截器Interceptor \quad 一. 会话技术 \quad \quad 1.1 cookie \quad \quad 1.2 session \quad \quad 1.3 令牌方案 \quad \quad 二. JWT令牌 \quad \quad 三. 过滤器Filter \quad \quad …

DeepSeek 赋能智慧教育 | 讯方“教学有方”大模型全面接入 DeepSeek!

国产 DeepSeek 大模型以强大的深度学习能力和广泛应用场景迅速火爆全球,其在智能对话、文本创作、语义解析、计算推理、代码生成与补全等多个应用领域,展现出了无与伦比的实力和魅力。2月10日 ,由讯方技术自研的教育行业大模型“教学有方”全…

Unity中自定义协程的简单实现

在 Unity 中,协程(Coroutine)是一种非常强大的工具,它允许我们在不阻塞主线程的情况下,将代码的执行分成多个步骤,在不同的帧中执行。 Unity中协程实现原理 迭代器与状态机:本质上是基于C#的迭…