华中科技大学李松课题组,利用机器学习预测多孔材料水吸附等温线

news2024/11/18 23:34:17

1eee3b3fb533bfa3107379403f56408c.png

By 超神经

多孔材料的水吸附等温线是一个非常重要的参数,但这一参数的获得并不容易。这是因为多孔材料种类过多、结构多元,通过实验和计算的方式获得水吸附等温线数据成本过高,耗时过长。

华中科技大学的李松课题组,建立了一个两步机器学习模型,训练 AI 通过材料的结构参数预测水吸附等温线参数和后续应用性能。

作者|加零

编辑|雪菜、李慧、三羊

在水净化、水脱盐、水收集和吸附热转换等过程中,多孔材料有着巨大的应用。这些吸附驱动应用中,诸如表面亲水性、解吸滞后性和吸水性等结构特性,都可能影响多孔材料的性能。这些结构特性都可以从水吸附等温线 (water adsorption isotherms) 中获得。

那么,如何获得材料的水吸附等温线呢?

如果以实验的方式,获得几种吸附剂的水吸附等温线并不困难,但多孔材料种类众多,如剑桥结构数据库中已录入 10 万余种多孔材料数据,对它们一一合成和测试显然是不合理的。

如果以计算的方式,通过吸附剂晶体结构分子模拟可以得到水吸附等温线,但计算成本极高,难以大规模预测。

而机器学习能够归纳处理大批量的数据,并从中提取规律,且在材料性质预测中有一定的应用案例。基于此,来自华中科技大学的李松课题组建立机器学习模型,训练 AI 提取多孔材料结构参数以预测水吸附等温线,并在此基础上进一步估算各种吸附剂的冷却性能和后续应用。

成果已发表在「Journal of Materials Chemistry A」期刊上。

65db262eebf1230a48f31da2a6f0e903.jpeg

成果发表在「Journal of Materials Chemistry A」期刊

论文链接:

https://pubs.rsc.org/en/content/articlelanding/2023/TA/D3TA03586G

后台回复「水吸附」获取完整论文 PDF

f96feb5f264eed5e84d54f4f4338e54a.jpeg

实验过程

数据集

EWAID 数据库

研究者从 3.0 版的水吸附等温线数据库 EWAID 中选择了 460 种纳米多孔吸附剂,包括金属-有机骨架 (MOFs)、共价有机骨架 (COFs) 和具有确定晶体结构的沸石 (zeolites) ,通过文献调研获取其水吸附等温线数据。

EWAID:experimental water adsorption isotherm database

在选取的 460 种吸附剂中有 148 种具有所有的结构特征,相关结构参数为可达表面积 (Sa) 、有效孔容 (Va) 和孔径 (Dp) 。

采用通用吸附等温线模型 (UAIM, universal adsorption isotherm model) 拟合 148 种吸附剂的水吸附等温线,得到材料在不同压力 (P) 下 298K 的吸水量 (W)。

将吸附剂的结构特征和吸附性能数据 (Sa、Va、Dp、 P 和 W) 输入机器学习模型进行训练。

430753803cd0c4d2f2199d289dac0913.png

从 EWAID 中选择的吸附剂

模型架构

两步 ML 策略

研究者们开发了两步 ML 策略:

从数据库中提取多孔材料的结构参数 (Sa、Va、 Dp) 和吸附压力 P 作为参数,输入 ML: S-I 模型,利用机器学习对水吸附等温线进行预测。

估计出水吸附等温线后,提取 3 个参数:饱和吸附容量 (Wsat),等温线的阶跃位置 (α) 和亨利常数 (KH) ,输入 ML: I-P 模型。计算吸附式制冷系统的性能系数 (COPC, the coefficient of performance for cooling) 和吸附剂/水工质对的比制冷效果 (SCE, specific cooling effects),评价其吸附冷却性能。

1766817948462fce885716d44a33ce76.png

两步机器学习策略示意图

算法训练

RF 和 ANN 综合应用

采用 Scikit-learn 模块开发机器学习模型,采用 RF(随机森林) 和 ANN 两种算法进行两步机器学习训练。

数据集 80% 的样本被随机选取作为训练集,其余 20% 作为测试集。

训练过程中,为了确定算法的最优超参数 (hyper-parameters) ,采用五重交叉验证的方法测试不同超参数组建立的模型,根据测定系数 R确定最优超参数。

e68f131459167ab316b9f1e0067e2d7f.jpeg

从结构到等温线:S-I 流程

性能验证

数据库内等温线预测

RF 准确性优于 ANN

根据 148 种训练吸附剂的结构特征和吸附性能数据  (Sa、 Va、 Dp、 P 和 W),采用 ML 模型对水吸附等温线进行预测。由下表可知, RF 模型在预测水吸附等温线方面具有较高的准确性。

c20a2a599dd9be7e63d492eabd832903.png

RF 和 ANN 预测精度

由下图 a 可见,这些吸附剂的吸水量分布在 0 ~ 2.0 g/g 之间,大部分在 0 ~ 0.8 g/g 之间。

由下图 b 的相对重要性分析可见,吸附压力 (P) 对吸水量影响最大,二者成正相关。在固定压力下,吸附剂的结构特征,特别是表面积和孔隙体积决定吸水量多少。

171a31f17bb2237de3d4a44a2f5a7796.png

RF 模型对吸水性的相关预测

RF 模型预测的精度更高

将数据库中具有不同结构特性的几种典型吸附剂作为实验对象,对比 EWAID 实验数据和 RF 模型预测的水吸附等温线。

数据库中主要有 4 种水吸附等温线类型,I 型(图 a、c 所示的倒 L 形),V 型(图 d、f 所示的典型 S 形),IV 型和 VI 型(图 g、i 所示的两个或多个吸附步骤的形状)。

由下图可见,无论等温线的类型和吸附材料的结构性质如何,吸附等温线预测值与实验值均具有较高的一致性,这验证了 RF 模型的高精度。

b4ce8829a946ffad8fe12d9323ea0720.png

水吸附等温线预测结果

灰色表示 EWAID 实验数据,蓝色表示 RF 模型预测数据

RF 可识别微小结构差异,灵敏度更高

改变 MOF 族吸附剂的金属 (MOF-74-M 和 CUK-1-M,M = Co,Mg,Ni) 和功能基 (MIL-101-Cr + X,X = NH2,SO3H,NO2) 研究结构差异导致的水吸附等温线变化。

改性后结构参数见下表:

d15e547fb25eab0a8d4f03cfb22556cb.png

吸附剂的结构特征

对应的水等温线预测结果见下图:

d7af9f45a102bc6c6fc0275bf5b95cd3.png

水等温线预测结果

菱形表示 EWAID 实验数据,圆点表示 RF 预测结果

针对结构差异微小的吸附剂,RF 模型准确地预测了水吸附等温线的差异,展现了高精度和高灵敏度。

性能拓展

数据库外等温线预测

为了进一步验证 RF 模型的适应性,研究者们选择 EWAID 数据库中不包含的吸附剂 (ZJU-210-Al,NU-405-Zr和 iso-NU-1000-Zr ) 进行测试,结果如下图。

6fb10ee7cae63cf0048161594f71a988.png

水等温线预测结果

灰色表示实验数据,蓝色表示 RF 模型预测数据

由图 a、b 可见,RF 模型对 ZJU-210-Al 和 NU-405-Zr 的水吸附等温线有较好的预测。在图 c 中,RF 模型对 ISO-NU-1000-Zr 的高压吸水量预测值低于实验值。

这一预测偏差的产生,可能是因为 EWAID 数据库中没有足够数量的高吸附量样本(吸水量 > 0.8 g/g),也可能是对 ISO-NU-1000-Zr 的结构描述不充分。

对具有微小结构差异的吸附剂开展研究,结果如下图:

5b052f095426f0e33ed603636ce253a6.png

水等温线预测结果

菱形表示 EWAID 实验数据,圆点表示 RF 预测结果

UiO-67-Zr 与 UiO-66-Zr 相比,配体的附加苯环有疏水性,在图 d 中,UiO-67-Zr 的水吸附等温线向高压方向移动。

MOF-303-Al 与 CAU-23-Al 相比有更高的亲水性,在图 e 中,MOF-303-Al 表现了更小的阶跃位置,水吸附等温线向低压方向移动。

按表面亲水性 UiO-66-Zr + (OH)> UiO-66-Zr + NH2 > UiO-66-Zr + CH3 的顺序进行 RF 模型预测。在图 f 中,UiO-66-Zr + NH和 UiO-66-Zr + CH3 等温线阶跃位置的预测值大于实验值,向高压方向移动,说明 RF 模型高估了它们的疏水性。

这一偏差的产生,可能是因为在 RF 模型中对吸附剂表面特性的描述符不够丰富,不能有效区分同族但具有不同表面亲水性的吸附剂。

综上,RF 模型对数据库外的多孔材料水吸附等温线预测精度较高,且一定程度上可以分辨材料的结构差异。但相比数据库内的材料预测,会产生一些偏差。可通过补充训练数据,丰富结构特性描述符等方式修正这些偏差。

952a93c6b85cac98cc968826db3d3151.jpeg

从等温线到性能:I-P 流程

参数提取

COP和 SCE

以 ML 模型预测的水吸附等温线为基础,提取三个描述符:饱和吸附容量 (Wsat) ,等温线的阶跃位置 (α) 和亨利常数 (KH),对吸附式制冷 (ACs, adsorption chillers) 的性能进行分析。

7757d0ba8fc7cc47b27afdbd722a3b37.png

吸附等温线特征示意图

吸附式制冷性能可根据性能系数 (COPC,the coefficient of performance for cooling) 和吸附剂/水工质对 (adsorbent/water working pairs) 的比制冷效果 (SCE,specific cooling effects) 这两个参数进行评估。

使用描述符 (Wsat,α,KH) ,ML 模型可以快速获得  COP和 SCE,而不需要复杂的计算过程。

性能预测

等温线参数与性能的关系

根据 460 个吸附剂/水工质对的吸附等温线特征 (Wsat,α,KH),采用 ML 模型对 SCE 和 COPC 进行预测。由下表可知,RF 模型在预测 SCE 和 COP方面均具有较高的精度。

c04d36698cd1c8c2971838afc018ff0f.png

25e854f7be5a25605f2e9933e25b7386.png

RF 和 ANN 预测精度

由下图 a 和 b 可见,绝大多数工质对的 SCE 和 COPC 分别位于 0.400 kJ/kg 和 0.4-0.8 的范围内。

由下图 c 和 d 的相对重要性分析可见,Wsat 在确定 SCE 中占 46% 的重要性,KH 在确定 COP中占 58% 的重要性,这意味着 Wsat 和 SCE、KH 和 COP之间存在很强的相关性

acecd6a8045e7805de96221c76b95674.png

RF 对 SCE 和  的预测值及相关性分析

从下图可以得知,当三个参数的范围为:Wsat = 0.2-0.8 g/g,α = 0.1-0.3,KH = 10-4 - 10-1 (mol/kg·Pa) 时,冷却性能可维持在 (SCE > 200kJ kg-1,COPC  > 0.7) 这一范围内,此时水吸附等温线为 V 型。

ddc710a30c6f069ee158790ba082c58d.png

148种吸附剂的 Wsat、α、KH 和冷却性能之间的关系

84067d07eed9d0910c1159f5785b6c4a.jpeg

材料科研新范式离不开机器学习

材料科学的指导思想可以总结为四种范式:

  • 经验的试错方法;

  • 物理和化学规律;

  • 计算机模拟;

  • 大数据驱动的科学。

20 世纪 90 年代,Rao 等人在研究陶瓷基复合材料 (CMC) 时,运用 ANN 进行模拟,这是机器学习在材料科学中的开创性应用。

随着科技的发展,第四种范式融合了其他三种范式的优势,近年来,机器学习在材料科学领域可谓是火热,材料的发现、制备和性能分析验证等方向都有它的身影。

4a084d302c80580b12a3b20117f2d513.png

机器学习在材料科学中的应用

但是,想让机器学习直接赋能于材料实际应用,研究者们仍然任重道远。

机器学习为我们提供了「结构—性能」的视角,期待研究者们与 AI 协作,真正实现识结构、知性能、促创新,共同探索材料科学新的未来。

参考文献:

[1]https://pubs.rsc.org/en/content/articlelanding/2023/TA/D3TA03586G

[2]https://www.sciencedirect.com/science/article/abs/pii/S235249282201741X

—— 完 ——

 往期推荐 

英伟达中文官网删除4090,芯片出口禁令范围扩大,A40、A6000赫然在列

华东理工李洪林课题组开发 Macformer,加速大环类药物发现

30 位学者合力发表 Nature 综述,10 年回顾解构 AI 如何重塑科研范式

9cb7730afdeed80c1e8ce405768d3aa0.jpeg

扫描二维码,加入讨论群

获得更多优质数据集

了解人工智能落地应用

关注顶会&论文

回复「读者」了解更多

5f567e073cd1a31fe0f78b879238f3cf.gif

2124dab78f43890bbc2f9f3f7cd823ad.gif

戳“阅读原文”,免费获取海量数据集资源!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1241792.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

开发板启动进入系统以后再挂载 NFS 文件系统, 这里的NFS文件系统是根据正点原子教程制作的ubuntu_rootfs

如果是想开发板启动进入系统以后再挂载 NFS 文件系统,开发板启动进入文件系统,开发板和 ubuntu 能互相 ping 通,在开发板文件系统下新建一个目录 you,然后执行如下指令进行挂载: mkdir mi mount -t nfs -o nolock,nfsv…

MySQL中自增id用完怎么办?

MySQL中自增id用完怎么办? MySQL里有很多自增的id,每个自增id都是定义了初始值,然后不停地往上加步长。虽然自然数是没有上限的,但是在计算机里,只要定义了表示这个数的字节长度,那它就有上限。比如&#…

【LeetCode二叉树进阶题目】606. 根据二叉树创建字符串,102. 二叉树的层序遍历,107. 二叉树的层序遍历 II

二叉树进阶题目 606. 根据二叉树创建字符串解题思路及实现 102. 二叉树的层序遍历解题思路及实现 107. 二叉树的层序遍历 II解题思路及实现 606. 根据二叉树创建字符串 描述 给你二叉树的根节点 root ,请你采用前序遍历的方式,将二叉树转化为一个由括号…

1553. 吃掉 N 个橘子的最少天数(记忆化+贪心优化)

Problem: 1553. 吃掉 N 个橘子的最少天数 文章目录 题目思路Code 题目 使得 n 变成0的操作有三种方式 : 吃掉一个橘子。如果剩余橘子数 n 能被 2 整除,那么你可以吃掉 n/2 个橘子。如果剩余橘子数 n 能被 3 整除,那么你可以吃掉 2*(n/3) 个…

xorm源码学习

文章目录 XORM源码浅析及实践ORMORM vs. SQLXORM软件架构 ORM 引擎 Engine——DBM*core.DB Golang:database/sql 源码基本结构连接复用,提高性能。增加数据库连接池数量连接管理 database/sql主要内容:sql.DB创建数据库连接sql.Open()DB.conn…

python数据结构与算法-15_堆与堆排序

堆(heap) 前面我们讲了两种使用分治和递归解决排序问题的归并排序和快速排序,中间又穿插了一把树和二叉树, 本章我们开始介绍另一种有用的数据结构堆(heap), 以及借助堆来实现的堆排序,相比前两种排序算法要稍难实现一些。 最后我…

《DApp开发:开启全新数字时代篇章》

随着区块链技术的日益成熟,去中心化应用(DApp)逐渐成为数字世界的新焦点。在这个充满无限可能的全新领域,DApp开发为创新者们提供了开启数字时代新篇章的钥匙。 一、DApp:区块链创新成果 DApp是建立在区块链技术基础之…

vue el-table (固定列+滚动列)【横向滚动条】确定滚动条是在列头还是列尾

效果图&#xff1a; 代码实现&#xff1a; html&#xff1a; <script src"//unpkg.com/vue2/dist/vue.js"></script> <script src"//unpkg.com/element-ui2.15.14/lib/index.js"></script> <div id"app" style&quo…

OpenGL YUV 和 RGB 图像相互转换出现的偏色问题怎么解决?

未经作者(微信ID:Byte-Flow)允许,禁止转载 文章首发于公众号:字节流动 早上知识星球里的一位同学,遇到 yuv2rgb 偏色问题,这个问题比较典型,今天展开说一下。 省流版 首先 yuv2rgb 和 rgb2yuv 之间的转换要基于相同的标准,转换使用不同的标准肯定会引起偏色,常见的…

监控员工上网有什么软件丨三款好用的员工上网管理软件推荐

监控员工上网行为是企业管理中不可或缺的一部分&#xff0c;因此&#xff0c;选择一款好的监控员工上网的软件至关重要。目前市场上存在多种监控员工上网的软件&#xff0c;它们具有各种特点和功能&#xff0c;但企业需要仔细评估和选择。 一、域之盾软件 这是一款优秀的监控员…

数据结构-leetcode(设计循环队列)

1.学习内容&#xff1a; 今天 我们讲解一道能够很好的总结所学队列知识的题目---设计循环队列 622. 设计循环队列 - 力扣&#xff08;LeetCode&#xff09; 2.题目描述&#xff1a; 让我们设计一个队列 要求是循环的 这和我们的双向链表有些类似 让我们按要求设计出这些相对…

【C++】特殊类设计 {不能被拷贝的类;只能在堆上创建的类;只能在栈上创建的类;不能被继承的类;单例模式:懒汉模式,饿汉模式}

一、不能被拷贝的类 设计思路&#xff1a; 拷贝只会发生在两个场景中&#xff1a;拷贝构造和赋值重载&#xff0c;因此想要让一个类禁止拷贝&#xff0c;只需让该类不能调用拷贝构造以及赋值重载即可。 C98方案&#xff1a; 将拷贝构造与赋值重载只声明不定义&#xff0c;并…

重生奇迹mu迹辅助什么好

主流辅助一号选手&#xff1a;弓箭手 智弓作为最老、最有资历的辅助职业&#xff0c;一直都是各类玩家的首要选择。因为智力MM提供的辅助能力都是最基础、最有效、最直观的辅助。能够减少玩家对于装备的渴求度&#xff0c;直接提升人物的攻防&#xff0c;大大降低了玩家升级打…

当当网获得dangdang商品详情商品列表API 测试请求入口

item_get-获得dangdang商品详情 获取商品详情 item_search-按关键字搜索dangdang商品 获取商品列表 公共参数 名称类型必须描述keyString是调用key&#xff08;必须以GET方式拼接在URL中&#xff09;secretString是调用密钥api_nameString是API接口名称&#xff08;包括在请…

单片机调试技巧--栈回溯

在启动文件中修改 IMPORT rt_hw_hard_fault_exceptionEXPORT HardFault_Handler HardFault_Handler PROC; get current contextTST lr, #0x04 ; if(!EXC_RETURN[2])ITE EQMRSEQ r0, msp ; [2]0 > Z1, get fault context from h…

强化学习------贝尔曼方程

目录 前言基础知识马尔可夫决策过程 (Markov decision process, MDP)回报(Return)折扣回报(Discounted Return) State Value&#xff08;状态价值函数&#xff09;贝尔曼方程的推导贝尔曼方程的矩阵形式Action Value&#xff08;动作价值函数&#xff09;贝尔曼最优公式 前言 …

Python——练习2

Python 练习一练习二练习三 练习一 (回文素数)回文素数是指一个数既是素数又是回文数。例如&#xff0c;131 既是素数也是回文数。数字313和717都是如此。编写程序显示前 100 个回文素数。每行显示10个数字&#xff0c;并且准确对齐如下所示。 2 3 5 7 11 …

网络安全等级保护收费标准?

不同省份价格会略有不同&#xff0c;二级等保一般不低于5万元;三级等保不低于9万元&#xff0c;个别省份也可能7万也能办理&#xff0c;根据企业实际情况和省市选定的代理机构确定。 等级保护二级? 第二级等保是指信息系统受到破坏后&#xff0c;会对公民、法人和其他组织的合…

pip安装python包到指定python版本下

python -m pip install 包名1.命令行进入到指定python安装目录。比如我电脑上有python3.8也有python3.9。准备给python3.9安装指定的包

企业软件定制开发有哪些优势?|app小程序网站搭建

企业软件定制开发有哪些优势&#xff1f;|app小程序网站搭建 企业软件定制开发是一种根据企业特定需求开发定制化软件的服务。相比于购买现成的软件产品&#xff0c;企业软件定制开发具有许多优势。 首先&#xff0c;企业软件定制开发可以满足企业独特需求。每个企业都有自己独…