利用可解释性技术增强制造质量预测模型

news2024/11/16 11:07:57

概述

论文地址:https://arxiv.org/abs/2403.18731
本研究提出了一种利用可解释性技术提高机器学习(ML)模型性能的方法。该方法已用于铣削质量预测,这一过程首先训练 ML 模型,然后使用可解释性技术识别不需要的特征并去除它们,以提高准确性。这种方法有望降低制造成本,提高对 ML 模型的理解。这项研究表明,可解释性技术可用于优化和解释制造业的预测模型。

介绍

铣削是一种加工工艺,通过去除材料来加工出所需的形状或表面光洁度。在这一过程中,被称为铣刀的切削工具高速旋转,在移动工件的同时去除材料。工件固定在一个可以多轴移动的工作台上,可以进行各种方向和角度的加工(Fertig 等人,2022 年)。铣削过程中的能耗会因设置和材料的不同而有很大差异,但通常被认为是一种能源密集型工艺。如果能预测和预防质量问题,就能降低能耗,减少因生产缺陷零件而造成的浪费(Pawar 等人,2021 年)。

机器学习(ML)模型可以识别数据中的模式和结构,并在不受程序直接指导的情况下进行预测。这些模型是预测铣削操作最终质量的有用工具,可以提高制造过程的效率和可靠性(Mundada 和 Narala,2018 年)。然而,铣削操作的实验数据非常昂贵,因此可用数据往往很少,难以训练 ML 模型来预测工件质量(Postel 等人,2020 年)。

此外,在使用复杂的 ML 模型(尤其是深度神经网络模型)时,其内部运作是不透明的,其 "黑箱 "性质可能会造成问题。出现这一问题的原因是这些模型的预测结果难以理解,因此无法被制粉质量预测领域的从业人员和利益相关者完全理解(Kwon 等人,2023 年)。

本研究提出了一种利用可解释性方法来阐明和优化 ML 模型预测机制,从而提高 ML 模型性能的方法。通过使用可解释性方法,可以识别 ML 模型预测中的重要特征并消除不必要的特征,从而有效推进优化工作(Bento 等人,2021 年;Sun 等人,2022 年)。

相关研究

将机器学习(ML)应用于制造和加工任务至少已有十年之久(Kummar,2017)。例如,ML 最初用于优化车削操作(Mokhtari Homami 等人,2014 年)、预测铣削操作的稳定条件(Postel 等人,2020 年)、估算内孔质量(Schorr 等人,2020 年)以及使用 ML 驱动的表面质量控制对缺陷进行分类(Chouhad 等人,2021 年)。Chouhad 等人,2021 年)等。

然而,可解释人工智能(XAI)方法在制造过程中的应用最近才开始受到关注(Yoo 和 Kang,2021 年;Senoner 等人,2022 年)。正在进行的欧洲 XMANAI 项目(Lampathaki 等人,2021 年)旨在评估 XAI 在不同制造领域的能力。特别是,XAI 在故障诊断领域的成功应用潜力已经显现(Brusa 等人,2023 年)。

还有一些研究侧重于数据集的特征选择,而不直接考虑 ML 模型(Bins 和 Draper,2001 年;Oreski 等人,2017 年;Venkatesh 和 Anuradha,2019 年)。本研究探讨了使用 XAI 通过消除不必要的传感器来提高预测模型质量的可能性,尽管通过可解释性方法来提高 ML 模型性能的方法在可解释性 ML 的背景下是众所周知的(Bento 等人,2021 年;Sun 等人,2022 年;Nguy 等人,2022 年)。等人,2022 年;Nguyen 和 Sakama,2021 年;Sofianidis 等人,2021 年),但这是 XAI 首次用于铣削操作的质量预测模型。特别是,通过使用 XAI 方法识别和消除不需要的特征来改进铣削过程质量预测模型的方法非常新颖。

方法论

本研究提出了一种利用可解释性技术提高机器学习(ML)模型性能的方法,具体步骤如下。

1. 训练 ML 模型

首先,使用给定的数据集训练 ML 模型。本研究使用了三种模型:决策树回归、梯度提升回归和随机森林回归。与神经网络相比,这些模型需要的数据更少,也更容易解释。

2. 可解释性方法的应用

将可解释性方法应用于训练好的 ML 模型和数据集,以确定对预测准确性至关重要的特征。这一步骤包括对特征的重要性进行排序,并使用越来越多的重要特征来训练新模型。

3. 特征选择

根据特征的重要性,只使用最重要的特征来训练新模型。这一过程可提高 ML 模型的性能。

机器学习模型

  • 决策树回归模型

决策树回归模型将输入空间划分为不同的区域,并对每个区域内的训练样本拟合一个简单的模型(通常为常数)。 对新输入𝑥 x 的预测 𝑦^表示如下。

其中,𝑐𝑚cm 是拟合区域 𝑅𝑚R m的常数,𝑀 M 是区域数量,𝐼 ⋅I⋅ 是指标函数。

  • 梯度提升回归模型

梯度提升回归模型结合了多个弱模型来优化损失函数。从初始近似值F0(x)开始,通过添加弱模型hmx(x)对其进行如下更新。

其中,𝛼 α 是学习率,hm(x) 是弱学习器,用于纠正前一个模型中的错误。

𝐹𝑚(𝑥)=𝐹𝑚-1(𝑥)+𝛼⋅타𝑚(𝑥)

  • 随机森林回归模型

随机森林回归模型通过训练多棵决策树并取其平均值来做出最终预测。

新输入数据𝑥x � �最终预测结果表达如下

其中,𝑇 T 是树的总数,yt(x)𝑦𝑡(𝑥) 是第 t 棵树的预测值。

𝑦^(𝑥)=1𝑇∑𝑡=1𝑇𝑦𝑡(𝑥)

可解释性技术

  • 特征的排列重要性

特征置换重要性是一种评估模型重要特征的问责方法。它通过随机替换某些特征并监测模型性能的变化来衡量每个特征的重要性。

  • 夏普利值

夏普利值源于合作博弈论,根据每个参与者的边际贡献分配公平值。在机器学习模型中,它量化了每个特征对预测的贡献。

案例研究

本研究使用 ENSAM 生成的数据集来应用所提出的方法。详情如下。

目标

本案例研究的目的是为每个质量指标开发一个预测模型。这不仅包括训练模型,还包括明确预测结果的原因,以及识别和删除不需要的特征。这一步骤旨在通过减少冗余传感器、优化资源和降低成本,最大限度地降低安装和维护成本。

图 1:用于加工工件的铣床

数据预处理

由于本研究处理的是时间序列长度不固定的数据,因此对每个时间序列都计算了方框图值。此外,数据集中的元数据包含各种实验参数。

训练机器学习模型

在本研究中,对决策树回归、梯度提升回归和随机森林模型进行了训练,以预测每个质量指标。模型输入和输出的整体视图如图 2 所示。每个模型的训练都采用了五部分交叉验证法。这种方法将数据分成五个相等的部分,其中四个部分(80%)用于训练,其余一个部分(20%)用于每次迭代测试。这一过程重复五次,五部分中的每一部分都作为测试集。对模型的性能取五次迭代的平均值,以得出更可靠的评估结果。

图 2:ML 预测模型接收箱形图(时域和频域)和机器配置参数,并输出质量指标。

分析

对所提出的方法进行了分析。首先评估了 ML 模型的性能,然后分析了 ML 模型的预测机制,最后评估了去除特征对 ML 模型性能的影响。

评估模型的预测质量

本研究旨在评估梯度提升回归、决策树和随机森林这三种 ML 模型的预测准确性。评估预测质量的主要指标是平均绝对误差率(MAPE)。如果 MAPE 小于 5%,则认为预测质量较高。

  • 设置:使用 100 个样本的预处理数据集。

  • 运行:在预处理数据集上训练了梯度提升回归、决策树和随机森林三种不同的机器学习模型,并使用 k 分割交叉验证法测量了 MAPE。

  • 研究结果:利用这些 ML 技术,我们能够利用一套完整的质量特征对 Rdq 进行预测,误差率低于 5%。具体来说,梯度提升回归模型的误差率为 4.58%,随机森林模型的误差率为 4.88%。

了解 ML 模型的预测机制

研究评估了每个属性在预测质量指标方面的重要性。

  • 设置:侧重于梯度提升回归模型,这些模型在训练后表现出最佳性能。
  • 运行:应用特征的排列重要性和 Shapley 值。
  • 发现:我们发现不同的解释方法显示出不同的原因。例如,与夏普利值相比,排列特征重要性突出显示 fa_ts_max 是更重要的特征(见图 3)。

图 3:使用 FPI(特征排列重要性排列)和 SHAP(夏普利值)方法对 Rdqmaxmean 预测的特征重要性等级进行可视化展示。

提高性能

本实验探索了将可解释性方法整合到 ML 模型开发过程中以提高模型性能的可能性。

  • 设置:ML 模型中的变量根据特征的重要性从高到低进行分类,每次试验都要训练一个新的模型,并改变顶级特征的比例(p)。

  • 运行:尝试只使用重要特征来提高模型的性能。

  • 研究结果:通过将最重要的特征整合到训练数据集中,ML 模型的性能得到了提高。例如,只选择排列重要性最高的 20% 的最重要特征,MAPE 就从约 4.58 提高到了 4.4。

图 4:在 Rdq 预测中根据不同方法使用不同比例的最重要特征。

讨论

本案例研究展示了可解释机器学习(ML)方法对制造质量预测模型的益处。可解释性分数(如特征重要性)用于解释每个特征与模型预测能力的相关性。人类专家可以利用这种解释来分析训练有素的模型,并验证重要性高的特征是否对预测任务有意义。

ML 模型可以揭示输入特征与预测目标之间的新关系,但在质量预测环境中,由于缺乏数据,过度依赖某些特征可能会成为学习错误相关性的指标。可解释性方法可以作为模型验证和人工检查的工具。

此外,研究还表明,可以通过去除低级特征来改进模型。具体来说,如图 4 所示,只保留最重要的特征就能提高模型的准确性。这种方法不仅提高了预测的准确性,还减少了预测所需的传感器数量,从而降低了预测的计算成本。在生产过程中进行实时质量预测以检测潜在缺陷和偏离计划的情况时,重要的是要尽量减少预测所需的时间并提高预测频率。

在设计生产原型机时,同样重要的是在早期阶段对预测模型进行评估,以确定机器的最终传感器组。虽然原型机配备了许多传感器,但只有在对预测模型进行评估后,才会选择相关的传感器。

此外,使用简单且可解释的模型(Breiman,2001 年;Rudin 等人,2022 年)可能有利于制造业质量预测模型的开发。然而,简单性和准确性之间存在权衡(奥卡姆困境):模型越简单,准确性就越低。在案例研究中,简单决策树与更复杂的梯度提升树和随机森林之间的误差差异也体现了这种权衡。使用可解释性技术减少特征数量再次降低了模型的复杂性,并使最终模型更具可解释性。

总结

本研究展示了结合机器学习(ML)和可解释性技术来提高制造业表面质量预测模型性能的潜力。尽管可用数据有限,但基于可解释性技术的特征选择能够利用少量数据提高 ML 模型的有效性。

未来研究的目标是将可解释性方法扩展到铣削以外的制造工艺,并建立一个更全面的预测系统。此外,这些 ML 模型将被用作物理机器的数字孪生模型,并将应用参数优化方法来开发新的开发成果。这种整合不仅能提高模型的准确性,还能对机器操作进行实时微调,从而提高效率并降低成本。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2200891.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

库函数相关(上一篇补充)

一、创建自己的头文件 在当前目录下创建一个my_head.h将这个文件移动到/usr/include目录 #ifndef __MY_HEAD_H__ #define __MY_HEAD_H__#include <stdio.h> #include <errno.h> #include <string.h>#define PRINT_ERR(s) do{\printf("%s %s %d\n&quo…

MongoDB初学者入门教学:与MySQL的对比理解

&#x1f3dd;️ 博主介绍 大家好&#xff0c;我是一个搬砖的农民工&#xff0c;很高兴认识大家 &#x1f60a; ~ &#x1f468;‍&#x1f393; 个人介绍&#xff1a;本人是一名后端Java开发工程师&#xff0c;坐标北京 ~ &#x1f389; 感谢关注 &#x1f4d6; 一起学习 &…

JavaEE: HTTPS的魅力与优势揭秘

文章目录 HTTPSHTTPS 是什么HTTPS 基本工作过程Fiddle 等抓包工具,为啥能解析 HTTPS 的数据? HTTPS HTTPS 是什么 HTTPS 是一个应用层协议,是在 HTTP 协议的基础上引入了一个加密层. 几个核心概念: 明文: 要传输的原始数据.密文: 把明文进行加密之后得到一个让别人不能理解…

【算法篇】三道题理解什么是递归,回溯和剪枝

递归&#xff0c;回溯&#xff0c;剪枝 想必大家再学习算法知识的路上经常听到回溯&#xff0c;剪枝类似的概念&#xff0c;对于初学者来说&#xff0c;很容易把他们理解成一种新的算法思想&#xff0c;其实回溯和剪枝只是在递归的基础上稍加修改&#xff0c;对于解决某些特定问…

k8s的pod的管理

常用的Pod基础命令 列出所有命名空间中的所有Pod kubectl get pods --all-namespaces 列出指定命名空间中的所有Pod kubectl get pods -n <namespace> 显示指定Pod的详细信息&#xff0c;包括状态、事件等 kubectl describe pod <pod-name> -n <namespace>…

机器学习入门(一)

一、机器学习概述 1、人工智能 像人一样智能的综合与分析&#xff0c;机器模拟人类。 是一个系统&#xff0c;像人那样思考&#xff0c;像人那样理性思考。 是一个系统&#xff0c;像人那样活动&#xff0c;像人那样合理的系统 2、机器学习 让机器自动学习&#xff0c;而不…

SAP将假脱机(Spool requests)内容转换为PDF文档[RSTXPDFT4]

将假脱机(Spool requests)内容转换为PDF文档[RSTXPDFT4] 有时需要将Spool中的内容导出成PDF文件&#xff0c;sap提供了一个标准程序RSTXPDFT4可以实现此功能。 1, Tcode:SP01, 进入spool requests list 2, SE38 运行程序RSTXPDFT4 输入spool reqeust号码18680&#xff0c;然后…

excel 单元格嵌入图片

1.图片右键,设置图片格式 2.属性 随单元格改为位置和大小 这样的话&#xff0c;图片就会嵌入到单元格&#xff0c;也会跟着单元格的大小而改变

10-记录器

这个功能允许记录和重现以前的模拟。所有发生的事件都记录在记录器文件 recorder file中。 1 记录 所有数据仅在服务器端以二进制文件的形式写入。但是&#xff0c;记录器是使用 carla.Client管理的。 注意&#xff1a;在回放结束时&#xff0c;车辆将被设置为自动驾驶&#xf…

强化学习和QLearning及GAN到底是什么关系啊

强化学习&#xff08;Reinforcement Learning&#xff09;、Q-Learning 和生成对抗网络&#xff08;GANs&#xff09;是机器学习中的三个不同概念&#xff0c;它们虽然有一些交叉&#xff0c;但本质上是针对不同问题的技术方法。下面我来详细解释它们之间的关系和区别&#xff…

leetcode每日一题day22(24.10.2)——准时到达的列车最小时速

思路&#xff1a;这种在有约束条件情况下&#xff0c;求最值或最符合要求的情况&#xff0c;首先是很容易想到&#xff0c;从时速为1开始往后找找到满足条件就输出&#xff0c;但这无疑工程量很大&#xff0c;每种可能的速度都要对列车数组进行遍历&#xff0c; 时间复杂度为C…

链表Set_LinkList(并集)

并集是把两个集合合并&#xff0c;去除重复元素后组成的集合。 通过键盘输入将两个集合保存在链表A和链表B中&#xff0c;再创建一个链表C用于保存集合A、B的并集&#xff0c;将链表C打印输出。 提示&#xff1a; 1.相对于上一题&#xff08;链表Set_LinkList&#xff08;建立&…

java 微服务 端口冲突 redis虚拟磁盘满 nacos挂

java 微服务 端口冲突 哥 排除法呀 什么卸载软件QAQ netstat -ano | findstr :48080 输这个呀 然后 taskkill /PID 1234 /F redis虚拟磁盘满 导致 假死 挂了 nacos 挂了重启 nacosrun.bat startup -m standalone

facebook受众选择设置策略的最佳方式

在进行Facebookguanggao投放时&#xff0c;受众的选择是一个至关重要的步骤。正确的受众选择不仅能够帮助我们更好地定位目标用户&#xff0c;还能显著提高guanggao的转化率和投资回报率&#xff08;ROI&#xff09;。然而&#xff0c;受众选择的数量和范围同样是需要认真考虑的…

QtDesign预览的效果与程序运行的结果不一致的解决方法

存在的问题 使用Qt designer软件设计出来的界面&#xff0c;与转换成python程序运行出来的结果不一致&#xff0c;具体看下图 Qt designer预览结果 程序运行出来的结果 原因分析 我自己的电脑是2560*1600分辨率的屏幕&#xff0c;采用的是200%的缩放比例&#xff0c;出现这种…

虚拟机没有网络怎么解决

CentOS7为例 进入虚拟网络编辑器 1.更改设置 2.选中NAT模式点击3点击移除网络 4添加网络&#xff0c;随便选一个 5.点开NAT设置&#xff0c;记住网关 6.DHCP设置&#xff0c;注意虚拟机设置ip必须在起始ip和结束ip范围内 进入虚拟机网络适配器&#xff0c;自定义选中第4步操作…

Tailwind Css的使用

1.Tailwind Css是什么 官网解释&#xff1a;Tailwind CSS 的工作原理是扫描所有 HTML 文件、JavaScript 组件以及任何 模板中的 CSS 类&#xff08;class&#xff09;名&#xff0c;然后生成相应的样式代码并写入 到一个静态 CSS 文件中。 我的理解是利用Tailwind CSS 提供的…

Element-快速入门

什么是 Element 在现代前端开发中&#xff0c;组件化的思想日益盛行&#xff0c;Element组件库作为一款流行的UI组件库&#xff0c;特别适用于基于Vue.js的项目&#xff0c;它为开发者提供了丰富的组件和良好的开发体验。 想要使用Element的组件库&#xff0c;我们需要完成下面…

基于opencv的人脸闭眼识别疲劳监测

关于深度实战社区 我们是一个深度学习领域的独立工作室。团队成员有&#xff1a;中科大硕士、纽约大学硕士、浙江大学硕士、华东理工博士等&#xff0c;曾在腾讯、百度、德勤等担任算法工程师/产品经理。全网20多万粉丝&#xff0c;拥有2篇国家级人工智能发明专利。 社区特色…

基于函数计算FC 部署 ComfyUI实现AI生图 的优势

基于函数计算FC 部署 ComfyUI实现AI生图 的优势 部署ComfyUI实现AI生图使用函数计算FC 一键部署ComfyUI 绘画平台的优势有哪些&#xff1f; 在文章开始之前&#xff0c;先来看一下基于函数计算FC 部署 ComfyUI实现AI生图 的大概步骤&#xff0c;整个基础部署操作比较简单。即便…