2022年天府杯全国大学生数学建模竞赛A题仪器故障智能诊断技术解题全过程文档及程序

news2025/1/22 15:58:17

2022年天府杯全国大学生数学建模竞赛

A题 仪器故障智能诊断技术

原题再现:

  问题背景:
  仪器设备故障诊断技术是一种了解和掌握机器在运行过程的状态,确定其整体或局部正常或异常,早期发现故障及其原因,并能预报故障发展趋势的技术。仪器故障按照来源可分为外部型和内部型,其中外部型故障的产生多为静电放射、电磁辐射、雷暴天气、空气湿度过大等导致的电路损坏或传感器失灵,内部型故障多为齿轮破裂、电机短路等。油液监测、振动监测、噪声监测、性能趋势分析和无损探伤等为其主要的诊断技术方式。
  随着计算机技术和人工智能科学的发展,基于机器学习或深度学习的故障智能诊断方法成为从业者的新型决策工具,其中故障类型识别是主要内容,该项技术特点在于:降低原始数据的环境噪声或异常数据影响,提取可靠的波形特征判据,选择或改进现有的机器学习方法,设计一系列必要的仿真实验,讨论与分析。
  请解决:
  (1)针对附件一和附件二中的数据,各自由选择 1 条原始数据进行信号去噪处理,并将处理效果汇总在附表 1-1 和附表 1-2 中,表中指标已存在 3 项,另需参赛者添加至少 3 项评价指标,以完善故障数据去噪效果评价;
  (2)信号特征提取是进行故障智能检测的重要前提。请针对附件一和附件二中的全部数据进行信号的特征提取,特征判据数量不得少于 10 项,并将提取的特征值汇总在附表 2-1 和附表 2-2 中;
  (3)基于无监督型或半监督型方法,进行附表 1 类数据和附表 2 类数据的二分类实验,并将实验结果登记在附表 3 中,预测结果评价指标已存在 3 项,另需参赛者添加至少 3 项评价指标,使用的预测方法应保证预测准确率均值在 90%以上,准确率标准差在 10 以内;
  (4)基于有监督型学习方法,进行附表 1 类数据和附表 2 类数据的二分类实验,并将实验结果登记在附表 4 中,预测结果评价指标已存在 3 项,另需参赛者另添加至少 3 项评价指标,使用的预测方法应保证预测准确率均值在 95%以上,准确率标准差在 5 以内;
  (5) 本问属于选择题,参赛者可在下列 3 个小问中任选一问解答:
  5.a 请对比分析信号去噪前后的信号特征在信号分类试验中的区别与影响;
  5.b 讨论特征的数量以及质量对特征识别的影响,以及给出解决办法;
  5.c 引入图像识别技术解决第三问或第四问。

  附件数据说明:文件名依次为 1~100,1~70 为 A 型故障数据,71~100 为B 型故障数据;每条数据长度统一为 4096,已做归一化处理,值域范围为[-1,+1]。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

整体求解过程概述(摘要)

  本文主要通过分析仪器设备产生的波形信号数据,提取重要信号特征,进而达到对设备仪器的故障智能检测。根据信号数据的特点,我们对问题 1 绘制箱线图对异常值进行降噪处理;对问题 2 用主成分分析法提取主成分特征,再用随机森林算法提取重要特征;对问题 3 用 K-均值聚类算法、高斯混合分布进行设备故障的分类;对问题 4 用随机森林及其优化、高斯朴素贝叶斯的方法进行设备故障的分类;对问题 5 用控制变量法解决“提取特征数量以及质量对特征识别的影响”的问题。
  对于问题 1,我们新添 3 个指标分别为 R-Square、MAE、MAPE。首先建立“箱线图异常点调整模型”。然后用 Python编译环境,计算每一列数值的箱线图的上边缘值和下边缘值。将每一列所有异常点调整至上、下边缘值之间。最后,用 Python绘制每一列数据调整前和调整后的箱线图进行比较,分析 6 项指标以验证模型降噪的合理性,并将处理后的结果汇总在附表 1-1 和 1-2 中。
  对于问题 2,我们首先读取降噪后的数据,在已搭配环境下运用主成分分析法建立“主成分特征提取模型”。在对该模型的基础之上运用随机森林算法建立“重要性特征提取模型”。在对两个模型合理的理论证明和推导后,从“主成分特征提取模型”中得到72 个主成分特征,再从“重要性特征提取模型”中提取更为重要的 16 个特征,最终得到维度为 100×16 的样本特征数据,并将其结果汇总在附表 2-1 和 2-2 中。
  对于问题 3,我们新添 3 个指标分别为精确率、F1-score、错误率。读取问题 2 得到的样本特征数据,在已搭建环境下构建“K-均值聚类算法模型”,预测准确率均值为58%,但未能达到题意要求。再根据高斯分步函数建立“混合高斯模型”。最终得到样本预测准确率均值为 91%,准确率标准差为 0.29。
  对于问题 4,我们用问题 2 中提取到的样本特征数据,在表中给两类故障分别加上标签。首先,在已搭配环境下用多种分类器给数据进行分类,得到最高分类准确率分别是随机森林分类器和高斯朴素贝叶斯分类器,且准确率都为 90%。在此基础之上我们运用控制变量法以及模型得分准则对参数进行调整,运用特殊的训练集和测试集划分进行改进,进而建立 “随机森林模型”和 “高斯朴素贝叶斯模型”。最终得到“随机森林模型”中分类器的准确率为 93.33%,预测准确率均值为 90%;“高斯朴素贝叶斯模型” 中分类器的准确率为 95%,预测准确率均值为 97%。
  对于问题 5,我们利用主成分分析法提取贡献率累计达到 95%的 72 个特征,利用 100个样本数据的 72 个特征在随进森林和高斯朴素贝叶斯分类器中进行分类,得出分类准确率分别为 83.33%和 86.67%。再利用随进森林分类器对 100 个样本进行单一特征分类,从而选取最佳特征组合,得到最终分类结果为 90%。

模型假设:

  1. 假设题目所给的数据真实可靠;
  2.假设不同仪器设备之间运行时不会相互影响;
  3.假设所有仪器设备信号数据都在相同运行时间段截取;
  4.假设所有仪器设备都在同一环境下运行;
  5.假设所有仪器设备使用年限一样。

问题分析:

  (一) 问题 1 的分析
  问题 1 要求我们对附件数据进行降噪处理,新添 3 项指标。降噪目的是找出噪声并减少或排除噪声对后续工作的影响。分析 6 项指标对降噪效果进行评价,以检验模型降噪的合理性。
  问题 1 属于数据预处理问题。读取原始数据,首先建立“箱线图异常点调整模型”。计算每一列数值的箱线图的上边缘值和下边缘值。将每一列数值大于该列上边缘值的异常点调整为上边缘值,并将每一列数值小于该列下边缘值的异常点调整为下边缘值。最后,绘制数据调整前和调整后的箱线图进行比较,并通过 6 项评估该模型的合理性。
  (二) 问题 2 的分析
  问题 2 属于提取主要特征的数学问题,要求我们在降低数据维度的同时要提取最重要的特征。
  问题 2 一般的数据降维分析方法有奇异值分解、主成分分析、因子分析以及独立成分分析等。由于题中所给数据为 4096 列信号数据,而主成分分析法适合对信号数据进行处理。因此,我们先建立“主成分特征提取模型”,然后在该模型基础上再建立“重要性特征提取模型”。最后,将这两个模型提取的样本特征数据分别在多种分类器中进行二分类,通过分类准确率验证特征模型的合理性。
  (三) 问题 3 的分析
  问题 3 要求我们运用无监督学习方法对两类数据进行分类并新添 3 项指标。
  问题 3 属于无标签分类问题,读取问题 2 的样本特征数据。我们先构建“K-均值聚类算法模型”,然后通过高斯分步概率密度函数建立“混合高斯模型”。将每一个未测试的样本作为测试集,将其余 70%样本作为模型训练集,30 作为测试集。最后记录 6 项指标。最后,通过比较两个模型分类的准确率,得到最终符合要求的模型。
  (四) 问题 4 的分析
  问题 4 要求我们运用有监督学习方法对两类数据进行分类并新添 3 项指标。问题 4 属于分类问题,读取问题 2 的样本特征数据,在表中给两类故障分别加上标签。首先,通过多种分类器以及参数调整优化建立“随机森林分类器模型”,和 “高斯朴素贝叶斯模型”。最后,通过比较两个模型分类的准确率,得到最终符合要求的模型。
  (五) 问题 5 的分析
  问题 5 要求我们讨论并解决特征的数量以及质量对特征识别的影响。对于问题 5,我们利用主成分分析法提取贡献率累计较高的多个特征,利用 100 个样本数据的这些特征在随进森林和高斯朴素贝叶斯分类器中进行分类,得出分类准确率。再利用随进森林分类器对 100 个样本进行单一特征分类,从而选取最佳特征组合,可得得到最终分类结果。

模型的建立与求解整体论文缩略图

在这里插入图片描述

全部论文请见下方“ 只会建模 QQ名片” 点击QQ名片即可

部分程序代码:(代码和文档not free)

import numpy as np
points = np.array([129,140,103.5,88,185.5,195,105,157.5,107.5,77,81,162,162,117.5,7.5,141.5,23,
147,22.5,137.5,85.5,-6.5,-81,3,56.5,-66.5,84,-33.5]).reshape(14,2)  
#这是给定数据的(xi, yi),只是先输入了全部x又输入了全部y
values = np.array([-4,-8,-6,-8,-6,-8,-8,-9,-9,-8,-8,-9,-4,-9])  #这是给定数据的zi
 
grid_x, grid_y = np.mgrid[0:200:400j, -100:200:600j] #这是插值点的(xi,yi)
from scipy.interpolate import griddata            #这是求插值点的zi
grid_z0 = griddata(points, values, (grid_x, grid_y), method='nearest')
grid_z1 = griddata(points, values, (grid_x, grid_y), method='linear')
grid_z2 = griddata(points, values, (grid_x, grid_y), method='cubic')
 
#下面是绘图
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d.axes3d import Axes3D
plt.figure()
 
ax1 = plt.subplot2grid((2,2), (0,0), projection='3d')
ax1.plot_surface(grid_x, grid_y, grid_z0, color = "c")
ax1.set_title('nearest')
 
ax2 = plt.subplot2grid((2,2), (0,1), projection='3d')
ax2.plot_surface(grid_x, grid_y, grid_z1, color = "c")
ax2.set_title('linear')
 
ax3 = plt.subplot2grid((2,2), (1,0), projection='3d')
ax3.plot_surface(grid_x, grid_y, grid_z2, color = "r")
ax3.set_title('cubic')
 
ax4 = plt.subplot2grid((2,2), (1,1), projection='3d')
ax4.scatter(points[:,0], points[:,1], values,  c= "b")
ax4.set_title('org_points')
 
plt.tight_layout()
plt.show()

全部论文请见下方“ 只会建模 QQ名片” 点击QQ名片即可

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/592917.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

关于高三经典励志文章精选

关于高三经典励志文章精选 篇一 人要心有所向 曾经有幸被母校邀请回校做演讲。那一次的演讲结束后,接到学弟学妹最多的问题是:为什么我的大学生活很充实,自己也很努力,可毕业之后依旧觉得很迷茫? 我觉得关于迷茫的解答最后都能归…

git创建本地分支的应用实践

场景 我们希望能够不影响本地master分支的情况下自己单独开发一个功能,等开发完成后再合并到master分支中 操作 创建本地分支sortdev,并且切换到该分支上: git checkout -b sortdev git branch -vv 可以查看到本地master分支追踪的是远程…

【学习记录】二次曲线、二次曲面、对偶二次曲线、对偶二次曲面

一、二次曲线与对偶二次曲线 最近在看基于椭球体的物体SLAM过程中,经常涉及到椭球体的空间几何知识,这里先补充一下一些空间几何相关的基础,参考链接。 椭球体本身属于二次曲面的一种,二次曲面是对空间形状的描述,属于…

每天一道面试题之如何将字符串反转?

在java中,我们可以使用StringBuilder或者StringBuffer类的reverse()方法来实现对字符串的反转。 在讲述实现方法之前,首先我们先来介绍一下StringBuilder和StringBuffer是什么?在实际开发中,会有大量的字符串的拼接,但java中的字…

pytorch 训练EfficientnetV2

文章目录 前言一、数据摆放二、训练二、测试三、训练和测试结果总结 前言 前不久用pytorch复现了efficientnetv2的网络结构,但是后边自己一直有其他事情再做,所以训练部分的文章拖到了现在。关于Efficientnet的部分文章链接可参考如下: Effic…

一百二十、Kettle——用kettle把Hive数据同步到ClickHouse

一、目标 用kettle把hive数据同步到clickhouse,简单运行、直接全量导入数据 工具版本:kettle:8.2 Hive:3.1.2 ClickHouse21.9.5.16 二、前提 (一)kettle连上hive (二)kettle连上cli…

10. 数据结构之树

前言 之前介绍了顺序表的数据结构,包含队列,栈等,这种结构都是一对一的,但是现实生活中,经常会遇见一对多的数据结构,比如族谱,部门机构等,此时我们需要一个更复杂的数据结构来表示…

分布式系统概念和设计——(事务与并发控制)

分布式系统概念和设计 事务与并发控制 简介 事务的目标是在多个事务访问对象以及服务器面临崩溃的情况下,保证所有由服务器管理的对象始终维持在一个一致的状态上 事务是由客户定义的针对服务器对象的一组操作,组成为一个不可分割的单元,由…

Unity | HDRP高清渲染管线学习笔记:HDRP配置文件(HDRP Asset)

目录 一、Frame Settings(帧设置) 二、Volume 三、HDRP配置文件、帧设置和Volume之间的关系 四、HDRP配置文件 1.Rendering (1)Color Buffer Format(颜色缓存格式) (2)Lit Sh…

芭比Q了,现在的00后实在是太卷了.....

都说00后躺平了,但是有一说一,该卷的还是卷。 这不,前段时间我们公司来了个00后,工作都没两年,跳槽到我们公司起薪20K,都快接近我了。后来才知道人家是个卷王,从早干到晚就差搬张床到工位睡觉了…

掌握这个90%的人都不会的大屏技术,裁员、降薪与你无关

裁员话题时不时就被拉到热搜上溜几圈,一方面让各位打工人们焦虑恐惧失业风险,另一方面也能让各位从一波波裁员危机事件中吸取“经验”。例如,技术人员狂敲代码、业务人员猛冲业绩…该被裁的依旧如此,在当今你得具备点别人没有的技…

测评补单操作在美客多店铺及产品优化中的决定性角色:深度解读

许多经营美客多平台的商家有一种观念,他们认为美客多平台的规则与亚马逊有所区别。在美客多上,店铺比产品更重要,而且平台的竞争相对较小。因此,他们认为在美客多平台进行补单操作是不必要的。 然而,是否真的如此呢&a…

RF接口测试(1)

RF是做接口测试的一个非常方便的工具,我们只需要写好发送报文的脚本,就可以灵活的对接口进行测试。 做接口测试我们需要做如下工作: 1、拼接发送的报文 2、发送请求的方法 3、对结果进行判断 我们先按步骤实现,再进行RF操作的…

人效九宫格|三个提升路径,三种管理模式,让人效实时可量化

文|盖雅学苑‍‍ 本文共5202字 在经济高速发展的过去,企业更关注机遇,当经济发展速度进入新常态时,企业更关注效率。在盖雅工场发布的《企业人效管理白皮书》中的数据显示,69.9%的企业依旧将人效提升作为紧急事项&am…

Vue主界面精美模板分享

文章目录 🐒个人主页🏅Vue项目常用组件模板仓库📖前言:🎀源码如下: 🐒个人主页 🏅Vue项目常用组件模板仓库 📖前言: 本篇博客主要提供vue组件之主页面组件源…

代码级质量技术之基本框架介绍

作者 | CQT&星云团队 一、背景 代码级质量技术:顾名思义为了服务质量更好,涉及到代码层面的相关技术,特别要指出的是,代码级质量技术不单纯指代码召回技术,如静态代码扫描、单元测试等。 研究代码级质量技术主要…

1.6 初探JdbcTemplate操作

一、JdbcTemplate案例演示 1、创建数据库与表 (1)创建数据库 执行命令:CREATE DATABASE simonshop DEFAULT CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci; 或者利用菜单方式创建数据库 - simonshop 打开数据库simonshop &#x…

边缘计算盒子在视觉分析领域的优势

边缘计算盒子在视觉分析领域有广泛的应用。边缘计算盒子是一种集成了计算、存储和网络连接功能的设备,通常部署在物理环境中的边缘位置,如工厂、城市、交通系统等。它们能够在离数据源更近的位置进行实时数据处理和分析,从而提供更低的延迟和…

使用Docker安装Kafka

第一步:使用下述命令从Docker Hub查找镜像,此处我们要选择的是zookeeper官网的镜像 docker search zookeeper 第二步:拉取zookeeper镜像 docker pull zookeeper:latest 第三步:启动zookeeper容器 docker run -d --name zookee…

微服务-Elasticsearch基础篇【内含思维导图】

Elasticsearch官网:欢迎来到 Elastic — Elasticsearch 和 Kibana 的开发者 | Elastic 注意:Elasticsearch官网访问和加载的耗时很长!!! Lucene官网:Apache Lucene - Welcome to Apache Lucene 目录 一、E…