【DTEmpower案例操作教程】智能数据挖掘

news2024/11/26 0:44:45

DTEmpower是由天洑软件自主研发的一款通用的智能数据建模软件,致力于帮助工程师及工科专业学生,利用工业领域中的仿真、试验、测量等各类数据进行挖掘分析,建立高质量的数据模型,实现快速设计评估、实时仿真预测、系统参数预警、设备状态监测等工程应用。软件内置有图形化、零编码的数据分析建模环境,围绕数据清理、特征生成、敏感性分析和模型训练等环节提供丰富的AI算法,提供从模型搭建到模型管理应用的一站式解决方案,学习门槛低、模型质量高,零基础用户也能快速挖掘得到优秀的数据模型。

一、案例描述

数据挖掘用于揭示数据背后存在的规律。在科学计算、工程设计、生产运维、商务管理等多个领域,从业人员会获得大量的数据,通过数据挖掘将其中所隐含的信息显式地提取出来,可以用于创造更大的价值。在本节中,将介绍包括数据准备、数据清理、模型训练等典型过程在内的精简案例,展示DTEmpower在数据挖掘方面的应用。该案例以基于Styblinski-Tang函数采样得到的299个算例和1个结果异常的算例作为原始数据,部分算例如图1所示,其中被红色标注的算例为结果异常的算例。

图1 部分原始数据

案例中Styblinski-Tang函数供包含五个输入变量x0、x1、x2、x3、x4,一个输出变量y,其中任意两个输入变量组成的函数曲面(其它输入变量值等于零时)如图2所示。

图2 Styblinski-Tang函数曲面

针对该案例,利用DTEmpower提供的智能数据清理算法AIOD和智能代理模型训练算法AIAgent进行智能数据挖掘。

二、操作流程

1)新建项目

双击打开DTEmpower软件,即可进入到如图3所示的界面。单击新建项目,即可创建一个临时项目文件,需要注意的是,临时创建的项目文件不会自动保存。如果想要保存项目文件,用户可以进入到项目中选择“文件-保存”,就可以保存工程文件到自己想要的指定位置。

图3 新建项目

2)添加数据集

新建项目之后,即会进入到DTEmpower的工程主页面,如图4所示。

图4 工程主页

进入工程主页之后,点击“导入数据”,即跳出数据集文件上传窗口。点击窗口中的“选择文件”按钮,即可选择本地磁盘中的数据文件加载至当前项目中,如图5所示。

图5上传原始数据

数据集添加完成后即出现在左侧的资源菜单中,如图6所示。

图6 数据集上传结果

3)加入流程

上传数据集之后,单击选中数据集,在数据集的右上方,点击选择“数据建模”,会即弹出数据建模的两种模式选择,点击选择专业模式,如图7所示。这里可以根据用户自身需求更改流程名称和描述(非必须操作),然后点击确定按钮。

图7 专业模式数据建模

点击确定之后,原始数据的载入即以“数据读取”节点的形式加入至建模流程中。在建模画布与左侧资源树中均可以观察到新增的节点,如图8所示。

图8 数据集加入流程

4)变量设定

在建模流程中,原始数据载入后,需要依托“数据操作-变量设定”节点将变量指定为输入变量和输出变量两类,后续的数据清洗、特征工程和模型训练都将依托于输入和输出变量进行。

在顶部菜单栏中单击工具箱中的“数据操作”,即可展开右侧工具箱。选择其中的“变量设定”控件并拖拽至画布中,即完成了新节点的添加,如图9所示。

图9 添加变量设定节点

此时可以单击添加至建模流程中的变量设定节点,在节点属性弹窗中修改节点名、节点描述,方便查看和理解,如图10所示。需要注意的是,该操作不是必须的。

图10 修改节点名称及描述

数据读取节点读取的原始数据将传递至变量设定节点,进行输入和输出变量的设定,因此需要连接数据读取节点和变量设定节点,如图11所示。

图11 连接数据载入和变量设定节点

数据读取节点和变量设定节点连接完成后,会自动弹出节点间输入输出量的关联列表,系统会默认对类型匹配的输入输出量进行自动关联,用户可以根据自身需求进行增删改操作,如图12所示。

图12 连线配置

5)异常点清洗

在DTEmpower提供自研智能数据清理算法AIOD,节点执行完成后,会为每条算例提供一个异常风险评分,分值越高该算例为异常点的可能性越高。将工具箱切换为数据清理,然后将AIOD节点加入至建模流程,如图13所示。

图13 添加AIOD节点

同变量设定节点一样,用户可通过单击AIOD节点的方式修改节点名称和描述,具体操作上文已经进行详细描述,此处不再赘述。经变量设定节点指定输入输出变量的数据将传递至AIOD节点,进行数据清洗,因此需要连接变量设定节点和AIOD节点,如图14所示。

图14 连接变量设定节点和AIOD节点

如需调整节点的位置与距离以保持画布整洁,可以同时按住键盘“Ctrl”键并用鼠标进行框选,在弹出菜单中选择对齐方式等,如图15所示。

图15 节点框选与对齐

6)智能模型训练——AIAgent

DTEmpower提供自研智能模型训练算法AIAgent,内嵌集成学习、数据分层分类及超参自学习模块的AIAgent无需用户具有算法基础或调参经验。

将工具箱切换为回归训练,然后将AIAgent节点加入至建模流程,如图16所示。

图16 添加AIAgent节点

点击画布上的AIAgent节点,右侧将弹出节点配置面板。开启其中的“小数据集优化”选项,如图17所示。该选项适合在样本量在1000行上下的数据集开启,将耗费更多的训练时长,但模型精度也相对更高。

图17 AIAgent配置面板

采用同样的方式可修改节点的名称,并完成节点间的连接,如图18所示。

图18 连接AIOD节点和AIAgent节点

7)执行流程与交互式配置

建模流程搭建完成后,单击顶部菜单栏“开始”按钮后,建模流程中的节点即开始依次执行,其中执行至变量设定和AIOD节点时流程执行会自动暂定,用户在交互式配置弹窗中配置完成后才会继续向下执行,直至建模流程执行完成。

执行至变量设定节点时,自动弹出的交互式配置弹窗如图19所示。

图19 变量设定交互弹窗

如前文所述,变量设定交互式弹窗左侧为从原始数据文件表头中读取到的变量名称,右侧上栏为输入变量,右侧下栏为输出变量。用户在左侧勾选变量,然后单击表格间的移动按钮,即可实现输入和输出变量的设定,分别如图20、图21所示。在勾选变量时,支持Shift快捷键批量选择。

图20 输入变量设定

图21输出变量设定

输入输出变量设定完成后,单击交互式弹窗右下角的提交按钮即可继续向下执行,如图22所示。

图22 提交变量设定

流程执行至AIOD节点后,会自动弹出数据清理的交互式弹窗,用户在该弹窗中可根据右侧列表中各算例给定的异常风险值辅以左侧的可视化图表,选择异常点。需要注意的是,右侧的算例列表是按异常风险评分由高到低排序的。左侧的可视化图表包含三种形式:柱状图、箱线图以及散点图,如图23所示。

图23 AIOD节点交互式弹窗

通常而言,异常风险评分明显高于其他算例的算例是异常点的概率更高。在右侧列表中勾选或左侧散点图中双击算例点均可将对应算例指定为异常点;在右侧列表中取消勾选或在左侧散点图中双击已经被指定为异常点的算例,即可将取消对应算例的异常点指定。点击左侧“预览”按钮可以查看剔除异常点后的新可视化显示。

图24 异常点配置

如图21所示,异常风险评分最高的算例即为真实的异常点,其异常风险评分在0.70以上,而其它算例异常风险评分最高为0.23。因此,将其指定为异常点后单击交互式右下角的确定按钮即可继续向下执行,直至整个流程执行完成,如图25所示。

图25 流程执行完成

三、效果对比

建模流程执行完成后,展开资源树中AIAgent节点,单击model选项,依次选择输出变量、勾选响应面自变量、并配置其它输入变量的变量值后,单击开始绘图按钮后,右侧即显示训练得到的模型响应面信息,如图26所示。

图26 模型信息查看

为了验证AIAgent的优越性,本案例同时新建了对比工程,利用集成学习算法Adaboost节点代替AIAgent节点,在其它配置均相同的情况下,两者响应面对比如图27所示。

图27 训练效果对比

由图27可知,AIAgent响应面结果与真实函数空间趋势几乎完全一致,而Adaboost的响应面绝大部分区域的细节信息丢失。

DTEmpower更多详细介绍及软件试用,请搜索“天洑软件”前往官网下载试用。试用无需申请license,软件安装后可直接免费试用30天。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1048380.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

m4a怎么转换mp3?4个方法包教包会

m4a怎么转换mp3?M4A是一种备受欢迎的音频文件格式,通常用于存储高保真音频数据。它代表着“MPEG-4 Audio”扩展名,这意味着它属于基于MPEG-4标准的音频格式之一。M4A格式有着众多的优势。首先,它能够提供出色的音质,并…

html、css学习记录【uniapp前奏】

Html 声明:该学习笔记源于菜鸟自学网站,特此记录笔记。很多示例源于此官网,若有侵权请联系删除。 文章目录 Html声明: CSS 全称 Cascading Style Sheets,层叠样式表。是一种用来为结构化文档(如 HTML 文档…

在微信小程序中跳转到另一个小程序(多种实现方式)

方式一: 配置要跳转的appid和小程序页面路径 wx.navigateToMiniProgram({appId: 目标小程序appid,path: 目标小程序页面路径,//develop开发版;trial体验版;release正式版envVersion: release, success(res) {// 打开成功console.log("跳…

【MATLAB源码-第38期】基于OFDM的块状导频和梳状导频误码率性能对比,不同信道估计方法以及不同调制方式对比。

1、算法描述 块状导频和梳状导频都是用于无线通信系统中信道估计的方法。 块状导频: 定义: 在频域上,块状导频是连续放置的一组导频符号。这意味着所有的导频符号都集中在一个短的时间段内发送。 优点: 对于时间选择性信道&#…

项目管理常用工具有哪些?

项目管理常用的工具有很多,以下是一些常见的工具: 1. 甘特图:甘特图是一种图形化的工具,用于展示项目的时间计划和任务进度。它可以清晰地显示项目中各个任务的开始时间、结束时间以及任务之间的依赖关系。 2. 工作分解结构&#…

ChatGPT必应联网功能正式上线

今日凌晨发现,ChatGPT又支持必应联网了!虽然有人使用过newbing这个阉割版的联网GPT4,但官方版本确实更加便捷好用啊! 尽管 ChatGPT 此前已经展现出了其他人工智能模型无可比拟的智能,但由于其训练数据的限制&#xff…

【AI视野·今日CV 计算机视觉论文速览 第256期】Thu, 28 Sep 2023

AI视野今日CS.CV 计算机视觉论文速览 Thu, 28 Sep 2023 Totally 96 papers 👉上期速览✈更多精彩请移步主页 Daily Computer Vision Papers SHACIRA: Scalable HAsh-grid Compression for Implicit Neural Representations Authors Sharath Girish, Abhinav Shriva…

视频直播美颜sdk与计算机视觉的奇妙结合

在数字时代,视频直播已经成为了人们分享生活、娱乐互动的重要方式之一。而随着社交媒体和在线直播平台的不断发展,用户们对于直播质量和体验提出了越来越高的要求。其中之一就是美颜效果。美颜不仅仅是为了矫正自身缺陷,它更是一种增强直播吸…

安卓玩机-----反编译apk 修改apk 去广告 去弹窗等操作中的一些常识

安卓机型app的编译与反编译 apk文件的简单说明与解析 -安卓修改apk apk的组成和编译 一 电脑端几种反编译apk工具操作步骤解析 前面几个博文有说明关于反编译apk和apk架构等有些常识.今天对以上做个补充。初学者记住一点。对于一个apk文件使用压缩软件7zip打开可以查看到文件…

Aruba CX交换机 初始化配置

文章目录 CX交换机使用type-c接口console管理口配置:更改时间更改/创建管理员密码接口vlan配置DHCP配置配置保存 CX交换机使用type-c接口console Aruba cx交换机 console速率 Serial :115200 ##初始化清空配置: 6300: erase all…

基于DTW算法的命令字识别

DTW算法介绍 DTW(Dynamic Time Warping):按距离最近原则,构建两个序列之间的对应的关系,评估两个序列的相似性。 要求: 单向对应,不能回头;一一对应,不能有空;对应之后&#xff0…

【图文】IRRA:跨模态隐式关系推理与对齐 | CVPR2023

详细内容指路zhihu👉CVPR2023 | IRRA论文阅读 摘要 Text-to-image Person Retrieval的目的是根据给定的文本描述查询确定目标个体。主要的挑战是学习把视觉和文本模态映射到一个公共的潜在空间里。之前的工作尝试通过利用单模态分开预训练来提取图像和文本特征来解…

TOWE工业级多口大功率USB插座,助力多设备同时供电

同为科技(TOWE)工业级多口大功率USB桌面PDU插座 随着科技的不断进步,人们对电子设备的需求也越来越多样化。在如今的快节奏生活中,我们常常需要同时给多个设备充电,而传统的插座往往无法满足这一需求。为解决这一问题…

JavaSE(三)

3.1 异常 Java 异常类层次结构图概览: 1.Exception 和 Error 有什么区别? 在 Java 中,所有的异常都有一个共同的祖先 java.lang 包中的 Throwable 类。Throwable 类有两个重要的子类,分别是 Exception 和 Error: Ex…

嵌入式中如何用C语言操作sqlite3(07)

sqlite3编程接口非常多,对于初学者来说,我们暂时只需要掌握常用的几个函数,其他函数自然就知道如何使用了。 数据库 本篇假设数据库为my.db,有数据表student。 nonamescore4嵌入式开发爱好者89.0 创建表格语句如下: CREATE T…

数据结构算法--8基数排序

> 多关键字排序:现在有一个员工表,要求按照薪资排序,薪资相同的员工按照年龄排序 >> 先按照年龄排序,再按照薪资进行稳定的排序 > 例如:32,13,94,52,17&am…

C++中指针的概念和声明

C中指针的概念和声明 学习 C 的指针既简单又有趣。通过指针,可以简化一些 C 编程任务的执行,还有一些任务,如动态内存分配,没有指针是无法执行的。所以,想要成为一名优秀的 C 程序员,学习指针是很有必要的…

Unity实现设计模式——责任链模式

Unity实现设计模式——责任链模式 责任链模式定义:将请求的发送和接收解耦,让多个接收对象都有机会处理这个请求。将这些接收对象串成一条链,并沿着这条链传递这个请求,直到链上的某个接收对象能够处理它为止。 在职责链模式中&…

CIP或者EtherNET/IP中的PATH是什么含义?

目录 SegmentPATH举例 最近在学习EtherNET/IP,PATH不太明白,翻了翻规范,在这里记个笔记。下面的叙述可能是中英混合,有一些是规范中的原文我直接搬过来的。我翻译的不准确。 Segment PATH是CIP Segment中的一个分类。要了解PATH…

dataGrip导出导入的方式

导出:选中需要导出的表 导入:选中导出的sql文件