大数据挖掘企业服务平台(TipDM大数据挖掘建模平台)-快速构建数据挖掘工程

news2024/12/25 9:37:18

“TipDM大数据挖掘建模平台”(以下简称平台)是由广东泰迪智能科技股份有限公司自主研发,基于Python引擎的数据挖掘建模平台。使用平台配置的开箱即用的算法组件,用户可在没有编程基础的情况下,通过拖拽的方式进行操作,将数据输入输出、数据预处理、挖掘建模等环节通过流程化的方式进行连接,帮助用户快速建立数据挖掘工程,提升数据处理的效能。目前已经广泛运用在南方电网、中国电力科学研究院、珠江数码、北京智慧信访、中国石油勘探研究院、轻工业环境保护研究所、交通运输部公路科学研究所等众多企事业单位。平台的界面如图1所示。

 图1 平台界面图

平台简介

TipDM大数据挖掘建模平台主要有以下几个特点。

(1)平台算法基于Python引擎,用于数据挖掘建模。Python是目前最为流行的用于数据挖掘建模的语言之一,高度契合使用需求。

(2)用户可在没有Python编程基础的情况下,使用直观的可视化图形界面,通过拖拽的方式构建数据挖掘流程,无需编程。

(3)提供公开可用的数据挖掘示例工程,一键创建,快速运行。支持挖掘流程每个节点的结果在线预览。提供实时日志查看功能,出现问题快速定位。

(4)提供八大类数十种算法组件,包括数据预处理、统计分析、分类、聚类、文本分析等常用数据挖掘算法。同时提供Python脚本,粘贴代码即可运行。

平台主要分为数据空间、我的项目、算法组件三个模块。

数据空间

【数据空间】主要用于数据集的导入与管理,用户可从本地将任意类型的数据导入到平台中使用,如图2所示。同时,还可以选择是否将数据作为公共数据集进行上传,分享给其他用户使用,如图3所示。

图2 新增数据集

图3 上传公共数据集

我的项目

【我的项目】主要用于数据挖掘流程化的创建与管理。通过【我的项目】模块,能够创建空白的工程,进行数据挖掘流程的配置,如图4所示。对于完成度优秀的工程,可以将其保存为模板,如图5所示,其他用户可通过模板创建已配置好算法的数据挖掘工程,一键运行。

图4 工程

图5 模板

算法组件

在平台中,每一个数据挖掘算法都可称之为一个组件。【算法组件】主要分为系统算法组件和个人算法组件两部分。系统算法组件是由平台提供的默认算法,用户无需编辑,可直接在工程中使用。个人算法组件是在系统算法组件无法满足使用的情况下,用户可使用Python编写个人算法组件,供本用户使用。

系统算法组件包括输入、统计分析、预处理、脚本组件、聚类、分类、回归、文本分析,共八大类,如图6所示。

(1) 【输入/输出】提供配置数据挖掘工程的输入组件,包括:输入源。

(2) 【统计分析】提供对数据整体情况进行统计的常用组件,包括:相关性分析、正态性检验、主成分分析、全表统计、平稳性检验、因子分析、卡方检验。

(3) 【预处理】提供对数据进行清洗的组件,包括:主键合并、表堆叠、记录去重、新增序列、数据标准化、数据拆分、频数统计、衍生变量、缺失值处理、数据排序、分组聚合。

(4)【脚本组件】:提供一个代码编辑框,用户可以在代码编辑框中粘贴已经写好的程序代码,直接运行,无需再额外配置成组件,包括:Python脚本。

(5) 【分类】提供常用的分类算法组件,包括:CART分类树、K最近邻、朴素贝叶斯、支持向量机、逻辑回归、Adaboost、随机森林。

(6) 【聚类】提供常用的聚类算法组件,包括:层次聚类、DBSCAN密度聚类、K-Means聚类、K-中心点聚类、模糊聚类。

(7) 【回归】提供常用的回归算法组件,包括:CART回归树、线性回归、支持向量回归、K最近邻回归。

(8) 【文本分析】提供常用的文本分析算法组件,包括:HanLP分词与词性、长短期记忆网络训练、过滤停用词、word2vec、结巴提取、正则匹配、基于词向量/文档向量、TextRank等。

图6 系统组件算法

图7 个人组件算法

接下来给大家秀把操作,使用平台构建一个鸢尾花聚类工程。

图8 上传数据

图9 创建工程

图10 配置输入源组件

 

图11 配置KMeans组件

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/601214.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

蓝牙规范系列--经典蓝牙概述(第一篇)

一、目的 从本篇开始介绍经典蓝牙的基础知识,内容较多故会分成多篇进行介绍。 经典蓝牙(BR/EBR)射频(物理层PHY)工作在免授权的2.4G ISM频段(2400 - 2483.5 MHz),使用跳频技术来对抗…

基于java的班级管理系统的设计与实现

一:需求分析 1.功能需求 1).能够实现对班级学生基本资料的录入,包括学生的学号,姓名,性别,所学专业,家庭住址以及出生年月等。 2).能够实现对学生基本资料的修改。 3).根据学号对学生资料进行查询。 4).能够删除某些学生的资料。 二:总体设计 本班级管理系统共有6…

静态Web服务器搭建

文章目录 一,安装Apache软件(一)Apache软件安装(二)Apache软件管理(三)Apache软件基本设置(四)测试Apache服务器 二,Apache服务器的配置文件(一&a…

【C++】结构体 - 定义和使用,结构体数组,结构体指针,结构体嵌套结构体,结构体做函数参数,结构体 const

文章目录 1. 定义和使用2. 结构体数组3. 结构体指针4. 结构体嵌套结构体5. 结构体做函数参数6. 结构体 const 1. 定义和使用 结构体属于用户自定义的数据类型,允许用户存储不同的数据类型。 struct 结构体 {结构体成员列表}; 通过结构体创建变量的方法有三种&…

2023,智能硬件的AIGC“又一春”

​ 文|智能相对论 作者|佘凯文 消费电子产品风光不再,特别是自去年以来,电子消费市场经历了一整年的寒潮袭击,智能手机等产品达到10年消费谷底,PC出货量整体下降16%,不仅如此,包括平板、可穿戴设备也一改…

URP Shader FrameBuffer Fetch Mali Crash

1)URP Shader FrameBuffer Fetch Mali Crash ​2)Unity模型Lightmap UV相关的疑问 3)动画上下半身融合问题 4)AnimatorControllerPlayable.PrepareFrame函数在什么情况下调用 这是第338篇UWA技术知识分享的推送,精选了…

如何将 HTML 字符串转换成 DOM 对象:用 DOMParser

如何将 HTML 字符串转换成 DOM 对象&#xff1a;用 DOMParser 一、问题描述 有的时候我们需要处理一些 HTML 字符串&#xff0c;比如我需要从下方 HTML 字符串中提取每个 <a> 标签的内容和属性。 <pre><a href"cc1245.jpg">cc1245.jpg</a>…

将ipa文件上架苹果应用商店详细教程

使用windows电脑打包好uniapp的ios应用之后&#xff0c;还有一个麻烦事&#xff0c;就是需要将这个打包好的ipa格式的文件&#xff0c;上架到苹果的应用商店。用户才能安装。 而苹果提供的上传工具&#xff0c;比如xcode或transports&#xff0c;只能安装在mac电脑&#xff0c…

国产AIGC大模型汇总

“ 随着ChatGPT和GPT-4的出现&#xff0c;直接引爆了全球的AIGC大模型市场&#xff01;为了赶上这一波热潮&#xff0c;国内的大厂和创业公司也纷纷内卷起来&#xff0c;相继发布了自己的大模型。但是到目前为止&#xff0c;没有一个大模型能与ChatGPT相提并论&#xff0c;更比…

【算法系列之二叉树III】leetcode236. 二叉树的最近公共祖先

617.合并二叉树 力扣题目链接 给你两棵二叉树&#xff1a; root1 和 root2 。 想象一下&#xff0c;当你将其中一棵覆盖到另一棵之上时&#xff0c;两棵树上的一些节点将会重叠&#xff08;而另一些不会&#xff09;。你需要将这两棵树合并成一棵新二叉树。合并的规则是&…

MySQL 三万字精华总结 + 面试100 问,和面试官扯皮绰绰有余

MySQL 三万字精华总结 面试100 问&#xff0c;和面试官扯皮绰绰有余 写在之前&#xff1a;不建议那种上来就是各种面试题罗列&#xff0c;然后背书式的去记忆&#xff0c;对技术的提升帮助很小&#xff0c;对正经面试也没什么帮助&#xff0c;有点东西的面试官深挖下就懵逼了。…

linuxOPS基础_linux文本文件查看

vi/vim vim文档编辑操作太多了,可以看这篇单独介绍vim的文章>https://blog.csdn.net/weixin_44368963/article/details/130963920 cat查看文件 命令&#xff1a;cat 作用&#xff1a;查看文件内容 语法&#xff1a;#cat 文件名称 ​ #cat 文件1 文件2 > 文件3 **特别注…

如何利用CiteSpace快速锁定领域内最新研究热点并制作精美的可视化专题图?

【基于Citespace和vosviewer文献计量学相关论文 】 ​ 01 文献计量学方法与应用 1. 文献计量学方法基本介绍 2. 与其他综述方法区别联系 3. 各学科领域应用趋势近况 4. 主流分析软件优缺点对比 5. 经典高分10SCI思路复盘 6. 软件安装与Java环境配置 02 主题确定、数据检…

Vue+springboot校园跳蚤二手市场管理系统

摘 要 本毕业设计的内容是设计并且实现一个基于Springboot框架的校园跳蚤市场管理系统。它是在Windows下&#xff0c;以MYSQL为数据库开发平台&#xff0c;Tomcat网络信息服务作为应用服务器。校园跳蚤市场管理系统的功能已基本实现&#xff0c;主要包括用户、卖家、商品分类…

中国存储竞争新格局:曙光掌舵分布式存储市场

近日&#xff0c;赛迪顾问发布了《中国分布式存储市场研究报告&#xff08;2023&#xff09;》。 作为数字经济的底座&#xff0c;数据存储的重要性日益凸显。 近年来&#xff0c;凭借高性能、高可靠性、高可扩展性等优势&#xff0c;基于分布式架构的分布式存储迎来了蓬勃发…

基于SpringBoot+vue的火车订票管理系统设计与实现

博主介绍&#xff1a; 大家好&#xff0c;我是一名在Java圈混迹十余年的程序员&#xff0c;精通Java编程语言&#xff0c;同时也熟练掌握微信小程序、Python和Android等技术&#xff0c;能够为大家提供全方位的技术支持和交流。 我擅长在JavaWeb、SSH、SSM、SpringBoot等框架下…

动静态库的区别

(5条消息) linux-动态库制作与使用_云的小站的博客-CSDN博客 (5条消息) linux-静态库制作与使用_云的小站的博客-CSDN博客 目录 编译区别 使用不同编译的可执行程序。 推荐使用动态链接 动态链接具有以下优缺点 编译区别 动态库&#xff1a;代码不加载到可执行程序中&am…

Java:Mybatis-Plus自动填充功能配置和使用

Mybatis-Plus可以实现字段自动填充功能 文档 https://baomidou.com/pages/4c6bcf/ 目录 需求数据库设置默认值通过代码的方式进行自动填充配置自动填充设置方式一设置方式二 测试依赖pom.xml 需求 我们需要自动填充的字段&#xff1a; 插入数据时自动填充&#xff1a;creat…

view的常用属性和方法介绍(arcgis for javascript)

ArcGIS for JavaScript中的视图&#xff08;view&#xff09;是一个地图实例类&#xff0c;用于管理地图的显示区域、符号和标注等。通过视图类&#xff0c;可以实现以下功能&#xff1a; 显示地图&#xff1a;将地图显示在Web页面上。 缩放&#xff1a;缩放视图到指定的级别。…

Benewake(北醒) 快速实现TF40与电脑通信操作说明

目录 一、前言二、工具准备1. TTL-USB 转接线2. TF403. 兆信直流电源4. 连接线5. PC&#xff1a;Windows 系统6. 上位机 WINCC_TF 三、 连接方式1. TTL-USB 转接线接口说明2. TF40 引脚功能及连接说明3. 连线图 四、TF40 与电脑通信操作说明1. 参数设置2.获取测距值3. 设置波特…