SQL SERVER ANALYSIS SERVICES决策树、聚类、关联规则挖掘分析电商购物网站的用户行为数据...

news2024/11/23 9:30:44

全文链接:http://tecdat.cn/?p=32118

假如你有一个购物类的网站,那么你如何给你的客户来推荐产品呢?点击文末“阅读原文”获取完整文档、数据

相关视频

这个功能在很多电商类网站都有,那么,通过SQL Server Analysis Services的数据挖掘功能,你也可以轻松的来构建类似的功能。

将分为三个部分来演示如何实现这个功能。

此篇文章演示了如何帮助客户使用SQL Server Analysis Services基于此问题来构建简单的挖掘模型。

步骤

准备工作:数据.xls 数据导入数据库中。

cf27cd2c969dcf697d9535d353ca8d6b.png

529909538f5ecba3b462fba6aadf8e3a.png

在相应数据库中找到对应的数据

611e100f9b62ffd78cb7d35b4b621c7c.png

(1) 打开visual studio,新建项目,选择商业智能项目,analysis services项目

1b44b2f88d6d4aeb582ec1f3c91dacf5.png

将data-mining数据库中的数据导入数据源

e546d031eaccf5ac90ec791455d06670.png

a395e7911425d2cfb86f17854cc3c299.png

在可用对象中,将要分析数据所在表添加到包含的对象中,继续下一步。

在解决方案资源管理器中,右键单击挖掘结构,选择新建挖掘结构。

40fe80f397c2236a0cb01154b8aec654.png

选择microsoft 决策树,继续下一步

a0a1afec579dec8d83fdf1461e2dd2a0.png

设置测试集和训练集

dda2783895ca653232cb88a459327b39.png

勾选允许钻取,完成。

然后对模型进行部署,继而进行挖掘(点击运行)

决策树模型

以下我们对电商购物网站的用户的信誉等级进行预测,使用其他用户的特征属性对其进行预测分类。建立如下的决策树模型。

f66e91ab99883bbe43b0306ea72597c4.png

从决策树模型的结果来看,

2864190308eec0bba857d2ad7a8a9a22.png

树一共有5个分支。其中重要节点分别为购物积分、家里人口数、居住面积、居住面积等。


点击标题查阅往期内容

c56ab3aeab5faf9ee7553ac1c4c65f4e.png

PYTHON用户流失数据挖掘:建立逻辑回归、XGBOOST、随机森林、决策树、支持向量机、朴素贝叶斯和KMEANS聚类用户画像

outside_default.png

左右滑动查看更多

outside_default.png

01

ecad533a5c7d3ea2b5ebd701bc8cbfd6.png

02

11a5577e45f75c8128a5686cc23258a9.png

03

714f0153b5817d6ef52838bdd5a71105.png

04

5c62051c5de3e4255fc4d96dd1887f56.png

从图中可以看到购物积分越高的用户,决策树得到的用户信誉等级越高。同时家里人口数越多,则信誉等级也越高。说明购物积分直接影响着信誉等级。一般购物次数越多则买家的信誉越高。同时家里人口数越多,则该用户在网上购物的开支越多。因此会导致网上购物越多,最后导致信誉增加。

4708c8746a5e017fef947505194ba72e.png

然后可以看到依赖网络。依赖网络图是指预测变量和其他变量直接的依赖性。从图中可以看到在用户属性中,几个属性会影响信用等级,包括购物积分、次数、居住面积以及人口数量。

24f8744cbf8842cf6bd65774e97950f0.png

聚类

从聚类结果可以看到,聚类将所有用户分成了10个信用级别。

d28e60b9aafb7c4294733771076c6886.png

从不同类别的依赖图可以看到,类别10、4、8、5之间具有较强的相关关系。说明这几个类别中的信用级别是类似的。下面可以具体看下每个类别中的各个属性的分布的比例。

e8e878d4ce0cd700d017dcdef1fbfc56.png

af1b6e86ef08ce8c7ee8b4c7ca643808.png

从上图可以看到不同类别的购物积分是不同的。

总的来看,相对来说,第4和7类别的购物积分最小的,其他几个类别中积分较高,因此可以认为这些类别中的用户的信用级别较高。同时可以看到这些类别的其他信息,这类用户的月收入较低,购物次数也较小。同时可以看到,这类用户大多的交易成功也较少。另一方面,可以看到低购物积分用户中 ,家庭人口数也较小。

827ecf3c792127d59519feab8f7b91c1.png

从每个类别的倾向程度来看,购物总次数多的用户交易成功次数也高。从另一方面来看,月收入较高的用户,倾向于是非分类1的用户,也就是它们的信用等级较好。同时可以看到,户交易成功次数多喝购物积分高的用户倾向于非分类1的用户。说明用户的信用等级相对较高。另一方面,可以看到拥有房屋的用户的交易成功次数 电商网站购物次数反而低于没有房屋的用户,可能是因为没有房屋的用户年龄段较低,因此更倾向于网络购物。

然后建立关联规则挖掘模型

运行关联规则,得到以下重要的关联规则

00ea623bacc9c424580d66fc84c82dc1.png

关联规则就是发现数据集中相互有关联的项目。它已经成为数据挖掘领域中具有重要影响的一种算法。也是数据挖掘领域的一个重要分支。最近几年已经被广泛的应用。在电子商务领域,关联规则技术主要用于物品链接页面等的推荐,它只需要购物记录的数据即可,而不需要过多的商品信息,通过关联规则可以发现用户的一些常见的购物模式和购物规律。找出用户通常会一起购买的商品。从而对用户进行推荐和挖掘。

c88ddee98a35a677b256b669e8d457c1.jpeg

本文中分析的数据和完整文档分享到会员群,扫描下面二维码即可加群!

483bfd70d9ada53867530ec2e3360876.png

ff9730fb6048904292fb6063b52ec31d.png

点击文末“阅读原文”

获取全文完整数据资料。

本文选自《SQL SERVER ANALYSIS SERVICES决策树、聚类、关联规则挖掘分析电商购物网站的用户行为数据》。

e17aaa07d561a0d078f4e985db81b316.jpeg

35fa800ffcc4322f739d7a1aad024367.png

点击标题查阅往期内容

Python对商店数据进行lstm和xgboost销售量时间序列建模预测分析

PYTHON集成机器学习:用ADABOOST、决策树、逻辑回归集成模型分类和回归和网格搜索超参数优化

R语言集成模型:提升树boosting、随机森林、约束最小二乘法加权平均模型融合分析时间序列数据

Python对商店数据进行lstm和xgboost销售量时间序列建模预测分析

R语言用主成分PCA、 逻辑回归、决策树、随机森林分析心脏病数据并高维可视化

R语言基于树的方法:决策树,随机森林,Bagging,增强树

R语言用逻辑回归、决策树和随机森林对信贷数据集进行分类预测

spss modeler用决策树神经网络预测ST的股票

R语言中使用线性模型、回归决策树自动组合特征因子水平

R语言中自编基尼系数的CART回归决策树的实现

R语言用rle,svm和rpart决策树进行时间序列预测

python在Scikit-learn中用决策树和随机森林预测NBA获胜者

python中使用scikit-learn和pandas决策树进行iris鸢尾花数据分类建模和交叉验证

R语言里的非线性模型:多项式回归、局部样条、平滑样条、 广义相加模型GAM分析

R语言用标准最小二乘OLS,广义相加模型GAM ,样条函数进行逻辑回归LOGISTIC分类

R语言ISLR工资数据进行多项式回归和样条回归分析

R语言中的多项式回归、局部回归、核平滑和平滑样条回归模型

R语言用泊松Poisson回归、GAM样条曲线模型预测骑自行车者的数量

R语言分位数回归、GAM样条曲线、指数平滑和SARIMA对电力负荷时间序列预测

R语言样条曲线、决策树、Adaboost、梯度提升(GBM)算法进行回归、分类和动态可视化

如何用R语言在机器学习中建立集成模型?

R语言ARMA-EGARCH模型、集成预测算法对SPX实际波动率进行预测

在python 深度学习Keras中计算神经网络集成模型

R语言ARIMA集成模型预测时间序列分析

R语言基于Bagging分类的逻辑回归(Logistic Regression)、决策树、森林分析心脏病患者

R语言基于树的方法:决策树,随机森林,Bagging,增强树

R语言基于Bootstrap的线性回归预测置信区间估计方法

R语言使用bootstrap和增量法计算广义线性模型(GLM)预测置信区间

R语言样条曲线、决策树、Adaboost、梯度提升(GBM)算法进行回归、分类和动态可视化

Python对商店数据进行lstm和xgboost销售量时间序列建模预测分析

R语言随机森林RandomForest、逻辑回归Logisitc预测心脏病数据和可视化分析

R语言用主成分PCA、 逻辑回归、决策树、随机森林分析心脏病数据并高维可视化

Matlab建立SVM,KNN和朴素贝叶斯模型分类绘制ROC曲线

matlab使用分位数随机森林(QRF)回归树检测异常值

f57299a9cb9edafb3717aca29deb840c.png

964ecbeef46367f3807621334451ccd9.jpeg

7523163960eb21e8ec8118079dce773b.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/779448.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Flink CEP (一)原理及概念

目录 1.Flink CEP 原理 2.Flink API开发 2.1 模式 pattern 2.2 模式 pattern属性 2.3 模式间的关系 1.Flink CEP 原理 Flink CEP内部是用NFA(非确定有限自动机)来实现的,由点和边组成的一个状态图,以一个初始状态作为起点&am…

Unity进阶-消息框架的理论知识与实际操作学习笔记

文章目录 Unity进阶-消息框架的理论知识与实际操作学习笔记 Unity进阶-消息框架的理论知识与实际操作学习笔记 笔记来源课程:https://study.163.com/course/courseMain.htm?courseId1212756805&_trace_c_p_k2_8c8d7393c43b400d89ae94ab037586fc 这种框架其实…

实现锂电池形状的数据可视化css+js

1.效果图 2.需求根据后端返回数据改变里面的高度 HTML&#xff1a; <div class"dianchichi"><div class"limian" id"divElementId"></div></div> css: .dianchichi {width: 84px;height: 146px;display: flex;justify-…

Two Days wpf 分享 分页组件

迟来的wpf分享。 目录 一、序言 二、前期准备 三、前端界面 四、后台代码部分 1、先定义些变量后面使用 2、先是按钮事件代码。 首页按钮 上一页按钮 下一页按钮 末尾按钮 画每页显示等数据 每页显示多少条 判断是否为数字的事件 分页数字的点击触发事件 跳转到…

Docker安装Nexus并配置Maven私服

1 准备工作 1 服务器已安装docker, docker各命令无报错 2 通过dockerhub查看nexus的版本信息&#xff0c;此次使用的镜像为&#xff1a;sonatype/nexus3&#xff0c;可以看到latest版本更前的的是3.58.0&#xff0c;我们这次就使用这个版本的nexus3. 2 开始安装 # 下载镜像 do…

springcloudAlibaba之springboot如何加载nacos配置文件

配置文件想必大家都很熟悉&#xff0c;无论什么架构 都离不开配置&#xff0c;虽然spring boot已经大大简化了配置&#xff0c;但如果服务很多 环境也好几个&#xff0c;管理配置起来还是很麻烦&#xff0c;并且每次改完配置都需要重启服务&#xff0c;nacos config出现就解决了…

【JavaEE】Servlet常用的API

目录 前言 一、HttpServlet类 1、Servlet的生命周期 ✨tomcat的两个端口 ✨设置告诉浏览器使用那种字符集解析响应 ✨Java中Unicode和utf8字符集的使用 二、HttpServletRequest类 1、获取请求的信息 2、 前端给后端传递数据的三种方式 2.1、通过query string传递 2.2…

unity--2d( A*寻路)

目录 一.网格式寻路 1.创建一个A*寻路脚本&#xff0c;命名为"AStarPathfinding.cs"。 2.创建一个人物控制的脚本&#xff0c;命名为"CharacterController2D.cs"。 3.创建一个游戏管理脚本&#xff0c;命名为"GameManager.cs"。 二.UGUI下的…

《零基础入门学习Python》第063讲:论一只爬虫的自我修养11:Scrapy框架之初窥门径

上一节课我们好不容易装好了 Scrapy&#xff0c;今天我们就来学习如何用好它&#xff0c;有些同学可能会有些疑惑&#xff0c;既然我们懂得了Python编写爬虫的技巧&#xff0c;那要这个所谓的爬虫框架又有什么用呢&#xff1f;其实啊&#xff0c;你懂得Python写爬虫的代码&…

基于半监督算法的工业图像缺陷检测方法:MemSeg

来源&#xff1a;投稿 作者&#xff1a;橡皮 编辑&#xff1a;学姐 论文&#xff1a;https://arxiv.org/ftp/arxiv/papers/2205/2205.00908.pdf 代码&#xff1a;https://github.com/TooTouch/MemSeg 主要贡献 提出了一个精心设计的异常模拟策略&#xff0c;用于模型的自监督…

缓存雪崩问题及解决思路

缓存雪崩是指在同一时段大量的缓存key同时失效或者Redis服务宕机&#xff0c;导致大量请求到达数据库&#xff0c;带来巨大压力。为了解决这个问题&#xff0c;我们可以采取以下几种方案。 1. 给不同的Key的TTL添加随机值 在设置缓存的过期时间&#xff08;TTL&#xff09;时…

PhpStudy靶场首页管理

PhpStudy靶场首页管理 一、源码一二、源码二三、源码三四、源码四 一、源码一 index.html <!DOCTYPE html> <html><head><meta charset"UTF-8"><title>靶场访问首页</title><style>body {background-color: #f2f2f2;colo…

一个月学通Python(二十三):RESTful架构和DRF入门

专栏介绍 结合自身经验和内部资料总结的Python教程&#xff0c;每天3-5章&#xff0c;最短1个月就能全方位的完成Python的学习并进行实战开发&#xff0c;学完了定能成为大佬&#xff01;加油吧&#xff01;卷起来&#xff01; 全部文章请访问专栏&#xff1a;《Python全栈教…

【字符流】案例:集合到文件(改进版)

案例&#xff1a;集合到文件&#xff08;改进版&#xff09; 1.需求&#xff1a; 把ArrayList集合中的学生数据写入到文本文件。要求&#xff1a;每一个学生对象的数据作为文件中的一行数据 ​ 格式&#xff1a;学号&#xff0c;姓名&#xff0c;年龄&#xff0c;居住地 2.思…

python与深度学习(五):CNN和手写数字识别

目录 1. 说明2. 卷积运算3. 填充4. 池化5. 卷积神经网络实战-手写数字识别的CNN模型5.1 导入相关库5.2 加载数据5.3 数据预处理5.4 数据处理5.5 构建网络模型5.6 模型编译5.7 模型训练、保存和评价5.8 模型测试5.9 模型训练结果的可视化 6. 手写数字识别的CNN模型可视化结果图7…

HideSeeker论文阅读

文章目录 3.1 Overview of Our System HideSeeker3.2 Visual Information Extraction3.3 Relation Graph Learning3.4 Hidden Object Inference 4 EVALUATIONS4.7 Summary 6 DISCUSSIONS AND CONCLUSION 3.1 Overview of Our System HideSeeker 我们设计了一种名为“HideSeeke…

【Selenium+Pytest+allure报告生成自动化测试框架】附带项目源码和项目部署文档

目录 前言 【文章末尾给大家留下了大量的福利】 测试框架简介 首先管理时间 添加配置文件 conf.py config.ini 读取配置文件 记录操作日志 简单理解POM模型 简单学习元素定位 管理页面元素 封装Selenium基类 创建页面对象 简单了解Pytest pytest.ini 编写测试…

保护数字世界的壁垒

随着科技的不断发展和互联网的普及&#xff0c;我们的生活日益依赖于数字化的世界。然而&#xff0c;随之而来的是网络安全威胁的不断增加。网络攻击、数据泄露和身份盗窃等问题已经成为我们所面临的现实。因此&#xff0c;网络安全变得尤为重要&#xff0c;我们需要采取措施来…

MySQL常见的几种约束

系列文章目录 后续补充 文章目录 系列文章目录前言一、主键约束二、非空约束三、唯一约束四、检查约束五、默认值约束六、字段值自动增加约束七、外键约束总结 前言 为防止不符合规范的数据存入数据库&#xff0c;在用户对数据进行插入、修改、删除等操作时&#xff0c;MySQL提…

新架构网易云音乐UI风格大变身,更像Apple Music?

继QQ的NT版本出来后&#xff0c;掀起了一番热潮&#xff0c;不少科技资讯的UP开始评测采用全新架构的QQ的性能以及内存占用情况&#xff0c; 文末中&#xff0c;苏音也提到了&#xff0c;是否在QQ新版本的发布下&#xff0c;会有越来越多的产品向Electron架构靠近&#xff1f;…