kaggle实战:基于超市消费数据的用户个性化分析案例

news2024/10/6 16:29:23

大家好,今天给大家分享一篇 kaggle 数据集的新文章:基于一份超市消费数据集的用户个性化分析以及用户分群的实现。

更多详细内容参考原数据集地址:

https://www.kaggle.com/code/sonalisingh1411/customer-personality-analysis-segmentation/data?select=marketing_campaign.csv

主要内容

本文的主要内容:

  • 数据和字段的基本信息

  • 缺失值分析与处理

  • 从4个方面来具体探索字段信息

  • 时间字段的处理

  • 双变量分析

  • 相关性分析

  • 用户分群与可视化

缺失值情况:

技术提升

本文由技术群粉丝分享,项目源码、数据、技术交流提升,均可加交流群获取,群友已超过2000人,添加时最好的备注方式为:来源+兴趣方向,方便找到志同道合的朋友

方式①、添加微信号:dkl88191,备注:来自CSDN +研究方向
方式②、微信搜索公众号:Python学习与数据挖掘,后台回复:加群

字段含义

主要是涉及到4个方面的字段:人、商品、促销、地点

PEOPLE

  1. ID: Customer’s unique identifier.

  2. Year_Birth: Customer’s birth year.

  3. Education: Customer’s education level.

  4. Marital_Status: Customer’s marital status.

  5. Income: Customer’s yearly household income.

  6. Kidhome: Number of children in customer’s household.

  7. Teenhome: Number of teenagers in customer’s household.

  8. Dt_Customer: Date of customer’s enrollment with the company.

  9. Recency: Number of days since customer’s last purchase.

  10. Complain: 1 if customer complained in the last 2 years, 0 otherwise.

PRODUCTS

  1. MntWines: Amount spent on wine in last 2 years.

  2. MntFruits: Amount spent on fruits in last 2 years.

  3. MntMeatProducts: Amount spent on meat in last 2 years.

  4. MntFishProducts: Amount spent on fish in last 2 years.

  5. MntSweetProducts: Amount spent on sweets in last 2 years.

  6. MntGoldProds: Amount spent on gold in last 2 years.

PROMOTION

  1. NumDealsPurchases: Number of purchases made with a discount.

  2. AcceptedCmp1: 1 if customer accepted the offer in the 1st campaign, 0 otherwise.

  3. AcceptedCmp2: 1 if customer accepted the offer in the 2nd campaign, 0 otherwise.

  4. AcceptedCmp3: 1 if customer accepted the offer in the 3rd campaign, 0 otherwise.

  5. AcceptedCmp4: 1 if customer accepted the offer in the 4th campaign, 0 otherwise.

  6. AcceptedCmp5: 1 if customer accepted the offer in the 5th campaign, 0 otherwise.

  7. Response: 1 if customer accepted the offer in the last campaign, 0 otherwise.

PLACE

  1. NumWebPurchases: Number of purchases made through the company’s web site.

  2. NumCatalogPurchases: Number of purchases made using a catalogue.

  3. NumStorePurchases: Number of purchases made directly in stores.

  4. NumWebVisitsMonth: Number of visits to company’s web site in the last month.

双变量分析

相关性

分群结果

plt.figure(figsize= (15,8))  
plt.scatter(X[y == 0, 0], X[y == 0, 1],   
            s = 25, c = 'mediumblue',   
            label = 'one')  
plt.scatter(X[y == 1, 0], X[y == 1, 1],   
            s = 25, c = 'turquoise',   
            label = 'two')  
plt.scatter(X[y == 2, 0], X[y == 2, 1],   
            s = 25, c = 'red',   
            label = 'three')  
plt.scatter(X[y == 3, 0], X[y == 3, 1],   
            s = 25, c = 'green',   
            label = 'four')  
plt.scatter(X[y == 4, 0], X[y == 4, 1],   
            s = 25, c = 'yellow',   
            label = 'five')  
  
  
plt.scatter(kmeans.cluster_centers_[:, 0],  
            kmeans.cluster_centers_[:, 1],   
            s = 55, c = 'black',   
            label = 'Centroids')  
  
plt.title('Clusters of customers',fontsize = 20)  
plt.xlabel('Income',fontsize = 15)  
plt.ylabel('Expenses',fontsize = 15)  
  
plt.legend(fontsize = 15)  
plt.show()  

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/77590.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

实验八 网络优化与正则化(3)不同优化算法比较

目录7.3 不同优化算法的比较分析7.3.1 优化算法的实验设定7.3.1.1 2D可视化实验7.3.1.2 简单拟合实验7.3.1.3 与Torch API对比,验证正确性7.3.2 学习率调整7.3.2.1 AdaGrad算法7.3.2.2 RMSprop算法7.3.3 梯度估计修正7.3.3.1 动量法7.3.3.2 Adam算法7.3.4 不同优化器…

java基于Springboot的简历系统-计算机毕业设计

项目介绍 随着科学技术的飞速发展,社会的方方面面、各行各业都在努力与现代的先进技术接轨,通过科技手段来提高自身的优势,简历系统当然也不能排除在外。简历系统是以实际运用为开发背景,运用软件工程原理和开发方法,…

SAP ABAP CDS view Association 引入的缘由

ABAP CDS view 支持三种 join 方式: Inner JoinLeft Outer joinRight outer join 我们使用 ABAP Development Tool 的 CDS view 向导创建一个 CDS view: 向导里包含的 $ 和大括号就是占位符,需要开发人员自己指定: 我们把占位符…

奇舞周刊475期:2022年 CSS 生态圈技术趋势!

记得点击文章末尾的“ 阅读原文 ”查看哟~下面先一起看下本期周刊 摘要 吧~奇舞推荐■ ■ ■2022年 CSS 生态圈技术趋势!一年一度的 State of CSS 调查结果正式公布!通过本文看看2022年 CSS 生态圈的技术趋势!React Streaming SSR 原理解析Re…

BI技巧丨RANKX浮点运算

RANKX这个函数,白茶之前已经写过很多期了,本期是对RANKX函数一个细节问题的补充。 我们常见的数据类型有很多,用来聚合的主要有三种数据类型:文本、整数、小数。 在大部分场合,小数是实际FACT数据中最为常见的数据类…

[1180]clickhouse查看数据库和表的容量大小

文章目录1.查看数据库容量、行数、压缩率2.查看数据表容量、行数、压缩率3.查看数据表分区信息4.查看数据表字段的信息5. 查看表的各个指标6.跟踪分区7.检查数据大小在mysql中information_schema这个数据库中保存了mysql服务器所有数据库的信息, 而在clickhouse&…

[附源码]Python计算机毕业设计SSM基于健身房管理系统(程序+LW)

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…

Java 变量作用域、构造方法官方教程

一、变量作用域 Java 中的变量有3种: 📖 ① 全局变量:被定义在类中(成员变量) 📖 ② 局部变量:被定义在成员方法、代码块、静态代码块中定义的变量 📖 ③ 参数:方法声明中的变量 T…

1.Spring简介

1.概念 Spring是一个免费开源框架,为了简化企业级项目开发,提供全面的开发部署解决方案。 2.体系结构 Data Access/Integeration是Spring对数据持久层的支持,SpringDataJpa就是其中的一种。Web是Spring对表现层处理的支持,Spir…

Springboot多环境开发

文章目录一. 前言二. 单文件版多环境配置三. 多文件版多环境配置四. 多环境开发配置技巧五. 多环境配置分组管理一. 前言 在日常开发中我们使用的环境可能会不一样,比如开发环境,测试环境,生产环境,那么这些环境对应的配置也会不…

【计算机视觉】数据获取、数据标注、数据增强的概念简介

觉得有帮助麻烦点赞关注收藏~~~ 基于深度学习的视频分析算法是依赖于数据训练的,数据是深度学习的主要原料,对于算法性能的提升是非常重要的。本章将重点介绍数据的获取、标注、增强及处理方法。 一、数据获取 训练数据的来源主要包括网上公开数据库和…

Redis实现短信登录

文章目录一、基于Session实现登录二、基于Redis实现共享Session实现登录一、基于Session实现登录 ---------------------------------------------------Controller PostMapping("code") public Result sendCode(RequestParam("phone") String phone, Http…

JavaScript进阶教程——面向对象、原型对象、this关键字、bind appl call方法

文章目录面向对象ES2015的面向对象语法:ES5的面向对象语法:原型对象原型链Object对象的原型this关键字**指向调用方法的对象:****构造函数:**触发事件指向全局对象:箭头函数总结bind appl call方法call的用法参数apply…

【计算机图形学入门】笔记4:变换(模型、视图、投影)

目录04变换(模型、视图、投影)1.使用齐次坐标表示的三维变换2.view/Camera 视图变换3.Projection 投影变换1.Orthographic projection 正交投影2.Perspective projection 透视投影 ——更适合人眼成像(近大远小,鸽子为什么这么大&…

AlphaControls 读取存贮数据VCL OnChange事件的处理

AlphaControls 读取存贮数据VCL OnChange事件的处理 AlphaControls控件,窗口时显示,对于VCL控件的处理,需要通过调用皮肤模板重新画出来。因此,在窗口的显示过程中,对VCL控件的数据装载(变更&#x…

从获评毕马威中国领先地产科技50强 看贝壳的长期主义

11月9日,在上海进博会现场,毕马威发布了2022年度(第二届)“毕马威中国领先地产科技企业50”报告,并正式发布了年度毕马威中国领先地产科技企业50榜及地产科技新锐企业榜。作为国内居住产业数字服务平台的贝壳上榜。 众…

前辈给的 Spring Cloud 与 Docker 微服务实战,挽救了要被辞退的我

前言 还记得那天天气阴冷,整个人心都是拔凉拔凉的;原因是因为领导找我聊了一下,委婉地说觉得我的技术不太行,能力不突出;要么自己做出改变,要么选择离开。 说实话,我是有点难过的,…

Lambda完整学习指南

什么是Lambda表达式 Lambda表达式是Java SE 8中一个重要的新特性。lambda表达式允许你通过表达式来代替功能接口。lambda表达式就和方法一样,它提供了一个正常的参数列表和一个使用这些参数的主体(body,可以是一个表达式或一个代码块)。Lambda表达式还增强了集合库。 Java La…

大学生HTML作业篮球网页 HTML作业篮球网页期末作业 HTML+CSS篮球网页 HTML学生作业体育篮球网页

🎉精彩专栏推荐 💭文末获取联系 ✍️ 作者简介: 一个热爱把逻辑思维转变为代码的技术博主 💂 作者主页: 【主页——🚀获取更多优质源码】 🎓 web前端期末大作业: 【📚毕设项目精品实战案例 (10…

ARS系列毫米波雷达技术一览

近年来,自动驾驶成为了当下最热门的话题。随着自动驾驶技术的发展,作为其关键传感器之一的毫米波雷达,也得到了广泛关注。但就目前来看,海外巨头公司主导着全球毫米波雷达产业的发展,其中,大陆ARS540更以九…