【python】Python航空公司客户价值数据分析(代码+论文)【独一无二】

news2024/11/16 13:53:02

请添加图片描述


👉博__主👈:米码收割机
👉技__能👈:C++/Python语言
👉公众号👈:测试开发自动化【获取源码+商业合作】
👉荣__誉👈:阿里云博客专家博主、51CTO技术博主
👉专__注👈:专注主流机器人、人工智能等相关领域的开发、测试技术。


系列文章目录


目录

  • 系列文章目录
  • 一、项目说明
  • 二、部分代码展示
  • 三、数据分析可视化
    • 3.1 客户飞行次数分析
    • 3.2 客户性别比例的可视化分析
    • 3.3 客户年龄段的可视化分析
    • 3.4 工作省份客户分布的可视化分析
    • 3.5 客户年龄与累计飞行里程之间关系的可视化分析
    • 3.6 不同会员等级的平均年龄分析,
    • 3.7 客户飞行次数和总飞行公里数的关系分析
    • 3.8 不同会员等级在平均飞行次数、平均飞行里程和平均折扣率等关键指标上的综合表现分析
    • 3.9 统计每个省份的客户数量和累计飞行里程总和
    • 3.10 首次和最后一次飞行时间的分析
    • 3.11 工作省份客户分布词云图:
    • 3.12 会员等级与平均累计飞行里程漏斗图
    • 3.13 客户的平均积分兑换次数分析
    • 3.14 液体填充图来展示了达到最高会员等级的客户比例
    • 3.15 最高会员等级的客户在总客户中所占的比例
    • 3.16 客户价值评估模型


一、项目说明

本文通过对航空公司的客户数据进行多维度的可视化分析,深入探讨了客户的性别比例、年龄段分布、工作省份分布、会员等级、飞行活跃度、折扣率、积分兑换次数等关键指标,以揭示客户群体的特征和趋势。分析结果显示,客户性别比例相对均衡,年龄跨度广泛,不同会员等级客户的年龄和飞行习惯有所差异。工作省份分布、客户飞行活跃度、累计飞行里程与年龄等方面的分析为航空公司提供了有益的市场洞察和战略指导。
尽管分析结果丰富多彩,但仍然存在一些不足之处,例如未考虑到个体差异、满意度、竞争对手等因素的影响。不过,这些可视化分析为航空公司提供了宝贵的数据支持,有助于提高客户关系管理、市场策略制定和服务质量,为业务增长和竞争优势提供了坚实基础。进一步的研究和分析将有助于更全面地理解客户行为和需求,推动航空公司的持续发展和创新。

(论文56页)

在这里插入图片描述

👇👇👇 关注公众号,回复 “航空数据分析” 获取源码👇👇👇

二、部分代码展示

# 数据读取
df = pd.read_csv('数据.csv', encoding='gbk')

#
bar = (
    Bar()
    .add_xaxis(df['MEMBER_NO'].tolist())
    .add_yaxis("飞行次数", df['FLIGHT_COUNT'].tolist())
    .set_global_opts(title_opts=opts.TitleOpts(title="客户飞行次数分析"))
)

# 保存为 HTML 文件
bar.render('flight_count_analysis.html')


# 客户性别比例分析:
# 计算性别比例
gender_counts = df['GENDER'].value_counts()

# 创建饼图
pie = (
    Pie()
    .add("", [list(z) for z in zip(gender_counts.index.tolist(), gender_counts.tolist())])
    .set_global_opts(title_opts=opts.TitleOpts(title="客户性别比例分析"))
    .set_series_opts(label_opts=opts.LabelOpts(formatter="{b}: {c} ({d}%)"))
)

# 保存为 HTML 文件
pie.render('gender_ratio_analysis.html')


# 客户年龄段分析:
# 将年龄分组(20-30, 30-40, 40-50, ...)
bins = [20, 30, 40, 50, 60, 70, 80]
labels = ['20-30', '30-40', '40-50', '50-60', '60-70', '70-80']
df['age_group'] = pd.cut(df['AGE'], bins=bins, labels=labels, right=False)

# 统计每个年龄段的客户数量
age_group_counts = df['age_group'].value_counts().sort_index()

# 创建柱状图
bar = (
    Bar()
    .add_xaxis(age_group_counts.index.tolist())
    .add_yaxis("客户数量", age_group_counts.tolist())
    .set_global_opts(title_opts=opts.TitleOpts(title="客户年龄段分析"))
)

# 保存为 HTML 文件
bar.render('age_group_analysis.html')



# 工作省份分析:
# 统计每个省份的客户数量
province_counts = df['WORK_PROVINCE'].value_counts()

# 创建地理图表
map_ = (
    Map()
    .add("客户数量", [list(z) for z in zip(province_counts.index.tolist(), province_counts.tolist())], "china")
    .set_global_opts(
        title_opts=opts.TitleOpts(title="工作省份客户分布"),
        visualmap_opts=opts.VisualMapOpts(max_=province_counts.max()),
    )
)

# 保存为 HTML 文件.....




👇👇👇 关注公众号,回复 “航空数据分析” 获取源码👇👇👇

文件展示:
在这里插入图片描述

三、数据分析可视化

3.1 客户飞行次数分析

这份分析从一份名为’数据.csv’的数据集中读取了客户信息和飞行次数的数据,并通过柱状图展示了客户飞行次数的分析结果。柱状图是一种适合显示离散数据分布的图表类型,其中X轴表示客户的会员号码(MEMBER_NO),而Y轴表示飞行次数。每个垂直柱子的高度代表了相应会员的飞行次数。

在这里插入图片描述

👇👇👇 关注公众号,回复 “航空数据分析” 获取源码👇👇👇

3.2 客户性别比例的可视化分析

  1. 性别分布:根据饼图显示,客户性别分为两类,分别是男性(“男”)和女性(“女”)。在特定数据集中,男性客户占据了绝大多数,而女性客户相对较少。
  2. 性别比例:饼图清晰地展示了不同性别客户的比例关系。男性客户占比较大的部分,而女性客户占比较小。通过饼图上的标签,还可以看到每个性别群体的具体占比百分比。

在这里插入图片描述
3. 性别分布的重要性:性别比例分析对于制定定向营销策略和客户细分非常重要。在了解客户性别分布后,航空公司可以根据不同性别的客户特点和需求来制定更具针对性的市场活动,以提高客户满意度和忠诚度。
4. 数据分析工具:通过饼图的分析,展示了数据分析师或数据科学家如何使用Python中的Pyecharts库来进行可视化分析,以便更好地理解客户数据。
总之,性别比例的饼图可视化分析为航空公司提供了客户性别分布的清晰概览,为制定相关策略和决策提供了有用的信息。

在这里插入图片描述

👇👇👇 关注公众号,回复 “航空数据分析” 获取源码👇👇👇

3.3 客户年龄段的可视化分析

年龄段划分:根据代码中的分组规则,客户年龄被划分成了六个不同的年龄段,分别是20-30岁、30-40岁、40-50岁、50-60岁、60-70岁和70-80岁。这种分组有助于更好地理解不同年龄段客户的特征和行为。

在这里插入图片描述
年龄段分布:柱状图清晰地展示了每个年龄段的客户数量。从图中可以看出,年龄段在客户分布中的分布情况,以及哪些年龄段的客户数量相对较多。
3. 年龄段分布的重要性:年龄段分析对于航空公司的市场定位和客户细分非常重要。不同年龄段的客户可能具有不同的需求和偏好,因此了解客户年龄分布有助于制定更有针对性的营销策略和产品定制。

在这里插入图片描述

3.4 工作省份客户分布的可视化分析

  1. 工作省份分布:地理图表清晰地展示了不同省份的客户数量分布,中国地图上的各个省份被不同颜色的区块表示,颜色深浅反映了客户数量的多少。
  2. 客户数量差异:根据图表可以看出,一些省份拥有较多的客户,而其他省份的客户数量相对较少。客户数量的差异可能受多种因素影响,如经济发展水平、人口密度等。
    在这里插入图片描述

3.5 客户年龄与累计飞行里程之间关系的可视化分析

  1. 散点图趋势:从图表可以看出,年龄与累计飞行里程之间存在一定的趋势。随着年龄的增长,部分客户的累计飞行里程也有所增加,但并不是所有客户都遵循相同的趋势。
  2. 分布差异:散点图展示了客户年龄和累计飞行里程的分布情况,可以看出年龄在不同范围内的客户有不同的累计飞行里程分布。一些年轻客户可能已经累积了较多的飞行里程,而一些年长客户可能累积较少。

👇👇👇 关注公众号,回复 “航空数据分析” 获取源码👇👇👇

在这里插入图片描述

  1. 数据关联性:散点图的分析有助于了解客户年龄和累计飞行里程之间的关联性。这对于航空公司可以更好地了解不同年龄段客户的旅行习惯和需求,从而优化市场策略和客户服务。
  2. 数据可视化工具:通过散点图的分析,展示了如何使用Python中的Pyecharts库创建散点图,帮助数据分析师或数据科学家更好地呈现和解释数据。
    在这里插入图片描述

3.6 不同会员等级的平均年龄分析,

  1. 平均年龄差异:根据环形图可以看出,不同会员等级的平均年龄存在差异。一般来说,高级会员等级的客户平均年龄相对较大,而低级会员等级的客户平均年龄相对较小。

  2. 会员等级分布:环形图展示了各个会员等级的平均年龄,通过不同颜色的环形区块表示不同的会员等级。这有助于航空公司了解不同会员等级客户的年龄特征。
    在这里插入图片描述

  3. 数据可视化工具:通过环形图的分析,展示了如何使用Python中的Pyecharts库创建环形图,以清晰可视化方式呈现不同会员等级的平均年龄数据。

  4. 业务决策:可视化分析可以帮助航空公司更好地了解其不同会员等级客户的年龄分布情况,有助于针对不同年龄段的客户制定更有针对性的市场策略和服务方案。
    在这里插入图片描述

👇👇👇 关注公众号,回复 “航空数据分析” 获取源码👇👇👇

3.7 客户飞行次数和总飞行公里数的关系分析

  1. 正相关关系:从散点图可以观察到,客户的飞行次数和总飞行公里数之间存在正相关关系。即随着飞行次数的增加,总飞行公里数也增加。
  2. 飞行活跃度:散点图反映了客户的飞行活跃度,更高的飞行次数通常对应着更大的总飞行公里数。这可以帮助航空公司了解客户的飞行行为和忠诚度。

在这里插入图片描述
4.业务决策:对于航空公司来说,理解客户飞行次数和总飞行公里数之间的关系可以有助于制定更精确的市场策略,例如奖励计划或促销活动,以鼓励客户提高飞行活跃度。

在这里插入图片描述

在这里插入图片描述

👇👇👇 关注公众号,回复 “航空数据分析” 获取源码👇👇👇

3.8 不同会员等级在平均飞行次数、平均飞行里程和平均折扣率等关键指标上的综合表现分析

在这里插入图片描述

2.高级会员表现:从雷达图可以看出,高级会员等级(FFP_TIER较高)通常在平均飞行次数和平均飞行里程上表现更好,曲线更接近雷达图的最大值。这意味着高级会员通常有更多的飞行次数和飞行里程。

在这里插入图片描述
3. 折扣率比较:雷达图还显示了不同会员等级在平均折扣率上的表现。较低的会员等级可能具有更高的平均折扣率,这可能是为了吸引更多的客户。
4. 数据可视化工具:通过分析,展示了如何使用Python中的Pyecharts库创建雷达图,以便比较不同会员等级在多个指标上的表现。

在这里插入图片描述

业务洞察:对于航空公司来说,这种分析可以帮助他们了解不同会员等级的特点和需求,有助于制定针对性的服务和促销策略,以提高客户忠诚度和盈利能力。
综上所述,雷达图分析提供了不同会员等级在关键指标上的综合表现信息,为航空公司提供了有用的业务见解,可用于优化客户管理和市场战略。

在这里插入图片描述

👇👇👇 关注公众号,回复 “航空数据分析” 获取源码👇👇👇

3.9 统计每个省份的客户数量和累计飞行里程总和

进行了根据工作省份对客户进行分组,统计每个省份的客户数量和累计飞行里程总和,并使用树形图展示了每个省份的客户数量和累计飞行里程。

  1. 客户分布情况:树形图以不同的省份为节点,展示了每个省份的客户数量。节点的大小表示客户数量,较大的节点代表客户数量较多的省份。

在这里插入图片描述

3.10 首次和最后一次飞行时间的分析

  1. 时间分布趋势:通过柱状图和折线图的组合,展示了首次和最后一次飞行的客户数量随时间的分布趋势。柱状图表示每个月的首次飞行客户数量,而折线图表示每个月的最后一次飞行客户数量。这两个图表有助于了解客户在不同时间段内的飞行行为。
  2. 首次飞行客户数量:柱状图显示了每个月首次飞行的客户数量。根据柱状图的趋势,可以看出不同月份首次飞行客户数量的波动情况。这有助于航空公司识别哪些月份可能是吸引新客户的最佳时机。

在这里插入图片描述

3.11 工作省份客户分布词云图:

👇👇👇 关注公众号,回复 “航空数据分析” 获取源码👇👇👇

在这里插入图片描述

3.12 会员等级与平均累计飞行里程漏斗图

在这里插入图片描述

3.13 客户的平均积分兑换次数分析

在这里插入图片描述

3.14 液体填充图来展示了达到最高会员等级的客户比例

在这里插入图片描述

3.15 最高会员等级的客户在总客户中所占的比例

在这里插入图片描述

👇👇👇 关注公众号,回复 “航空数据分析” 获取源码👇👇👇

3.16 客户价值评估模型

在这里插入图片描述

👇👇👇 关注公众号,回复 “航空数据分析” 获取源码👇👇👇

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1482963.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【ArcPy】简化ArcGISPro默认Python环境体量

参考文献 安装 ArcPy—ArcGIS Pro | 文档

Kubernetes(k8s第二部分)

资源清单相当于剧本 什么是资源: k8s中所有的内容都抽象为资源,资源实例化后,叫做对象。 1.K8S中的资源 集群资源分类 名称空间级别: kubeadm k8s kube-system kubectl get pod -n default 工作负载型资源,&a…

【Vue3】深入理解Vue中的ref属性

💗💗💗欢迎来到我的博客,你将找到有关如何使用技术解决问题的文章,也会找到某个技术的学习路线。无论你是何种职业,我都希望我的博客对你有所帮助。最后不要忘记订阅我的博客以获取最新文章,也欢…

物联网主机:为智能交通赋能

物联网(IoT)技术的发展为智能交通领域带来了许多创新的解决方案。而在物联网应用中,物联网主机起着关键的作用。本文将为大家介绍一款名为E6000的物联网主机,它是一种多协议、多接口的物联网主机,为智能交通系统的建设…

操作系统x面试|进程与线程

1. 线程进程的区别 进程可以称为是资源分配的最小单元,而线程可以称为是处理器分配的最小单元。 资源包括内存空间。同时进程是一段代码的执行过程,这段代码需要多少的内存在代码确定时已经确定下来了。 处理器就是执行单元,一个进程可以拆解…

Vue(黑马学习笔记)

Vue概述 通过我们学习的htmlcssjs已经能够开发美观的页面了,但是开发的效率还有待提高,那么如何提高呢?我们先来分析下页面的组成。一个完整的html页面包括了视图和数据,数据是通过请求从后台获取的那么意味着我们需要将后台获取…

每日一题 2368受限条件下可到达节点的数目

2368. 受限条件下可到达节点的数目 题目描述: 现有一棵由 n 个节点组成的无向树,节点编号从 0 到 n - 1 ,共有 n - 1 条边。 给你一个二维整数数组 edges ,长度为 n - 1 ,其中 edges[i] [ai, bi] 表示树中节点 ai 和…

java的JDK选择和在win11的安装与配置

一.背景 还是公司安排的师带徒的任务。自己也回头看看。 二.JDK的选择 开发的版本java1.8。所以准备使用JDK8。 1.JDK有谁在给我们提供呢? 我以前知道的是sun、RedHat、Oracle、IBM。 我以前一般都是去sun的网站下载,后来被Oracle收购后去的Oracle…

Java智慧云HIS医院信息化系统源码 更具灵活性、扩展性

目录 什么是云HIS 趋势与转变 HIS上云后有哪些好处 解决方案 云HIS组成 1、门诊挂号 2、住院管理 3、电子病历 4、药物管理 5、统计报表 6、综合维护 7、运营运维 什么是云HIS 云HIS是一种基于云计算技术的医院信息管理系统。云HIS可以帮助医院管理各类医院信息&a…

MySQL:一行记录如何

1、表空间文件结构 表空间由段「segment」、区「extent」、页「page」、行「row」组成,InnoDB存储引擎的逻辑存储结构大致如下图: 行 数据库表中的记录都是按「行」进行存放的,每行记录根据不同的行格式,有不同的存储结构。 页…

跨域引起的两个接口的session_id不是同一个

来源场景: RequestMapping(“/captcha”)接口设置了SESSION_KEY,也能获取到,但是到了PostMapping(“/login”)接口就是空的,由于跨域导致的两个session_id不是同一个 /*** 系统用户 前端控制器*/ Controller CrossOrigin(origins…

vue项目电商

这个项目功能有首页,分类,商品详情,购物车,用户注册、登录等等的实现,并且可以在手机上进行展示。 git仓库地址:https://gitee.com/BisShen/project.git

分类问题经典算法 | 二分类问题 | Logistic回归:梯度下降

目录 一. 损失函数1. 交叉熵损失函数2. 梯度下降 一. 损失函数 Logistic回归算法公式推导篇中,我们通过对似然函数求对数,得到 l ( θ ) l(\theta ) l(θ): l ( θ ) l n [ L ( θ ) ] ∑ i 1 M { y ( i ) l n [ h θ ( x ( i ) ) ] ( …

【Python笔记-FastAPI】后台任务+WebSocket监控进度

目录 一、代码示例 二、执行说明 (一) 调用任务执行接口 (二) 监控任务进度 实现功能: 注册后台任务(如:邮件发送、文件处理等异步场景,不影响接口返回)监控后台任务执行进度(进度条功能)支…

2024最新算法:河马优化算法(Hippopotamus optimization algorithm,HO)求解23个基准函数,提供MATLAB代码

一、河马优化算法 河马优化算法(Hippopotamus optimization algorithm,HO)由Amiri等人于2024年提出,该算法模拟了河马在河流或池塘中的位置更新、针对捕食者的防御策略以及规避方法。河马优化算法的灵感来自河马生活中观察到的三…

在Windows系统上安装Docker和SteamCMD容器的详细指南有哪些?

在Windows系统上安装Docker和SteamCMD容器的详细指南有哪些? 安装Docker: 首先,需要在Windows操作系统上激活WSL2功能。这是因为Docker作为一个容器工具,依赖于已存在并运行的Linux内核环境。可以通过使用winget来安装Docker。具体…

[技巧]Arcgis之图斑四至范围批量计算

ArcGIS图层(点、线、面三类图形)四至范围计算 例外一篇介绍:[技巧]Arcgis之图斑四至点批量计算 说明:如下图画出来的框(范围标记不是很准) ,图斑的x最大和x最小,y最大,…

2024年全国乙卷高考理科数学备考:十年选择题真题和解析

今天距离2024年高考还有三个多月的时间,今天我们来看一下2014~2023年全国乙卷高考理科数学的选择题,从过去十年的真题中随机抽取5道题,并且提供解析。后附六分成长独家制作的在线练习集,科学、高效地反复刷这些真题,吃…

聊聊 HTTP 性能优化

作为用户的我们在 "上网冲浪" 的时候总是希望快一点,尤其是抢演唱会门票的时候,但是现实并非如此,有时候我们会遇到页面加载缓慢、响应延迟的情况。 而 HTTP 协议作为互联网世界的基础,从网站打开速度到移动应用的响应…

Maven-私服(黑马学习笔记)

前面我们在讲解多模块开发的时候,我们讲到我们所拆分的模块是可以在同一个公司各个项目组之间进行资源共享的。这个模块的资源共享,就需要通过我们接下来所讲解的Maven的私服来实现。 首先我们先介绍一下什么是私服,以及它的作用是什么。再来…