文章目录
- 🏳️🌈 1. 导入模块
- 🏳️🌈 2. Pandas数据处理
- 2.1 读取数据
- 2.2 查看数据信息
- 2.3 数据处理
- 🏳️🌈 3. Pyecharts数据可视化
- 3.1 奥迪用户购车时间分布
- 3.2 奥迪各系销量占比饼图
- 3.3 奥迪各系销量占比
- 3.4 奥迪全系销量占比
- 3.5 奥迪全系销量及裸车价格
- 3.6 奥迪百公里油耗分布
- 3.7 各项指标平均评分雷达图
- 3.8 优评词云
- 3.9 差评词云
- 🏳️🌈 4. 可视化项目源码+数据
大家好,我是 👉【Python当打之年(点击跳转)】
本期利用 python 分析一下某平台「奥迪汽车销售数据」 ,看看奥迪车主购车时间分布、驾驶感受、全系车价分布 等等,希望对大家有所帮助,如有疑问或者需要改进的地方可以联系小编。
涉及到的库:
- Pandas — 数据处理
- Pyecharts — 数据可视化
🏳️🌈 1. 导入模块
import jieba
import pandas as pd
from pyecharts.charts import Line
from pyecharts.charts import Bar
from pyecharts.charts import Pie
from pyecharts.charts import Scatter
from pyecharts.charts import WordCloud
from pyecharts.charts import Radar
import pyecharts.options as opts
from pyecharts.commons.utils import JsCode
🏳️🌈 2. Pandas数据处理
2.1 读取数据
df = pd.read_csv('奥迪汽车数据.csv')
2.2 查看数据信息
df.info()
一共有17543条数据。
2.3 数据处理
df1 = df.copy()
df1 = df1[~df1['百公里油耗'].str.contains('百公里电耗')]
df_tmp = df1['行驶里程'].str.split('km',expand=True)
df1['行驶里程'] = df_tmp[0]
df1['行驶里程'] = df1['行驶里程'].astype('int')
df_tmp = df1['百公里油耗'].str.split('L百公里油耗',expand=True)
df1['百公里油耗'] = df_tmp[0]
df1['百公里油耗'] = df1['百公里油耗'].astype('float')
🏳️🌈 3. Pyecharts数据可视化
3.1 奥迪用户购车时间分布
def get_line():
l1 = (
Line()
.add_xaxis(x_data)
.add_yaxis("", y_data)
.set_global_opts(
title_opts=opts.TitleOpts(
title='1-奥迪用户购车时间分布',
pos_top='1%',
pos_left="center",
title_textstyle_opts=opts.TextStyleOpts(color='#00838F',font_size=25),
),
)
)
return l1
-
购车时间在2014-2016年这三年之间处于一个顶峰的位置,2020年也迎来了一波小高潮。
-
近两年随着国产车的崛起,购买奥迪的用户出现持续走低现象。
3.2 奥迪各系销量占比饼图
def get_pie():
p1 = (
Pie()
.add("",
[list(z) for z in zip(x_data, y_data)]
)
.set_global_opts(
title_opts=opts.TitleOpts(
title='2-奥迪各系销量占比',
pos_top='5%',
pos_left="center",
title_textstyle_opts=opts.TextStyleOpts(color='#00838F',font_size=25),
),
)
)
return p1
- 迪A系销量超过了全系的2/3,S系销量占比在1%左右。
3.3 奥迪各系销量占比
3.4 奥迪全系销量占比
- 从全系销量来看:奥迪A6和奥迪A4的销量几乎占据了半壁江山。
3.5 奥迪全系销量及裸车价格
def get_bar():
bar = (
Bar()
.add_xaxis(x_data)
.add_yaxis("销量",y_data1)
.set_global_opts(
title_opts=opts.TitleOpts(
title='5-奥迪全系销量及裸车价格',
pos_top='1%',
pos_left="center",
title_textstyle_opts=opts.TextStyleOpts(color='#00838F',font_size=25),
),
)
)
return bar
- 全系裸车价格基本在20-80万之间。
3.6 奥迪百公里油耗分布
- 百公里油耗基本在6L-13L之间
3.7 各项指标平均评分雷达图
def get_radar():
radar = (
Radar(init_opts=opts.InitOpts(width='1000px', height='600px',bg_color='#CFD8DC')chema(
schema=schemas,
splitarea_opt=opts.SplitAreaOpts(
is_show=True, areastyle_opts=opts.AreaStyleOpts(opacity=1)
),
textstyle_opts=opts.TextStyleOpts(color="#263238"),
)
.add(
series_name="",
data=[datas],
linestyle_opts=opts.LineStyleOpts(color="#CD0000"),
)
.set_global_opts(
title_opts=opts.TitleOpts(
title='7-各项指标平均评分雷达图',
pos_top='1%',
pos_left="center",
title_textstyle_opts=opts.TextStyleOpts(color='#00838F',font_size=25),
),
)
)
return radar
- 从空间评分、驾驶感受、油耗评分、外观评分、内饰评分、性价比评分、配置评分等几个维度的雷达图来看,整体评分都在4.0以上,还是比较高的。
3.8 优评词云
3.9 差评词云
🏳️🌈 4. 可视化项目源码+数据
点击跳转:【全部可视化项目源码+数据】
以上就是本期为大家整理的全部内容了,赶快练习起来吧,原创不易,喜欢的朋友可以点赞、收藏也可以分享(注明出处)让更多人知道。