文章目录
- 🏳️🌈 1. 导入模块
- 🏳️🌈 2. Pandas数据处理
- 2.1 读取数据
- 2.2 查看数据信息
- 2.3 查看数据描述信息
- 🏳️🌈 3. Pyecharts数据可视化
- 3.1 销量(瓶)地图分布
- 3.2 每月销量(瓶)
- 3.3 男性女性购买数量占比
- 3.4 产品品种销量
- 3.5 消费者年龄段销量
- 3.6 男性女性每月购买数量
- 3.7 销量前15的城市
- 3.8 评论词云
- 3.9 每月各地区销售额度
- 🏳️🌈 4. 可视化项目源码+数据
大家好,我是 👉【Python当打之年(点击跳转)】
本期利用 python 分析一下「京东某商品销量数据」 ,希望对大家有所帮助,如有疑问或者需要改进的地方可以联系小编。
涉及到的库:
- Pandas — 数据处理
- Pyecharts — 数据可视化
🏳️🌈 1. 导入模块
import jieba
import pandas as pd
from pyecharts.charts import Line
from pyecharts.charts import Bar
from pyecharts.charts import Pie
from pyecharts.charts import Map
from pyecharts.charts import WordCloud
from pyecharts import options as opts
import warnings
warnings.filterwarnings('ignore')
🏳️🌈 2. Pandas数据处理
2.1 读取数据
df = pd.read_excel("./销量数据.xlsx")
2.2 查看数据信息
df.info()
2.3 查看数据描述信息
df.describe()
🏳️🌈 3. Pyecharts数据可视化
3.1 销量(瓶)地图分布
def map1():
map1 = (
Map()
.add('',
data,
'china',
is_map_symbol_show=False,
label_opts=opts.LabelOpts(is_show=False)
)
.set_global_opts(
title_opts=opts.TitleOpts(
title='1-销量(瓶)地图分布',
subtitle=subtitle,
pos_top='1%',
pos_left="1%"
),
legend_opts=opts.LegendOpts(is_show=False),
visualmap_opts=opts.VisualMapOpts(
pos_bottom='10%',
pos_left='20%'
),
)
)
- 云南、贵州、河北、广东、四川等地销量比较高。
3.2 每月销量(瓶)
def bar():
bar = (
Bar()
.add_xaxis(x_data)
.add_yaxis('', y_data, category_gap='30%')
.set_global_opts(
title_opts=opts.TitleOpts(
title='2-每月销量(瓶)',
subtitle=subtitle,
pos_top='1%',
pos_left="1%"
),
visualmap_opts=opts.VisualMapOpts(
is_show=False,
),
legend_opts=opts.LegendOpts(is_show=False),
)
)
3.3 男性女性购买数量占比
3.4 产品品种销量
def pie1():
pie1 = (
Pie()
.add(
"",
[list(z) for z in zip(x_data, y_data)],
radius=["40%", "70%"],
center=["50%", "50%"],
)
.set_colors(['#D32F2F','#1864ab','#FFCA28','#616161'])
.set_global_opts(
title_opts=opts.TitleOpts(
title='4-产品品种销量',
subtitle=subtitle,
pos_top='1%',
pos_left="1%"
),
legend_opts=opts.LegendOpts(is_show=False)
)
)
- 红色包装销量最高,占比达到约40%,其次是金色包装,占比约24%。
3.5 消费者年龄段销量
- 从消费者年龄段分布上看,老年、中年、青年占比基本持平。
3.6 男性女性每月购买数量
3.7 销量前15的城市
def bar1():
bar = (
Bar()
.add_xaxis(x_data)
.add_yaxis('', y_data,label_opts=opts.LabelOpts(position='right'))
.set_global_opts(
title_opts=opts.TitleOpts(
title='7-销量前15的城市',
subtitle=subtitle,
pos_top='1%',
pos_left="1%",
),
visualmap_opts=opts.VisualMapOpts(
is_show=False,
),
legend_opts=opts.LegendOpts(is_show=False),
)
.reversal_axis()
)
- 石家庄市以762的销量排名第一,是排名第二昆明市、北京市的2.5倍左右。
3.8 评论词云
3.9 每月各地区销售额度
🏳️🌈 4. 可视化项目源码+数据
点击跳转:【全部可视化项目源码+数据】
以上就是本期为大家整理的全部内容了,赶快练习起来吧,原创不易,喜欢的朋友可以点赞、收藏也可以分享(注明出处)让更多人知道。