【38 Pandas+Pyecharts | 奥迪汽车销量数据分析可视化】

news2024/9/20 16:58:06

文章目录

  • 🏳️‍🌈 1. 导入模块
  • 🏳️‍🌈 2. Pandas数据处理
    • 2.1 读取数据
    • 2.2 查看数据信息
    • 2.3 数据处理
  • 🏳️‍🌈 3. Pyecharts数据可视化
    • 3.1 奥迪用户购车时间分布
    • 3.2 奥迪各系销量占比饼图
    • 3.3 奥迪各系销量占比
    • 3.4 奥迪全系销量占比
    • 3.5 奥迪全系销量及裸车价格
    • 3.6 奥迪百公里油耗分布
    • 3.7 各项指标平均评分雷达图
    • 3.8 优评词云
    • 3.9 差评词云
  • 🏳️‍🌈 4. 可视化项目源码+数据

大家好,我是 👉【Python当打之年(点击跳转)】

在这里插入图片描述

本期利用 python 分析一下某平台「奥迪汽车销售数据」 ,看看奥迪车主购车时间分布、驾驶感受、全系车价分布 等等,希望对大家有所帮助,如有疑问或者需要改进的地方可以联系小编。

涉及到的库:

  • Pandas — 数据处理
  • Pyecharts — 数据可视化

🏳️‍🌈 1. 导入模块

import jieba
import pandas as pd
from pyecharts.charts import Line
from pyecharts.charts import Bar
from pyecharts.charts import Pie
from pyecharts.charts import Scatter
from pyecharts.charts import WordCloud
from pyecharts.charts import Radar
import pyecharts.options as opts
from pyecharts.commons.utils import JsCode

🏳️‍🌈 2. Pandas数据处理

2.1 读取数据

df = pd.read_csv('奥迪汽车数据.csv')

在这里插入图片描述

2.2 查看数据信息

df.info()

在这里插入图片描述

一共有17543条数据。

2.3 数据处理

df1 = df.copy()
df1 = df1[~df1['百公里油耗'].str.contains('百公里电耗')]
df_tmp = df1['行驶里程'].str.split('km',expand=True)
df1['行驶里程'] = df_tmp[0]
df1['行驶里程'] = df1['行驶里程'].astype('int')

df_tmp = df1['百公里油耗'].str.split('L百公里油耗',expand=True)
df1['百公里油耗'] = df_tmp[0]
df1['百公里油耗'] = df1['百公里油耗'].astype('float')

在这里插入图片描述

🏳️‍🌈 3. Pyecharts数据可视化

3.1 奥迪用户购车时间分布

def get_line():
    l1 = (
        Line()
        .add_xaxis(x_data)
        .add_yaxis("", y_data)
        .set_global_opts(
            title_opts=opts.TitleOpts(
                title='1-奥迪用户购车时间分布',
                pos_top='1%',
                pos_left="center",
                title_textstyle_opts=opts.TextStyleOpts(color='#00838F',font_size=25),
            ),
        )
    )
    return l1

在这里插入图片描述

  • 购车时间在2014-2016年这三年之间处于一个顶峰的位置,2020年也迎来了一波小高潮。

  • 近两年随着国产车的崛起,购买奥迪的用户出现持续走低现象。

3.2 奥迪各系销量占比饼图

def get_pie():
    p1 = (
        Pie()
        .add("",
             [list(z) for z in zip(x_data, y_data)]
            )
        .set_global_opts(
            title_opts=opts.TitleOpts(
                title='2-奥迪各系销量占比',
                pos_top='5%',
                pos_left="center",
                title_textstyle_opts=opts.TextStyleOpts(color='#00838F',font_size=25),
            ),
        )
    )
    return p1

在这里插入图片描述

  • 迪A系销量超过了全系的2/3,S系销量占比在1%左右。

3.3 奥迪各系销量占比

在这里插入图片描述

3.4 奥迪全系销量占比

在这里插入图片描述

  • 从全系销量来看:奥迪A6和奥迪A4的销量几乎占据了半壁江山。

3.5 奥迪全系销量及裸车价格

def get_bar():
    bar = (
        Bar()
        .add_xaxis(x_data)
        .add_yaxis("销量",y_data1)
        .set_global_opts(
            title_opts=opts.TitleOpts(
                title='5-奥迪全系销量及裸车价格',
                pos_top='1%',
                pos_left="center",
                title_textstyle_opts=opts.TextStyleOpts(color='#00838F',font_size=25),
            ),
        )
    )
    return bar

在这里插入图片描述

  • 全系裸车价格基本在20-80万之间。

3.6 奥迪百公里油耗分布

在这里插入图片描述

  • 百公里油耗基本在6L-13L之间

3.7 各项指标平均评分雷达图

def get_radar():
    radar = (
        Radar(init_opts=opts.InitOpts(width='1000px', height='600px',bg_color='#CFD8DC')chema(
            schema=schemas,
            splitarea_opt=opts.SplitAreaOpts(
                is_show=True, areastyle_opts=opts.AreaStyleOpts(opacity=1)
            ),
            textstyle_opts=opts.TextStyleOpts(color="#263238"),
        )
        .add(
            series_name="",
            data=[datas],
            linestyle_opts=opts.LineStyleOpts(color="#CD0000"),
        )
        .set_global_opts(
             title_opts=opts.TitleOpts(
                title='7-各项指标平均评分雷达图',
                pos_top='1%',
                pos_left="center",
                title_textstyle_opts=opts.TextStyleOpts(color='#00838F',font_size=25),
            ),
        )
    )
    return radar

在这里插入图片描述

  • 从空间评分、驾驶感受、油耗评分、外观评分、内饰评分、性价比评分、配置评分等几个维度的雷达图来看,整体评分都在4.0以上,还是比较高的。

3.8 优评词云

在这里插入图片描述

3.9 差评词云

在这里插入图片描述

🏳️‍🌈 4. 可视化项目源码+数据

点击跳转:【全部可视化项目源码+数据】


以上就是本期为大家整理的全部内容了,赶快练习起来吧,原创不易,喜欢的朋友可以点赞、收藏也可以分享注明出处)让更多人知道。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1354577.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

使用Python和Pygame库创建简单的的彩球效果

简介 Pygame是一款强大的游戏开发库,可以用于创建各种有趣的图形效果。为了更好地了解Pygame的功能,今天我们将要做的是在屏幕上随机生成一些彩色的小球,并使它们以不同的速度和方向移动。当小球碰到屏幕边缘时,它们将反弹。 功能…

小型洗衣机哪个牌子质量好?五款最好用的迷你洗衣机品牌

不得不说洗衣机的发明解放了我们的双手,而我们从小到大就有这个意识,贴身衣物不可以和普通的衣服一起丢进去洗衣机一起,而内衣裤上不仅有肉眼看见的污渍还有手上根本无法消灭的细菌,但是有一款专门可以将衣物上的细菌杀除的内衣小…

仓库出入库登记系统的推荐

在信息时代,仓库管理已成为企业不可缺少的一项工作。我们如何高效、准确地管理仓库的进货、出货以及库存,是每个企业或仓管都需要面对的问题。而一个优秀的仓库出入库登记系统,则能够大大提升仓库管理的效率和准确性。本文将为您推荐一款实用…

NFC物联网开发在智慧校园中的应用

近年来,校园信息化建设速度加快,以物联网为基础、以各种应用服务系统为载体的智慧校园将教学、管理和校园生活充分融合,形成了工作、学习和生活的一体化环境。沉寂已久的NEC 技术,得益于智能手机的普及、无线网络数据速率提高&…

『开发工具篇』- 配置 gradle 等相关依赖镜像源

『开发工具篇』- 配置 gradle 等相关依赖镜像源 1.更换gradle下载源2. 配置setting.gradlekts文件gradle文件 1.更换gradle下载源 使用腾讯云的镜像库https://mirrors.cloud.tencent.com/gradle/ gradle-x.x-all.zip:编译后的二进制发布版以及源码和文档gradle-x.…

FreeRTOS——优先级翻转

1.优先级翻转概念 优先级翻转:高优先级的任务反而慢执行,低优先级的任务反而优先执行 注意:在实时操作系统中不允许出现,在二值信号量中经常出现 2.优先级翻转实战 2.1freertos_demo.c #include "freertos_demo.h" #i…

1.69寸SPI接口240*280TFT液晶显示模块使用中碰到的问题

1.69寸SPI接口240280TFT液晶显示模块使用中碰到的问题说明并记录一下, 在网上买了1.69寸液晶显示模块,使用spi接口,分辨率240280,给的参考程序是GPIO模拟的SPI接口,打算先移植到FreeRtos测试,再慢慢使用硬件…

Algorithm-Left Edge算法

算法输入: 多个段,每个段由两个值表示,例如(1,3) 算法原理: 将多个段按照左边的值排序放到列表中遍历列表,不断选择没有重叠的段,直到列表遍历结束,将选择…

rk3588中编译带有ffmpeg的opencv

有朋友有工程需要,将视频写成mp4,当然最简单的方法当然是使用opencv的命令 cv::VideoWriter writer;bool bRet writer.open("./out.mp4", cv::VideoWriter::fourcc(m, p, 4, v), 15, cv::Size(640, 512), 1); 但是奈何很难编译成功&#xff…

【python入门】day12:bug及其处理思路

bug的常见类型 粗心 / 没有好习惯 思路不清 lst[{rating:[9.7,2062397],id:1292052,type:[犯罪,剧情],title:肖申克的救赎,actors:[蒂姆罗宾斯,摩根弗里曼]},{rating:[9.6,1528760],id:1291546,type:[剧情,爱情,同性],title:霸王别姬,actors:[张国荣 ,张丰毅 , 巩俐 ,葛优]},{r…

redis的使用、打开、关闭的详细介绍

redis的使用、打开、关闭的详细介绍 1.安装redis cd / cd opt/ wget https://download.redis.io/releases/redis-5.0.5.tar.gz 2.解压redis tar xzf redis-5.0.5.tar.gz 3.执行make cd redis-5.0.5/ make 如果出现找不到make的情况就yum install -y make 如果没有gcc就…

网络安全—SSL安全访问应用

文章目录 网络拓扑部署CA服务器颁发证书开启Web服务安装IIS服务修改Web默认网页 申请Web证书前提准备申请文件生成申请web证书开始安装web证书 客户机访问web默认网站使用HTTP使用HTTPS 为客户机安装浏览器证书 环境:Windows Server 2003 网络拓扑 这里使用NAT还是…

力扣hot100 二叉树的直径

👨‍🏫 题目地址 一个节点的最大直径 它左树的深度 它右树的深度 😋 AC code /*** Definition for a binary tree node.* public class TreeNode {* int val;* TreeNode left;* TreeNode right;* TreeNode() {}* Tr…

[C#]C# OpenVINO部署yolov8图像分类模型

【官方框架地址】 https://github.com/ultralytics/ultralytics.git 【算法介绍】 YOLOv8 抛弃了前几代模型的 Anchor-Base。 YOLO 是一种基于图像全局信息进行预测的目标检测系统。自 2015 年 Joseph Redmon、Ali Farhadi 等人提出初代模型以来,领域内的研究者们…

设计模式篇章(1)——理论基础

设计模式:在软件开发中会面临许多不断重复发生的问题,这些问题可能是代码冗余、反复修改旧代码、重写以前的代码、在旧代码上不断堆新的代码(俗称屎山)等难以扩展、不好维护的问题。因此1990年有四位大佬(GoF组合&…

魔改Stable Diffusion,开源创新“单目深度估计”模型

单目深度估计一直是计算机视觉领域的难点。仅凭一张 RGB 图像,想要还原出场景的三维结构,在几何结构上非常不确定,必须依赖复杂的场景理解能力。 即便使用更强大的深度学习模型来实现,也面临算力需求高、图像数据注释量大、泛化能力弱等缺点。 为了解决这些难题&a…

导入和导出功能的简单实现

理解定义 导入:将外部文件数据导入到数据库或内存中。导出:将数据库或内存中的数据导出为外部文件。 具体实现步骤如下: 导入数据:可以通过读取外部文件(如Excel、CSV等)的数据,然后将数据保存…

简易机器学习笔记(八)关于经典的图像分类问题-常见经典神经网络LeNet

前言 图像分类是根据图像的语义信息对不同类别图像进行区分,是计算机视觉的核心,是物体检测、图像分割、物体跟踪、行为分析、人脸识别等其他高层次视觉任务的基础。图像分类在许多领域都有着广泛的应用,如:安防领域的人脸识别和…

【数据结构】二叉树的创建和遍历:前序遍历,中序遍历,后序遍历,层次遍历

目录 一、二叉树的定义 1、二叉树的定义 2、二叉树的五种形态 二叉树的子树 : 3、满二叉树与完全二叉树 4、二叉树的性质 5、二叉树的存储结构 1、顺序存储 ​编辑 2、链式存储 二、二叉树的遍历 按照前序序列构建二叉树 1、前 (先) 序遍历(Preorder …

没有Kubernetes也可以玩转Dapr?

一、NameResolution组件 虽然Dapr提供了一系列的编程模型,比如服务调用、发布订阅和Actor模型等,被广泛应用的应该还是服务调用。我们知道微服务环境下的服务调用需要解决服务注册与发现、负载均衡、弹性伸缩等问题,其实Dapr在这方面什么都没…