【数据可视化】第四章—— 基于pandas的数据可视化(pandas基本操作)

news2025/1/10 12:02:18

图形绘制的代码:链接:https://pan.baidu.com/s/1pgS60sry6XDILIhth8bAvA?pwd=abcd
提取码:abcd

文章目录

  • 1. Pandas库的数据运算
    • 1.1 方法形式的运算
    • 1.2 比较运算法则
    • 1.3 排序
  • 2. 基本统计分析函数
    • 2.1 基本统计分析函数
    • 2.2 累计统计分析函数
    • 2.3 相关分析函数
  • 3. Pandas可视化
    • 3.1 绘制折线图
    • 3.2 绘制柱状图
    • 2.3 绘制直方图
    • 2.4 绘制散点图
    • 2.5 绘制饼图
    • 2.6 面积图
    • 2.7 盒须图


1. Pandas库的数据运算

  • 算数运算根据行列索引,补齐后运算,运算默认产生浮点数
  • 补齐时缺项填充NaN(空值)
  • 二维和一维、一维和零维间为广播运算
  • 采用+_*/符号 进行的二元运算产生新的对象

在这里插入图片描述

1.1 方法形式的运算

在这里插入图片描述
在这里插入图片描述

1.2 比较运算法则

  • 比较运算只能比较相同索引的元素,不进行补齐
  • 二维和一维、一维和零维间为广播运算
  • 采用> < >= <= == !=等符号进行的二元运算产生新布尔对象

在这里插入图片描述
在这里插入图片描述

1.3 排序

sort_index()方法在指定轴上根据索引进行排序,默认升序
在这里插入图片描述
在这里插入图片描述

sort_values()方法在指定轴上根据数值进行排序,默认升序

  • Series.sort_values(axis = 0, ascending = True)

  • DataFrame.sort_values(by, axis = 0, ascending = True)
    by: axis轴上的某个索引或索引列表
    在这里插入图片描述

NaN统一放到排序末尾
在这里插入图片描述

2. 基本统计分析函数

2.1 基本统计分析函数

适用于Series和DataFrame类型
在这里插入图片描述
在这里插入图片描述

适用于Series类型
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

2.2 累计统计分析函数

适用于Series和DataFrame类型
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

适用于Series和DataFrame类型,滚动计算(窗口计算)
在这里插入图片描述
在这里插入图片描述

2.3 相关分析函数

两个事物,表示为X和Y,如何判断它们之间的存在相关性?

X增大,Y增大,两个变量正相关
X增大,Y减小,两个变量负相关
X增大,Y不变,两个变量不相关

在这里插入图片描述
协方差>0,X和Y正相关
协方差<0,X和Y负相关
协方差=0,X和Y独立无关

Pearson相关系数
在这里插入图片描述
r的取值范围 [-1,1]

0.8-1.0极强相关
0.6-0.8强相关
0.4-0.6中等强度相关
0.2-0.4弱相关
0.0-0.2极弱相关或不相关

在这里插入图片描述
在这里插入图片描述

3. Pandas可视化

常见的图表类型
在这里插入图片描述
Series的plot方法参数
在这里插入图片描述
DataFrame的plot方法参数
在这里插入图片描述

3.1 绘制折线图

【例】在pandas中使用Series绘制线性图,代码如下。

from pandas import DataFrame,Series
import pandas as pd 
import numpy as np
import matplotlib.pyplot as plt
s = pd.Series(np.random.randn(10).cumsum(), index=np.arange(0, 100, 10))
s.plot()
plt.show()

【例】在pandas中使用DataFrame绘制线性图,代码如下。

from pandas import DataFrame,Series
import pandas as pd 
import numpy as np
import matplotlib.pyplot as plt
df = pd.DataFrame(np.random.randn(10, 4).cumsum(0),
                  columns=['A', 'B', 'C', 'D'],
                  index=np.arange(0, 100, 10))
df.plot()
plt.show()

在这里插入图片描述
在这里插入图片描述

3.2 绘制柱状图

plot.bar()

【例】在pandas中使用Series绘制柱状图,代码如下。

from pandas import DataFrame,Series
import pandas as pd 
import numpy as np
import matplotlib.pyplot as plt
fig, axes = plt.subplots(2, 1)
data = pd.Series(np.random.rand(16), index=list('abcdefghijklmnop'))
data.plot.bar(color='r', alpha=0.7) # 垂直柱状图
plt.show()

【例】在pandas中使用Series中绘制条形图,代码如下。

from pandas import DataFrame,Series
import pandas as pd 
import numpy as np
import matplotlib.pyplot as plt
fig, axes = plt.subplots(2, 1)
data = pd.Series(np.random.rand(16), index=list('abcdefghijklmnop'))
data.plot.barh(color=‘r’, alpha=0.7) # 条形图
plt.show()

【例】在pandas中使用DataFrame绘制柱状图,代码如下。

from pandas import DataFrame,Series
import pandas as pd 
import numpy as np
import matplotlib.pyplot as plt
df = pd.DataFrame(np.random.rand(4, 4),
                  index=['one', 'two', 'three', 'four'],
                  columns=pd.Index(['A', 'B', 'C', 'D'], name='bar'))
df.plot.bar()
plt.show()

2.3 绘制直方图

plot.hist()

【例】在pandas中绘制直方图,代码如下。

from pandas import DataFrame,Series
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from numpy.random import randn
df = pd.DataFrame({'a':np.random.randn(1000)+1,'b':np.random.randn(1000),}, columns=['a', 'b'])
df.plot.hist(bins=20)
plt.show()

2.4 绘制散点图

plot.scatter()
【例】在pandas中绘制散点图,代码如下。
在这里插入图片描述

2.5 绘制饼图

plot.pie()

【例】在pandas中绘制饼图,代码如下。

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
df = pd.Series(3*np.random.rand(4),index = list('ABCD'))
df.plot.pie(subplots = True)
plt.show()

在这里插入图片描述
在这里插入图片描述

2.6 面积图

plot.area()
【例】在pandas中绘制面积图,代码如下。

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
df = pd.DataFrame(np.random.rand(8,4),columns = list('ABCD'))
df.plot.area()
plt.show()

2.7 盒须图

plot.box()

【例】在pandas中绘制盒须图,代码如下。

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
df = pd.DataFrame(np.random.rand(8,4),columns = list('ABCD'))
df.plot.box()
plt.show()

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/55374.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

[附源码]计算机毕业设计JAVA学生量化考核管理系统

[附源码]计算机毕业设计JAVA学生量化考核管理系统 项目运行 环境配置&#xff1a; Jdk1.8 Tomcat7.0 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; SSM my…

基于PHP+MySQL高校毕业设计管理系统的设计与实现

直以来我国领导人提倡以人为本的治国方案,而大学是未来人才的培养基地,如何能够更好的对高校毕业设计信息进行管理,是很多高校一直在研究的一个问题,只有更加科学的对高校毕业设计信息进行管理,才能够更加积极的培养国家的栋梁之才。 管理员部分功能 1&#xff1a;教师新管理…

第二十二章《记事本》第1节:记事本项目简介

记事本软件能够打开、编辑、保存各种类型的文本文档,也能在文本文档中查找特定的关键字,此外在还能设定文本文档的字体、字号以及风格等。 22.1.1记事本功能简介 记事本软件的运行结果如图22-1所示。 图22-1记事本软件界面 从图21-1可以看到:记事本程序运行开始后,在没有…

OpenFeign动态代理、源码分析

1、OpenFeign概述 OpenFeign 组件的前身是 Netflix Feign 项目&#xff0c;由 Netflix 公司开发。后来 Feign 项目被贡献给了开源组织&#xff0c;随后Feign退出历史舞台。 OpenFeign是Spring Cloud在Feign的基础上支持了SpringMVC的注解&#xff0c;如RequestMapping等等。O…

基于springboot的家装平台设计与实现

项目描述 临近学期结束&#xff0c;还是毕业设计&#xff0c;你还在做java程序网络编程&#xff0c;期末作业&#xff0c;老师的作业要求觉得大了吗?不知道毕业设计该怎么办?网页功能的数量是否太多?没有合适的类型或系统?等等。这里根据疫情当下&#xff0c;你想解决的问…

牛客练习赛106 三子棋

牛客练习赛106 三子棋 2022.12.02 题目描述 给定一个 333 \times 333 的棋盘&#xff0c;共有 3393 \times 3 9339 个格子&#xff0c;初始时每个格子均没有放置棋子。 A 和 B 轮流行动&#xff0c;每次行动的人&#xff0c;必须在当前棋盘上选择一个没有放置棋子的格子…

基于PHP+MySQL学生成绩管理系统的设计与实现

基于PHP的学生成绩管理系统主要高校内部提供服务,系统分为管理员,教师用户和学生用户三部分。 在基于PHP的学生成绩管理系统中分为管理员用户,教师用户和学生用户三部分,其中管理员用户主要是用来管理教师信息,学生信息,课程信息,专业信息和班级信息等内容,教师用户主要是用来管…

业务流程管理的未来趋势:个性化定制

自进入互联网时代以来、甚至更早&#xff0c;无论是从物质还是精神层面&#xff0c;“个性化”已经成为大众所普遍追求的东西。个性化定制允许买家按照自身偏好对产品进行二次改造&#xff0c;例如许多汽车品牌&#xff0c;就可以根据车主的想法来实现定制。 其实&#xff0c;…

Spring Boot 集成 EasyExcel 3.x 优雅实现Excel导入导出

Spring Boot 集成 EasyExcel 3.x 本章节将介绍 Spring Boot 集成 EasyExcel&#xff08;优雅实现Excel导入导出&#xff09;。 &#x1f916; Spring Boot 2.x 实践案例&#xff08;代码仓库&#xff09; 介绍 EasyExcel 是一个基于 Java 的、快速、简洁、解决大文件内存溢出的…

CSS盒子模型(上)

&#x1f353;个人主页&#xff1a;bit.. &#x1f352;系列专栏&#xff1a;Linux(Ubuntu)入门必看 C语言刷题 数据结构与算法 HTML和CSS3 目录 1.盒子模型 1.2盒子模型&#xff08;Box Model&#xff09;组成 1.3边框&#xff08;border&#xff09; 1.4 表格的…

这才是Git的正确学习方式

程序员宝藏库&#xff1a;https://gitee.com/sharetech_lee/CS-Books-Store 你想要的&#xff0c;这里都有&#xff01; 我认为学习一门知识最怕的就是一知半解、草草了事&#xff0c;对于Git这种工具类更是如此。 有很多同学工作后&#xff0c;日常用到git clone、git add、g…

ubuntu18.04下cmake的安装

一.使用安装命令 sudo apt install cmake这种方式安装最为简单&#xff0c;但是&#xff0c;这种方式安装的不是最新版本的Cmake。 我此次安装cmake是因为要编译fastdds&#xff0c;其实之前系统中有cmake&#xff0c;但是在编译fastdds的过程中依然提示我&#xff1a; CMake…

第二证券|千亿巨头飙涨,消费板块掀起涨停潮!

消费板块复苏可期。 外围股市团体大反弹&#xff0c;隔夜纳斯达克指数大涨超4&#xff05;&#xff0c;标普500指数涨超3&#xff05;&#xff0c;道琼斯指数涨逾2%。跟着近两个月来的持续反弹&#xff0c;道琼斯指数自阶段底已反弹超20%&#xff0c;进入技术性牛市。早盘A股同…

留言墙项目【Vue3 + nodejs + express + mysql】——上

创建项目 如何使用 mddir 命令生成目录结构树 规范文件目录 ## 默认目录 |-- undefined|-- .gitignore|-- babel.config.js|-- jsconfig.json|-- package.json|-- README.md|-- vue.config.js|-- yarn.lock|-- 开发文档.md|-- public| |-- favicon.ico| |-- index.html|-…

[激光原理与应用-29]:典型激光器 -1- 固体激光器

目录 第1章 什么是固体激光器 1.1 什么是固体激光器 1.2 固体激光器特点 1.3 特性 1.4 分类 1.5 波长 第2章 固体激光器的组成 2.1 固体工作物质 2.2 激励源 第1章 什么是固体激光器 1.1 什么是固体激光器 用固体激光材料作为工作介质的激光器。 固体激光材料是在作…

老杨说运维 | 想转型的请注意!这几点不容忽视

随着各行各业数字化转型的持续推进&#xff0c;以及信息化建设的不断深入&#xff0c;IT系统规模及复杂程度日趋增长。据IDC预测&#xff0c;2021年中国金融行业IT支出规模&#xff08;包括&#xff1a;软件、硬件、IT服务等&#xff09;达到2186.02亿元&#xff0c;到2025年将…

Go-Excelize API源码阅读(三十九)——SetCellHyperLink

Go-Excelize API源码阅读&#xff08;三十九&#xff09;——SetCellHyperLink 开源摘星计划&#xff08;WeOpen Star&#xff09; 是由腾源会 2022 年推出的全新项目&#xff0c;旨在为开源人提供成长激励&#xff0c;为开源项目提供成长支持&#xff0c;助力开发者更好地了解…

Mysql存储过程和游标的一点理解

最近学习数据库语言sql&#xff0c;学到了存储过程和游标这一块&#xff0c;上课一点没听&#xff0c;可以说是全程懵逼。不过好在有个课后的实验&#xff0c;然而cmd中的报错往往极其粗糙&#xff0c;只会告诉你什么附近有错&#xff08;有时候还是错的&#xff09;&#xff0…

大一新生HTML期末作业 个人旅游图片博客HTML5 用DIV+CSS技术设计的个人网站(web前端网页制作课作业)

&#x1f389;精彩专栏推荐&#x1f447;&#x1f3fb;&#x1f447;&#x1f3fb;&#x1f447;&#x1f3fb; ✍️ 作者简介: 一个热爱把逻辑思维转变为代码的技术博主 &#x1f482; 作者主页: 【主页——&#x1f680;获取更多优质源码】 &#x1f393; web前端期末大作业…

Centos7安装部署openLDAP并springboot集成openLDAP

这里安装部署都是基于docker的&#xff0c;供参考 安装docker 1、yum list docker 2、yum install -y yum-utils device-mapper-persistent-data lvm2 3、yum-config-manager --add-repo https://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo 4、yum install do…