[Pandas] 查看DataFrame的常用属性

news2024/10/6 1:37:58

导入数据

import pandas as pd
 
df = pd.DataFrame([['L123','A',0,123],
                   ['L456','A',1,456],
                   ['L437','C',0,789],
                   ['L112','B',1,741],
                   ['L211','A',0,852],
                   ['L985','B',1,963]
                  ],columns=['Material','Level','Passing','LT'])

df


1.dtypes: 查看DataFrame中各列的数据类型

df.dtypes会返回每个字段的数据类型及DataFrame整体的类型 

# 查看各字段的数据类型
df.dtypes

结果如下

Material     object
Level         object
Passing       int64
LT                int64
dtype: object

可以看到,字段'Material'和'Level'为object,其他字段都是int64 

2.values: 返回DataFrame中的数值 

# array(<所有值的列表矩阵>)
df.values

结果如下

array([['L123', 'A', 0, 123],
          ['L456', 'A', 1, 456],
          ['L437', 'C', 0, 789],
          ['L112', 'B', 1, 741],
          ['L211', 'A', 0, 852],
          ['L985', 'B', 1, 963]], dtype=object)

3.size: 返回DataFrame中元素的个数

# 元素个数  = 行数 * 列数
df.size

结果如下

24 

4.shape: 返回DataFrame的行数与列数

执行df.shape会返回一个元组,该元组的第一个元素代表行数,第二个元素代表列数

# 返回一个元组(行数,列数)
df.shape

结果如下

(6, 4) 

可以看到,上述数据框df有6行4列的数据

5.ndim: 返回DataFrame的维度数

df.ndim

结果如下

6.index: 返回DataFrame中的行索引

df.index

结果如下

RangeIndex(start=0, stop=6, step=1) 

7.columns: 返回DataFrame中的列索引

df.columns

结果如下

Index(['Material', 'Level', 'Passing', 'LT'], dtype='object') 

8.info: 返回DataFrame中的基本信息

执行df.info会显示所有数据的类型、索引情况、行列数、各字段数据类型、内存占用等

df.info

结果如下

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 6 entries, 0 to 5
Data columns (total 4 columns):
Material    6 non-null object
Level       6 non-null object
Passing     6 non-null int64
LT          6 non-null int64
dtypes: int64(2), object(2)
memory usage: 272.0+ bytes 

9.查看DataFrame部分样本信息

df.head(): 显示DataFrame头部几行数据,默认5条,可指定条数  

# 默认查看DataFrame前5条数据
df.head()

结果如下

    Material  Level  Passing  LT
0     L123       A          0       123
1     L456       A          1       456
2     L437       C         0       789
3     L112       B         1        741
4     L211       A          0       852 

# 查看DataFrame前3条数据
df.head(3)

结果如下

    Material  Level  Passing  LT
0     L123       A          0       123
1     L456       A          1       456
2     L437       C          0       789 

df.tail(): 显示DataFrame尾部几行数据,默认5条,可指定条数  

# 默认查看DataFrame后5条数据
df.tail()

结果如下

    Material  Level  Passing  LT
1     L456       A          1        456
2     L437       C          0       789
3     L112       B          1        741
4     L211       A           0       852
5     L985       B          1       963 

# 查看DataFrame后3条数据
df.tail(3)

结果如下

    Material  Level  Passing  LT
3     L112       B          1       741
4     L211       A          0       852
5     L985       B          1       963 

df.sample(): 显示DataFrame一条随机数据,可指定条数

# 随机查看一条数据
df.sample()

结果如下

    Material  Level  Passing  LT
4     L211       A          0       852 

# 随机查看3条数据
df.sample(3)

结果如下

    Material  Level  Passing  LT
5     L985       B          1       963
1     L456       A          1       456
0     L123       A          0       123 

10.查看DataFrame的统计信息

df.describe()显示DataFrame的统计信息(只能统计数值类型的列)

'''
count:这一组数据中包含数据的个数(数量)
mean:这一组数据的平均值(平均数)
std:标准差
min:最小值
max:最大值
25%,50%,75%:百分位数,其中50%是中位数
'''
df.describe()

百分位数

如果将一组数据从小到大排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数,以Pk表示第k百分位数
Pk表示至少有k%的资料小于或等于这个数,而同时也有(100-k)%的资料大于或等于这个数

以身高为例,身高分布的第五百分位数表示有5%的人的身高小于或等于此测量值,95%的身高大于或等于此测量值 

结果如下

             Passing          LT
count  6.000000    6.000000
mean  0.500000   654.000000
std      0.547723   310.368813
min     0.000000   123.000000
25%    0.000000   527.250000
50%    0.500000   765.000000
75%    1.000000   836.250000
max    1.000000   963.000000 

df.describe()会返回一个有多行的所有数字列的统计表,每一行对应一个统计指标 

提示Tips: 如果DataFrame没有数字列,则会输出与字符相关的统计数据

import pandas as pd
 
df = pd.DataFrame([['L123','L123','A'],
                   ['L456','L456','B'],
                   ['L437','L437','C'],
                   ['L112','L112','B'],
                   ['L1212','L985','B'],
                   ['L911','L985','B']
                  ],columns=['Material','New_Material','Level'])

df 

'''
count:这一组数据中包含数据的个数(数量)
unique:表示有多少种不同的值(不重复值数)
top:最大值(按首字母排序)
freq:最大值(top)的出现频率
'''
df.describe()

结果如下

            Material  New_Material  Level
count         6                6                6
unique       6                5                3
top          L911           L985            B
freq           1                2                 4

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/483613.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C++练级之初级:第六篇

类和对象入门级&#xff1a;第六篇 1.类的引入2.类的定义2.1类的访问限定符2.2类的封装2.3类的实例化 3.如何计算类或者对象的大小4.this指针 总结 我们知道&#xff0c;C在C语言的基础上引入了对象的概念&#xff0c;那么从本篇开始进入类和对象&#xff1b; 1.类的引入 &…

【JavaEE】_1.多线程(1)

目录 1.操作系统 2. 进程 3. CPU分配——进程调度 3.1 操作系统对进程的管理 3.2 PCB的属性 3.2.1 基础属性 3.2.2 实现进程调度的属性 4. 内存分配——内存管理 4.1 虚拟地址空间 4.2 进程间通信 5. 线程 5.1 线程的概念 5.2 创建与使用多线程 5.2.1 方式1&a…

【数据结构】八大排序(一)

&#x1f61b;作者&#xff1a;日出等日落 &#x1f4d8; 专栏&#xff1a;数据结构 珍惜自己的时间&#xff0c;利用好每一份每一秒。做事不放过没一个细节&#xff0c;小心谨慎&#xff0c;细致&#xff0c;能够做到这些&#xff0c;还有什么是不可能的呢? 目录 ​编辑 ✔…

【刷题之路Ⅱ】LeetCode 61. 旋转链表

【刷题之路Ⅱ】LeetCode 61. 旋转链表 一、题目描述二、解题1、方法1——移动部分链表1.1、思路分析1.2、代码实现 2、方法1——闭合为环2.1、思路分析2.2、代码实现 一、题目描述 原题连接&#xff1a; 61. 旋转链表 题目描述&#xff1a; 给你一个链表的头节点 head &#x…

【Python | matplotlib】matplotlib.cm的理解以及举例说明

文章目录 一、模块介绍二、颜色举例 一、模块介绍 matplotlib.cm是Matplotlib中的一个模块&#xff0c;它提供了一组用于处理颜色映射&#xff08;colormap&#xff09;的函数和类。颜色映射是一种将数值映射到颜色的方法&#xff0c;常用于制作热力图、等值线图、散点图等。 …

软件工程实验:原型设计

目录 前言实验目的实验要求实验过程系统原型绘制生成html代码 总结 前言 本次实验的主题是原型设计&#xff0c;即根据用户需求和系统功能&#xff0c;设计一个简单的软件原型&#xff0c;展示系统的界面和交互方式。原型设计是软件工程中的一种重要技术&#xff0c;它可以帮助…

深入探索PyTorch中的自动微分原理及梯度计算方法

❤️觉得内容不错的话&#xff0c;欢迎点赞收藏加关注&#x1f60a;&#x1f60a;&#x1f60a;&#xff0c;后续会继续输入更多优质内容❤️ &#x1f449;有问题欢迎大家加关注私戳或者评论&#xff08;包括但不限于NLP算法相关&#xff0c;linux学习相关&#xff0c;读研读博…

如何完全卸载linux下通过rpm安装的mysql

卸载linux下通过rpm安装的mysql 1.关闭MySQL服务2.使用 rpm 命令的方式查看已安装的mysql3. 使用rpm -ev 命令移除安装4. 查询是否还存在遗漏文件5. 删除MySQL数据库内容 1.关闭MySQL服务 如果之前安装过并已经启动&#xff0c;则需要卸载前请先关闭MySQL服务 systemctl stop…

Tomcat整体架构解析

一、Tomcat整体架构介绍 Tomcat是一个开源的轻量级web应用服务器。整体架构如下&#xff1a; Tomcat中最顶层的容器是Server&#xff0c;即代表一个Tomcat服务器&#xff0c;一个Server中可以有多个Service&#xff0c;对外提供不同的web服务。Service是对Connector和Contain…

电话号码的字母组合

题目&#xff1a;17. 电话号码的字母组合 - 力扣&#xff08;Leetcode&#xff09; 思路&#xff1a; 给定一个电话号码字符串 digits&#xff0c;须输出它所能表示的所有字母组合。我们可以先定义一个数字字符到字母表的映射表 numToStr&#xff0c;然后再用 Combine 函数递归…

【Linux专区】 环境搭建 | 带你白嫖七个月阿里云服务器

&#x1f49e;&#x1f49e;欢迎来到 Claffic 的博客&#x1f49e;&#x1f49e; &#x1f449; 专栏&#xff1a;《Linux专区》&#x1f448; 前言&#xff1a; 工欲善其事必先利其器&#xff0c;没个Linux环境怎么愉快地学Linux&#xff1f;这期就先带大家把环境搞好&#xf…

物联网系统中常见的通信协议分析

物联网&#xff08;Internet of Things, 简称IoT&#xff09;是指将各种传感器、设备等通过互联网连接起来&#xff0c;形成一个庞大的网络&#xff0c;实现物与物之间的互联互通。在实现这个过程中&#xff0c;各种不同的通信协议被广泛应用。本文将为大家介绍物联网中常见的通…

[架构之路-185]-《软考-系统分析师》-3-操作系统基本原理 - 文件索引表

目录 一、文件的索引块。 二、索引分配表 三、索引表的链接方案 四、多层索引 五、混合索引分配 一、文件的索引块。 存放在目录中的文件&#xff0c;并非是文件的真实内容。 目录中记录了文件的索引块是几号磁盘块。 文件对应的索引表是存放在指定的磁盘块中的&#x…

CSI指纹预处理(中值、均值、Hampel、小波滤波)

目录 1、前言 2、中值滤波器 3、均值滤波器 4、Hampel滤波器 5、小波变换滤波器 1、前言 因为设备、温度和实验室物品摆设等因素的影响&#xff0c;未经处理的CSI数据不能直接使用&#xff0c;需要对数据进行异常值处理以保证数据的稳定性&#xff0c;同时减少环境中人的…

云原生Istio架构和组件介绍

目录 1 Istio 架构2 Istio组件介绍2.1 Pilot2.2 Mixer2.3 Citadel2.4 Galley2.5 Sidecar-injector2.6 Proxy(Envoy)2.7 Ingressgateway2.8 其他组件 1 Istio 架构 Istio的架构&#xff0c;分为控制平面和数据面平两部分。 - 数据平面&#xff1a;由一组智能代理&#xff08;[En…

Eclipse改SSH项目,修改java代码无效

遇到了一个大坑&#xff0c;记录一下… 坑1&#xff1a;修改后台代码总是没用… 1.背景&#xff1a; Eclipse运行SSH项目&#xff08;StrutsSpringHibernate&#xff09;&#xff0c;修改SQL语句&#xff0c;但是前端查询的结果没变化…(例如&#xff0c;在sql里加上 where …

LeetCode279之完全平方数(相关话题:动态规划,四平方和定理)

题目描述 给你一个整数 n ,返回 和为 n 的完全平方数的最少数量 。 完全平方数 是一个整数,其值等于另一个整数的平方;换句话说,其值等于一个整数自乘的积。例如,1、4、9 和 16 都是完全平方数,而 3 和 11 不是。 示例 1: 输入:n = 12 输出:3 解释:12 = 4 + 4 +…

【Android构建篇】MakeFile语法

前言 对于一个看不懂Makefile构建文件规则的人来说&#xff0c;这个Makefile语法和shell语法是真不一样&#xff0c;但是又引用了部分shell语法&#xff0c;可以说是shell语法的子类&#xff0c;Makefile语法继承了它。 和shell语法不一样&#xff0c;这个更难一点&#xff0…

Vue3基本知识点

为什么要学vue3 1、Vue是国内 最火的前端框架 2、Vue3是2020年09月18日正式发布的 目前以支持Vue3的UI组件库 库名称简介ant-design-vuePC 端组件库&#xff1a;Ant Design 的 Vue 实现&#xff0c;开发和服务于企业级后台产品arco-design-vuePC 端组件库&#xff1a;字节跳…

DataX3同步Mysql数据库数据到Mysql数据库和DataX3同步mysql数据库数据到Starrocks数据库

DataX3同步Mysql数据库数据到Mysql数据库和DataX3同步mysql数据库数据到Starrocks 一、认识DataX二、DataX3概览三、DataX3框架设计四、DataX3插件体系五、DataX3核心架构六、DataX 3六大核心优势1.可靠的数据质量监控2.丰富的数据转换功能3.精准的速度控制4.强劲的同步性能5.健…