【Python】进阶学习:pandas--info()用法详解

news2025/1/6 19:53:01

【Python】进阶学习:pandas–info()用法详解
在这里插入图片描述

🌈 个人主页:高斯小哥
🔥 高质量专栏:Matplotlib之旅:零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程👈 希望得到您的订阅和支持~
💡 创作高质量博文(平均质量分92+),分享更多关于深度学习、PyTorch、Python领域的优质内容!(希望得到您的关注~)


🌵文章目录🌵

  • 📚 一、初识`info()`函数
  • 💻 二、`info()`函数的基本用法
  • 🔍 三、定制`info()`函数的输出
  • 📚 四、总结
  • 🤝 五、期待与你共同进步

📚 一、初识info()函数

  在pandas库中,info()函数是一个DataFrame和Series对象的方法,用于获取有关数据结构的简要摘要。通过调用info()函数,我们可以快速了解数据集中的基本信息,如行数、列数、列的数据类型、非空值的数量以及内存使用情况等。

💻 二、info()函数的基本用法

  info()函数的基本用法非常简单,只需在DataFrame或Series对象上调用即可。

import pandas as pd

# 创建一个示例DataFrame
data = {
    'A': [1, 2, 3, None],
    'B': [4, None, 6, 8],
    'C': ['p', 'q', 'r', 's']
}
df = pd.DataFrame(data)

# 调用info()函数
df.info()

上述代码将输出DataFrame的简要摘要,包括索引类型、列名、非空值的数量以及每列的数据类型:

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 4 entries, 0 to 3
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype  
---  ------  --------------  -----  
 0   A       3 non-null      float64
 1   B       3 non-null      float64
 2   C       4 non-null      object 
dtypes: float64(2), object(1)
memory usage: 224.0+ bytes

🔍 三、定制info()函数的输出

  info()函数提供了一些可选参数,用于定制输出的内容。以下是 info() 函数的主要参数及其描述:

  1. verbose(布尔值,默认为 True):

    • 控制输出的详细程度。如果为 True,则会显示每列的详细信息,包括非空值的数量。如果为 False,则只显示摘要信息。
  2. buf(可写缓冲区,默认为 None):

    • 指定一个可写缓冲区,如文件对象或 StringIO 对象,用于将输出写入。如果提供了这个参数,info() 函数不会将输出直接打印到控制台,而是写入到指定的缓冲区。
  3. memory_usage(布尔值或字符串,默认为 None):

    • 控制是否显示内存使用情况。如果为 True,则会显示每列占用的内存大小。如果为字符串,则可以指定内存使用的单位,如 'deep' 表示深度内存使用。如果为 None,则不显示内存使用情况。
  4. show_counts(布尔值,默认为 None):

    • 控制是否显示非空值的数量。如果为 True,则会显示每列中非空值的数量。如果为 False,则不显示这个信息。当 verboseFalse 时,这个参数将被忽略。

示例代码:

import pandas as pd

# 创建一个示例DataFrame
data = {
    'A': [1, 2, 3, None],
    'B': [4, None, 6, 8],
    'C': ['p', 'q', 'r', 's']
}
df = pd.DataFrame(data)

# 调用info()函数
# verbose = False
df.info(verbose=False)

print("*"*50)
print("*"*50)

# 指定一个[可写]缓冲区
with open("result.txt", "w") as f:
    df.info(buf=f)
    print("相关信息已写入result.txt!")
print("*"*50)
print("*"*50)

# memory_usage
df.info(memory_usage="deep")
print("*"*50)
df.info(memory_usage=True)
print("*"*50)
df.info(memory_usage=False)

print("\n" + "*"*50)
print("*"*50)

# show_counts
df.info(show_counts=True)
print("\n" + "*"*50)
df.info(show_counts=False)

输出:

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 4 entries, 0 to 3
Columns: 3 entries, A to C
dtypes: float64(2), object(1)
memory usage: 224.0+ bytes
**************************************************
**************************************************
相关信息已写入result.txt!
**************************************************
**************************************************
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 4 entries, 0 to 3
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype  
---  ------  --------------  -----  
 0   A       3 non-null      float64
 1   B       3 non-null      float64
 2   C       4 non-null      object 
dtypes: float64(2), object(1)
memory usage: 424.0 bytes
**************************************************
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 4 entries, 0 to 3
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype  
---  ------  --------------  -----  
 0   A       3 non-null      float64
 1   B       3 non-null      float64
 2   C       4 non-null      object 
dtypes: float64(2), object(1)
memory usage: 224.0+ bytes
**************************************************
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 4 entries, 0 to 3
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype  
---  ------  --------------  -----  
 0   A       3 non-null      float64
 1   B       3 non-null      float64
 2   C       4 non-null      object 
dtypes: float64(2), object(1)
**************************************************
**************************************************
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 4 entries, 0 to 3
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype  
---  ------  --------------  -----  
 0   A       3 non-null      float64
 1   B       3 non-null      float64
 2   C       4 non-null      object 
dtypes: float64(2), object(1)
memory usage: 224.0+ bytes

**************************************************
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 4 entries, 0 to 3
Data columns (total 3 columns):
 #   Column  Dtype  
---  ------  -----  
 0   A       float64
 1   B       float64
 2   C       object 
dtypes: float64(2), object(1)
memory usage: 224.0+ bytes

  通过合理设置这些参数,用户可以根据具体需求定制 info() 函数的输出内容,从而更有效地理解和分析数据集。这些参数使得 info() 函数在数据探索、数据清洗和预处理等阶段都非常有用。

📚 四、总结

  info()函数是pandas库中一个非常实用的函数,它可以帮助我们快速了解数据集的基本信息。通过灵活运用info()函数,我们可以更好地理解和处理数据,为后续的数据分析和建模提供有力支持。

🤝 五、期待与你共同进步

  🌱 亲爱的读者,非常感谢你每一次的停留和阅读!你的支持是我们前行的最大动力!🙏

  🌐 在这茫茫网海中,有你的关注,我们深感荣幸。你的每一次点赞👍、收藏🌟、评论💬和关注💖,都像是明灯一样照亮我们前行的道路,给予我们无比的鼓舞和力量。🌟

  📚 我们会继续努力,为你呈现更多精彩和有深度的内容。同时,我们非常欢迎你在评论区留下你的宝贵意见和建议,让我们共同进步,共同成长!💬

  💪 无论你在编程的道路上遇到什么困难,都希望你能坚持下去,因为每一次的挫折都是通往成功的必经之路。我们期待与你一起书写编程的精彩篇章! 🎉

  🌈 最后,再次感谢你的厚爱与支持!愿你在编程的道路上越走越远,收获满满的成就和喜悦!祝你编程愉快!🎉

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1490594.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

模拟信号转换光电隔离变送器导轨式0-75mV0-100mV0-50mV转4-20mA0-5V0-10V

概述&#xff1a; 导轨安装DIN11 IPO OC系列模拟信号隔离放大器是一种将输入信号隔离放大、转换成按比例输出的直流信号混合集成厚模电路。产品广泛应用在电力、远程监控、仪器仪表、医疗设备、工业自控等需要直流信号隔离测控的行业。此系列产品内部采用了线性光电隔离技术相…

鸿蒙 Stage模型-应用组件-配置、UIAbility

前提&#xff1a;基于官网3.1/4.0文档。参考官网文档 基于Android开发体系来进行比较和思考。&#xff08;或有偏颇&#xff0c;自行斟酌&#xff09; 一、概念 可以看到分为运行期、编译器&#xff0c;主要关注UIAbility&#xff08;类似Activity&#xff0c;UI相关&#xff0…

【C++】list模拟实现+反向迭代器

list模拟实现 list定义list用法list iterator的使用begin() end()rbegin()rend() reverse()sort()merge()unique()remove()splice() list模拟实现struct和class的区别list三个类模板默认成员函数构造函数拷贝构造函数赋值运算符重载析构函数 数据修改操作push_back()push_fron…

探索数据之美:山海鲸可视化软件的五大核心组件解析

作为一名数据分析师&#xff0c;我们每天都在与海量的数据打交道。如何将这些看似杂乱无章的数据转化为有价值的信息&#xff0c;进而为决策提供支持&#xff0c;是我们的核心任务。在这个过程中&#xff0c;可视化工具扮演着至关重要的角色。我日常使用的是山海鲸可视化软件&a…

TCPDump 使用教程

每次服务器网络不通的时候&#xff0c;总会听到一个声音&#xff0c;你去抓包啊&#xff0c;那这里就来介绍下TCPDump&#xff0c;一款强大的网络分析工具&#xff0c;可以捕获网络上的数据包&#xff0c;并进行分析。这款工具在网络管理员和安全专家中非常受欢迎。 一、安装 …

LiveGBS流媒体平台GB/T28181功能-集中录像存储前端设备录像回看解决方案设备录像|云端录像|实时录像说明

LiveGBS集中录像存储前端设备录像回看解决方案设备录像|云端录像|实时录像说明 1、平台概述2、视频录像2.1、设备录像2.1.1、存储位置2.1.1.1、下级硬件设备2.1.1.2、下级国标平台 2.1.2、页面操作2.1.2.1、国标设备2.1.2.1.1、查看通道2.1.2.1.1.1、设备录像 2.1.2.1.2、配置中…

Scrapy与分布式开发(2.3):lxml+xpath基本指令和提取方法详解

lxmlxpath基本指令和提取方法详解 一、XPath简介 XPath&#xff0c;全称为XML Path Language&#xff0c;是一种在XML文档中查找信息的语言。它允许用户通过简单的路径表达式在XML文档中进行导航。XPath不仅适用于XML&#xff0c;还常用于处理HTML文档。 二、基本指令和提取…

【深圳五兴科技】Java面经

本文目录 写在前面试题总览1、java集合2、创建线程的方式3、对spring的理解4、Spring Boot 和传统 Spring 框架的一些区别5、springboot如何解决循环依赖6、对mybatis的理解7、缓存三兄弟8、接口响应慢的处理思路9、http的状态码 写在前面 关于这个专栏&#xff1a; 本专栏记录…

Python常用验证码标注和识别(需求分析和实现思路)

目录 一、需求分析 图像验证码识别&#xff1a; 文本验证码识别&#xff1a; 二、实现思路 三、案例与代码 四、总结与展望 在当今的数字时代&#xff0c;验证码&#xff08;CAPTCHA&#xff09;作为一种安全机制&#xff0c;广泛应用于网站和应用程序中&#xff0c;以防…

Python语言元素之变量

程序是指令的集合&#xff0c;写程序就是用指令控制计算机做我们想让它做的事情。那么&#xff0c;为什么要用Python语言来写程序呢&#xff1f;因为Python语言简单优雅&#xff0c;相比C、C、Java这样的编程语言&#xff0c;Python对初学者更加友好。 一、一些计算机常识 在…

二叉树——从中序与后序遍历序列构造二叉树、654. 最大二叉树、617. 合并二叉树

从中序与后序遍历序列构造二叉树 给定两个整数数组 inorder 和 postorder &#xff0c;其中 inorder 是二叉树的中序遍历&#xff0c; postorder 是同一棵树的后序遍历&#xff0c;请你构造并返回这颗 二叉树 。 示例 1: 在这里插入代码片 输入&#xff1a;inorder [9,3,15…

程序员如何面对金三银四

在当今数字化时代&#xff0c;程序员这个职业已经变得越来越受人们欢迎。随着互联网和信息技术的飞速发展&#xff0c;程序员的需求量也在不断增加。然而&#xff0c;尽管行业需求大&#xff0c;但想要在金三银四这个竞争激烈的时节找到一份满意的工作并不容易。那么&#xff0…

xss.haozi.me:0X0F

虽然是他把特殊字符给转了但是在HTML中是会转回去的所以是啥用 );alert(1

拿到年终奖马上离职,厚道吗?

拿到年终奖马上离职&#xff0c;厚道吗&#xff1f; 大家好&#xff0c;我是銘&#xff0c;全栈开发程序员。 今天在知乎上看到一个问题&#xff1a;拿到年终奖后马上辞职&#xff0c;厚道吗&#xff1f; image-20240229232132786 我的答案是&#xff1a;厚道&#xff0c;非常厚…

Java 小项目开发日记 06(Vue3 前端开发)

Java 小项目开发日记 06&#xff08;Vue3 前端开发&#xff09; 一、环境准备 1.1 创建vue工程(big-event-admin) npm init vuelatestcd big-event-admin npm install1.2 安装插件 1. 安装element-plus cnpm i element-plus --save2. 安装axios cnpm i axios3. 安装sass依赖…

判断给定数值x是否是NANmath.isnan(x)

【小白从小学Python、C、Java】 【计算机等考500强证书考研】 【Python-数据分析】 判断给定数值x是否是NAN math.isnan(x) [太阳]选择题 以下关于代码输出结果的说法中正确的是? import math import numpy as np print("【执行1】math.isnan(1.0)") print(math.is…

LeetCode:1976. 到达目的地的方案数(spfa + 记忆化 Java)

目录 1976. 到达目的地的方案数 原题链接 题目描述&#xff1a; 实现代码与解析&#xff1a; spfa 记忆化 原理思路&#xff1a; 1976. 到达目的地的方案数 原题链接 1976. 到达目的地的方案数 题目描述&#xff1a; 你在一个城市里&#xff0c;城市由 n 个路口组成&a…

企业级虚拟主播解决方案及制作流程

为满足企业对于高质量、高效率视频内容的需求&#xff0c;美摄科技推出了一款创新的虚拟主播解决方案。该方案结合先进的文字转视频技术和云端计算能力&#xff0c;帮助企业快速制作数字人视频&#xff0c;实现品牌宣传的多样化和个性化。 一、方案概述 美摄科技虚拟主播解决…

P-States/C-States/S-States/G-States/D-States

P-States是指处理器的性能状态&#xff0c;可以根据需要调整处理器的工作频率和电压来平衡性能和能效。 S-States是指系统的睡眠状态&#xff0c;可以让系统在空闲时进入低功耗状态以节省能量。 G-States是系统的全局状态&#xff0c;通常用于描述整个系统的运行状态。 C-St…

华为OD机试 - 数字排列 - 深度优先搜索dfs算法(Java 2024 C卷 100分)

目录 专栏导读一、题目描述二、输入描述三、输出描述1、输入2、输出3、说明 四、解题思路五、Java算法源码六、效果展示1、输入2、输出3、说明 华为OD机试 2024C卷题库疯狂收录中&#xff0c;刷题点这里 专栏导读 本专栏收录于《华为OD机试&#xff08;JAVA&#xff09;真题&a…