【Python】进阶学习:pandas--read_csv()用法详解

news2024/10/5 19:15:37

🚀【Python】进阶学习:pandas–read_csv()用法详解🚀
在这里插入图片描述

🌈 个人主页:高斯小哥
🔥 高质量专栏:Matplotlib之旅:零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程👈 希望得到您的订阅和支持~
💡 创作高质量博文(平均质量分92+),分享更多关于深度学习、PyTorch、Python领域的优质内容!(希望得到您的关注~)


🌵文章目录🌵

  • 📚 一、为什么需要read_csv()?
  • 🔍 二、read_csv()的基本用法
  • 🛠️ 三、read_csv()的参数
  • 🛠️ 四、实际案例应用
  • 🎉 五、总结
  • 🤝 六、期待与你共同进步

📚 一、为什么需要read_csv()?

  在数据分析的旅程中,我们经常需要从CSV(Comma Separated Values,逗号分隔值)文件中读取数据。CSV是一种常见的数据存储格式,由于其简单性和通用性,被广泛应用于各种领域。Pandas库中的read_csv()函数为我们提供了一个方便、高效的方式来读取这些数据。

🔍 二、read_csv()的基本用法

使用read_csv()函数读取CSV文件的基本语法是:

import pandas as pd

data = pd.read_csv('file_path.csv')

其中,file_path.csv是你的CSV文件的路径。

例如,如果你有一个名为data.csv的文件,你可以这样读取它:

data = pd.read_csv('data.csv')
print(data)

输出:

  StringColumn  IntColumn  FloatColumn  BoolColumn MixedColumn
0            A          0     0.311623       False      class1
1            B          1     0.377196        True      class2
2            C          2     0.930861        True      class3

🛠️ 三、read_csv()的参数

  read_csv()函数有许多参数可以帮助我们更好地处理数据。以下是一些常用的参数:

  1. sepdelimiter:指定分隔符,默认为,。如果你的CSV文件使用的是其他分隔符,如\t(制表符),你可以这样指定:

    data = pd.read_csv('data.csv', sep='\t')
    
  2. header:指定表头行。默认为0,表示第一行是表头。如果CSV文件没有表头,你可以设置为None

    data = pd.read_csv('data.csv', header=None)
    
  3. index_col:将某一列设置为索引。

    data = pd.read_csv('data.csv', index_col=0)
    

    输出:

    在这里插入图片描述

  4. usecols:选择读取的列。你可以传入一个列名的列表,或者一个整数列表来表示列的索引。

    data = pd.read_csv('data.csv', usecols=['IntColumn', 'FloatColumn'])
    print(data)
    

    或者

    data = pd.read_csv('data.csv', usecols=[1, 2])
    

    输出:

       IntColumn  FloatColumn
    0          0     0.311623
    1          1     0.377196
    2          2     0.930861
    
  5. na_values:指定哪些值应被视为NaN(缺失值)。

data = pd.read_csv('data.csv', na_values=['N/A', 'nan'])
  1. dtype:指定列的数据类型(谨慎使用,具体情况具体分析,容易报错)。
data = pd.read_csv('data.csv', dtype={'StringColumn': str, 'IntColumn': int})

这只是read_csv()函数的一部分参数,还有更多参数可以帮助你更好地处理CSV文件。

🛠️ 四、实际案例应用

假设你有一个名为sales.csv的CSV文件,其中包含以下数据:

date,product,sales
2023-01-01,A,100
2023-01-02,B,150
2023-01-03,A,200
2023-01-04,C,250

你可以使用read_csv()函数读取这个文件,并进行一些数据分析。

import pandas as pd

# 读取CSV文件
data= pd.read_csv('sales.csv')

# 查看数据
print(data)

print("*"*50)

# 计算每个产品的总销售额
total_sales = data.groupby('product')['sales'].sum()
print(total_sales)
print("*"*50)

# 计算每个日期的销售额
daily_sales = data.groupby('date')['sales'].sum()
print(daily_sales)

输出:

         date product  sales
0  2023-01-01       A    100
1  2023-01-02       B    150
2  2023-01-03       A    200
3  2023-01-04       C    250
**************************************************
product
A    300
B    150
C    250
Name: sales, dtype: int64
**************************************************
date
2023-01-01    100
2023-01-02    150
2023-01-03    200
2023-01-04    250
Name: sales, dtype: int64

  这个例子中,我们首先使用read_csv()函数读取了CSV文件。然后,我们使用groupby()函数按产品和日期对数据进行分组,并使用sum()函数计算每个组的销售额。最后,我们打印了结果。

🎉 五、总结

  read_csv()函数是Pandas库中一个非常重要的函数,它为我们提供了一个方便、高效的方式来读取CSV文件。通过掌握read_csv()函数的基本用法和参数,我们可以轻松地处理各种CSV文件,并进行数据分析和处理。

  在本文中,我们详细介绍了read_csv()函数的基本用法。我们还通过一个实际案例演示了如何使用read_csv()函数进行数据分析。希望这篇文章能帮助你更好地理解和使用read_csv()函数,为你的数据分析工作带来便利。

🤝 六、期待与你共同进步

  🌱 亲爱的读者,非常感谢你每一次的停留和阅读!你的支持是我们前行的最大动力!🙏

  🌐 在这茫茫网海中,有你的关注,我们深感荣幸。你的每一次点赞👍、收藏🌟、评论💬和关注💖,都像是明灯一样照亮我们前行的道路,给予我们无比的鼓舞和力量。🌟

  📚 我们会继续努力,为你呈现更多精彩和有深度的内容。同时,我们非常欢迎你在评论区留下你的宝贵意见和建议,让我们共同进步,共同成长!💬

  💪 无论你在编程的道路上遇到什么困难,都希望你能坚持下去,因为每一次的挫折都是通往成功的必经之路。我们期待与你一起书写编程的精彩篇章! 🎉

  🌈 最后,再次感谢你的厚爱与支持!愿你在编程的道路上越走越远,收获满满的成就和喜悦!祝你编程愉快!🎉

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1487993.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Windows服务器:通过nginx反向代理配置HTTPS、安装SSL证书

先看下效果: 原来的是 http,配置好后 https 也能用了,并且显示为安全链接。 首先需要 SSL证书 。 SSL 证书是跟域名绑定的,还有有效期。 windows 下双击可以查看相关信息。 下载的证书是分 Apache、IIS、Tomcat 和 Nginx 的。 我…

redis批量删除指定前缀key四种方法(收藏)

这篇文章主要介绍了redis批量删除指定前缀key四种方法。 目录 redis批量删除指定前缀key四种方法 第一种:第二种:第三种:第四种:Redis 如何批量删除指定前缀的Key 编码方式 redis批量删除指定前缀key四种方法 第一种&#xff…

【题解】—— LeetCode一周小结9

【题解】—— 每日一道题目栏 上接:【题解】—— LeetCode一周小结8 26.二叉搜索树的范围和 题目链接:938. 二叉搜索树的范围和 给定二叉搜索树的根结点 root,返回值位于范围 [low, high] 之间的所有结点的值的和。 示例 1: 输…

SpringBoot-yaml语法

1.概念 在Springboot的项目中,配置文件有以下几种格式: Application.propertiesApplication.yamlApplication.yml 其中官方推荐我们使用yaml的格式(因为能表示的数据类型很多样) 2.基本语法 # yaml形式的配置文件# 普通的key-value(分号之后…

windows环境下Grafana+loki+promtail入门级部署日志系统,收集Springboot(Slf4j+logback)项目日志

🌹作者主页:青花锁 🌹简介:Java领域优质创作者🏆、Java微服务架构公号作者😄 🌹简历模板、学习资料、面试题库、技术互助 🌹文末获取联系方式 📝 往期热门专栏回顾 专栏…

MyBatis操作数据库(XML方式)

MyBatis是一个持久层框架,和Spring没有任何关系,可以用来简化数据库的操作! 创建工作: 创建Spring Boot工程,并导入MyBatis的起步依赖,Mysql的依赖等 配置数据 #配置数据库的连接字符串 spring:datasour…

ruoyi 图片等文件资源读取

老是忘,记录一下 ResourcesConfig 文件下 /** 本地文件上传路径 */ registry.addResourceHandler(Constants.RESOURCE_PREFIX "/**").addResourceLocations("file:" RuoYiConfig.getProfile() "/"); /*** 资源映射路径 前缀*/ …

C++使用工具进阶(LOG输出、堆栈跟踪、代码结构、code review)

0. 简介 对于C,无论是大学生还是算法工程师都是非常需要学习并使用的一门语言,而C不像python、rust一样简单好用。不单单是在嵌套复杂代码后的逻辑还是各种类和堆栈的管理,都是非常头疼的问题。一般来说对于LOG类很多都是使用GLOG、而堆栈跟…

STM32 (1)

1.基本信息 stm32是由ST公司生产的一种32位微控制器(单片机)。 1.1 各种型号 stm32是32位单片机的总称,有多种不同的系列。 32即用32个比特位表示一个地址,寻址范围:0x00000000 --0xffffffff (4GB) 1.2 存储密度 …

本地如何配置支付宝模拟支付场景并结合内网穿透实现公网环境调试开发?

文章目录 前言1. 下载当面付demo2. 修改配置文件3. 打包成web服务4. 局域网测试5. 内网穿透6. 测试公网访问7. 配置二级子域名8. 测试使用固定二级子域名访问 前言 在沙箱环境调试支付SDK的时候,往往沙箱环境部署在本地,局限性大,在沙箱环境…

[环境配置]ssh连接报错“kex_exchange_identification: read: Connection reset by peer”

已经被VScode ssh毒死好几次了,都是执行命令意外中断,然后又VSCode里连不上、本机Terminal也连不上了。。。 重启远程服务器,VSCode可以连上了, 系统ssh还是不行,报错“kex_exchange_identification: read: Connecti…

数字化转型对企业有什么意义

降本增效,提高生产力 数字化转型可以引入自动化和智能化技术、帮助企业优化流程、减少人工操作和错误,提高工作效率和生产力。例如,使用机器人流程自动化 (RPA) 可以自动执行重复性任务,使员工能够专注于更具价值的工作。除了通过…

YOLOv5独家原创改进:特征融合涨点篇 | 广义高效层聚合网络(GELAN) | YOLOv9

💡💡💡本文独家改进:即结合用梯度路径规划(CSPNet)和(ELAN)设计了一种广义的高效层聚合网络(GELAN),高效结合YOLOv5,实现涨点。 将GELAN添加在backbone和head处,提供多个yaml改进方法 💡💡💡在多个私有数据集和公开数据集VisDrone2019、PASCAL VOC实现…

5.测试教程 - 进阶篇

文章目录 1.按测试对像划分1.1**界面测试**1.2**可靠性测试**1.3**容错性测试**1.4**文档测试**1.5**兼容性测试**1.6**易用性测试**1.7**安装卸载测试**1.8**安全测试**1.9**性能测试**1.10**内存泄漏测试** 2.按是否查看代码划分2.1黑盒测试(Black-box Testing)2.2白盒测试(W…

获取properties二个键值对的值

配置文件: 将属性文件中的值赋给Java类的成员变量: 测试方法: GetMapping("/test1") public String test1(String key) {JSONObject jsonUrl JSONObject.parseObject("{"url"}");System.out.println(" …

计算机网络-网络安全(一)

1.网络安全威胁和漏洞类型: 窃听 假冒 重放 流量分析 破环完整 病毒 木马 诽谤 非授权访问 拒绝服务 漏洞:物理、软件、不兼容、其他等。 2.网络安全信息数据五大特征: 完整性&…

四川首例强生全视人工晶体在成都爱尔眼科医院成功植入

【2024年3月1日,成都】全国首批、四川首例强生全视TECNIS Symfony™ Toric IOL植入手术在成都爱尔眼科医院成功开展,手术由爱尔眼科四川省区白内障学组组长、成都爱尔眼科医院副院长巫雷教授执刀。TECNIS Symfony™ Toric IOL的成功运用,不仅…

第二十一周周报

文献阅读:Recent Advances of Monocular 2D and 3D Human Pose Estimation: A Deep Learning Perspective 摘要:在本文中,作者提供了一个全面的 2d到3d视角来解决单目人体姿态估计的问题。首先,全面总结了人体的二维和三维表征。…

思科网络设备监控

思科是 IT 行业的先驱之一,提供从交换机到刀片服务器的各种设备,以满足中小企业和企业的各种 IT 管理需求。管理充满思科的 IT 车间涉及许多管理挑战,例如监控可用性和性能、管理配置更改、存档防火墙日志、排除带宽问题等等,这需…

如何自学python

Python是一种高级编程语言,它具有简单易学、可读性强、可移植性好、功能丰富等优点,因此在许多领域都被广泛使用,如科学计算、数据分析、人工智能、Web开发、游戏开发等等。 Python具有丰富的标准库和第三方库,可以帮助程序员快速开发功能强大的应用程序。同时,Python也具…