python的csv库常用操作

news2024/11/15 4:34:33

        csv 模块是 Python 标准库中的一个模块,用于处理 CSV(逗号分隔值)文件。它提供了简单易用的功能来读取和写入 CSV 文件。以下是一些常用的操作:

一、读取 CSV 文件

新建文件data.csv,内容如下:

使用 csv.reader 读取CSV 文件

使用reader之前先要使用python的内置标准函数open()打开文件。open()的用法见:

python的open()函数-CSDN博客

import csv

with open('data.csv', mode='r', newline='') as file:
    

 csv.reader(file) 创建的 reader 对象是一个迭代器,用于逐行读取 CSV 文件中的数据。reader 对象的格式是一个生成器对象,每次迭代返回一行数据,每一行数据以列表的形式呈现,每个列表元素对应 CSV 文件中的一个字段(单元格)。

逐行打印reader数据:

import csv

with open('data.csv', mode='r', newline='') as file:
    reader = csv.reader(file)
    
    for row in reader:
        print(row)
打印输出结果:
['line0_0', 'line0_1', 'line0_2', 'line0_3', 'line0_4', 'line0_5']
['line1_0', 'line1_1', 'line1_2', 'line1_3', 'line1_4', 'line1_5']
['line2_0', 'line2_1', 'line2_2', 'line2_3', 'line2_4', 'line2_5']
['line3_0', 'line3_1', 'line3_2', 'line3_3', 'line3_4', 'line3_5']
['line4_0', 'line4_1', 'line4_2', 'line4_3', 'line4_4', 'line4_5']
['line5_0', 'line5_1', 'line5_2', 'line5_3', 'line5_4', 'line5_5']

 将reader数据转换为列表:

import csv

with open('data.csv', mode='r', newline='') as file:
    reader = csv.reader(file)
    
    csv_data = list(reader)
打印输出结果:
[['line0_0', 'line0_1', 'line0_2', 'line0_3', 'line0_4', 'line0_5'], ['line1_0', 'line1_1', 'line1_2', 'line1_3', 'line1_4', 'line1_5'], ['line2_0', 'line2_1', 'line2_2', 'line2_3', 'line2_4', 'line2_5'], ['line3_0', 'line3_1', 'line3_2', 'line3_3', 'line3_4', 'line3_5'], ['line4_0', 'line4_1', 'line4_2', 'line4_3', 'line4_4', 'line4_5'], ['line5_0', 'line5_1', 'line5_2', 'line5_3', 'line5_4', 'line5_5'], ['', '', '', '', '', ''], ['', '', '', '', '', ''], ['', '', '', '', '', ''], ['', '', '', '', '', ''], ['', '', '', '', '', '']]

csv.reader 对象的特性


返回类型:csv.reader 对象的每一项是一个列表,每个列表表示 CSV 文件中的一行数据。列表中的元素是每个字段的值。

迭代方式:csv.reader 是一个迭代器,可以使用 for 循环逐行遍历 CSV 文件。

默认分隔符:csv.reader 默认使用逗号(,)作为字段分隔符,但你可以通过设置 delimiter 参数来使用其他分隔符,如分号(;)。 

reader = csv.reader(file, delimiter=';')

引号处理:csv.reader 可以处理字段中的引号。默认情况下,它会将被引号括起来的字段视为一个单独的字段,并自动处理字段中的引号和转义字符。

reader = csv.reader(file, quotechar='"')

 例如,data.csv的内容如下:

import csv

with open('data.csv', newline='', encoding='gbk') as csvfile:
    reader = csv.reader(csvfile, quotechar='"')
    for row in reader:
        print(row)

 输出结果:

['A', 'B']
['A,B']

 在这个例子中,第一行中的逗号是字段之间的分隔符,第二行的逗号被双引号包围,这个逗号不被解释为字段之间的分隔符,而是作为一个字段中的字符存在。

转义符:escapechar
escapechar 参数用于指定一个转义字符。在 CSV 文件中,如果某个字段中包含了 quotechar 指定的字符,并且您不希望这个字符被解释为字段的边界,您可以使用 escapechar 来转义它。转义字符通常出现在要转义的字符之前,表示该字符应该按字面意义解释,而不是作为特殊字符。

​ 

import csv

with open('data.csv', newline='', encoding='gbk') as csvfile:
    reader = csv.reader(csvfile, quotechar='"', escapechar='\\')
    for row in reader:
        print(row)

输出结果:

['Trunpm', '30', 'He said, "Hello!"']

 He said前面的双引号和末尾的双引号,由于没有转义符,就被识别为字段的边界。而Hello!处的双引号有转义符,就被识别为字符双引号。

当然,除了"\",也可以使用别的字符作为转义符。例如:

import csv

with open('data.csv', newline='', encoding='gbk') as csvfile:
    reader = csv.reader(csvfile, quotechar='"', escapechar='#')
    for row in reader:
        print(row)

输出结果相同。

csv.DictReader

使用 csv.DictReader 从 CSV 文件中读取数据,并将每一行数据转换为字典格式。

读CSV 文件并将其转换为字典的示例:

import csv

# 打开 CSV 文件进行读取
with open('output.csv', mode='r', newline='') as file:
    # 创建 DictReader 对象
    reader = csv.DictReader(file)
    
    # 读取数据并打印
    for row in reader:
        print(row)

二、写入csv文件

使用 csv.writer 写入

import csv

data = [
    ["Name", "Age", "City"],
    ["Alice", "30", "New York"],
    ["Bob", "25", "Los Angeles"]
]

with open('output.csv', mode='w', newline='') as file:
    writer = csv.writer(file)
    writer.writerows(data)

csv.writer(file):创建一个 CSV 写入器对象。
writer.writerows(data):将 data 中的所有行写入 CSV 文件。

基本的写入和读取

import csv

# 读取
with open('data.csv', mode='r', newline='') as file:
    reader = csv.reader(file)
    data = list(reader)

# 写入
with open('output.csv', mode='w', newline='') as file:
    writer = csv.writer(file)
    writer.writerows(data)

# 再次读取
with open('output.csv', mode='r', newline='') as file:
    reader = csv.reader(file)
    data = list(reader)
    print(data)

使用 csv.DictWriter 写入

import csv

fieldnames = ['Name', 'Age', 'City']
data = [
    {'Name': 'Alice', 'Age': '30', 'City': 'New York'},
    {'Name': 'Bob', 'Age': '25', 'City': 'Los Angeles'}
]

with open('output.csv', mode='w', newline='') as file:
    writer = csv.DictWriter(file, fieldnames=fieldnames)
    writer.writeheader()
    writer.writerows(data)

csv.DictWriter(file, fieldnames=fieldnames):创建一个字典写入器对象。fieldnames 指定了字典的键的顺序。
writer.writeheader():写入 CSV 文件的头部(列名)。
writer.writerows(data):将字典数据写入 CSV 文件。

读和写的demo:

import csv

fieldnames = ['Name', 'Age', 'City']
data = [
    {'Name': 'Alice', 'Age': '30', 'City': 'New York'},
    {'Name': 'Bob', 'Age': '25', 'City': 'Los Angeles'}
]

with open('output.csv', mode='w', newline='') as file:
    writer = csv.DictWriter(file, fieldnames=fieldnames)
    writer.writeheader()
    writer.writerows(data)

with open('output.csv', mode='r', newline='') as file:
    reader = csv.DictReader(file)
    data = list(reader)
    print(data)

 输出结果:

[{'Name': 'Alice', 'Age': '30', 'City': 'New York'}, {'Name': 'Bob', 'Age': '25', 'City': 'Los Angeles'}]

三、不同的分隔符

CSV 文件的分隔符默认是逗号(,),但有时候需要使用其他分隔符,例如分号(;)。可以通过设置 delimiter 参数来指定不同的分隔符。

import csv

# 读取使用分号作为分隔符的 CSV 文件
with open('input.csv', mode='r', newline='') as file:
    reader = csv.reader(file, delimiter=';')
    for row in reader:
        print(row)

# 写入使用分号作为分隔符的 CSV 文件
with open('output.csv', mode='w', newline='') as file:
    writer = csv.writer(file, delimiter=';')
    writer.writerows(data)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1942777.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

使用JAVA代码实现生成二维码

系列文章目录 1.SpringBoot整合RabbitMQ并实现消息发送与接收 2. 解析JSON格式参数 & 修改对象的key 3. VUE整合Echarts实现简单的数据可视化 4. List<HashMap<String,String>>实现自定义字符串排序(key排序、Val…

录屏神器!这四款软件让你轻松记录屏幕

随着现在在线教育的兴起,用录屏软件将课程录制下来能够帮助我助我们通过视频分享知识,展示成果。电脑怎么录屏的重要性愈发凸显了,下面我为你介绍几款热门的 录屏软件吧。 1.福晰REC大师 这个软件是我用过觉得最顺手的一款了。它录制的视频…

c++ 高精度加法(只支持正整数)

再给大家带来一篇高精度,不过这次是高精度加法!话不多说,开整! 声明 与之前那篇文章一样,如果看起来费劲可以结合总代码来看 定义 由于加法进位最多进1位,所以我们的结果ans[]的长度定义为两个加数中最…

马斯克:xAI启动“最强大AI训练集群” 年底推出全球最强AI

埃隆马斯克最近在社交平台上表示,xAI已经启动了“世界上最强大的 AI 集群”,以在今年12 月之前创建“世界上最强大的AI”。马斯克自豪地透露,得益于xAI团队、X团队、Nvidia及众多合作伙伴的紧密协作,位于孟菲斯的超级计算工厂“Su…

【BUG】已解决:libpng warning: iccp: known incorrect sRGB profile

已解决:libpng warning: iccp: known incorrect sRGB profile 目录 已解决:libpng warning: iccp: known incorrect sRGB profile 【常见模块错误】 错误原因: 原因分析 解决方案 具体步骤 欢迎来到英杰社区https://bbs.csdn.net/topics…

请你谈谈:spring bean的生命周期 - 阶段4:检查Aware相关接口

在Spring框架中,Aware 接口系列提供了一种机制,允许bean在初始化过程中感知到容器中的特定对象,如应用上下文(ApplicationContext)、Bean工厂(BeanFactory)等。如果你有一个用户自定义的对象&am…

ReLU-KAN:仅需要矩阵加法、点乘和ReLU*的新型Kolmogorov-Arnold网络

摘要 由于基函数(B样条)计算的复杂性,Kolmogorov-Arnold网络(KAN)在GPU上的并行计算能力受到限制。本文提出了一种新的ReLU-KAN实现方法,该方法继承了KAN的核心思想。通过采用ReLU(修正线性单元…

计算机视觉与面部识别:技术、应用与未来发展

引言 在当今数字化时代,计算机视觉技术迅速发展,成为人工智能领域的一个重要分支。计算机视觉旨在让机器理解和解释视觉信息,模拟人类的视觉系统。它在各行各业中发挥着重要作用,从自动驾驶汽车到智能监控系统,再到医疗…

2 fabric 关键概念

Peer 节点 区块链网络主要由 Peer 节点(或者简单称之为 Peer)组成。Peer 是网络的基本元素,因为他们存储了账本和智能合约。之前我们说过账本不可篡改地保存着智能合约生成的所有交易(在 Hyperledger Fabric 中智能合约包含在链码中,稍后会详细介绍)。智能合约和账本将网…

Spring AOP(1)

目录 一、AOP 概述 什么是Spring AOP? 二、Spring AOP 快速入门 1、引入AOP依赖 2、编写AOP程序 三、Spring AOP 详解 1、Spring AOP的核心概念 (1)切点(Pointcut) (2)连接点&#xff…

SQL labs靶场-SQL注入入门

靶场及环境配置参考 一,工具准备。 推荐下载火狐浏览器,并下载harkbar插件(v2)版本。hackbar使用教程在此不做过多描述。 补充:url栏内部信息会进行url编码。 二,SQL注入-less1。 1,判断传参…

AGI 之 【Hugging Face】 的【从零训练Transformer模型】之一 [ 如何寻找大型数据集 ] / [ 构建词元分析器 ] 的简单整理

AGI 之 【Hugging Face】 的【从零训练Transformer模型】之一 [ 如何寻找大型数据集 ] / [ 构建词元分析器 ] 的简单整理 目录 AGI 之 【Hugging Face】 的【从零训练Transformer模型】之一 [ 如何寻找大型数据集 ] / [ 构建词元分析器 ] 的简单整理 一、简单介绍 二、Transf…

tslib 库-I.MX6U嵌入式Linux C应用编程学习笔记基于正点原子阿尔法开发板

tslib 库 tslib 简介 tslib 库,这是 Linux 系统下,专门为触摸屏开发的应用层函数库,开源 功能与作用:作为触摸屏驱动和应用层之间的适配层,封装了读取和解析触摸屏数据的复杂过程,提供API接口 数据处理&…

工具(linux)

Yum 软件包管理器 介绍 yum Yum 是一个在 Red Hat 和 CentOS 等 Linux 发行版中常用的软件包管理器,它可以方便地进行软件包的安装、更新和删除。 安装软件包 使用 yum install 命令可以安装指定的软件包,例如: yum install package_nam…

《程序猿入职必会(2) · 搭建具备前端展示效果的 Vue》

📢 大家好,我是 【战神刘玉栋】,有10多年的研发经验,致力于前后端技术栈的知识沉淀和传播。 💗 🌻 CSDN入驻不久,希望大家多多支持,后续会继续提升文章质量,绝不滥竽充数…

华为OD2024D卷机试题汇总,含D量50%+,按算法分类刷题,事半功倍

目录 专栏导读华为OD机试算法题太多了,知识点繁杂,如何刷题更有效率呢? 一、逻辑分析二、数据结构1、线性表① 数组② 双指针 2、map与list3、队列4、链表5、栈6、滑动窗口7、二叉树8、并查集9、矩阵 三、算法1、基础算法① 贪心思维② 二分查…

Graph Guided Transformer论文精读

摘要 抛出问题:基于深度学习的框架在将平衡局部空间结构信息的时候对于区域信息的特征建模能力会下降! 紧接着提出一个GT(Graph–guided transformer)模型,整个网络的框架为:首先使用卷积块获取像素级别的…

开源项目:推动经济与科技发展的新引擎

文章目录 每日一句正能量前言开源项目的发展趋势开源项目的发展趋势开源社区的活跃度开源项目在技术创新中的作用结论 参与开源的经验分享如何选择开源项目如何贡献代码如何与开源社区合作个人品牌与职业发展贡献与成就感 开源项目的挑战维护难度版权问题社区管理技术债务安全问…

理解进程status的二进制位表示及进程等待(是什么,为什么,怎么办)

信号编号:低7位 状态编号:次低8位 1.子进程退出后会变为僵尸进程,将退出结果写入自身的task_struct结构体中 2.wait/waitpid是一个系统调用->OS可以读取子进程的task_struct 1.为什么要进行进程等待? 1.将子进程&#xff…

Vatee万腾平台:智慧金融的创新引擎,驱动金融服务升级

在数字化浪潮席卷全球的今天,金融行业正经历着前所未有的变革与升级。Vatee万腾平台,作为智慧金融领域的创新先锋,正以其独特的技术优势、前瞻的战略布局和卓越的服务能力,成为推动金融服务升级的重要引擎。 智慧金融:…