csv 模块是 Python 标准库中的一个模块,用于处理 CSV(逗号分隔值)文件。它提供了简单易用的功能来读取和写入 CSV 文件。以下是一些常用的操作:
一、读取 CSV 文件
新建文件data.csv,内容如下:
使用 csv.reader 读取CSV 文件
使用reader之前先要使用python的内置标准函数open()打开文件。open()的用法见:
python的open()函数-CSDN博客
import csv
with open('data.csv', mode='r', newline='') as file:
csv.reader(file) 创建的 reader 对象是一个迭代器,用于逐行读取 CSV 文件中的数据。reader 对象的格式是一个生成器对象,每次迭代返回一行数据,每一行数据以列表的形式呈现,每个列表元素对应 CSV 文件中的一个字段(单元格)。
逐行打印reader数据:
import csv
with open('data.csv', mode='r', newline='') as file:
reader = csv.reader(file)
for row in reader:
print(row)
打印输出结果:
['line0_0', 'line0_1', 'line0_2', 'line0_3', 'line0_4', 'line0_5']
['line1_0', 'line1_1', 'line1_2', 'line1_3', 'line1_4', 'line1_5']
['line2_0', 'line2_1', 'line2_2', 'line2_3', 'line2_4', 'line2_5']
['line3_0', 'line3_1', 'line3_2', 'line3_3', 'line3_4', 'line3_5']
['line4_0', 'line4_1', 'line4_2', 'line4_3', 'line4_4', 'line4_5']
['line5_0', 'line5_1', 'line5_2', 'line5_3', 'line5_4', 'line5_5']
将reader数据转换为列表:
import csv
with open('data.csv', mode='r', newline='') as file:
reader = csv.reader(file)
csv_data = list(reader)
打印输出结果:
[['line0_0', 'line0_1', 'line0_2', 'line0_3', 'line0_4', 'line0_5'], ['line1_0', 'line1_1', 'line1_2', 'line1_3', 'line1_4', 'line1_5'], ['line2_0', 'line2_1', 'line2_2', 'line2_3', 'line2_4', 'line2_5'], ['line3_0', 'line3_1', 'line3_2', 'line3_3', 'line3_4', 'line3_5'], ['line4_0', 'line4_1', 'line4_2', 'line4_3', 'line4_4', 'line4_5'], ['line5_0', 'line5_1', 'line5_2', 'line5_3', 'line5_4', 'line5_5'], ['', '', '', '', '', ''], ['', '', '', '', '', ''], ['', '', '', '', '', ''], ['', '', '', '', '', ''], ['', '', '', '', '', '']]
csv.reader 对象的特性
返回类型:csv.reader 对象的每一项是一个列表,每个列表表示 CSV 文件中的一行数据。列表中的元素是每个字段的值。
迭代方式:csv.reader 是一个迭代器,可以使用 for 循环逐行遍历 CSV 文件。
默认分隔符:csv.reader 默认使用逗号(,)作为字段分隔符,但你可以通过设置 delimiter 参数来使用其他分隔符,如分号(;)。
reader = csv.reader(file, delimiter=';')
引号处理:csv.reader 可以处理字段中的引号。默认情况下,它会将被引号括起来的字段视为一个单独的字段,并自动处理字段中的引号和转义字符。
reader = csv.reader(file, quotechar='"')
例如,data.csv的内容如下:
import csv
with open('data.csv', newline='', encoding='gbk') as csvfile:
reader = csv.reader(csvfile, quotechar='"')
for row in reader:
print(row)
输出结果:
['A', 'B']
['A,B']
在这个例子中,第一行中的逗号是字段之间的分隔符,第二行的逗号被双引号包围,这个逗号不被解释为字段之间的分隔符,而是作为一个字段中的字符存在。
转义符:escapechar
escapechar 参数用于指定一个转义字符。在 CSV 文件中,如果某个字段中包含了 quotechar 指定的字符,并且您不希望这个字符被解释为字段的边界,您可以使用 escapechar 来转义它。转义字符通常出现在要转义的字符之前,表示该字符应该按字面意义解释,而不是作为特殊字符。
import csv
with open('data.csv', newline='', encoding='gbk') as csvfile:
reader = csv.reader(csvfile, quotechar='"', escapechar='\\')
for row in reader:
print(row)
输出结果:
['Trunpm', '30', 'He said, "Hello!"']
He said前面的双引号和末尾的双引号,由于没有转义符,就被识别为字段的边界。而Hello!处的双引号有转义符,就被识别为字符双引号。
当然,除了"\",也可以使用别的字符作为转义符。例如:
import csv
with open('data.csv', newline='', encoding='gbk') as csvfile:
reader = csv.reader(csvfile, quotechar='"', escapechar='#')
for row in reader:
print(row)
输出结果相同。
csv.DictReader
使用 csv.DictReader
从 CSV 文件中读取数据,并将每一行数据转换为字典格式。
读CSV 文件并将其转换为字典的示例:
import csv
# 打开 CSV 文件进行读取
with open('output.csv', mode='r', newline='') as file:
# 创建 DictReader 对象
reader = csv.DictReader(file)
# 读取数据并打印
for row in reader:
print(row)
二、写入csv文件
使用 csv.writer 写入
import csv
data = [
["Name", "Age", "City"],
["Alice", "30", "New York"],
["Bob", "25", "Los Angeles"]
]
with open('output.csv', mode='w', newline='') as file:
writer = csv.writer(file)
writer.writerows(data)
csv.writer(file):创建一个 CSV 写入器对象。
writer.writerows(data):将 data 中的所有行写入 CSV 文件。
基本的写入和读取
import csv
# 读取
with open('data.csv', mode='r', newline='') as file:
reader = csv.reader(file)
data = list(reader)
# 写入
with open('output.csv', mode='w', newline='') as file:
writer = csv.writer(file)
writer.writerows(data)
# 再次读取
with open('output.csv', mode='r', newline='') as file:
reader = csv.reader(file)
data = list(reader)
print(data)
使用 csv.DictWriter 写入
import csv
fieldnames = ['Name', 'Age', 'City']
data = [
{'Name': 'Alice', 'Age': '30', 'City': 'New York'},
{'Name': 'Bob', 'Age': '25', 'City': 'Los Angeles'}
]
with open('output.csv', mode='w', newline='') as file:
writer = csv.DictWriter(file, fieldnames=fieldnames)
writer.writeheader()
writer.writerows(data)
csv.DictWriter(file, fieldnames=fieldnames):创建一个字典写入器对象。fieldnames 指定了字典的键的顺序。
writer.writeheader():写入 CSV 文件的头部(列名)。
writer.writerows(data):将字典数据写入 CSV 文件。
读和写的demo:
import csv
fieldnames = ['Name', 'Age', 'City']
data = [
{'Name': 'Alice', 'Age': '30', 'City': 'New York'},
{'Name': 'Bob', 'Age': '25', 'City': 'Los Angeles'}
]
with open('output.csv', mode='w', newline='') as file:
writer = csv.DictWriter(file, fieldnames=fieldnames)
writer.writeheader()
writer.writerows(data)
with open('output.csv', mode='r', newline='') as file:
reader = csv.DictReader(file)
data = list(reader)
print(data)
输出结果:
[{'Name': 'Alice', 'Age': '30', 'City': 'New York'}, {'Name': 'Bob', 'Age': '25', 'City': 'Los Angeles'}]
三、不同的分隔符
CSV 文件的分隔符默认是逗号(,),但有时候需要使用其他分隔符,例如分号(;)。可以通过设置 delimiter 参数来指定不同的分隔符。
import csv
# 读取使用分号作为分隔符的 CSV 文件
with open('input.csv', mode='r', newline='') as file:
reader = csv.reader(file, delimiter=';')
for row in reader:
print(row)
# 写入使用分号作为分隔符的 CSV 文件
with open('output.csv', mode='w', newline='') as file:
writer = csv.writer(file, delimiter=';')
writer.writerows(data)