csv库在python3中是自带的。
利用它可以方便的进行csv文件内容的读取。
注意:要以gbk
的编码形式打开,因为WPS的csv文件默认是gbk
编码,而不是utf-8
。
01-读取表头并在打印每一行内容时一并输出表头
表头为第1行,现在要读取并打印出第2行的内容,并附加上表头信息的代码如下:
import csv
file_path = r'E:\Temp\test01.csv'
with open(file_path, 'r', newline='', encoding='gbk') as file:
# 创建CSV字典文件读取器
reader = csv.DictReader(file)
# 读取第二行的各列内容并打印
second_row = next(reader)
for column_title, value in second_row.items():
print(f"{column_title}: {value}")
运行效果如下:
如果要读取第3行的内容,代码如下:
import csv
file_path = r'E:\Temp\test01.csv'
with open(file_path, 'r', newline='', encoding='gbk') as file:
# 创建CSV字典文件读取器
reader = csv.DictReader(file)
# 读取第三行的各列内容并打印
second_row = next(reader)
third_row = next(reader)
for column_title, value in second_row.items():
print(f"{column_title}: {value}")
运行效果如下:
02-涉及到的相关对象
02-01-DictReader对象:通过方法DictReader
读取csv文件得到的DictReader对象
通过语句:reader = csv.DictReader(file)
读取csv文件后,reader
是一个DictReader对象,其属性如下:
从中我们可以看出,在属性fieldnames
中,存储了这个csv文件的表头。
另外,有个名叫line_num
的存储了当前位于第几行【行数是从1开始算,不是从0开始算】,比如截图中的line_num
的值为3,那么代表当前位于第3行。注意这个值是只读的,是不能修改的,它是基于当前的内存位置得出的。如果要改变它的值,我们只能通过类似于下面的语句去迭代增长内存位置,从而改变它的值:
current_row = next(reader)
或者:
for current_row in reader
这个值其实挺有用的,比如我可以设置我想读哪一行的内容,然后通过如上面的for循环去迭代DictReader对象,当这个值等于我设置的行数时,就可以去读取我想要的内容了。
02-02-每一行的内容实际上是一个字典对象
对于下面两句代码返回的对象:
second_row = next(reader)
third_row = next(reader)
看下面的这两张截图就知道了:
所以就不多说什么了。
03-读取表头并打印出指定行的内容的代码
假如要读第1000行的内容,咱们不可能去写999条语句second_row = next(reader)
呀,根据02-01中对DictReader
对象的属性line_num
的分析,我们可以像下面这样写代码:
import csv
file_path = r'E:\Temp\test01.csv'
with open(file_path, 'r', newline='', encoding='gbk') as file:
# 创建CSV字典文件读取器
reader = csv.DictReader(file)
# 读取到第1000行
target_row_number = 1000
for row in reader:
if reader.line_num == target_row_number:
# 在这里你可以处理目标行的内容
for column_title, value in row.items():
print(f"{column_title}: {value}")
break # 退出循环,因为我们已经读取到了目标行
我们把上面的 target_row_number的值换成2,运行效果如下:
我们把上面的 target_row_number的值换成3,运行效果如下:
从上面的结果来看,实现了我们的需求。