简要版,更多功能参考资料1。
1 Excel文件保存格式
基础概念此处不提,详见资料1。
Excel的文件保存格式有两种: xls 和 xlsx。如果你看不到文件后缀,按下图设置可见。
xls是Office 2003及之前版本的表格的默认保存格式。
xlsx 是 Excel 2007及之后版本的表格的默认保存格式。
2 Python库
针对两种格式的表格,有不同的Python库。
openpyxl
适用于 xlsx 格式,即最新的表格格式,不支持 xls 等老版本格式。
xlrd
适用于 xls 格式表格的读取。
xlwt
适用于 xls 格式表格的写入。
建议用openpyxl。
两个库的安装命令:
pip install openpyxl
pip install xlrd
pip install xlwt
3 用法/代码
3.1 openpyxl库
import openpyxl
wb = openpyxl.load_workbook('1.xlsx') # 读取表格文件
sheet = wb.worksheets[0] # 工作簿内的第一个表
# 从第2行开始读取,最大列第5列(含),均从1计数, values_only表示只取字面值
for row in sheet.iter_rows(min_row=2, max_col=5, values_only=True):
print(row[0]) # 输出每行的第一列, row是每行(list格式)
3.2 xlrd库
import xlrd
namefile = "1.xls"
wb = xlrd.open_workbook(namefile)
sheet = wb.sheets()[0] # 表格内的第一个表
rows = sheet.nrows # 总行数
cols = sheet.ncols # 总列数
for row in range(rows):
for col in range(cols):
value = table.cell_value(row, col)
print('第{}行{}列的数据为:{}'.format(row, col, value))
# 不打印首行(标题行)
for row in range(1, rows):
for col in range(cols):
value = table.cell_value(row, col)
print('第{}行{}列的数据为:{}'.format(row, col, value))
后面再补充。
资料:
python实现——处理Excel表格(超详细),该文非常详细,推荐。