前景提要:
有一个项目的数值和员工统计的对不上,如果一页一页翻找自己手动算,一个就有16、7页,
功能实现
1、创建csv文件
需要将每一个模块的所有数据头提取出来,这个可以直接用爬虫或者手工复制出来,因为后续还会使用正则进行筛选,所以全部获取出来也没事
上面就是所有数据的csv
2、读取csv中的每一个数据进行正则判断
可以看到我上面csv文件中的分数是一位数或者两位数,然后p结尾,所以筛选的时候非常好判断,最后强转一下格式算上总分就好了,如果算单个模块的可以按照csv里面文件的格式,选定判断元素的下一个元素做求和
import csv
import re
sum = 0
with open(r'msu\file\819.csv', encoding="utf-8") as f:
reader = csv.reader(f)
for row in reader:
for item in row:
# 所有分数
match = re.match(r'(\d{1,2})p$', item)
if match:
number = int(match.group(1))
sum += number
print(sum)