最近公司通过网络查询到我们部门有人工作时间逛b站次数太多,这事惊动了上层领导,搅得人心惶惶。突然星期某信服的一套监控员工电脑的系统,不经一颤。想着自己也尝试玩玩电脑屏幕文字识别-----抓取关键字,然后将图片保存下来。
这里将使用python,通过百度API识别电脑屏幕文字,并将含有关键字的截图保存下来。
一、百度API获取
1.进入百度云官网,先注册/登录,在首页顶端搜索文字识别,然后进入:
百度云官网
2.先领取免费的体验票,然后再创建应用(务必先“免费尝鲜”,再“创建应用”)
3.按要求填写“应用名称”和“应用描述”等信息。
4.记住三个参数AppID、API Key、Secret Key,后面代码中需要用到。
二、python代码实现
在晚上应用的创建后,接下来就可以编写代码了,在编写代码之前,需要安装几个Module:
pip3 install chardet
pip3 install pyautogui
pip3 install baidu-aip
接着就可以编写代码了,这里直接贴出:
import pyautogui
from datetime import datetime
import time
import os
from aip import AipOcr
APP_ID = '28704805'
API_KEY = 'YChehXrQqmV9c1pp48NziMWV'
SECRET_KEY = '4VmGz8Dt4NxjOIyEWdgXOIzPsXST9kFA'
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
def pic_text_recognition(picname):
with open(picname, 'rb') as fp:
image = fp.read()
dic_result = client.basicAccurate(image)
print(dic_result)
res = dic_result['words_result']
result = ''
for m in res:
result += str(m['words'])
return result
while True:
# 截取电脑全屏
img = pyautogui.screenshot()
# 获取实时时间
screen_time = datetime.now().strftime('%Y%m%d%H%M%S')
png_name = screen_time + '.jpg'
# 标记截屏时间
img.save(png_name)
try:
string = pic_text_recognition(png_name)
print(string)
if string.index("离职"):
print(png_name + "have key")
else:
print(png_name + " have no string2!")
os.remove(png_name)
except:
print(png_name + " have no string1!")
os.remove(png_name)
# 截屏间隔时间(秒)
time.sleep(10)
代码中,
APP_ID = '28704805'
API_KEY = 'YChehXrQqmV9c1pp48NziMWV'
SECRET_KEY = '4VmGz8Dt4NxjOIyEWdgXOIzPsXST9kFA'
为在百度云创建应用时给出的三个参数。
三、测试结果
运行代码,每过10s会获取当前屏幕截图,然后获取屏幕文字,检测这些文字中是否有“离职”的关键字,有的话,则保存接入,如果没有,则舍弃截图。
如下:
四、总结
1.如果你也用的是pycharm,而电脑里有很多个版本的python,且python不同版本安装时都是自定义安装目录,那么你有概率代码编译会报错没有某些Module,注意当前工程的编译环境配置,比如我电脑安装有两个版本的python,这里我使用的是python3.8。有关python不同版本的切换,请查看自己电脑的“环境变量”配置。
2.工作需要注意隐私!