python-百度API文字识别

news2026/2/15 14:03:07

最近公司通过网络查询到我们部门有人工作时间逛b站次数太多，这事惊动了上层领导，搅得人心惶惶。突然星期某信服的一套监控员工电脑的系统，不经一颤。想着自己也尝试玩玩电脑屏幕文字识别-----抓取关键字，然后将图片保存下来。

这里将使用python，通过百度API识别电脑屏幕文字，并将含有关键字的截图保存下来。

一、百度API获取

1.进入百度云官网，先注册/登录，在首页顶端搜索文字识别，然后进入：
百度云官网
在这里插入图片描述

2.先领取免费的体验票，然后再创建应用（务必先“免费尝鲜”，再“创建应用”）

3.按要求填写“应用名称”和“应用描述”等信息。
4.记住三个参数AppID、API Key、Secret Key，后面代码中需要用到。

二、python代码实现

在晚上应用的创建后，接下来就可以编写代码了，在编写代码之前，需要安装几个Module：

pip3 install chardet
pip3 install pyautogui
pip3 install baidu-aip

接着就可以编写代码了，这里直接贴出：

import pyautogui
from datetime import datetime
import time
import os
from aip import AipOcr


APP_ID = '28704805'
API_KEY = 'YChehXrQqmV9c1pp48NziMWV'
SECRET_KEY = '4VmGz8Dt4NxjOIyEWdgXOIzPsXST9kFA'
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)


def pic_text_recognition(picname):
    with open(picname, 'rb') as fp:
        image = fp.read()
    dic_result = client.basicAccurate(image)
    print(dic_result)
    res = dic_result['words_result']
    result = ''
    for m in res:
        result += str(m['words'])
    return result

while True:
    # 截取电脑全屏
    img = pyautogui.screenshot()

    # 获取实时时间
    screen_time = datetime.now().strftime('%Y%m%d%H%M%S')

    png_name = screen_time + '.jpg'
    # 标记截屏时间
    img.save(png_name)

    try:
        string = pic_text_recognition(png_name)
        print(string)
        if string.index("离职"):
            print(png_name + "have key")
        else:
            print(png_name + " have no string2!")
            os.remove(png_name)
    except:
        print(png_name + " have no string1!")
        os.remove(png_name)

        # 截屏间隔时间（秒）
    time.sleep(10)

代码中，

APP_ID = '28704805'
API_KEY = 'YChehXrQqmV9c1pp48NziMWV'
SECRET_KEY = '4VmGz8Dt4NxjOIyEWdgXOIzPsXST9kFA'

为在百度云创建应用时给出的三个参数。

三、测试结果

运行代码，每过10s会获取当前屏幕截图，然后获取屏幕文字，检测这些文字中是否有“离职”的关键字，有的话，则保存接入，如果没有，则舍弃截图。
如下：
在这里插入图片描述

四、总结

1.如果你也用的是pycharm，而电脑里有很多个版本的python，且python不同版本安装时都是自定义安装目录，那么你有概率代码编译会报错没有某些Module，注意当前工程的编译环境配置，比如我电脑安装有两个版本的python，这里我使用的是python3.8。有关python不同版本的切换，请查看自己电脑的“环境变量”配置。
在这里插入图片描述

2.工作需要注意隐私！