1、直接pip安装
工具使用vscode和pycharm都可以。
这里介绍使用vscode的方法。
(1)、调出终端
(2)、安装依赖
(3)、编写代码
import pyocr
import pyocr.builders
from PIL import Image
import re
# 获取Tesseract-OCR工具
tools = pyocr.get_available_tools()
tool = tools[0]
# 打开图像
image = Image.open(r'D:\SoftWare\QQ截图20240708140532.png')
# 使用pyocr提取文本
img_text = tool.image_to_string(
image,
lang = 'chi_sim',
builder = pyocr.builders.TextBuilder()
)
print(img_text)
图片:
(4)、结果
(5)、报错
出现这种情况,走第二种方式,安装Tesseract-OCR工具。
2、安装Tesseract-OCR工具
(1)、下载
下载链接:https://digi.bib.uni-mannheim.de/tesseract/
一般是64位操作系统
下载完成后,随便放到哪个盘的文件夹下
(2)、安装
双击
但是这里注意,勾选这个,会帮你安装所有的语言,后续不用再去别的地方下载对应语言包。
然后选择安装路径,点击安装即可。
找到安装路径,复制整个路径
验证。直接Win+R,cmd,回车。输入:tesseract -v 或者全路径 D:\SoftWare\Tesseract-OCR\tesseract -v
(3)、配置电脑环境
打开高级系统设置–>环境变量
将复制的路径粘贴进去。重要的是点击确定按钮。
(4)、直接使用绝对路径
找到文件,复制全路径:D:\SoftWare\Tesseract-OCR\tesseract.exe
(5)、运行
准备一张图片,格式不规定为png。
将路径放到下面当中