Anacoda3中成功配置Tesseract-OCR超详细教程!!(win7、win10)

news2024/11/15 19:30:31

Anacoda3中成功配置Tesseract-OCR

  • Tesseract-OCR简介
  • 安装及配置环境步骤
    • 1、在Anaconda虚拟环境中安装pytesseract第三方库
    • 2、下载tesseract-ocr安装包并安装
    • 3、环境配置
    • 检验是否安装成功
    • 修改pytesseract.py文件(很重要!)

Tesseract-OCR简介

Tesseract-OCR 最初是由惠普(HP) 实验室于 1985 年开始研发的一款 OCR 引擎, 到1995 年成为最准确的 3 款 OCR 识别引擎之一,但不久后,惠普放弃了 Tesseract 的研发与维护,将其贡献给开源软件业。在 2005 年,由美国内华达州信息技术研究所获得并与 Google(谷歌)合作对 Tesseract 进行改进和优化,直至目前, Tesseract-OCR 仍是识别精度较高的识别引擎之一。源生的 Tesseract-OCR 是采用 C 语言编写的, Pytesseract 库是 Tesseract-OCR 的 PythonAPI 封装。通过下载安装 Pytesseract 库并调用相关函数,可以实现在 Python 环境中使用
Tesseract-OCR 进行 OCR 文字识别。
以下是关于Tesseract的常用网址
下载地址:https://digi.bib.uni-mannheim.de/tesseract/
官方网站:https://github.com/tesseract-ocr/tesseract
官方文档:https://github.com/tesseract-ocr/tessdoc
语言包地址:https://github.com/tesseract-ocr/tessdata

注意事项:
1.尽量不要下载dev(开发中的版本),alpha(内部测试版,一般不向外部发布,会有很多Bug),beta(公测版本,即针对所有用户公开的测试版本)等版本。
2.建议下载最新稳定版本(目前最新版本tesseract-ocr-w64-setup-5.3.1.20230401.exe,经过测试如果安装的是旧版本,安装时若勾选了Additional Language中的Chinese可能会报错)

安装及配置环境步骤

1、在Anaconda虚拟环境中安装pytesseract第三方库

Pytesseract 库的安装与 OpenCV 库的安装基本一致,可
直接在 Anaconda Prompt 中输入“pip install pytesseract”命令进行安装。

pip install pytesseract

安装好后,如果直接运行程序会提示错误
在这里插入图片描述
接下来我们要配置环境

2、下载tesseract-ocr安装包并安装

(1) Tesseract-OCR 的安装包可在官网或其他开源项目中获取,选择与自己电脑位数相同的版本进行下载。
在这里插入图片描述
(2) 将下载好的 Tesseract-OCR 安装包双击打开,进入到安装界面,单击“Next”按钮进行下一步操作。
在这里插入图片描述
最新版多了一个语言选择界面。

在这里插入图片描述
(3) 在“License Agreement”许可协议窗口中,单击“I Agree”按钮同意安装协议进行下一步操作。
在这里插入图片描述
(4) 选择安装类型单击“Next”按钮进行下一步操作。
在这里插入图片描述

(5) 在 Tesseract-OCR 中默认的识别语言是英文,如果需要识别中文或其他文字,可在“Choose Components”选择组件窗口中,找到“Additional language data(download)”附加语言数据下载,在下面的选项中找到“Chinese(Simplified)”简体中文和“Chinese(Simplified Vertical)”竖排简体中文进行勾选,单击“Next”进行下一步操作。
在这里插入图片描述
(6) Tesseract-OCR 的安装位置可选择保持默认,也可单击“Browse”自定义安装位置,在后续的环境配置操作中会需要用到该路径,需记住 Tesseract-OCR 的安装位置,单击“Next”按钮进行下一步操作。
在这里插入图片描述
( 7) 在“Choose Start Menu Folder”选择开始菜单文件夹的窗口中,选择保持默认,单击“Install”进行安装。
在这里插入图片描述
( 8) 等待 Tesseract-OCR 安装完成后单击“Next”按钮进行下一步,最后单击“Finish”按钮结束安装。
在这里插入图片描述
在这里插入图片描述

3、环境配置

打开计算机的高级系统设置。
在这里插入图片描述
点击环境变量,找到系统变量中的Path,将Tesseract-OCR的安装路径添加进去。
在这里插入图片描述
然后新建一个系统变量TESSDATA_PREFIX,变量值为tessdata路径:
C:\Program Files\Tesseract-OCR\tessdata
在这里插入图片描述

检验是否安装成功

打开Anaconda Prompt,激活使用的虚拟环境(输入activate 环境名),默认是在base环境下。
切换到Tesseract-OCR安装路径下
cd C:\Program Files\Tesseract-OCR
在这里插入图片描述
不然会提示“不是内部或外部命令”
在这里插入图片描述
输入tesseract --version
在这里插入图片描述
输入tesseract --list-langs
在这里插入图片描述

修改pytesseract.py文件(很重要!)

在Anaconda对应虚拟环境下的pytesseract库下的pytesseract.py文件中找到tesseract_cmd = ‘tesseract’,修改成
tesseract_cmd =r’C:\Program Files\Tesseract-OCR\tesseract.exe’
(将加粗部分替换成自己的安装路径)
在这里插入图片描述
最后运行程序,成功!!!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/713298.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C语言常用的数据转换函数

编程时&#xff0c;经常用到进制转换、字符转换。现整理记录如下&#xff1a; 一、字符串转十六进制 void StrToHex(char *pbDest, char *pbSrc, int nLen) {char h1,h2;char s1,s2;int i;for (i0; i<nLen/2; i){h1 pbSrc[2*i];h2 pbSrc[2*i1];s1 toupper(h1) - 0x30; …

ASP.NET Core MVC -- 控制器

添加控制器 访问测试 默认控制器访问index public string Index() {return "This is my default action..."; }特定访问路径 public string Welcome() {return "This is the Welcome action method..."; } 特定路径访问&#xff0c;带参数 public str…

查询Oracle当前用户下,所有数据表的总条数

需求&#xff1a;查询Oracle当前用户下&#xff0c;所有数据表的总条数 方法&#xff1a;存储过程 右键点击Procedures&#xff0c;点击New 点击OK 把存储过程写进去&#xff0c;然后点击编译运行&#xff1a; create or replace procedure tables_count ist_count numbe…

dolphinscheduler的switch组件

目录 一、背景 switch组件官方文档 Switch简介 创建任务 任务参数 二、实操DEMO SQL任务switch判断DEMO 第一步&#xff1a;新建SQL任务&#xff0c;配置好参数 第二步&#xff1a; 定义SWITCH节点 三、参考资料 默认任务参数 一、背景 Apache DolphinScheduler 是…

B站广告投放,B站有哪些投放广告的方式比较靠谱?

随着各视频平台发展&#xff0c;B站也逐渐壮大&#xff0c;成为当下最受年轻人喜爱的社交媒体平台之一&#xff0c;B站根据年轻人的喜好提供了多样化的产品和服务&#xff0c;如视频、直播、游戏、漫画、影业、演出活动、专栏等。形成了自己独特的up主文化。B站拥有着高黏性和高…

如何保证消息的可靠性传输?或者说,如何处理消息丢失的问题?

这个是肯定的&#xff0c;用 MQ 有个基本原则&#xff0c;就是数据不能多一条&#xff0c;也不能少一条&#xff0c;不能多&#xff0c;就是 前面说的重复消费和幂等性问题。不能少&#xff0c;就是说这数据别搞丢了。那这个问题你必须得考 虑一下。 如果说你这个是用 MQ 来传…

基于单片机心率脉搏心率血压体温血氧检测系统的设计与实现

功能介绍 本次设计通过32系列单片机STM32进行数据处理&#xff0c;配置引脚和JFC103传感器以及温度传感器进行数据通信。采用防水DS18B20进行腋下温度采集&#xff0c;通过单总线方式进行数据传输。心率血氧血压模块通过串口通信方式把采集到的数据发送给单片机&#xff0c;所有…

mac版本的xshell远程ssh工具

官网下载地址&#xff1a; https://www.royalapps.com/ts/win/download 注意&#xff1a;一定要保存(下载安装之后记得一定要点击&#xff1a;Apply & Close&#xff0c;保存设置) 使用

Transactional outbox pattern

文章目录 Transactional outbox pattern事件驱动架构(Event Driven Architecture, EDA)数据库事务和消息发布的一致性问题Transactional outbox如何解决数据事务和消息发布之间的一致性问题如何实现Transactional outbox pattern消息幂等性问题Transactional outbox pattern能保…

百万连接实现01:使用epoll+多线程+多IP地址管理tcp客户端集群

操作系统采用 <客户端IP : 客户端端口> : <服务端IP : 服务端端口> 四元组来标识一条TCP连接。 所以要想实现百万连接&#xff1a; 第一种是服务器端只开启一个进程&#xff0c;然后使用很多个客户端进程绑定不同的客户端 ip 来连接&#xff0c;假设 20个ip * 5w&a…

linux使用grep命令查询nginx的进程情况时总是出现 grep --color=auto nginx

问题&#xff1a; 每次使用ps aux | grep 服务名 命令查询某个服务的进程时&#xff0c;总会出现一条grep --colorauto 服务名 例如&#xff1a; ps aux | grep nginx # 会出现图片中的情况解答&#xff1a; 这是因为grep 也是一条命令&#xff0c;它在输出时&#xff0c;会…

《谈事说理》之《“脱节”的顶层设计》续集

欢迎收看本期《谈事说理》之《“脱节”的顶层设计》续集。当事人再次来到节目现场&#xff0c;为我们讲述近期事件的新发展。他与父母苦心经营的企业是否出现转机&#xff1f;我们一起来听听他的故事。 回忆事件经过&#xff0c;他的企业遭遇灭顶 当事人季博文&#xff08;化名…

Express-基础语法

介绍 Express是基于Node.js开发的第三方模块包&#xff0c;使用 Express&#xff0c;我们可以方便、快速的创建 Web 网站的服务器或 API 接口的服务器 参考 https://www.expressjs.com.cn/ 基本用法 安装 npm install express4.17.1 后面追加版本号&#xff0c;不写安装最新…

Docker 安装 MySQL 并使用 Navicat 连接

本文目录 1. 拉取 MySQL 镜像2. 创建并运行一个 MySQL 容器3. 验证MySQL容器是否创建并运行成功3.1 进入 MySQL 容器3.2 进入 MySQL3.3 查看 host 和 user 4. MySQL 开启远程访问权限4.1 切换数据库4.2 给 root 用户分配远程访问权限4.3 强制刷新权限 5. 服务器配置 3306 的开放…

iOS开发中的APP内活动之通用链接

首先&#xff0c;我们先来了解下APP内活动&#xff0c;这是苹果官方给的说明&#xff1a;https://developer.apple.com/cn/help/app-store-connect/offer-in-app-events/overview-of-in-app-events简单来说&#xff0c;就是我们在苹果后台开发者后台里填写关于自己APP内的一些具…

《MySQL》对表进行操作(DDL语句)

文章目录 &#x1f4a1;创建表&#x1f4a1;修改表&#x1f4a1;删除表 在了解下列语句前&#xff0c;先掌握一下指令 # 查看表内容 desc [表名] # 详细查看表内容 show create table [表名] \G&#x1f4a1;创建表 # 创建表 create table [表名] ([字段1] [类型1],[字段2] […

嵌入式 - UART使用进阶

UART – Advanced Features 概要 / Overview 最简单直接的使用UART接口的方式&#xff0c;是在轮循操作中来设置和处理UART接口。 轮询式UART的问题是轮询方式本身就是低效率的。 如果我们的UART被配置为115200的波特率和8N1&#xff0c;那么传输一个字符需要多长时间&#xff…

一款支持AI思维导图的AI助手——ChatMindAI

写在前面 Hello大家好&#xff0c; 我是【麟-小白】&#xff0c;一位软件工程专业的学生&#xff0c;喜好计算机知识。希望大家能够一起学习进步呀&#xff01;本人是一名在读大学生&#xff0c;专业水平有限&#xff0c;如发现错误或不足之处&#xff0c;请多多指正&#xff0…

“智慧水利”怎么建?这份智慧水利整体解决方案 值得参?

2021年&#xff0c;补齐水利信息化突出短板&#xff0c;提升强监管支撑能力。 2025 年&#xff0c;全面提升水利数字化、网络化水平&#xff0c;明显提升重点领域智能化水平。 2035 年&#xff0c;全面支撑水治理体系和治理能力现代化。 构建天空地一体化水利感知网&#xf…

python怎么使用Pillow库来添加图片水印

当使用Pillow库来添加图片水印时&#xff0c;下面是一个示例代码&#xff1a; 请确保在运行示例代码之前&#xff0c;已经安装了Pillow库&#xff08;可以使用pip install pillow命令进行安装&#xff09;。示例代码中&#xff0c;打开原始图片、创建透明的水印图层、绘制水印文…