图片识别工具Tesseract与使用

news2024/11/26 10:35:48

       Tesseract工具是一个图片识别工具, 由HP实验室开发 由Google维护的开源的光学字符识别(OCR)引擎。它可以直接使用,或者(对于程序员)使用 API​​ 从图像中提取输入,包括手写的或打印的文本。与Microsoft Office Document Imaging(MODI)相比,我们可以不断的训练语言,提高图像转换文本的能力。

       Tesseract工具环境安装分为win和python

一、Win环境Tesseract下载与安装

1、Win环境Tesseract下载
tesseract官方下载地址
tesseract语言包下载

64位电脑下载:

2、Win环境Tesseract安装

       选择安装,默认下一步,到下面步骤时候,可以勾选**Additional language data(download)**选项来安装OCR识别支持的语言包,这样OCR便可以识别多国语言,比如可以选择math,英文,中文等。然后一路点击Next按钮即可。

 

3、环境配置

       配置环境变量path

4、安装校验

打开cmd验证,输入tesseract -v验证,出现如下说明你配置好了

 

二、python环境

1、安装

       在指定虚拟环境中执行安装命令:pip install pytesseract

2、配置

       在 python的安装目录下进入  xxx\Python37\Lib\site-packages\pytesseract

       修改 pytesseract.py 中 tesseract_cmd = Tesseract安装目录‘\Tesseract-OCR/tesseract.exe’,修改后在python中运行就不会报错了。

3、python的验证

import pytesseract

img_path = "../chi.PNG"
#路径;语言;配置
result = pytesseract.image_to_string(image=img_path,lang="chi_sim",config="--psm 1")  

print(result)

 识别下面图片

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/595953.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

KCC@上海正式成立啦!

5月28号下午,开源社区的朋友共聚于上海的一间茶室中,组织召开了 KCC上海第一次线下见面会,并正式成立了 KCC上海。 KCC(KAIYUANSHE City Community)是由开源社理事兼执行长庄表伟老师号召发起,旨在让开源社…

关于职场中的面试,要是遇到这些问题时,应该怎么回

(点击即可收听) 关于职场中的面试,要是遇到这些问题时,应该怎么回 平常多学一点,面试入职时就少踩一点坑,无论是去面试还是换工作,怎么样去回答面试官,遇到此类的问题,能够应付自如 1. 你觉得这份工作你能胜任? 首先,无论你在面试过程当中表现怎么样,一定要非常坚定,一定可以 …

让身份验证更简单:OAuth2基于令牌方式为第三方应用提供认证和授权方案

随着互联网应用的发展,跨系统身份认证解决方案也在不断演化和改进。下面是它的发展史: 早期的 Web 应用程序使用基于表单的身份验证方式;随着 Web 应用程序数量的增加,需求跨应用程序身份验证的呼声也越来越高,从而出…

行胜于言

点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 最近在给我女儿辅导作业的过程中,发现了许多小问题,自己偶尔也会因此而焦躁,同时也在反思作为父母应该更好的帮助孩子成长,而AI能力的增强和孩子的成长有什么相似…

【Python】Python系列教程--Python3 VScode(三)

文章目录 前言安装 VS Code 前言 往期回顾: Python系列教程–Python3介绍(一)Python系列教程–Python3 环境搭建(二) 准备工作: 安装 VS Code安装 VS Code Python 扩展安装 Python 3 安装 VS Code VS…

Maven仓库(本地仓库+远程仓库)

在 Maven 中,任何一个依赖、插件或者项目构建的输出,都可以称为构件。 Maven 在某个统一的位置存储所有项目的构件,这个统一的位置,我们就称之为仓库。换言之,仓库就是存放依赖和插件的地方。 任何的构件都有唯一的坐标…

VUE代码批量格式化

1、下载安装Visual Studio Code 2、安装插件 Vetur和Format Files 3、配置格式化,点击右下角设置 4、自定义格式化规则 复制下面的配置信息,覆盖原始配置,保存配置。 {"vetur.format.defaultFormatter.html": "js-beauti…

MySQL数据库 6.DDL操作 表

目录 🤔前景知识: 数据类型: 1. 数值类型 2. 字符串类型 3. 日期时间类型 🤔DDL操作表: 1.创建 示例:尝试创建把以下实例创建到表里 2.查询 1.查询当前数据库的所有表: &#x1f50…

南京智慧工厂量产下线, 深蓝S7展现硬核制造品质

以科技之力构建电动出行体验,深蓝S7要用硬核实力树立高价值电动SUV全新标杆。 深蓝S7南京智慧工厂下线 作为深蓝汽车旗下的首款中型SUV,深蓝S7自从5月20日开启预定以来,就一直是许多车友关注的焦点,订单火爆更是远超预期&#xff…

设计模式之~职责链模式

简述: 职责链模式(Chain of Responsibility):使多个对象都有机会处理请求,从而避免请求的发送者和接收者之间的耦合关系。将这个对象连成一条链,并沿着这条链传递该请求,直到有一个对象处理它为…

【哈希】位图/布隆过滤器

位图 前言 在实现位图结构之前我们先看一个问题: 给出40亿个不重复的无符号整型,并且是无序的。然后给一个无符号整数,怎样快速判断这个数是否在40亿个数之中。 方法一:对40亿个数据进行遍历。我们会发现,时间复杂度…

重启天涯,一场关于 “救命” 的直播

大家好,我是校长。 昨天在知乎热搜榜上看到了关于天涯网站的帖子,感觉值得思考。 前一段时间,我们就看到了关于天涯要关闭的新闻,感觉撑不下去了。 说实话,当时看到这个新闻的时候,挺感慨的,一个…

初识网络之UDP网络套接字

目录 一、UDP中的socket编程常用接口 1. socket的含义 2. sockaddr结构 3. socket编程中UDP协议常用接口介绍 3.1 创建socket文件描述符(TCP/UDP、客户端 服务器) 3.2 绑定端口号(TCP/UDP,服务器) 3.3 接收数据…

2023年上半年数据库系统工程师上午真题及答案解析

1.计算机中, 系统总线用于( )连接。 A.接口和外设 B.运算器、控制器和寄存器 C.主存及外设部件 D.DMA控制器和中断控制器 2.在由高速缓存、主存和硬盘构成的三级存储体系中,CPU执行指令时需要读取数据,那么DMA控制器和中断CPU发出的数据地…

聊聊我在淘宝做性能分析的经历

我们新推出大淘宝技术年度特刊《长期主义,往往从一些小事开始——工程师成长总结专题》,专题收录多位工程师真诚的心路历程与经验思考,覆盖终端、服务端、数据算法、技术质量等7大技术领域,欢迎一起沟通交流。 本文为此系列第三篇…

RNN基础概念

一、潜变量回归模型 使用潜变量 h t h_{t} ht​总结过去的信息 二、RNN 更新隐藏状态: h t φ ( W h h h t − 1 W h x x t − 1 b h ) h_{t}φ(W_{hh}h_{t-1}W_{hx}x_{t-1}b_{h}) ht​φ(Whh​ht−1​Whx​xt−1​bh​) 更新输出: o t W o h h t b…

第六十天学习记录:C语言进阶:文件操作3文件版通讯录改造

在之前写的静态通讯录和动态通讯录中,都存在一个致命的弊端,那就是当软件运行的过程中添加信息,不关闭软件能够正常显示信息。但一旦关闭软件,内存回收之后当再次打开软件,之前保存的信息全部都得重新添加。 因此需要…

人工智能-推荐

常用的推荐系统算法实现方案有三种: 协同过滤推荐(Collaborative Filtering Recommendation):该算法的核心是分析用户的兴趣和行为,利用共同行为习惯的群体有相似喜好的原则,推荐用户感兴趣的信息。兴趣有高…

老旧Mac不能升级macOS Ventura 13解决方案

老旧Mac不能升级macOS Ventura 13. 我2016年的MacBook Pro,遇到升级xcode失败以及不能更新到最新系统的问题。 ITMS-90725: SDK Version Issue - This app was built with the iOS 15.5 SDK. All iOS apps submitted to the App Store must be built with the iOS 15 SDK or …

chatgpt赋能python:Python信息隐藏:掩耳盗铃的神奇技巧

Python信息隐藏:掩耳盗铃的神奇技巧 在现代社会中,保护信息资产安全已经变得至关重要。信息隐藏(steganography)是一种将秘密信息嵌入到其他无关数据中以便于传输的技术。Python作为一种易学易用,而且功能强大的编程语…