Python 如何获取图片中的文字----OCR安装使用

news2024/10/5 17:18:23

环境: windows10, anaconda3

背景:使用conda install pytesseract 安装失败

解决方法:

从Index of /tesseract (uni-mannheim.de)中下载最新的安装包

https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-w64-setup-5.3.1.20230401.exe

点击安装,

安装成功后如果需要识别中文,在Index of /tesseract/tessdata_fast (uni-mannheim.de) 中下载

[   ]

chi_sim.traineddata2022-01-18 22:052.4M

[   ]

chi_sim_vert.traineddata2022-01-18 22:051.8M

[   ]

chi_tra.traineddata2022-01-18 22:052.3M

[   ]

chi_tra_vert.traineddata2022-01-18 22:051.7M

这四个中文包,放到Tesseract安装目录的tessdata 文件夹下(如 D:\program\Tesseract-OCR\tessdata )

from PIL import Image
import pytesseract
img = Image.open('test.jpg')
text = pytesseract.image_to_string(img, lang="chi_sim", config='--psm 6')
print(text)

test.jpg

 

执行结果

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/860219.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

vscode搭建c语言环境问题

c语言环境搭建参考文章:【C语言初级阶段学习1】使用vscode运行C语言,vscode配置环境超详细过程(包括安装vscode和MinGW-W64安装及后续配置使用的详细过程,vscode用户代码片段的使用)[考研专用]_QAQshift的博客-CSDN博客 问题如下:…

利用MS-SAMR协议修改用户密码

本文为Windows RPC利用系列文章的第一篇,主要介绍关于MS-SAMR的部分利用,在后续的文章中将继续介绍RPC在渗透测试中的应用 在渗透测试过程中,经常遇到拿到用户的NTLM哈希但无法解密出明文密码的情况。本文介绍并分析一种在仅知道域用户密码哈…

作为非计算机专业的学生觉得 C 语言远比其他语言更易上手正常吗

作为非计算机专业的学生,觉得 C 语言相对其他编程语言更易于上手是很正常的。C 语言的简洁语法和贴近底层的特性使其更容易理解和掌握。相比其他语言,C 语言不涉及复杂的高级特性和抽象概念,更直接地与计算机硬件交互,这种直观性对…

学习Linux,要把握哪些重点?

不知道有没有想学习Linux,但又把握不住学习重点,找不到合适的学习方法的小伙伴,反正我刚开始学习Linux时就像无头苍蝇似的“乱撞”,没有把握住学习重点,不知道怎么去学,差点要放弃了,还好在慢慢…

KEIL自带的Jlink怎么升级更换版本

问题背景 V4.20以上的keil安装包中都自带Jlink驱动包,即当你安装了KEIL后,Debug或Download就是用的安装KEIL时附带安装的Jlink版本。 那如果存在这种情况,你正在开发的芯片比较新,只有比较新的Jlink驱动软件才能支持&#xff0c…

有答案:10个网络工程师面试常见问题

目录 1、交换机转发数据包的原理? 2. 数据包如果经过二层交换机转发后,那这个数据包的源MAC会变化吗?如果经过三层交换机理由转发,那源MAC会变成什么呢? 3. 如何查看PC的ARP表,如何清除ARP表&#xff0c…

什么是训练数据?

算法从数据中学习。算法从得到的训练数据中找到关系,形成理解,做出决策,并评估信心。训练数据越好,模型的表现就越好。 实际上,与算法本身一样,训练数据的质量和数量与数据项目的成功有很大关系。 现在&…

WordPress数据库一次性批量删除所有文章和删除指定分类文章技巧

在自己建网站时,有时需要将一个网站搬家到另一个空间里,只想保留网站的模板样式,而不需要里面的文章内容。这时我们可以在后台将已发布的文章删除掉。但如果文章很多时,我们就需要使用下面数据库操作进行一次性删除所有文章的方法。 wordpress批量删除文章步骤 进入网站空…

探索规律:Python地图数据可视化艺术

文章目录 一 基础地图使用二 国内疫情可视化图表2.1 实现步骤2.2 完整代码2.3 运行结果 一 基础地图使用 使用 Pyecharts 构建地图可视化也是很简单的。Pyecharts 支持多种地图类型,包括普通地图、热力图、散点地图等。以下是一个构建简单地图的示例,以…

基于Python爬虫+词云图+情感分析对某东上完美日记的用户评论分析

🤵‍♂️ 个人主页:艾派森的个人主页 ✍🏻作者简介:Python学习者 🐋 希望大家多多支持,我们一起进步!😄 如果文章对你有帮助的话, 欢迎评论 💬点赞&#x1f4…

线程池的创建和使用

目录 创建线程池 多线程用线程池的两种方式(一般用第二种) 注意:项目当中线程池尽量不要使用的时候再创建(不要再业务逻辑中创建),这样每次调用这个方法都会创建一个线程池,应该在项目启动的时候就创建好 创建线程池…

你不了解的Dictionary和ConcurrentDictionary

最近在做项目时,多线程中使用Dictionary的全局变量时,发现数据并没有存入到Dictionary中,但是程序也没有报错,经过自己的一番排查,发现Dictionary为非线程安全类型,因此我感觉数据没有写进去的原因是多线程…

在linux系统上部署Nginx

一、准备环境 1、关闭防火墙 systemctl disable firewalld.service 2、 安装Nginx相关依赖 yum install -y gcc-c zlib zlib-developenssl openssl-devel pcre pcre-devel 二、源码安装 1、上传压缩包并解压到目标文件 cd /usr/local tar -zxvf nginx-1.22.0.tar.gz 2、…

“深入解析Maven:安装、创建项目和依赖管理的完全指南“

目录 引言Maven的安装创建Maven项目之前的装备工作Eclipse创建新的Maven项目项目依赖管理 总结 引言 Maven是一个流行的项目管理工具,被广泛用于Java项目的构建、依赖管理和部署。它提供了一种简单而强大的方式来管理项目的各个方面,使开发人员能够更专…

Node 使用 MySQL

1、安装驱动 使用 npm 进行安装 mysql $ npm install mysql 2、连接数据库 在以下实例中根据你的实际配置修改数据库用户名、及密码及数据库名: test.js 文件 var mysql require(mysql); var connection mysql.createConnection({host : localhost…

这10个在线AI绘图工具太好用了,设计师们快来get!

无论你是一名专业的插画师,还是一个富有创造力、想随时随地记录生活灵感的人,现在只需要拿起平板或打开电脑浏览器,就能将头脑中的画面描绘出来。本篇文章,我们挑选了10款功能强大又方便好用的在线画图软件,其中一定有…

E. Power of Points - 思维

分析: 题意本质就是找点在数组中任意一个位置时和所有的端点之间的距离和,但是直接暴力会超时,可以对数组排个序,设当前遍历的是xi,那么此时求的到各端点的距离就是j从1 ~ i - 1的所有端点与xi的距离之和,也…

07-3_Qt 5.9 C++开发指南_文件目录操作

文章目录 1. 文件目录操作相关的类2. 实例概述2.1 实例功能2.2 信号发射信息的获取 3. QCoreApplication 类4. QFile类5. QFileInfo类6. QDir类7. QTemporaryDir 和QTemporaryFile8. QFileSystemWatcher 类9. 框架和源码9.1 可视化UI设计9.2 dialog.cpp 1. 文件目录操作相关的类…

D. Weights Assignment For Tree Edges - 思维(树)

分析: 给出了父节点,要求到根节点的权重按p的顺序递增, 那么就可以从前往后一个一个赋值,依次加一,当时忽略了树的特性,忽略了节点之间的相互关系,WA了好几次,如果在进行依次递增赋值…

青大数据结构【2015】

一、单选 二、简答 5.如果一组关键字,以不同的次序输入后建立起来的二叉排序树是否相同?当中序遍历这些二叉排序树时,其遍历的结果是否相同?为什么? 不同,因为输入次序不同,所放置的位置与上一个结点有关,次序不同,二叉排序不同; 相同,中序遍历二叉树得到对应的关…