Python OCR 使用easyocr库将图片中的文章提取出来

news2026/2/8 14:00:34

Python OCR 使用easyocr库将图片中的文章提取出来

初
环境
- 内容
- - 步骤一：安装easyocr库
  - 步骤二：导入必要的库
  - 步骤三：创建OCR阅读器对象
  - 步骤四：指定要识别的图片路径
  - 步骤五：执行OCR识别并提取文章内容
  - 步骤六：遍历识别结果并打印文章内容
- 完整代码
- 运行结果

EasyOCR是一个开源的Python库，专注于提供易用而准确的文字识别功能。它基于深度学习技术，使用了一种端到端的方法，能够在多种语言和字体下进行稳定的识别。

初

希望能写一些简单的教程和案例分享给需要的人

环境

Python 3.10.12
系统： ubuntu 22.04

内容

接下来我分享如何使用Python的easyocr库，将图片中的文字提取出来。

步骤一：安装easyocr库

首先，确保您已经安装了Python。接下来，我们需要安装easyocr库，可以通过以下命令在命令行中进行安装：

pip install easyocr

步骤二：导入必要的库

在您的Python脚本中，导入所需的库，其中包括我们即将使用的easyocr库：

import easyocr

步骤三：创建OCR阅读器对象

创建一个OCR阅读器对象，您可以选择要识别的语言。以下示例选择了中文和英文语言：

reader = easyocr.Reader(['ch_sim', 'en'])

步骤四：指定要识别的图片路径

将要进行OCR识别的图片放置在您选择的路径下，并将该路径赋值给变量image_path：

image_path = 'test.png'

确保将test.png替换为您实际的图片路径。

步骤五：执行OCR识别并提取文章内容

使用OCR阅读器对象的readtext方法读取图片中的文本，将识别结果存储在变量results中：

results = reader.readtext(image_path)

步骤六：遍历识别结果并打印文章内容

使用循环遍历results中的每个识别结果，然后打印出每个结果的文本内容：

for (bbox, text, prob) in results:
    print(text)

完整代码

# 导入所需库
import easyocr

# 创建一个OCR阅读器对象，选择中文和英文语言
reader = easyocr.Reader(['ch_sim', 'en'])

# 指定要进行OCR识别的图片路径
image_path = 'aaa.png'

# 使用OCR阅读器对象读取图片中的文本
results = reader.readtext(image_path)

# 遍历识别结果并打印文本内容
for (bbox, text, prob) in results:
    print(text)

运行结果

在这里插入图片描述

python3 a.py

在这里插入图片描述
识别出来是这样：识别率还行，不过有些确实不是很正确。

盗理者
玛龄7年
企业员工
355
4954
1458
103万+
原创
屑#名
总排名
访问
1万+
1770
788
241
1071
讧论

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/908862.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

Python OCR 使用easyocr库将图片中的文章提取出来

Python OCR 使用easyocr库将图片中的文章提取出来

初

环境

内容

步骤一：安装easyocr库

步骤二：导入必要的库

步骤三：创建OCR阅读器对象

步骤四：指定要识别的图片路径

步骤五：执行OCR识别并提取文章内容

步骤六：遍历识别结果并打印文章内容

完整代码

运行结果

相关文章

vscode如何关闭受限模式

企业都在用的热门客服系统

TheGem主题 - 创意多用途和高性能WooCommerce WordPress主题/网站

Python“牵手”1688商品详情数据采集方法，1688API申请步骤说明

rtmp直播

EMQ 成功通过 SOC 2 Type I 认证，为全球客户的数据安全保驾护航

老师如何制作电子成绩单？

分类预测 | MATLAB实现BWO-TCN-Attention数据分类预测

基于微信小程序的图书管理系统ljr9i

供应链 | 大数据报童模型：基于机器学习的实践见解

零阶矩、一阶矩、二阶矩、…

【初体验】使用微信开发工具

记录一个用C#实现的windows计时执行任务的服务

日撸代码300行：第66-68天(主动学习之 ALEC)

HTTPS 握手过程

Spring之ioc容器

听GPT 讲Alertmanager源代码--notify

企业网三层架构实验

800V高压电驱动系统架构分析

张驰课堂：揭秘学习6sigma黑带培训重要价值