Python OCR文本识别详细步骤及代码示例

news2026/2/15 3:41:02

光学字符识别（OCR）是将图像中的文字转换为可编辑文本的技术。在Python中，我们可以利用多种库实现OCR功能。本文将详细介绍使用Tesseract和EasyOCR进行文本识别的步骤，并提供完整的代码示例。

一、OCR简介

OCR（Optical Character Recognition）技术广泛应用于文档数字化、车牌识别、验证码识别等领域。Python中常用的OCR库有：

Tesseract：Google开源的OCR引擎，支持多种语言
EasyOCR：基于Tesseract的封装库，使用更简单
PaddleOCR：百度飞桨框架下的OCR系统，支持中英文识别

二、环境准备

1. 安装必要库


	# 安装Tesseract（需要先安装系统级依赖）

	# Ubuntu: sudo apt install tesseract-ocr

	# macOS: brew install tesseract

	# Windows: 通过安装包安装

	


	# 安装Python库

	pip install pillow # 图像处理库

	pip install pytesseract # Tesseract的Python封装

	pip install easyocr # EasyOCR库

2. 准备测试图像

准备一张包含清晰文字的测试图片（如test.png），建议：

文字方向为正
背景与文字对比明显
图片分辨率适中（建议300dpi以上）

三、使用Tesseract进行OCR

1. 基础识别


	from PIL import Image

	import pytesseract

	


	# 打开图像文件

	image = Image.open('test.png')

	


	# 执行OCR识别

	text = pytesseract.image_to_string(image, lang='eng+chi_sim') # 中英文识别

	


	# 打印结果

	print("识别结果：\n", text)

这里插播一条粉丝福利，如果你正在学习Python或者有计划学习Python，想要突破自我，对未来十分迷茫的，可以点击这里获取最新的Python学习资料和学习路线规划（免费分享，记得关注）

2. 图像预处理（提高识别率）


	import easyocr

	


	# 初始化阅读器（首次使用会自动下载模型）

	reader = easyocr.Reader(['ch_sim','en']) # 中英文模型

	


	# 执行识别

	results = reader.readtext('test.png', detail=0)

	


	# 打印结果

	print("识别结果：\n", results)

四、使用EasyOCR进行OCR

1. 基础识别


	import easyocr

	


	# 初始化阅读器（首次使用会自动下载模型）

	reader = easyocr.Reader(['ch_sim','en']) # 中英文模型

	


	# 执行识别

	results = reader.readtext('test.png', detail=0)

	


	# 打印结果

	print("识别结果：\n", results)

2. 获取详细识别信息


	results = reader.readtext('test.png', detail=1)

	


	for (bbox, text, prob) in results:

	print(f'文本: {text}, 置信度: {prob:.2f}, 位置: {bbox}')

五、结果后处理


	def post_process(text):

	# 去除特殊字符

	text = ''.join(filter(str.isalnum, text))

	


	# 替换常见错误

	replacements = {

	'0': 'O',

	'1': 'I',

	'5': 'S',

	'€': 'E'

	}

	


	for old, new in replacements.items():

	text = text.replace(old, new)

	


	return text

	


	# 应用后处理

	final_text = post_process(text)

	print("后处理结果：\n", final_text)