适用ddddocr自动化测试验证码识别

news2025/7/9 3:07:52

原打算使用tesseract进行验证码识别的但后面发现实在太辣鸡了

不知道tesseract以及没安装的可以看这篇文章：
tesseract安装以及联调python

使用tesseract的代码：

import pytesseract
from PIL import Image, ImageEnhance
"""
步骤①：定位图片的元素，并且截取当前浏览器的页面图片
步骤②：获取验证码坐标点，以及验证码图片、浏览器、截图的长和宽
步骤③：截取截图里的验证码图片，获得的验证码图片并保存
步骤④：获得验证码code
"""
# imagePng = "../img/test.png"
# 原图路径
imagePng = "../img/test.png"
# 处理之后图片的路径
savePngPath = "../img/savePng.png"

# 原图转对象
resource_img = Image.open(imagePng)

# 转换模式：L | RGB
resource_img = resource_img.convert('L')

# 提高识别率（提高个毛）
enhancer = ImageEnhance.Color(resource_img)
enhancer = enhancer.enhance(0)
enhancer = ImageEnhance.Brightness(enhancer)
enhancer = enhancer.enhance(2)
enhancer = ImageEnhance.Contrast(enhancer)      # 增强对比度
enhancer = enhancer.enhance(8)
enhancer = ImageEnhance.Sharpness(enhancer)
resource_img = enhancer.enhance(20)

resource_img = ImageEnhance.Contrast(resource_img)  # 增强对比度
resource_img = resource_img.enhance(2.0)
resource_img.save(savePngPath)

# 识别图片
code = pytesseract.image_to_string(Image.open(savePngPath)).strip()
#code = pytesseract.image_to_string(Image.open('../img/xin.png')).strip()
print(f"提取的验证码为：【{code}】")

实际验证码图片
在这里插入图片描述

得到的效果
在这里插入图片描述
这还识别个毛啊

使用ddddocr进行识别

ddddocr安装

pip install ddddocr

代码：

import ddddocr

ocr = ddddocr.DdddOcr()
with open('../img/test.png', 'rb') as f:
	img_bytes = f.read()
res = ocr.classification(img_bytes)
print('识别出的验证码为：' + res)

运行结果

E:\code\venv\Scripts\python.exe E:\code\SeleniumTest\ddddocr验证码识别.py 
欢迎使用ddddocr，本项目专注带动行业内卷，个人博客:wenanzhe.com
训练数据支持来源于:http://146.56.204.113:19199/preview
爬虫框架feapder可快速一键接入，快速开启爬虫之旅：https://github.com/Boris-code/feapder
谷歌reCaptcha验证码 / hCaptcha验证码 / funCaptcha验证码商业级识别接口：https://yescaptcha.com/i/NSwk7i
识别出的验证码为：2177

Process finished with exit code 0

运行的时候可能会出现：
ddddocr找不到onnxruntime_pybind11_state模块的异常

...
    from .onnxruntime_pybind11_state import *  # noqa
ImportError: DLL load failed: 找不到指定的模块。

找对应的你电脑的对应位数直接下载就好了

Microsoft Visual C++ Redistributable 2019x86 官方下载地址：32位
Microsoft Visual C++ Redistributable 2019x64 官方下载地址：64位

参考解决链接

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/692436.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

适用ddddocr自动化测试验证码识别

使用tesseract的代码：

使用ddddocr进行识别

找对应的你电脑的对应位数直接下载就好了

相关文章

DOTA大环配体化合物：DOTA PEG5 amine/azide/DBCO，特点分享说明

【图像处理】去雾代码收（附halcon、python、C#、VB、matlab）

了解架构是什么

Linux服务器同步Windows目录同步-rsync

react context上下文与vue中 provide inject的用法区别

微流控芯片压力和流量的超高精度串级控制解决方案

JMeter如何进行多服务器远程测试

云计算服务模式、PaaS、SaaS都是啥？

Mysql找出执行慢的SQL【慢查询日志使用与分析】

WideResNet(宽残差网络)算法解析-鸟类识别分类-Paddle实战

vue2项目引入vant组件库

【零基础入门学习Python---Python数据处理和存储保姆级教程】

记一次Tomcat控制台弱口令爆破事件应急响应

多线程的CAS（Compare and Swap）机制与乐观锁、AtomicInteger等原子包装类的使用

Nginx Rewrite 重写跳转

Jmeter（jmeter-plugins插件的安装使用）

学习系统编程No.26【信号处理实战】

rust基本语法

kafka初学入门

大模型显存占用分析