【图像算法】pytesseract简单实现图片数字识别

【图像算法】pytesseract简单实现图片数字识别

news2026/4/3 18:33:38

【前置目的】
识别视频中是否包含目标元素；
抽象自动化，就是处理一段含有时间戳的视频；
再核心就是对视频进行图片裁减，识别出图片中的数字，做数学计算延时。

【学习地址】
环境：mac、python3、pytesseract库
关键语句：pytesseract.image_to_string 基本语言库，可支持汉子和数字的识别
后续就是OCR流程

机器学习
图像预处理：去噪、灰度化、图像增强等
文本检测：滑动窗口算法遍历整张图片
字符分类：划分单个字符，识别单字

【图片例子】
time1.png
在这里插入图片描述 time2.png

time3.pngtime4.png

eng.png

【代码实现】

import pytesseract

def seek_num():
    text1 = pytesseract.image_to_string(Image.open("time1.png"), lang='eng')
    print(text1)

识别结果：

['ITE AY (8)\n\nbe\n\n20224712 A308\n\n']
['14:08:01\n']
['14:19:17\n\nFriday, 30 December 2022\n']
['14:56:10\n']
['nn BWNY\n\nWriting a Closing\n\nWrapping Up\n\nSummarize\n\nCheck for agreement\n\nReminders\n\nThank You / congratulations/ personal messages\n\nFollow Ups\n']

查看本地语言库支持的类型目录
cd /opt/homebrew/share/tessdata/

本地支持更高低点语言库，比如lang='chi_sim’等
https://github.com/tesseract-ocr/tessdata

【延伸问题】

pytesseract对代测图片的内容要求很高，一般带有点文字内容会识别出数字！！！
视频每帧输出成图片

ffmpeg -i input.mp4 -r 1 -s 1280,720 -ss 00:00:00 %d.png

需要用ffmpeg对图片大小进行裁剪，才难识别出具体的数字

ffmpeg -i input.png -vf crop=600:170:330:570 outpit.png

crop=W:H:X:Y参数说明
W:输出视频的宽度
H:输出视频的高度
X:开始裁剪的水平位置，从左边开始(绝对左距为0)。默认为中心(iw-ow)/2
Y:开始裁剪的垂直位置，从视频的顶部开始(绝对顶部为0)。默认为中心(ih-oh)/2

(也可以在视频剪切成每张图片之前先对视频进行裁剪)

对输出的内容进行替换，可能存在标点符号的问题
（勉强可用，支持了我的诉求～）

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/128724.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

PCB阻焊桥的工艺设计,华秋一文告诉你

PCB阻焊桥的工艺设计,华秋一文告诉你

PCB表面的一层漆称为阻焊油墨，也就是PCB线路板防焊油墨。阻焊油墨是PCB线路板中非常常见也是主要使用的油墨。阻焊油墨一般90%都是绿色的，但也有其他颜色，例如：红色、蓝色、黑色、白色、黄色称之为杂色油墨。阻焊油墨的作用就是…

阅读更多...

星尘数据完成5000万元A轮融资，Autolabeling加速自动驾驶量产

星尘数据完成5000万元A轮融资，Autolabeling加速自动驾驶量产

近日，国内领先的AI数据服务商星尘数据宣布完成A轮融资5000万元人民币，本轮融资由华映资本领投，小米生态链背景的厚天资本和瑞夏资本跟投。融资将用于端到端的数据闭环系统研发、商务拓展以及供应商合作。星尘数据创始人、CEO章磊表示&#xf…

阅读更多...

用Python制作一个文件解压缩工具

用Python制作一个文件解压缩工具

经常由于各种压缩格式的不一样用到文件的解压缩时就需要下载不同的解压缩工具去处理不同的文件，以至于桌面上的压缩工具就有三四种，于是使用python做了一个包含各种常见格式的文件解压缩的小工具。常见的压缩格式主要是下面的四种格式： zip…

阅读更多...

New File Format:SpreadJS v16 Crack

New File Format:SpreadJS v16 Crack

New File Format 有你需要的更新内容，请大家及时更新到最新版 SpreadJS V16 has just released, and with it, Ω578867473 some exciting new features, including a new SpreadJS file format and enhancements to the TableSheet, Designer, Calculation, and W…

阅读更多...

基于51单片机的数字电压表（TCL549）（Proteus仿真+程序）

基于51单片机的数字电压表（TCL549）（Proteus仿真+程序）

编号：31 基于51单片机的数字电压表（TCL549） 功能描述： 本系统由51单片机最小系统TCL549模块一路模拟量输入模块液晶1602显示模块 1、主控制器是89C52单片机 2、TCL54模数转换器进行A/D转换，读取电压一路数据&#xf…

阅读更多...

VSCode（Flutter开发）使用的 4 个技巧

VSCode（Flutter开发）使用的 4 个技巧

1.更清晰的文件夹结构在创建一个新的 flutter 项目后，有太多的文件。但是我们可以在 VSCode 中用非常简单的步骤来构造这些文件: 打开命令面板(Ctrl/Cmd Shift P) 键入“首选项: 打开设置(JSON)” 将以下代码行添加到 setings.json: { "explorer.fileNes…

阅读更多...

yapi的安装

yapi的安装

Yapi的安装 Yapi是一款不错的接口管理软件，我主要用它来进行接口Mock。 Yapi安装所需环境： Node.js（7.6）Mongodb（2.6）git 各环境安装地址： git：https://git-scm.com/downloadsN…

阅读更多...

[极客大挑战 2019]Buy Flag1(BUUCTF)

[极客大挑战 2019]Buy Flag1(BUUCTF)

前言: 这篇文章还是是为了帮助一些像我这样的菜鸟找到简单的题解题目描述解题工具: 我爱用edit this cookie2和hackerbar， 当然也可以burpsuite和fiddler抓包解题过程: 看到他说flag要100000000 MONEY， 还要是Cuits students， …

阅读更多...

windows11 elasticsearch-head 插件安装

windows11 elasticsearch-head 插件安装

1.elasticsearch-head 插件介绍 elasticSearch-head就是一款能连接ElasticSearch搜索引擎，并提供可视化的操作页面对elasticSearch搜索引擎进行各种设置和数据检索功能的管理插件，如在head插件页面编写RESTful接口风格的请求，就可以对Elastic…

阅读更多...

DaVinci：限定器之蒙版优化

DaVinci：限定器之蒙版优化

调色页面：限定器Color：Qualifier使用限定器等工具进行抠像后，所得到的遮罩 Matte（又称为“蒙版”）可能会存在诸多问题，比如边缘过于锐利或呈锯齿状、遍布杂点（噪点）或中间有不规则的…

阅读更多...

【pandas】教程：5-从已有数据中创建新列

【pandas】教程：5-从已有数据中创建新列

Pandas 从已有的数据列中创建新列加载数据本节使用的数据为 data/air_quality_no2.csv，链接为 pandas案例和教程所使用的数据-机器学习文档类资源-CSDN文库通过假设在25，1013hPa 压力下密度为 1.882 air_quality["london_mg_per_cubic"]…

阅读更多...

java调用dubbo服务接口_Dubbo使用invoke指令来调用dubbo接口以及telnet命令连接Dubbo服务

java调用dubbo服务接口_Dubbo使用invoke指令来调用dubbo接口以及telnet命令连接Dubbo服务

java调用dubbo服务接口_Dubbo使用invoke指令来调用dubbo接口前言正文Mac使用telnet命令提示：command not found，Mac安装telnet 命令一、telnet是什么？二、telnet命令连接Dubbo服务显示列表 – ls显示服务端口和连接 – ps跳转服务 – cd显示当…

阅读更多...

[虚幻引擎][UE][UE5]在UE5中使用线条画一颗简单的三维圣诞树(练习向)

[虚幻引擎][UE][UE5]在UE5中使用线条画一颗简单的三维圣诞树(练习向)

TOP 一、前言搞得不好看，简单了解一下叭。主要是在三维中使用线条。需要理解圆的方程式。 （小声逼逼，后来还想搞个三维圆锥螺旋线写个点球点缀一下的，结果上网一搜没人给出方程式，只好不了了之了，有哪位…

阅读更多...

Linux之从命令行管理文件

Linux之从命令行管理文件

文章目录1. 使用ln命令，创建grading/grade1文件的硬链接，取名为/hardlink2. 使用ls -l 命令查看grading/grade1文件的链接数3. 使用ln -s命令，创建grading/grade2文件的软链接，取名为student/softlink4. 使用ls -l 命令查看studen…

阅读更多...

简单随机多边形切割方案

简单随机多边形切割方案

过程化处理中希望能够对某块区域生成随机多边形，以及再切割成子多边形各种尝试之后发现一种通过python、turtle、pyclipper实现的简单方案随机多边形采用python直接生成随机多边形，算法原理：将360度随机拆分成各个角度，再通过…

阅读更多...

过年不让放炮，我用Python实现了1000响大地红的特效

过年不让放炮，我用Python实现了1000响大地红的特效

同志们，马上（后天）就要2023年啦，您有没有对象啦哈哈哈咳咳，搞错了~~再来新的一年，新的气象，穿上新衣逛街俗话说得好，这所谓放鞭炮就是来压邪祟，除恶的，…

阅读更多...

web前端-javascript-DOM和BOM详解

web前端-javascript-DOM和BOM详解

文章目录DOM 和 BOM1. DOM2. BOM2.1 BOM 简介2.2 分类2.3 语法1) Navigator 当前浏览器2）Histry 向前或向后翻页3）Location 地址栏的信息DOM 和 BOM 1. DOM 浏览器已经为我们提供了文档节点的对象，这个对象是 window 对象的属性可以在页面中…

阅读更多...

2023北京/深圳NPDP产品经理入门到精通班招生简章

2023北京/深圳NPDP产品经理入门到精通班招生简章

NPDP产品经理国际资格认证是国际公认的唯一的新产品开发专业认证，集理论、方法与实践为一体的全方位的知识体系，为公司组织层级进行规划、决策、执行提供良好的方法体系支撑。我们针对互联网时代的个人、互联网企业、与传统企业推出一系列学习。课程从…

阅读更多...

喜上加喜|怿星科技荣获高工智能金球奖两项大奖

喜上加喜|怿星科技荣获高工智能金球奖两项大奖

12月2日晚，2022第六届高工智能汽车金球奖年度颁奖典礼在上海虹桥正式开幕，来自行业内的100多家头部企业出席了此次盛会。金球奖是由高工智能汽车组织的聚焦于汽车智能网联产业链的年度颁奖盛典。参选企业覆盖了汽车智能化创新公司、人工智能创新公司、传…

阅读更多...

怎样把图片转化成jpeg格式？jpeg格式转换器分享

怎样把图片转化成jpeg格式？jpeg格式转换器分享

我们保存照片时发现有时候保存的图片为png格式或webp格式，而上传到其他平台的时候会有jpeg图片格式要求，那么就需要将图片转为jpeg，如何将图片格式转换（在线图片格式转换器（jpg、png、gif、webp、bmp、tiff&#xff09…

阅读更多...

推荐文章

最新文章