tesseract:一个.Net版本的开源OCR项目

news2025/1/11 6:11:22

推荐一个.Net版本的开源OCR项目,方便我们在项目中集成OCR功能。

01 项目简介

tesseract是针对Tesseract-OCR(C++)引擎封装的.NET版本,支持超过100种语言的文本识别,使得.NET开发者能够轻松地利用Tesseract的强大功能,无需深入了解OCR的底层技术。

此项目缺点是,只能识别印刷的文本,针对手写的需要自己训练语言包。

02 使用方法

1、安装依赖Tesseract

Install-Package Tesseract

2、下载语言数据文件

根据需求下载对于的语言数据文件,并在属性设置“复制到输出目录”设置为“始终”,如下示例为中文简体数据文件。

图片

语言文件下载地址:

https://github.com/tesseract-ocr/tessdata_fast

3、示例代码

using System.Diagnostics;
using Tesseract;

var testImagePath = "./photo.bmp";

try
{
    using (var engine = new TesseractEngine(@".", "chi_sim", EngineMode.Default))
    {
        using (var img = Pix.LoadFromFile(testImagePath))
        {
            using (var page = engine.Process(img))
            {
                var text = page.GetText();

                Console.WriteLine("识别结果:" + text);
            }
        }
    }
}
catch (Exception e)
{
    Console.WriteLine(e.ToString());
}
Console.ReadKey(true);

4、识别效果

图片:

图片

识别:

图片

03 项目地址

https://github.com/charlesw/tesseract

- End -

更多开源项目: https://github.com/bianchenglequ/NetCodeTop

我是编程乐趣,一个.Net开发经验老程序员,欢迎“关注”我,每天为你分享开源项目和编程知识。
也欢迎加入【.Net技术编程交流社区】,和大家共同学习交流!,点击加入:https://bbs.csdn.net/topics/613465368

推荐阅读

2个零基础入门框架教程!

一个C#开源工具库,集成了超过1000个扩展方法

Sep:一个低内存、高性能的CSV文件读写操作.Net开源库

Boxed:包含多个.Net项目模板,涵盖了ASP.NET Core API、GraphQL等。

Atata:一个基于 Selenium的C#自动化测试Web框架

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2179325.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

LLM基础概念-训练集

数据集 训练集(Training Set) 用来训练模型的数据。就像给学生提供教材一样,训练集帮助模型学习如何从输入数据预测出正确的结果。 验证集(Validation Set) 这个数据集用来检查模型在训练过程中的表现。它帮助我们调整模型训练参数的设置,以确保模型不…

《基于 Spring Boot 的健身房管理系统功能介绍》

一、系统概述 本健身房管理系统基于 Spring Boot 框架开发,旨在为健身房提供一套高效、便捷的管理解决方案。系统涵盖了会员卡查询、会员管理、员工管理、器材管理和课程管理等核心功能,帮助健身房实现全面的数字化管理。 二、会员卡查询 用户可以通过输…

影响 Linux、Unix 系统的 CUPS 漏洞可导致 RCE

在经过大量炒作和第三方过早泄露信息之后,安全研究员 Simone Margaritelli 公布了有关通用 UNIX 打印系统 (CUPS) 中的四个零日漏洞的详细信息。 这些漏洞可被远程、未经身份验证的攻击者滥用,在易受攻击的 Linux 和类 Unix 系统上实现代码执行。 CUPS…

【多线程】多线程(2):Thread方法,线程核心操作

【Thread类其他的属性和方法】 给线程命名的方法,不起名字则默认叫做Thread-0,Thread-1…… 【线程的属性】 ID,名称,状态,优先级:JVM自动分配,不能手动设置 状态:java中把线程的…

速通数据结构与算法第六站 树堆

系列文章目录 速通数据结构与算法系列 1 速通数据结构与算法第一站 复杂度 http://t.csdnimg.cn/sxEGF 2 速通数据结构与算法第二站 顺序表 http://t.csdnimg.cn/WVyDb 3 速通数据结构与算法第三站 单链表 http://t.csdnimg.cn/cDpcC 4 速通…

长期提供APX515/B原装二手APX525/B音频分析仪

Audio Precision APx515 是一款针对生产测试而优化的高性能音频分析仪。它因其速度、性能、自动化和易用性而成为一流的仪器。它具有卓越的性能,具有 –106 dB 的典型 THDN、1M 点 FFT 和 192k 数字 I/O,以及所有 APx 系列音频分析仪的一键式自动化和易用…

Flask-1

文章目录 Flask准备创建flask项目flask加载项目配置的二种方式 路由的基本定义接收任意路由参数接收限定类型参数自定义路由参数转换器 终端运行Flask项目http的请求与响应flask的生命周期请求获取请求中各项数据获取请求URL参数获取请求体获取请求头相关信息 响应响应html文本…

通信工程学习:什么是LAN局域网、MAN城域网、WAN广域网

LAN局域网、MAN城域网、WAN广域网 LAN(Local Area Network,局域网)、MAN(Metropolitan Area Network,城域网)和WAN(Wide Area Network,广域网)是计算机网络中根据覆盖范围…

Hive数仓操作(五)

一、Hive 信息查看 Hive的元数据管理: Hive 将表的元数据(如表名、列名、类型等)存储在关系型数据库中,通常是 MySQL。元数据的主要表包括: TBLS:存储表的信息(表名、类型、ID 等)。…

VMware NSX Advanced Load Balancer (NSX ALB) 22.1.7 发布下载,新增功能概览

VMware NSX Advanced Load Balancer (NSX ALB) 22.1.7 - 多云负载均衡平台 应用交付:多云负载均衡、Web 应用防火墙和容器 Ingress 服务 请访问原文链接:https://sysin.org/blog/vmware-nsx-alb-22/,查看最新版。原创作品,转载请…

一、Spring Boot集成Spring Security之自动装配

Spring Boot集成Spring Security之自动装配介绍 一、实现功能及软件版本说明二、创建Spring Boot项目三、查看自动装配配置类四、自动装配配置类之SecurityAutoConfiguration1、SecurityAutoConfiguration部分源码2、主要作用3、SpringBootWebSecurityConfiguration3.1、Spring…

D - Hidden Weights

题目链接: D - Hidden Weights (atcoder.jp) 题目描述: 数据范围限制: 样例: 输入: 3 3 1 2 2 3 2 3 1 3 -1 输出: 3 5 2 样例图: 思路: 第一次想的是从没有入节点的点去出发,然后去依次去更新,但是发现这个是错误的。 用dfs…

GPG error golang 1.19

1. 问题描述及原因分析 在飞腾2000的服务器,OS为Kylin Linux Advanced Server release V10环境下,docker版本为18.09.0(docker-engine-18.09.0-101.ky10.aarch64),基于容器镜像golang:1.19编译新的容器镜像&#xff0…

图解C#高级教程(二):事件

在现实生活当中,有一些事情发生时,会连带另一些事情的发生。例如,当某国的总统发生换届时,不同党派会表现出不同的行为。两者构成了“因果”关系,因为发生了A,所以发生了B。在编程语言当中,具有…

Motion open Heart 详细动画化开放式心脏解剖

详细和动画的心脏直视解剖。 具有真实的运动和精确的心动周期动画。 包括真实阀门动画序列。 配备高清纹理2048x2048和高清法线贴图,可在教育和游戏方面获得更好、更真实的效果。为(VR)虚拟现实场景和增强现实(AR)做好准备。 下载:​​Unity资源商店链接资源下载链接 …

高职院校“ICT工程师”人才培养方案——以华为认证高级网络工程师HCIP为例

一、引言 在电子信息领域,新技术、新理念和新思路的迅猛发展正推动着信息和网络技术成为各行业产业链的关键部分。信息技术与网络技术的深度融合催生了多样化的应用技术。ICT行业正逐渐渗透到生活的每一个角落,引领着新一轮信息通信产业的发展浪潮。 为…

在LabVIEW中如何读取EXCEL

在LabVIEW中读取Excel文件通常使用“报告生成工具包”(Report Generation Toolkit)。以下是详细步骤: ​ 安装工具包:确保已安装“报告生成工具包”。这通常随LabVIEW一起提供,但需要单独安装。 创建VI: 打…

一文详解:跨国医疗机构安全合规文件流转的跨境传输解决办法

跨国医疗机构是指那些能够在不同国家之间提供医疗服务的机构,它们通常具有国际化的医疗网络、专业的医疗团队和先进的医疗设备。这些机构不仅能够帮助患者获取国外优质的医疗资源,还能提供包括医疗咨询、治疗安排、病历翻译、签证办理、海外陪同等在内的…

中国联通(海外)数据中心资源:从基础设施运维服务到IDC机房增值服务

在全球化日益加深的今天,企业海外拓展已成为其发展战略的重要一环。然而,面对复杂多变的国际环境和严格的业务要求,如何确保海外业务的高效运行与数据安全,成为了企业亟需解决的关键问题。中国联通国际有限公司凭借其丰富的全球资…

实验5 预备实验1-交换机端口的基本配置

交换机端口的基本配置 (本预备实验的重点是四种操作模式的切换) 一、实验目的 1、练习cisco 交换机端口的基本配置 二、实验内容和结果 1、新建交换机 2、点击交换机图标,进入CLI窗口,可以看到交换机加电后会进行加电自检&…