Tesseract .Net SDK C# OCR 2022.1

news2024/9/23 9:23:30

Tesseract .Net SDK C# OCR 库 #将扫描的 PDF 转换为可搜索的文档 #快速准确的基于神经网络的引擎 #纠正低质量扫描 # 120 多种语言 # .Net 2.0+, .Net 5, 标准, 核心

Tesseract OCR - industry-fastest .Net OCR library
 
4 行代码,仅此而已
var api = OcrApi.Create();
api.Init(Languages.English);
using (var renderer = OcrPdfRenderer.Create("searchable.pdf"))
api.ProcessPages(@"scanned.pdf", renderer);

它只是一个魔术!

得益于简单的 API,您只需几行代码即可将扫描的 PDF 转换为可搜索的文档。

顺便说一句,不仅是PDF。添加到您的应用程序 JPEG、多页 TIFF 或 PNG 转换为可搜索的 PDF 现在只需几分钟,而不是几小时或几天。


120 多种语言的多种图像格式
Tesseract.NET SDK 可准确识别超过 120 种语言的文本,支持多语言文本,并且可以训练使用以前未知的语言。作为标准支持的语言包括英语、法语、意大利语、德语、西班牙语、阿拉伯语、中文、希伯来语、日语、俄语、泰语等。

纠正低质量扫描
例如,去歪斜输入过滤器会自动旋转图像,使其以正确的方式向上和正交。如果页面太倾斜,Tesseract 的线分割质量会显着降低,这会严重影响 OCR 的质量。

 

Patagames OCR SDK 中内置的用于增强 OCR 性能的输入过滤器包括:二值化、对比度和对比度归一化、去偏斜、增强分辨率、腐蚀和膨胀、膨胀和收缩、反转、删除边框、旋转、ToGray 和白色背景。

为您的 .Net 应用程序配备 OCR 功能的最佳方式
虽然 Tesseract 无疑是迄今为止最好的 OCR 库,但 Tesseract.NET SDK 是为您的应用程序配备文本识别功能的最佳方式之一。

Tesseract.Net SDK 结合易于部署、出色的识别准确性、闪电般快速的 OCR 和多种输出选项(包括 PDF、HOCR、UNLV 和纯文本),提供灵活简单的 API 以及许多高级和低级文本识别程序。

多亏了简单的 API,您可以用几行代码将给定的图像转换为可搜索的文本。如果您需要更详细地了解文本的组成部分,Tesseract.NET SDK API 提供了许多类来检索单个字母、单词、段落甚至字体参数。

您现在可以免费试用 Tesseract.NET SDK,体验 .Net 应用程序有史以来最快、最完美的光学识别。

享受支持 OCR 的 .Net 应用程序的强大开发!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/32659.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

[附源码]java毕业设计疫情环境下的酒店管理系统

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…

不知道什么的复习题

P4408 [NOI2003] 逃学的小孩,一眼就看出要化简题面:不就是找三个点使得ABBC最大嘛,不妨想起直径的性质,最长,而且其他点到它的距离最长。那么直接拿直径来做就行。推导出结论为ansmax(min(dis[A][k],dis[B][k])dis[A][…

CSS3------CSS选择器

界面中的“超文本“本质上就是通过一个一个矩形盒子包起来,然后进行排版组合,那么接下来要详细研究这个标签盒子的细节结构,以帮助学习如何使用它,但是在开始研究它之前,我们先来了解一个概念,选择器的概念…

BN、CBN、CmBN 的对比与总结

BN、CBN、CmBN 的对比与总结 最近看到了关于 Yolo 系列 trick 的总结文章 【Make YOLO Great Again】YOLOv1-v7全系列大解析(Tricks篇),其中提到了 YoloV4 中使用了 CmBN,这是对 CBN 的改进,可以较好的适应小 batch 的…

电容笔值不值得买?电容笔十大品牌排行

要想给我们的ipad配置一款电容笔,如果感觉苹果原装的电容笔价格远远超过预算。这时候平替电容笔是个非常值得入手的选择。试想一下购买一款苹果原装的电容笔的资金都够买整整四款平替电容笔了,平替电容笔价格便宜且功能跟苹果的电容笔相差无几。下面我来…

【设计模式】 - 结构型模式 - 迭代器模式

目录标题前言迭代器模式概述结构实现优缺点JDK源码解析前言 行为型模式用于描述程序在运行时复杂的流程控制,即描述多个类或对象之间怎样相互协作共同完成单个对象都无法单独完成的任务,它涉及算法与对象间职责的分配。 行为型模式分为类行为模式和对象…

ai绘画有哪些软件,盘点三款免费且超级好用的AI绘画工具

Ai绘画有哪些软件?不但可以免费使用,而且生成的画作精美,而且生成的图片速度还要很快? 不用急,今天小编给大家推荐的这三款ai绘画工具完全满足了上述条件! 第一款,重磅级产品,数画…

内存 地址转换、分段、空闲空间管理

目录 1. 地址转换 1.1 动态重定位 1.1.1 基址寄存器(虚拟地址 -> 物理地址) 1.1.2 界限寄存器(提供访问保护) 1.2 操作系统的工作 2. 分段 2.1 分段:泛化的基址/界限 2.2 引用哪个段 2.3 代码和堆的地址转换举例 2.4…

Java#23(常见API--1)

目录 一.Math Math是一个帮助我们用于进行数学计算的工具类 工具类的特点: Math类中的常用方法 二.System System是一个工具类,为我们提供一些与系统相关的办法 一.Math Math是一个帮助我们用于进行数学计算的工具类 工具类的特点: 私有化构造方法,所有的方法都是静态的 M…

[附源码]java毕业设计医院预约挂号管理系统

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…

web网页设计期末课程大作业 我的美丽家乡盐城 HTML+CSS+JavaScript

家乡旅游景点网页作业制作 网页代码运用了DIV盒子的使用方法,如盒子的嵌套、浮动、margin、border、background等属性的使用,外部大盒子设定居中,内部左中右布局,下方横向浮动排列,大学学习的前端知识点和布局方式都有…

Linux C应用编程-2-Makefile编写

1.基本规则 #规则格式 target ... : prerequisites ... command1command2#例如 main: main.o stack.o maze.ogcc main.o stack.o maze.o -o main main是规则的目标(Target),main.o、stack.o和maze.o是规则的条件(Prerequisite&am…

贴地气的安卓UI自动化工具4399AT全面更新了~

4399AT是 一款兼容多设备运行并实现全自动化的测试的安卓UI工具,全自动化测试是指从apk的安装到按钮点击,密码输入到安装完成,不需要人工介入,兼容android5.0-12.0系统大部分品牌,至于开始测试,启动apk后&a…

(十)笔记.net学习Lambda和Linq表达式

1.lambda表达式的演变 Lambda表达式的本质是“匿名方法”: C#的Lambda 表达式都使用 Lambda 运算符 >,该运算符读为“goes to”。语法如下: (object argOne, object argTwo) > {; /*Your statement goes here*/} 函数体多于一条语句…

一次Actuator未授权访问利用

目录 介绍 复现 Actuator目录下可能利用泄漏信息的路径 利用 思考 处理意见 介绍 事先得到同意对朋友公司的网站进行了扫描,扫出了一个Actuator未授权,于是开始复现并记录一下,最后获取了redis的密码 复现 这里是请求包 响应包成功返回…

qt 虚拟键盘中的几个瑕疵

最近使用了下面楼主的虚拟键盘,总体还是挺好用的,只是有几个地方,需要完善下。 基于Qt的可用于嵌入式的虚拟键盘_偷段代码的博客-CSDN博客_qt 嵌入式虚拟键盘这几天完成了一个基于Qt的虚拟键盘的编写,记录一下过程与感受&#xf…

Python操作Numpy模块库

14天学习训练营导师课程: 杨鑫《Python 自学编程基础》 杨鑫《 Python 网络爬虫基础》 杨鑫《 Scrapy 爬虫框架实战和项目管理》 Python操作Numpy模块库 文章目录Python操作Numpy模块库1.Numpy介绍2.Numpy安装3.Numpy模块练习3.1 创建数组3.2 获取数组3.3 切割数组…

二叉树路径问题+递归+有关题目

一、分类 1、自顶向下 顾名思义,就是从某一个节点(不一定是根节点),从上向下寻找路径,到某一个节点(不一定是叶节点)结束,具体题目如下:而继续细分的话还可以分成一般路径与给定和的路径 二叉树的所有路径面试题 04…

Qt 利用UDP进行通信

一、UDP的特点 UDP(用户数据报协议)是一种简单轻量级、不可靠、面向数据报,无连接的传输层协议。而TCP/IP协议却是有连接的 二、UDP适合应用的几种情况 1、网络数据大多为短消息 2、拥有大量客户端 3、对数据安全性无特殊要求 4、网络负…

pmap gdb 分析堆外内存泄露情况

一、查看内存分部 pmap -x 8 | sort -k3 -n -r | more ---- 8 是 PID 最大的肯定是堆内存。 其他的就需要看情况来分析了。 二、cat /proc/8/smaps | grep 7fad64000000 -- 8 是 PID , 地址的前4个0需要去掉。查到起止内存地址。 7fad64000000-7fad68000000 r…