快速入手光学字符识别控件Aspose.OCR!如何从PDF中提取文本

news2024/11/23 9:06:23

Aspose.OCR是一款字符识别组件,它使得开发人员可以添加OCR功能到他们的ASP.NET Web应用程序、web服务和windows应用程序中。它提供了一个简单的类集用于控制字符识别。Aspose.OCR目的是为那些需要在他们自己的应用程序中使用图像(BMP和TIFF)的开发人员提供需求。它允许开发人员快速而简单的从图像中提取文本,并节省了从头开发一个OCR解决方案的时间和精力。

Aspose API支持流行文件格式处理,并允许将各类文档导出或转换为固定布局文件格式和最常用的图像/多媒体格

Aspose.OCR 最新下载(qun:761297826)icon-default.png?t=N3I4https://www.evget.com/product/2884/download

PDF 文件是最常见的业务文档之一。在某些情况下,我们可能需要以编程方式阅读扫描的PDF文档。从扫描的PDF文件中提取文本的困难导致了工具的开发,这些工具可以更轻松地从此类PDF文档中阅读和检索文本。根据文档的内容,出于多种原因,从 PDF 文件中提取文本可能很有用。在本文中,我们将学习如何在C#中对PDF文档进行OCR并从PDF中提取文本。

OCR PDF 到文本 C# API

我们将使用 Aspose.OCR for .NET API 对 PDF 文档执行 OCR。它可以识别扫描的图像,智能手机照片,屏幕截图和图像区域。API 以最流行的文档和数据交换格式返回识别的文本结果。除了将图像转换为文本外,API 还可以根据扫描创建可搜索的 PDF。此外,它能够自动更正已识别文本中的拼写错误。

该 API 提供了 AsposeOcr 类,该类提供了执行 OCR 操作的各种方法。它提供了RecognizePdf(字符串,DocumentRecognitionSettings)方法来识别所提供的PDF文档中的文本。API 的 DocumentRecognitionSettings 类提供 PDF 识别过程的设置。类表示图像识别的结果。

OCR PDF 和从 C 语言的 PDF 中提取文本

我们可以对PDF文档执行OCR,并按照以下步骤提取识别的文本:

  1. 首先,创建 AsposeOcr 类的实例。
  2. 接下来,初始化 DocumentRecognitionSettings 类的对象。
  3. 然后,指定要用于 OCR 的语言。
  4. 之后,通过调用 RecognizePdf() 方法获取 RecognitionResult。它采用图像路径和文档识别设置对象作为参数。
  5. 最后,循环浏览识别结果列表并显示标识的文本。

以下示例代码演示如何在 C# 中对 PDF 文档进行 OCR 和提取识别的文本。

// This code example demonstrates how to OCR PDF documents and extract the recognized text.
// Initialize the PCR engine
AsposeOcr recognitionEngine = new AsposeOcr();

// Initialize recognition settings
DocumentRecognitionSettings recognitionSettings = new DocumentRecognitionSettings();

// Specify language for OCR. Multi-language by default
recognitionSettings.Language = Language.Eng;

// Recognize text from PDF
List<RecognitionResult> results = recognitionEngine.RecognizePdf("C:\\Files\\sample.pdf", recognitionSettings);

// Show the recognized text
foreach (RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}

对 PDF 执行 OCR 并将文本保存在 C 语言中

我们可以对PDF文档执行OCR,并按照以下步骤保存识别的文本:

  1. 首先,创建 AsposeOcr 类的实例。
  2. 接下来,初始化 DocumentRecognitionSettings 类的对象。
  3. 然后,指定要用于 OCR 的语言。
  4. 之后,调用 RecognizePdf() 方法来获取 RecognitionResult。它采用图像路径和文档识别设置对象作为参数。
  5. 最后,使用 SaveMultipageDocument() 方法保存文本。它采用输出文件路径、SaveFormat 和 RecognitionResult 对象作为参数。

以下示例代码演示如何对 PDF 文档进行 OCR 并将识别的文本保存在 C# 中。

// This code example demonstrates how to OCR PDF documents and extract the recognized text.
// Initialize the PCR engine
AsposeOcr recognitionEngine = new AsposeOcr();

// Initialize recognition settings
DocumentRecognitionSettings recognitionSettings = new DocumentRecognitionSettings();

// Specify language for OCR. Multi-language by default
recognitionSettings.Language = Language.Eng;

// Recognize text from PDF
List<RecognitionResult> results = recognitionEngine.RecognizePdf("C:\\Files\\sample.pdf", recognitionSettings);

// Save the recognized text
AsposeOcr.SaveMultipageDocument("C:\\Files\\OCR_result.txt", SaveFormat.Text, results);

OCR PDF 和将扫描的 PDF 转换为 C 语言中的单词

我们可以对扫描的PDF文档执行OCR,并按照前面提到的步骤将识别的文本保存在Word文档中。但是,我们只需要在最后一步中指定 SaveFormat.Docx。

下面的示例代码演示如何在 C# 中对 PDF 进行 OCR PDF 并将识别的文本另存为 Word 文档。

// This code example demonstrates how to OCR PDF documents and save the recognized text as DOCX.
// Initialize the PCR engine
AsposeOcr recognitionEngine = new AsposeOcr();

// Initialize recognition settings
DocumentRecognitionSettings recognitionSettings = new DocumentRecognitionSettings();

// Specify language for OCR. Multi-language by default
recognitionSettings.Language = Language.Eng;

// Recognize text from PDF
List<RecognitionResult> results = recognitionEngine.RecognizePdf("C:\\Files\\sample.pdf", recognitionSettings);

// Save the recognized text as DOCX
AsposeOcr.SaveMultipageDocument("C:\\Files\\OCR_result.docx", SaveFormat.Docx, results);

OCR PDF 和 将 PDF 转换为 JSON 语言

我们可以对 PDF 文档执行 OCR,并按照前面提到的步骤将识别的文本保存在 JSON 文件中。但是,我们只需要在最后一步中指定 SaveFormat.Json。

以下示例代码演示如何在 C# 中对 PDF 进行 OCR PDF 并将识别的文本另存为 JSON 文件。

// This code example demonstrates how to OCR PDF documents and save the recognized text as JSON.
// Initialize the PCR engine
AsposeOcr recognitionEngine = new AsposeOcr();

// Initialize recognition settings
DocumentRecognitionSettings recognitionSettings = new DocumentRecognitionSettings();

// Specify language for OCR. Multi-language by default
recognitionSettings.Language = Language.Eng;

// Recognize text from PDF
List<RecognitionResult> results = recognitionEngine.RecognizePdf("C:\\Files\\sample.pdf", recognitionSettings);

// Save the recognized text as JSON
AsposeOcr.SaveMultipageDocument("C:\\Files\\OCR_result.json", SaveFormat.Json, results);

以上便是如何对 PDF 文档执行 OCR 以及如何在 C# 中从 PDF 中提取文本的详细步骤,希望能帮到您。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/531928.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

软件设计师计算机系统知识点笔记大总结

数据寄存器是一个中转站 指令寄存器 ir 保存暂存指令&#xff08;操作码加地址吗等于指令&#xff09; 地址寄存器 保存当前cpu所访问的内存单元地址 程序计数器 保存的是下一条指令的地址 状态寄存器 标志运算的结果 类似 0&#xff08;&#xff09;状态寄存器是运算器中的部件…

Ansible Automation Platform - 用 API 访问 Ansible Automation Platform

《OpenShift / RHEL / DevSecOps 汇总目录》 说明&#xff1a;本文已经在支持 Ansible Automation Platform 2.3 的环境中验证 文章目录 AAP 的 API 索引Host 主机列表 API通过 API 操作 Ansible Automation Platform 说明&#xff1a;以下命令中 mycontroller-aap.apps-crc.t…

论文阅读-17-Deep Long-Tailed Learning: A Survey---3.3 Module Improvement

文章目录 1. Representation Learning1.1 Metric learning(1) large margin local embedding LMLE①##### ②##### ③ (2) Range loss(3) CRL(4) KCL(5) Hybrid(6) PaCo(7) DRO-LT 1.2 Sequential training(1) HFL(2) Unequal-training 1.3 Prototype learning(1) OLTR(2) IEM …

PPT背景图片怎么设置?4个详细教程在这!

案例&#xff1a;PPT背景图片怎么设置&#xff1f; 【因为论文答辩&#xff0c;最近需要制作PPT&#xff0c;昨晚之后感觉有点单调&#xff0c;我想设置一个背景图片&#xff0c;让我的PPT看起来更有风格&#xff0c;请问大家是怎么设置PPT背景图片的呢&#xff1f;】 PPT背景…

容器中的operator[]注意事项

首先看一张表格&#xff0c;支持operator[]的容器包括string、array、vector、deque、map、unordered_map&#xff0c;顺序容器和关联容器的operator[]不太一致。 string中的operator[] 在pos < size()时返回到位于指定位置pos的字符的引用&#xff0c;或在pos size()时…

信息安全数学基础笔记

三个数学难题: 群的定义: 满足乘法结合律&#xff0c;有单位元&#xff0c;逆元即为群&#xff0c;如果同时满足交换律则为交换群 满足乘法结合律&#xff0c;有单位元即为半群&#xff0c;如果同时满足交换律则为交换半群 希尔密码: 其中加密矩阵为n阶一般线性群&#xff0c;…

视频与音频一键同步嘴型数字人ai工具分享

在ai发展的今天,各种虚拟主播工具层出不穷,我们在选择ai工具的适合往往陷入一个使用陷阱。 比如, 看演示视频效果非常不错,自己去用却跟智障一样的。出现这种情况,我们首先不去评价这个工具的好用,我们得分析别人使用的前置条件。 大部分前置条件都是大量的训练数据, …

进程通信和信号量

1.进程通信 管道&#xff1a;包括无名管道(pipe)和命名管道(named pipe),无名管道可用于具有父进程和子进程之间的通信。命名管道除具有管道所具有的所有功能外&#xff0c;它还允许无亲缘关系进程间的通信。消息队列&#xff1a;进程可以向队列中添加消息&#xff0c;其他进程…

代码量原地缩减50%,这个Java工具类库太香了

Guava是google公司开发的一款Java类库扩展工具包&#xff0c;内含了丰富的API&#xff0c;涵盖了集合、缓存、并发、I/O等多个方面。使用这些API一方面可以简化我们代码&#xff0c;使代码更为优雅&#xff0c;另一方面它补充了很多jdk中没有的功能&#xff0c;能让我们开发中更…

长沙银行财报启示录:“生态引擎”如何突破“低维竞争”?

众多行业当中&#xff0c;银行业一直被当做“经济晴雨表”。 今年以来&#xff0c;中国经济开启回暖模式。尤其是在前不久的五一假期&#xff0c;各地消费回暖&#xff0c;释放出经济持续向好的积极信号。此时&#xff0c;也正是各家银行发布成绩单的财报季&#xff0c;能发现…

OPC UA Client接口库

OPC UA库秉承简单、易用、可靠的设计理念&#xff0c;只需少量接口即可实现所需功能&#xff0c;同时使用者无需考虑多线程&#xff0c;时序等问题 1. 拷贝代码文件 将 \JngOpcUaClient\JngOpcUaClient\Input\ 文件夹拷贝到项目中&#xff0c;添加到项目。 2. 拷贝dll库及Secu…

ES+Redis+MySQL,高可用架构设计方案

ES高可用方案 1. ES双中心主备集群架构 全平台所有体系的会员总量是十多亿。在这么大的数据体量下&#xff0c;业务线的查询维度也比较复杂。有的业务线基于手机号&#xff0c;有的基于微信unionid&#xff0c;也有的基于卡号等查询会员信息。这么大的数据量&#xff0c;又有…

Java基础(40)反射机制

Java反射机制是 Java 语言的一个重要特性。先了解两个概念&#xff0c;编译期和运行期。编译期是指把源码交给编译器编译成计算机可以执行的文件的过程。在 Java 中也就是把 Java 代码编成 class 文件的过程。编译期只是做了一些翻译功能&#xff0c;并没有把代码放在内存中运行…

平平无奇的Python为什么能一跃成为世界排名第一的语言

一、前言 本文将结合个人经历为各位同学客观的分析是否有学习Python的必要、Python适合谁学、为什么要学&#xff0c;希望能够给看到此文章的同学一点建议&#xff0c;树立学习目标&#xff0c;让学习有结果。 读完后&#xff0c;相信你一定能够有所收获。 二、简述个人经历…

Word控件Spire.Doc 【文本框】教程(4):如何将图像插入文本框

Spire.Doc for .NET是一款专门对 Word 文档进行操作的 .NET 类库。在于帮助开发人员无需安装 Microsoft Word情况下&#xff0c;轻松快捷高效地创建、编辑、转换和打印 Microsoft Word 文档。拥有近10年专业开发经验Spire系列办公文档开发工具&#xff0c;专注于创建、编辑、转…

swift闭包底层本质

swift学习笔记 闭包底层原理 1、函数赋值给一个变量 func getFn(_ a: Int) -> Int {return a 1 }let funcVar getFn当在把一个函数赋值给一个变量funcVar的时候&#xff0c;funcVar变量会存储两个东西 funcVar总共占用16个字节前八个字节存储着getFn的函数地址后八个字…

浅聊一下NTP

浅聊一下NTP 仅了解&#xff0c;没实践过NTP 文章目录 浅聊一下NTP1.什么是NTP2.基本原理3.工作模式1.单播服务器/客户端模式2.对等体模式3.广播模式4.组播模式 4.NTP数据报文 1.什么是NTP 网络时间协议NTP&#xff08;Network Time Protocol&#xff09;是TCP/IP协议族里面…

PowerShell系列(三):PowerShell发展历程梳理

目录 1、PowerShell 1.0 版本特性 2、PowerShell 2.0 版本特性 3、PowerShell 3.0 版本特性 4、PowerShell 4.0 版本特性 5、PowerShell 5.0 版本特性 6、PowerShell 5.1 版本特性 7、PowerShell6.0 Core 版本特性 8、PowerShell7.0 Core 版本特性 今天给大家聊…

openAI图像生成开发文档

图像生成 了解如何使用我们的 DALLE 型号 介绍 图像 API 提供了三种与图像交互的方法&#xff1a; 根据文本提示从头开始创建图像根据新的文本提示创建现有图像的编辑创建现有图像的变体 本指南介绍了使用这三个 API 终结点的基础知识以及有用的代码示例。要了解它们的实际…

海外网红营销vs国内网红营销:2023年市场洞察与策略差异

随着互联网和社交媒体的迅猛发展&#xff0c;网红营销已经成为一种炙手可热的推广方式。无论是国内还是海外&#xff0c;网红营销都在不断演变和创新&#xff0c;以满足广告主和品牌的需求。然而&#xff0c;海外网红营销和国内网红营销之间存在一些显著的区别。本文Nox聚星将和…