基于paddleocr的文档识别

基于paddleocr的文档识别

news2026/2/13 7:52:45

1、版面分析

使用轻量模型PP-PicoDet检测模型实现版面各种类别的检测。

数据集：

英文：publaynet数据集的训练集合中包含35万张图像，验证集合中包含1.1万张图像。总共包含5个类别。

中文：CDLA据集的训练集合中包含5000张图像，验证集合中包含1000张图像

2、文本分析

文本检测：改进了基于分割的DBNet (Differentiable Binarization)

数据集：ICDAR 2015 数据集包含1000张训练图像和500张测试图像。

文本识别：SVTR_LCNet（将基于Transformer的SVTR网络和轻量级CNN网络PP-LCNet 融合的一种轻量级文本识别网络）

数据集：

3、表格

1. 文字检测模型：用于检测表格里的文本

2. 文字识别模型：用于对检测到的文本进行识别

3. SLANet模型用于预测表格结构的HTML信息和表格单元格坐标

数据集：

PubTabNet数据集的训练集合中包含50万张图像，验证集合中包含0.9万张图像

好未来表格识别竞赛数据集的训练集合中包含1.6万张图像。验证集未给出可训练的标注。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/918893.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Vue3：通过路由写多个页面，通过不同的路径可以进入不同的页面

Vue3：通过路由写多个页面，通过不同的路径可以进入不同的页面

前言 Vue3：想通过路由写2个页面，不同的路径可以进入不同的页面实现步骤 1、创建Vue3项目通过脚手架创建一个Vue3的项目，然后在此基础上对文件进行增删改，修改成自己需要的项目框架 2、views文件夹对应页面文件如果需要…

阅读更多...

网络编程——网络基础知识

网络编程——网络基础知识

目录一、网络历史两个重要名词1.1 阿帕网1.2 TCP/IP协议二、局域网和广域网三、IP地址3.1 基本概念3.2 划分(IPV4)3.3 特殊IP地址3.4 子网掩码3.5 重新组网四、网络模型4.1 网络的体系结构：4.2 OSI与TCP/IP模型4.2.1 OSI模型4.2.2 TCP/IP模型4.2.3 OSI和TCP/IP模…

阅读更多...

C++，类的特殊函数练习

C++，类的特殊函数练习

设计一个Per类，类中包含私有成员:姓名、年龄、指针成员身高、体重，再设计一个Stu类，类中包含私有成员:成绩、Per类对象p1，设计这两个类的构造函数、析构函数和拷贝构造函数。 #include <iostream> using namespace std;cla…

阅读更多...

OpenAI的Superalignment策略：计算为王

OpenAI的Superalignment策略：计算为王

卷友们好，我是rumor。对于怎么实现AGI这个玄学的目标，感觉大家都是差不多的状态：咱也不知道怎么做，但就是觉得现在的LLM技术还远远不够。所以之前看到OpenAI说要用模型去做对齐研究[1]，以及最近发话要4年内做出Super…

阅读更多...

创建R包-2.1：在RStudio中使用Rcpp制作R-Package(更新于2023.8.23)

创建R包-2.1：在RStudio中使用Rcpp制作R-Package(更新于2023.8.23)

目录 0-前言 1-在RStudio中创建R包项目 2-创建R包 2.1通过R函数创建新包 2.2在RStudio通过菜单来创建一个新包 2.3关于R包创建的说明 3-添加R自定义函数 4-添加C函数 0-前言目标：在RStudio中创建一个R包，这个R包中包含C函数，接口是Rc…

阅读更多...

$牛客复盘] 2023河南萌新联赛第（七）场：信息工程大学 B\I 20230823$

牛客复盘] 2023河南萌新联赛第（七）场：信息工程大学 B\I 20230823

牛客复盘] 2023河南萌新联赛第（七）场：信息工程大学 B\I 20230823 总结B 七夕1. 题目描述2. 思路分析3. 代码实现 I 细胞分裂1. 题目描述2. 思路分析3. 代码实现六、参考链接总结场外OB做了B和I题，只能说这场有点离谱。B 并查…

阅读更多...

律师事务所微信小程序开发方案：实现智能化服务与用户体验的完美结合

律师事务所微信小程序开发方案：实现智能化服务与用户体验的完美结合

随着移动互联网的快速发展，微信成为了人们日常生活中不可或缺的社交工具。为了满足用户对便捷、高效法律服务的需求，律师事务所微信小程序应运而生。本文将探讨律师事务所微信小程序的开发方案，旨在为读者提供一个专业、思考深度和逻辑性的指…

阅读更多...

黑客自学笔记

黑客自学笔记

谈起黑客，可能各位都会想到：盗号，其实不尽然；黑客是一群喜爱研究技术的群体，在黑客圈中，一般分为三大圈：娱乐圈技术圈职业圈。娱乐圈：主要是初中生和高中生较多，玩网恋…

阅读更多...

【RHEL】硬盘分区与格式化

【RHEL】硬盘分区与格式化

fdisk命令在linux中，fdisk是基于菜单的命令。对硬盘分区时，可以在fdisk命令后面直接加上要分区的硬盘作为参数(分区工具) 利用如下所示命令，打开fdisk操作菜单。输入p,查看当前分区表。从命令执行结果可以到，/dev/mapper/rhel…

阅读更多...

网络拓扑结构

网络拓扑结构

目录 1.网络拓扑结构 1.星型拓扑结构 2.网型拓扑结构 3. 数制介绍 3.1 数制的基本概念 1.网络拓扑结构网络拓扑结构是指用传输媒体互连各种设备的物理布局，也就是用什么方式连接网络中的计算机、网络设备，它的结构有星型拓扑，总线型拓扑…

阅读更多...

JVM 之垃圾收集算法详解

JVM 之垃圾收集算法详解

文章目录一、标记清楚算法二、标记复制算法三、标记整理算法四、不同垃圾收集算法优缺点总结1. 标记-清除算法：2. 标记-复制算法：3. 标记-整理算法： 一、标记清楚算法标记清除是一种简单而直接的垃圾回收算法。它的执行流程如下&#xff1…

阅读更多...

【Rust】Rust学习第十九章高级特征

【Rust】Rust学习第十九章高级特征

现在我们已经学习了 Rust 编程语言中最常用的部分。在第二十章开始另一个新项目之前，让我们聊聊一些总有一天你会遇上的部分内容。你可以将本章作为不经意间遇到未知的内容时的参考。本章将要学习的功能在一些非常特定的场景下很有用处。虽然很少会碰到它们&#xf…

阅读更多...

SpringBoot案例-文件上传

SpringBoot案例-文件上传

目录简介文件上传前端页面三要素服务端接收文件小结本地储存实现代码优化小结阿里云OSS 阿里云阿里云OSS 使用第三方服务--通用思路准备工作参照官方SDK代码，编写入门程序集成使用阿里云OSS-使用步骤阿里云OSS使用步骤参照SDK编写入…

阅读更多...

【QT5-自我学习-线程qThread练习-两种使用方式-2：通过继承Qobject类-自己实现功能函数方式-基础样例】

【QT5-自我学习-线程qThread练习-两种使用方式-2：通过继承Qobject类-自己实现功能函数方式-基础样例】

【QT5-自我学习-线程qThread练习-两种使用方式-2：通过继承Qobject类-自己实现功能函数方式-基础样例】 1、前言2、实验环境3-1、学习链接-参考文章3-2、先前了解-自我总结（1）线程处理逻辑事件，不能带有主窗口的事件（2&…

阅读更多...

攻防世界-base÷4

攻防世界-base÷4

原题解题思路 base644，莫不是base16，base16解码网站： 千千秀字

阅读更多...

k8s 安装istio (一)

k8s 安装istio (一)

前置条件已经完成 K8S安装过程十：Kubernetes CNI插件与CoreDNS服务部署部署 istio 服务网格与 Ingress 服务用到了 helm 与 kubectl 这两个命令行工具，这个命令行工具依赖 ~/.kube/config 这个配置文件，目前只在 kubernetes master 节点中…

阅读更多...

postgres数据常用SQL语句

postgres数据常用SQL语句

-- 系统信息函数 select version(),user,current_user; -- 创建表 CREATE TABLE biao(id INT primary key,name VARCHAR(25) not null,sex VARCHAR(25) unique,salary FLOAT default 9000 ); -- 更换表名 ALTER TABLE biaoRename to biao1; -- 更换字段类型 ALTER TABLE biao1 …

阅读更多...

Tushare入门小册

Tushare入门小册

Tushare入门小册一、Tushare平台介绍 Pro版数据更稳定质量更好了，我们提供的不再是直接从互联网抓取，而是通过社区的采集和整理存入数据库经过质量控制后再提供给用户。但Pro依然是个开放的，免费的平台，不带任何商业性质和目的…

阅读更多...

红黑树的调整图解

红黑树的调整图解

讲的很好的红黑树原理上面的视频讲解的红黑树很好。尤其是关于红黑树的调整。画图做了下总结，谢谢。

阅读更多...

AVL——平衡搜索树

AVL——平衡搜索树

✅<1>主页：我的代码爱吃辣📃<2>知识讲解：数据结构——AVL树☂️<3>开发环境：Visual Studio 2022💬<4>前言：AVL树是对二叉搜索树的严格高度控制，所以AVL树的搜索效率很高…

阅读更多...

推荐文章

最新文章