又要起飞，浏览器居然都可以本地 OCR 啦

又要起飞，浏览器居然都可以本地 OCR 啦

news2025/4/17 18:11:46

前言

PaddleOCR，这是一个由百度开发的开源 OCR（Optical Character Recognition，光学字符识别）工具，它可以用于从图像中识别文本。

PaddleOCR支持多种语言的文本识别，并且能够处理多种场景下的图像。

现在 PaddleOCR 也支持在浏览器中直接运行啦。

FastDeploy 介绍

FastDeploy 是一款全场景、易用灵活、极致高效的AI推理部署工具，支持云边端部署。

提供超过 🔥160+ Text，Vision， Speech和跨模态模型开箱即用的部署体验，并实现🔚端到端的推理性能优化。

包括物体检测、字符识别（OCR）、人脸、人像扣图、多目标跟踪系统、NLP、Stable Diffusion文图生成、TTS 等几十种任务场景，满足开发者多场景、多硬件、多平台的产业部署需求。

安装

克隆仓库

git clone https://github.com/PaddlePaddle/FastDeploy/

打开 web_demo 目录

cd examples/application/js/web_demo/

安装依赖并运行

yarn && yarn dev

打开该地址即可看到demo

运行效果

主界面

文本识别

代码

项目中关于 OCR 使用的代码非常简单，，如下：

import * as ocr from "@paddle-js-models/ocr";
onMounted(async () => {
  canvas.value = document.getElementById("canvas") as HTMLCanvasElement;

  await ocr.init();
  isLoadingModel.value = false;
});

const predict = async () => {
  const img = document.getElementById("raw-img") as HTMLImageElement;
  const res = await ocr.recognize(img, { canvas: canvas.value });
  console.log(res);
  if (res.text?.length) {
    // 页面展示识别内容
    result.value = res.text.reduce((total, cur) => total + `<p>${cur}</p>`);
  }
};

可见已经封装得十分地完整和简便了。

总结

本文对 web 中直接使用 OCR 的方法进行了简述，但并未对实际使用和具体实现原理等进行分析。

单从效果上看，已经接本上达到了可用级别。

后面我们再接着深入讨论原理和应用。

– 欢迎点赞、关注、转发、收藏【我码玄黄】，gonghao同名

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1954859.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

【Web开发手礼】探索Web开发的魅力（十二）-Vue（2）用户动态页面

【Web开发手礼】探索Web开发的魅力（十二）-Vue（2）用户动态页面

前言主要介绍了用vue框架创建用户动态页面的具体过程，可以帮助学习vue框架的基本知识！！！！ 用户动态页面用户信息用户头像通过 Bootstrap 所提供的 .img-fluid 类让图片支持响应式布局。其原理是将 max-width: 10…

阅读更多...

Java面试八股之Spring boot的自动配置原理

Java面试八股之Spring boot的自动配置原理

Spring boot的自动配置原理 Spring Boot 的自动配置原理是其最吸引人的特性之一，它大大简化了基于 Spring 框架的应用程序开发。以下是 Spring Boot 自动配置的基本原理和工作流程： 1. 启动类上的注解 Spring Boot 应用通常会在主类上使用 SpringBoot…

阅读更多...

ZBrush入门使用介绍——4、笔刷选项说明

ZBrush入门使用介绍——4、笔刷选项说明

大家好，我是阿赵。这次来看看ZBrush的笔刷的选项用法。一、选择笔刷点击笔刷，可以打开笔刷选择面板。在最上面的Quick Pick，有最近使用过的笔刷，可以快速的选择。下面有很多可以选择的笔刷。但由于笔刷太多，…

阅读更多...

AJAX之基础知识

AJAX之基础知识

目录 AJAX入门及axios使用什么是AJAX怎么用AJAX 认识URL协议域名资源路径URL查询参数查询参数URL查询参数axios查询参数常用请求方法axios请求配置 axios错误处理HTTP协议请求报文请求报文-错误排查响应报文HTTP响应状态码 form-serialize插件 AJAX入门及axios使用什么是AJ…

阅读更多...

【Python机器学习】决策树的构造——信息增益

【Python机器学习】决策树的构造——信息增益

决策树是最经常使用的数据挖掘算法。它之所以如此流行，一个很重要的原因就是不需要了解机器学习的知识，就能搞明白决策树是如何工作的。决策树的优缺点： 优点：计算复杂度不高，输出结果易于理解，对中间值的…

阅读更多...

RabbitMq手动ack的超简单案例+Confirm和Return机制的配置和使用

RabbitMq手动ack的超简单案例+Confirm和Return机制的配置和使用

最简单的例子先简单介绍一下这三个方法 basicAck 表示确认成功，使用此方法后，消息会被rabbitmq broker删除 basicNack 表示失败确认，一般在消费消息业务异常时用到此方法，可以将消息重新投递入队列 basicReject 拒绝消息&am…

阅读更多...

Chainlit一个快速构建成式AI应用的Python框架，无缝集成与多平台部署

Chainlit一个快速构建成式AI应用的Python框架，无缝集成与多平台部署

概述 Chainlit 是一个开源 Python 包，用于构建和部署生成式 AI 应用的开源框架。它提供了一种简单的方法来创建交互式的用户界面，这些界面可以与 LLM（大型语言模型）驱动的应用程序进行通信。Chainlit 旨在帮助开发者快速构建基于…

阅读更多...

全网最适合入门的面向对象编程教程：25 类和对象的 Python 实现-Python 判断输入数据类型

全网最适合入门的面向对象编程教程：25 类和对象的 Python 实现-Python 判断输入数据类型

全网最适合入门的面向对象编程教程：25 类和对象的 Python 实现-Python 判断输入数据类型摘要： 本文主要介绍了在使用 Python 面向对象编程时，如何使用 type 函数、isinstance 函数和正则表达式三种方法判断用户输入数据类型，并对…

阅读更多...

PWA(渐进式网页应用）方式实现TodoList桌面应用

PWA(渐进式网页应用）方式实现TodoList桌面应用

参考： https://cloud.tencent.com/developer/article/2322236 todlist网页参考： https://blog.csdn.net/weixin_42357472/article/details/140657576 实现在线网页当成app应用： 一个 PWA 应用首先是一个网页, 是通过 Web 技术编写出的一个网…

阅读更多...

如何全面提升架构设计的质量？

如何全面提升架构设计的质量？

当我们从可扩展、高可用、高性能等角度设计出来架构的时候，我们如何优化架构呢？就需要从成本、安全、测试等角度进行优化。如何设计更好的架构 - 步骤成本低成本复杂度本质低成本手段和应用低成本的主要应用场景安全安全性复杂度本质架构安全…

阅读更多...

大语言模型系列-Transformer：深入探索与未来展望

大语言模型系列-Transformer：深入探索与未来展望

大家好，我是一名测试开发工程师，已经开源一套【自动化测试框架】和【测试管理平台】，欢迎大家联系我，一起【分享测试知识，交流测试技术】 Transformer模型自其问世以来，便迅速在自然语言处理领域崭露头角&a…

阅读更多...

2024年【危险化学品生产单位安全生产管理人员】最新解析及危险化学品生产单位安全生产管理人员考试总结

2024年【危险化学品生产单位安全生产管理人员】最新解析及危险化学品生产单位安全生产管理人员考试总结

题库来源：安全生产模拟考试一点通公众号小程序危险化学品生产单位安全生产管理人员最新解析参考答案及危险化学品生产单位安全生产管理人员考试试题解析是安全生产模拟考试一点通题库老师及危险化学品生产单位安全生产管理人员操作证已考过的学员汇总，…

阅读更多...

mysql基本数据类型（整型）

mysql基本数据类型（整型）

一、常见面试题整型都有哪些基础类型，各占几个字节 tinyint, smallint, mediumint, int, bigint: 1 2 3 4 8 int(n) 是什么意思，什么时候用到指定显示位宽，需配合 zerofill 使用（不够位宽则在前面补0），…

阅读更多...

Could not find a version that satisfies the requirement

Could not find a version that satisfies the requirement

Could not find a version that satisfies the requirement 目录 Could not find a version that satisfies the requirement 【常见模块错误】【解决方案】欢迎来到英杰社区https://bbs.csdn.net/topics/617804998 欢迎来到我的主页，我是博主英杰，2…

阅读更多...

MATLAB被360误杀的解决方案

MATLAB被360误杀的解决方案

前面被误杀，今天又被误杀。前面误杀结果是缺少文件，重装MATLAB也不行。结果重装了操作系统。这次，看到了提示额外小心。当时备份了“病毒”文件，结果备份的也被杀了。解铃还须系铃人在360安全卫士里面恢复，步骤…

阅读更多...

线性代数|机器学习-P27用于深度学习的神经网络结构

线性代数|机器学习-P27用于深度学习的神经网络结构

文章目录 1. 概述2. 参数定义3. CNN 网络 1. 概述 – 1. 卷积神经网络 CNNs – 2. 连续型线性分段函数 F – 3. 损失函数 – 4. 链式法则计算反向传播算法梯度 ∇ F g r a d F \nabla F \mathrm{grad}\; F ∇FgradF 2. 参数定义我们定义每个样本有m维度特征，有…

阅读更多...

java找不到符号解决办法

java找不到符号解决办法

一、java找不到符号如果你的代码里没有报错，明明是存在的。但是java报错找不到符号。如下所示， 二、解决步骤 1.清除编码工具缓存本人用的idea， eclipse清除缓存方式有需要的可以百度一下！ 2.如果是mavne项目的先clean 再…

阅读更多...

流媒体服务器一：使用成熟的流媒体SRS 搭建 RTMP流媒体服务器

流媒体服务器一：使用成熟的流媒体SRS 搭建 RTMP流媒体服务器

1 安装和测试srs流媒体服务器服务器：SRS(Simple RTMP Server，⽀持RTMP、HTTP-FLV，HLS) 推流端：ffmpeg OBS 拉流端：ffplay VLC srs播放器 1.1 安装srs流媒体服务器官网 SRS (Simple Realtime Server) | SRS 码…

阅读更多...

大模型算法面试题（十四）

大模型算法面试题（十四）

本系列收纳各种大模型面试题及答案。 1、微调后的模型出现能力劣化，灾难性遗忘是怎么回事微调后的模型出现能力劣化，灾难性遗忘（Catastrophic Forgetting）是一个在机器学习领域，尤其是在深度学习和大模型应用中频繁出…

阅读更多...

【SpringBoot】6 全局异常捕获

【SpringBoot】6 全局异常捕获

介绍在项目开发中，如果每个 Controller 都增加 try catch 方法去捕获异常及处理，就会导致代码变得很繁琐、效率低下，而大部分异常是不能直接向外抛出，需要有个统一的显示处理方法，因此需要加上全局异常捕获统一获取并…

阅读更多...

推荐文章

最新文章