mmocr安装和使用

news2026/2/12 6:27:56

https://github.com/open-mmlab/mmocr/blob/main/README_zh-CN.md
https://mmocr.readthedocs.io/en/dev-1.x/get_started/quick_run.html

介绍

MMOCR 是基于 PyTorch 和 mmdetection 的开源工具箱，专注于文本检测，文本识别以及相应的下游任务，如关键信息提取。它是 OpenMMLab 项目的一部分。

安装

安装依赖包：
根据cuda版本下载pytorch

在这里插入图片描述

pip install mmdet
pip install mmcv

安装mmocr

git cone https://github.com/open-mmlab/mmocr.git

pip install -e .

OCR代码：

from mmocr.apis import MMOCRInferencer
ocr = MMOCRInferencer(det='DBNet', rec='CRNN')
ocr('demo/demo_text_ocr.jpg',     show=True, print_result=True)

安装报错：
ERROR: Could not build wheels for mmcv, which is required to install pyproject.toml-based projects

那把pip安装换成mim安装

pip install -U openmim

–》

mim install mmcv

没有解决

安装visual studio 2022

pip install mmcv

还是报相同错。参考https://blog.csdn.net/qq_44042678/article/details/131486896 在这里插入图片描述

实践

识别结果：
在这里插入图片描述

可以使用别的检测和识别模型：
使用textsnake算法
在这里插入图片描述
其他算法：

其他

训练识别模型用自己的字典
在这里插入图片描述
训练其他语言识别模型吗

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1546446.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

mmocr安装和使用

介绍

安装

实践

其他

相关文章

Chromium 通过IDL方式添加扩展API，并且在普通网页也可以调用

探索网络分析：图理论算法介绍及其如何用于地理空间分析

【探究图论中dfs记忆化，搜索，递推，回溯关系】跳棋，奶牛隔间，小A和uim之大逃离 II

【JavaScript】JavaScript 程序流程控制 ⑧ ( 循环控制关键字 | continue 关键字 | break 关键字 )

登录注册界面

蓝牙信标定位精度

NVIDIA A100 NVLink 和 NVIDIA A100 PCIe的区别？

深度学习的发展历史（深度学习入门、学习指导）

【实战】服务隐藏与排查 | Windows 应急响应

JDK8中ArrayList扩容机制

C语言-如何判断当前环境是大端存储还是小端存储

Spring设计模式-实战篇之单例模式

Ubuntu20.04修改屏幕分辨率

秋招刷题2

黑马鸿蒙学习（3）：滑动条

安踏与耐克的赛场，不止在中国

算法笔记~—位运算

Focal Modulation Networks聚焦调制网络

latex报错Undefined control sequence.

YOLOv9改进策略：注意力机制 | 动态稀疏注意力的双层路由方法BiLevelRoutingAttention | CVPR2023