用kimichat批量识别出图片版PDF文件中的文字内容

news2024/11/28 16:50:21

图片版的PDF文件,怎么才能借助AI工具来提取其中全部的文字内容呢?

第一步:将PDF文件转换成图片格式

具体方法参见文章:《零代码编程:用kimichat将图片版PDF自动批量分割成多个图片》

第二步:识别图片中的文字

将第一步pdf转换成的图片,上传到kimichat

注意:kimichat目前上传图片一次最多50张图片,单个大小不超过100M

上传完成后,kimichat会进行解析。

部分图片会提示:未提取到文字或者解析失败

点击这些解析失败图片的右上角红色X,把这些无法解析的图片删除掉

然后回车,就全部识别出来到了。但是,识别的顺序不是按照文件标题名来的,有些乱,可以让kimichat调整下:

请按照图片标题顺序排列

Kimichat最终的输出结果:

当然,根据您提供的图片标题顺序,这里是整理后的文字内容:

  1. **page_5.png:**
    - I'll Be α
    - COWBOY
    - Anita Bijsterbosch
    - Clavis
    - NEWYORK
  2. **page_6.png:**
    - “Mommy, there's a party at school
    - tomorrow, and we get to wear
    - costumes!" Sammy says.
  3. **page_8.png:**
    - "I think I'll be
    - a cowboy.
    - lasso"
  4. **page_9.png:**
    - cowboyhat
    - Shirt .........
    - vest
    - ....
    - Fringed pants
    - cowboy boots
    - spurs
  5. **page_10.png:**
    - "Yee-Haw!"
  6. **page_12.png:**
    - "Or wait, I'll go as
    - a firefighter."
    - dragon
    - walkie-talkie
    - Fire engine
    - Flashlight
  7. **page_13.png:**
    - helmet
    - Firefighter suit
    - gloves
    - Firefighter boots
  8. **page_15.png:**
    - "Fire!"
  9. **page_16.png:**
    - "Hmm, perhaps
    - I'll be a pirate."
    - parrot
    - JollyRoger
    - treasure map
    - treasure chest
    - spyglass
  10. **page_17.png:**
    - bandana
    - eyepatch
    - striped T-shirt
    - ......
    - belt
    - trousers
    - buccaneer
    - boots
  11. **page_19.png:**
    - Land
    - ho!"
  12. **page_20.png:**
    - “Or I could
    - gc
    - as a knight.
    - castle
    - horse
    - cuddly toy
    - Feather
    - dragon
    - Sword”
  13. **page_21.png:**
    - helmet
    - armor
    - shield
    - gauntlet
    - boots
  14. **page_23.png:**
    - Tan-tan-tara!
  15. **page_24.png:**
    - "I could be
    - a magician...
    - wand"
  16. **page_25.png:**
    - magic hat
    - OD
    - boots
  17. **page_26.png:**
    - "+"
  18. **page_27.png:**
    - Abracadabra!
  19. **page_28.png:**
    - “Or maybe
    - I should
    - just go
    - as myself?”
  20. **page_29.png:**

- T-shirt

- overalls

- boots

这些文字内容似乎是从一本关于职业和角色扮演的儿童书中提取的。如果您需要进一步的信息或帮助,请随时联系我。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1562437.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Springboot之Actuator的渗透

1. env http://ip:8080/actuator/env GET 请求 /env 会直接泄露环境变量、内网地址、配置中的用户名等信息;当程序员的属性名命名不规范,例如 password 写成 psasword、pwd 时,会泄露密码明文; 2.heapdump Heapdump地址为http…

互联网轻量级框架整合之JavaEE基础II

编写本篇代码并实际执行之前请仔细阅读前一篇互联网轻量级框架整合之JavaEE基础I Servlet 在Servlet容器中,Servlet是最基础的组件,也可以把JSP当做Servlet,JSP的存在意义只在于方便编写动态页面,使Java语言能和HTML相互结合&…

深度学习-计算机视觉入门-part1

计算机视觉入门 文章目录 计算机视觉入门一、 从卷积到卷积神经网络1.图像的基本表示2. 卷积操作3.卷积遇见深度学习3.1 通过学习寻找卷积核3.2 参数共享:卷积带来参数量骤减3.3 稀疏交互:获取更深入的特征 二、手撕卷积代码三、经典CNN模型介绍四、CNN模…

爬取BOSS直聘招聘数据(详情页数据+__zp_stoken__逆向)

这里携带逆向方法进行请求 获得数据 需要逆向方法请私聊 , 下面部分只展示爬取思路 对网页进行分析抓包 设置参数 – 城市/薪资范围/职业 对网页进行请求获得数据集 利用xpath,soup等进行进行数据清洗 将数据一csv的格式保存

【面试八股总结】超文本传输协议HTTP(一)

一、 什么是HTTP协议? HTTP是超文本传输协议 HyperText Transfer Protocol 特性: 简单、灵活、易于扩展无状态:服务器不会记忆HTTP状态不安全:通信使用明文,不验证通信方身份,无法的证明报文的完整性&…

研发设计人员能力级别定义

研发设计人员能力&级别定义 1. 源由2. 级别定义3. 级别能力3.1 助理工程师3.1.1 工作内容3.1.2 级别晋升3.1.3 详细描述 3.2 初级工程师3.2.1 工作内容3.2.2 级别晋升3.2.3 详细描述 3.3 高级工程师3.3.1 工作内容3.3.2 级别晋升3.3.3 详细描述 3.4 资深工程师3.4.1 工作内…

百度网站收录提交入口

百度网站收录提交入口 在网站刚建立或者更新内容后,及时将网站提交给搜索引擎是提高网站曝光和获取流量的重要步骤之一。百度作为中国最大的搜索引擎之一,网站在百度中的收录情况尤为重要。下面介绍一下如何通过百度的网站收录提交入口提交网站。 1. 百…

黑马HTMLCSS基础

黑马的笔记和资料都是提供好了的,这个文档非常适合回顾复习。我在黑马提供的笔记上做了一些微不足道的补充,以便自己复习查阅。该笔记比较重要的部分是 表单,http请求 第一章. HTML 与 CSS HTML 是什么:即 HyperText Markup lan…

VScode 集成终端设置默认打开当前文件夹 mac系统

一.快捷键设置 搜索 openInIntegratedTerminal 如图: 二.设置cmd 默认打开位置 点击设置 搜索 ntegrated:cwd 如下图: 三.查看ip 快捷指令: ipconfig getifaddr en0

【御控物联】JSON结构数据转换在物联业务中应用(场景案例二)

文章目录 一、物联网业务场景现状二、物联网业务场景数据交互格式三、JSON格式数据转换案例四、JSON数据格式转换DEMO五、在线转换工具六、技术资料 一、物联网业务场景现状 目前,市场上多数物联网关与物联平台捆绑售卖,网关采集到设备数据只能按照指定…

亲测可用,解决matplotlib中文字体乱码问题(使用Windows设置)

SimHei字体下载 https://pan.baidu.com/s/14BzhntzSeEjE4FmlVENwUw?pwd1111 用我自己的,看了好几个其他博主的帖子,所用的下载链接都失效了,太TM不靠谱了 import matplotlib.pyplot as plt import random x range(60) x_ticks_label ["11点{}分".format(i) for …

HashMap 集合源码分析

系列文章目录 文章目录 系列文章目录前言谈一谈HashMap的红黑树节点类 TreeNode 设计一、字段分析二、构造方法分析三、内部类分析四、方法分析五、扩容分析六、总结 前言 HashMap 底层是使用了 哈希表(数组实现的哈希表) 链表 红黑树 实现的&#xff…

Spring框架之WebFlux

Spring WebFlux高级实战 1、WebFlux作为核心响应式服务器基础 Spring 框架的整个基础设施都是围绕Servlet API 构建的,它们之间紧密耦合。 因此在开始深入响应式Web 之前,先回顾一下Web 模块的设计,看看它做了什么。 底层Servlet 容器负责…

mysql 数据库的MHA高可用

目录 一、MHA概述: 1.认识MHA: 2.MHA 的组成: 3.MHA 的特点: 4.MHA 工作原理: 5.数据流向: 6.数据同步方式: 7. mysql 的高可用 : 二. MySQL MHA 的搭建: 1. 修改 Master、…

LeetCode刷题:无重复字符的最长子串 详解 【3/1000 第三题】

👤作者介绍:10年大厂数据\经营分析经验,现任大厂数据部门负责人。 会一些的技术:数据分析、算法、SQL、大数据相关、python 作者专栏每日更新: LeetCode解锁1000题: 打怪升级之旅 LeetCode解锁1000题: 打怪升级之旅htt…

单片机简介(一)

51单片机 一台能够运行的计算机需要CPU做运算和控制,RAM做数据存储,ROM做程序存储,还有输入/输出设备(串行口、并行输出口等),这些被分为若干块芯片,安装在主板(印刷线路板&#xf…

文本直接生成2分钟视频,即将开源模型StreamingT2V

Picsart人工智能研究所、德克萨斯大学和SHI实验室的研究人员联合推出了StreamingT2V视频模型。通过文本就能直接生成2分钟、1分钟等不同时间,动作一致、连贯、没有卡顿的高质量视频。 虽然StreamingT2V在视频质量、多元化等还无法与Sora媲美,但在高速运…

记一次 pdfplumber 内存泄漏导致的服务器宕机

有一个项目需求,要在每天凌晨5点的时候执行一个任务,获取一系列的PDF文件并解析。 后端是Django框架,定时任务用Celery来实现的。 本地跑没什么问题,但是一放到服务器上跑就会宕机,而且是毫无征兆的宕机,…

css- 4

1.浮动 1. 浮动最初用于实现文字环绕效果 2. 现在,浮动是主流的布局方式之一 1.1元素浮动之后的特点 元素浮动之后,称为浮动元素,具有如下特点: 1. 浮动元素脱离文档流 2. 多个浮动的元素会水平排列,一行放不下自动换…

【STM32嵌入式系统设计与开发】——14PWM(pwm脉宽输入应用)

这里写目录标题 一、任务描述二、任务实施1、WWDG工程文件夹创建2、函数编辑(1)主函数编辑(2)USART1初始化函数(usart1_init())(3)USART数据发送函数( USART1_Send_Data(&#xff09…