python实现截图识别文字v2.0[脱离开发环境]

news2024/12/28 11:15:17

目录

1、简介

2、如何使用

3、完整代码

4、免费下载

5、说明文档


🍃作者介绍:双非本科大三网络工程专业在读,阿里云专家博主,专注于Java领域学习,擅长web应用开发、数据结构和算法,初步涉猎Python人工智能开发和前端开发。
🦅主页:@逐梦苍穹

📕所属专栏:项目
🍔您的一键三连,是我创作的最大动力🌹

1、简介

这个程序创建了一个屏幕截图工具的GUI应用程序,允许用户选择区域截图并进行文字识别。

它解决了以下问题:

  1. 提供了一个GUI界面,让用户选择屏幕上的区域进行截图。
  2. 使用Tesseract OCR进行文字识别,将截取的文本复制到剪贴板。
  3. 根据配置文件中的设置,可以自动删除截图。
  4. 它比微信提取文字更精确

下面是对比情况:

204ce6881de94796b0853f7d4d2d02f0.png

2、如何使用

首先会得到一个初始的文件夹,各个文件的作用如下所示(未提及的文件均不可动):

ee816aa0b15146db845574865cc3f9e0.png

切记:仔细查看说明文档!

执行初始化脚本的过程,当看见successfully则表示成功!

de839117443b7c66f5666cc44c117f2d.png

1aeb5f5a7c0dc48740545af6f3cc419a.png

执行了初始化准备环境之后,得到的文件夹结果是:

1822bc1248e3437abe12cb504a805a99.png

运行了extraction.exe之后会得到一个窗口(这个用处不大):

ce17dcad850c4796880b3dcc73d92de5.png

看到这个就证明运行成功了。接下来就可以双击设置好的快捷键,开始截图:

9b47c614c58e48ad983982c0d4296433.png

0c0b8b95560946a79520657f332d1c7a.png

这个就是截图的应用程序。

如果双击快捷键之后截图界面没有出来,则在自己电脑的状态栏点击一下打开即可(右边那个就是截图窗口):

49d9862ce96b470fa97e4224f3117004.png

3、完整代码

完整代码如下,代码即注释:

# 导入必要的模块
from datetime import datetime  # 用于获取当前日期和时间
from tkinter import *  # 用于创建 GUI 界面
import pyautogui  # 用于屏幕截图
from PIL import ImageGrab  # 用于处理图像数据
import os  # 用于文件和目录操作
import pytesseract  # 用于文字识别
import pyperclip  # 用于剪贴板操作

# 设置 Tesseract OCR 的路径和配置
tesseract_exe = r'.\Tesseract-OCR\tesseract.exe'
tessdata_dir = r'.\Tesseract-OCR\tessdata'
pytesseract.pytesseract.tesseract_cmd = tesseract_exe
tessdata_dir_config = '--tessdata-dir "{}"'.format(tessdata_dir)

# 创建一个名为 ScreenCaptureApp 的类
class ScreenCaptureApp:
    def __init__(self, root):
        # 初始化应用程序的根窗口
        self.root = root
        self.root.attributes('-fullscreen', True)  # 设置窗口全屏
        self.root.attributes('-alpha', 0.1)  # 设置窗口透明度
        self.root.title("Area capture")  # 设置窗口标题

        # 获取屏幕的宽度和高度
        self.screen_width, self.screen_height = pyautogui.size()

        # 创建一个 Canvas 控件用于显示截图区域
        self.canvas = Canvas(self.root, cursor="cross")
        self.canvas.pack(fill=BOTH, expand=YES)

        # 绑定鼠标事件处理函数
        self.canvas.bind("<ButtonPress-1>", self.on_press)
        self.canvas.bind("<B1-Motion>", self.on_drag)
        self.canvas.bind("<ButtonRelease-1>", self.on_release)

        # 初始化一些坐标和变量
        self.start_x = None
        self.start_y = None
        self.end_x = None
        self.end_y = None
        self.rect = None
        self.mask_rect = None
        self.image_path = None

        # 更新窗口大小
        self.update_window_size()

    # 更新窗口大小
    def update_window_size(self):
        screen_width = self.root.winfo_screenwidth()
        screen_height = self.root.winfo_screenheight()
        self.root.geometry("%dx%d" % (screen_width, screen_height))

    # 鼠标按下事件处理函数
    def on_press(self, event):
        self.start_x = self.canvas.canvasx(event.x)
        self.start_y = self.canvas.canvasy(event.y)
        if self.rect:
            self.canvas.delete(self.rect)
        if self.mask_rect:
            self.canvas.delete(self.mask_rect)
        self.rect = self.canvas.create_rectangle(self.start_x, self.start_y, self.start_x, self.start_y, outline="blue", fill="blue",
                                                 stipple='gray25', width=3)

    # 鼠标拖动事件处理函数
    def on_drag(self, event):
        cur_x = self.canvas.canvasx(event.x)
        cur_y = self.canvas.canvasy(event.y)
        self.canvas.coords(self.rect, self.start_x, self.start_y, cur_x, cur_y)
        self.update_mask(cur_x, cur_y)

    # 鼠标释放事件处理函数
    def on_release(self, event):
        self.end_x = self.canvas.canvasx(event.x)
        self.end_y = self.canvas.canvasy(event.y)
        # 计算截图区域的坐标
        if self.start_x < self.end_x and self.start_y < self.end_y:
            left = self.start_x
            top = self.start_y
            right = self.end_x
            bottom = self.end_y
        # ... (其他情况的计算省略)

        # 使用 ImageGrab.grab 截取屏幕图像
        screenshot = ImageGrab.grab(bbox=(left, top, right, bottom))

        # 获取当前脚本的目录和当前日期时间
        script_directory = os.path.dirname(os.path.abspath(__file__))
        current_datetime = datetime.now().strftime("%Y-%m-%d-%H%M%S")

        # 构建图像文件名
        file_name = f"xzlScreenshot-{current_datetime}.png"
        self.image_path = os.path.join(script_directory, "image/" + file_name)

        # 保存截图到文件
        screenshot.save(self.image_path)

        # 配置 Tesseract OCR 参数
        custom_config = r'--oem 3 --psm 6 -c preserve_interword_spaces=1'

        # 使用 pytesseract 进行文字识别
        text = pytesseract.image_to_string(screenshot, lang='+'.join(['eng', 'chi_sim']), config=f'--tessdata-dir "{tessdata_dir}" {custom_config}')

        # 将识别结果复制到剪贴板
        pyperclip.copy(text)

        # 读取配置文件并检查是否需要自动删除截图
        with open('config.txt', 'r', encoding="utf-8") as file:
            content = file.read()
        key_value_pairs = content.strip().split('\n')
        for i in range(0, len(key_value_pairs)):
            key = key_value_pairs[i].split('=')
            value = key[1]
            if str(key[0]) == "autoDeleteImg":
                auto_delete_img_value = value
                break
        if int(auto_delete_img_value) == int(1):
            if self.image_path:
                os.remove(self.image_path)

        # 关闭应用程序窗口
        self.root.destroy()

    # 更新遮罩效果
    def update_mask(self, cur_x, cur_y):
        if self.mask_rect:
            self.canvas.delete(self.mask_rect)
        self.mask_rect = self.canvas.create_rectangle(0, 0, self.root.winfo_screenwidth(), self.root.winfo_screenheight(), fill="black", )
        self.canvas.tag_lower(self.mask_rect)
        self.canvas.coords(self.mask_rect, self.start_x, self.start_y, cur_x, cur_y)

# 主函数,创建应用程序对象并运行
def main():
    root = Tk()
    app = ScreenCaptureApp(root)
    root.mainloop()

# 检查脚本是否作为主程序运行
if __name__ == "__main__":
    main()

4、免费下载

下载的安装包是不需要独立安装第三方模块以及环境的,都已经集成好了。

链接如下:

链接:https://pan.baidu.com/s/1X60c6Egl-CogSPOL2WTnbg?pwd=1234 
提取码:1234

5、说明文档

说明文档内容如下:

@Author: CSDN@逐梦苍穹
这是程序的说明文档。
条款和条件:
①这个应用程序是完全免费的,没有商业用途。
②本程序由"CSDN@逐梦苍穹"编写,CSDN博客账号:“https://blog.csdn.net/qq_60735796”


注意事项:
①程序存放的路径必须全是英文的
②所有级别的文件夹和目录名称之间不能有空格。
③各级文件夹和目录的字符中不允许使用汉字。
④最好不要在各级文件夹和目录中使用特殊字符。


使用说明:
①使用说明中未提及的文件夹,不得以任何方式删除或修改。
如果有任何更改,将影响程序的运行。

②如果您准备第一次运行这个程序,请先配置好config.txt文件的内容。
config.txt文件是这个应用程序的配置文件。存储为键值对。
(请记住,“=”左侧的内容不能修改)
原始参数信息如下:
     autoDeleteImg=0
     shortcutKeys=f2
     LetterOfTheDriveWhereTheCurrentFileResides=D
     CurrentFileAbsolutePath=D:\Python\package_exe\extractionByXzl
如果你在使用该程序识别文本并将其放入剪贴板之后,希望能够自动删除图像,请设置"autoDeleteImg = 1",否则将其设置为0。
如果您想修改使用的快捷键,需要设置"shortcutKeys"的值。
(如果您不知道如何设置快捷键"shortcutKeys"的值,请运行"Check-Shortcut-Keys.exe"程序。按下相应的键,控制台将向您展示如何编写快捷键的值!)
重要的是,你需要把"LetterOfTheDriveWhereTheCurrentFileResides"设置为当前文件夹存放的驱动器字母,并将"CurrentFileAbsolutePath"的值设置为当前文件夹的绝对路径!

③设置完以上参数后,双击"environmentConfiguration.bat"文件启动程序,执行程序环境的初始化操作。(该操作只需要第一次执行,以后不需要再次执行)

④初始化执行环境后,可以开始执行启动文件"extract.exe"
(这是应用程序的核心启动文件,相关功能由它启动)。
(出现“Active code page: 65001”表示成功)。
此时,双击您设置的快捷键,就可以开始截图和自动识别文本到剪切板。


⑤如果要识别的字符比较多,操作可能会比较慢。

如果本地有python环境的,也可以看我之前这篇:

python实现截图识别文字(已打包成exe程序)_pytesseract 自动识别截图-CSDN博客icon-default.png?t=N7T8https://blog.csdn.net/qq_60735796/article/details/133916453

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1395204.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

element-ui 打包流程源码解析(下)

目录 目录结构和使用1&#xff0c;npm 安装1.1&#xff0c;完整引入1.2&#xff0c;按需引入 2&#xff0c;CDN3&#xff0c;国际化 接上文&#xff1a;element-ui 打包流程源码解析&#xff08;上&#xff09; 文章中提到的【上文】都指它 ↑ 目录结构和使用 我们从使用方式来…

简单高效学习 LaTeX 007 - LaTex Format Control 科学排版之格式控制

这一集的视频演示了如何在LaTeX中进行排版的格式控制&#xff1a; https://www.douyin.com/user/self?modal_id7303925716830211379&showTabpost

ubuntu系统 vscode 配置c/c++调试环境

文章目录 1.安装插件2.目录结构3.cmake tools配置 1.安装插件 c/c插件 cmake cmake tools插件 2.目录结构 . ├── build ├── CMakeLists.txt ├── demo │ └── main.cpp ├── image.png ├── src │ ├── add.cpp │ └── add.hpp └── vsdebug.…

Debian 11.8.0 安装图解

引导和开始安装 这里直接回车确认即可&#xff0c;选择图形化安装方式。 选择语言 这里要区分一下&#xff0c;当前选中的语言作为安装过程中安装器所使用的语言&#xff0c;这里我们选择中文简体。不过细心的同学可能发现&#xff0c;当你选择安装器语言之后&#xff0c;后续安…

汽车用螺纹紧固件的拧紧力矩规范主要考虑哪些方面——SunTorque智能扭矩系统

在汽车制造过程中&#xff0c;螺纹紧固件是连接和固定各个零部件的重要元件。为了保证汽车的可靠性和安全性&#xff0c;对于螺纹紧固件的拧紧力矩有着严格的规定和规范。SunTorque智能扭矩系统和大家一起掌握这一重要知识点。 拧紧力矩是指将螺纹紧固件拧紧到预定位置所需的力…

最小公倍数之和(莫比乌斯反演P3911)

路径&#xff1a; P3911 最小公倍数之和 - 洛谷 | 计算机科学教育新生态 (luogu.com.cn) 思路&#xff1a; 代码&#xff1a; #define _CRT_SECURE_NO_WARNINGS #include<iostream> #include<string> #include<cstring> #include<cmath> #include<…

新上线一个IT公司微信小程序

项目介绍 项目背景: 一家IT公司,业务包含以下六大块: 1、IT设备回收 2、IT设备租赁 3、IT设备销售 4、IT设备维修 5、IT外包 6、IT软件开发 通过小程序,提供在线下单,在线制单,在线销售,业务介绍,推广,会员 项目目的: 业务介绍: 包含企业业务介绍 客户需…

蓝桥杯(C++ 整数删除 优先队列 )

优先队列&#xff1a; 优先队列具有队列的所有特性&#xff0c;包括队列的基本操作&#xff0c;只是在这基础上添加了内部的一个排序&#xff0c;它本质是一个堆实现的。 1.头文件&定义 #include <queue> #include <functional> //greater<>// 定义 p…

设计模式之“接口隔离原则“:打破僵化,实现灵活编程

在现代软件开发中&#xff0c;设计模式是解决常见问题的最佳实践。其中&#xff0c;接口隔离原则&#xff08;Interface Segregation Principle&#xff0c;简称ISP&#xff09;是面向对象设计模式中的重要原则之一。本文将深入解析接口隔离原则&#xff0c;帮助您理解其重要性…

学习Spring的第五天(Bean的依赖注入)

Bean的依赖注入有两种方式: 一 . 常规Bean的依赖注入 很简单,不过多赘述了,注意ref: 是构造函数或set方法的参数,一般为对象, value: 是构造函数或set方法的参数,一般为值. 看下图 1.1 下面来演示一下集合数据类型的关于Bean的依赖注入 1.1.1这是List的注入(演示泛型为Strin…

AppLovin员工爆料:年底遭暴力辞退。6点通知,直接走人,一分不赔。

* 你好&#xff0c;我是前端队长&#xff0c;在职场&#xff0c;玩副业&#xff0c;文末有福利!&#xff01; 今天&#xff0c;队长看到一个帖子&#xff0c;内容是关于一个员工&#xff0c;在 applovin 公司突然被辞退的经历。 故事的主角&#xff0c;是位尽心尽力的职员&…

墙地砖外形检测的技术方案-外部轮廓检测算法

Ramer算法 利用Canny算子得到墙地砖轮廓后&#xff0c;必须进一步将轮廓线精确分段成墙地砖的四条边&#xff0c;从而可得到墙地砖轮廓尺寸、边直度和直角度指标。采用如下算法实现&#xff1a; 第1&#xff0c;选择较高阈值&#xff0c;利用ramer算法将轮廓线用多边形&#…

PHP Fatal error: Unparenthesized `a ? b : c ? d : e` is not supported.

这个错误是关于三元运算符的错误 这个错误在php8.0以下的版本好像是没问题呢 PHP Fatal error: Unparenthesized a ? b : c ? d : e is not supported. Use either (a ? b : c) ? d : e or a ? b : (c ? d : e) in /cangku/app/common.php on line 57 这个问题是 程…

2024年甘肃省职业院校技能大赛信息安全管理与评估 样题三 理论题

竞赛需要完成三个阶段的任务&#xff0c;分别完成三个模块&#xff0c;总分共计 1000分。三个模块内容和分值分别是&#xff1a; 1.第一阶段&#xff1a;模块一 网络平台搭建与设备安全防护&#xff08;180 分钟&#xff0c;300 分&#xff09;。 2.第二阶段&#xff1a;模块二…

第三讲_ArkTS的初识

ArkTS的初识 1. ArkTS的基本组成2. ArkTS自定义组件 1. ArkTS的基本组成 装饰器&#xff1a; 用于装饰类、结构、方法以及变量&#xff0c;并赋予其特殊的含义。自定义组件&#xff1a;可复用的UI单元&#xff0c;可组合其他组件&#xff0c;图示中Component装饰的struct Hello…

gitgud.io+Sapphire注册账号教程

gitgud.io是一个仓库&#xff0c;地址 https://gitgud.io/&#xff0c;点进去之后会看到注册页面。 意思是需要通过注册这个Sapphire账户来登录。点击右边的Sapphire&#xff0c;就跳转到Sapphire的登陆页面&#xff0c;点击创建新账号&#xff0c;就进入注册页面。&#xff0…

阿里云地域和可用区分布表,2024更新

2024年阿里云服务器地域分布表&#xff0c;地域指数据中心所在的地理区域&#xff0c;通常按照数据中心所在的城市划分&#xff0c;例如华北2&#xff08;北京&#xff09;地域表示数据中心所在的城市是北京。阿里云地域分为四部分即中国、亚太其他国家、欧洲与美洲和中东&…

【.NET Core】 多线程之(Thread)详解

【.NET Core】 多线程之&#xff08;Thread&#xff09;详解 文章目录 【.NET Core】 多线程之&#xff08;Thread&#xff09;详解一、概述二、线程的创建和使用2.1 ThreadStart用于无返回值&#xff0c;无参数的方法2.2 ParameterizedThreadStart:用于带参数的方法 三、线程的…

【Redis】Redis基础

Redis基础 初识Redis 认识NoSQL SQL&#xff1a;结构化查询语言 > 关系型数据库 NoSQL&#xff1a;非关系型数据库 SQL与NoSQL的差异&#xff1a; 数据结构 SQL结构化&#xff1a;表的信息依赖于表的结构NoSQL非结构化&#xff1a;存储的信息为KV形式 数据关联 SQL关联…

OpenCV-Python(47):支持向量机

原理 线性数据分割 如下图所示&#xff0c;其中含有两类数据&#xff0c;红的和蓝的。如果是使用kNN算法&#xff0c;对于一个测试数据我们要测量它到每一个样本的距离&#xff0c;从而根据最近的邻居分类。测量所有的距离需要足够的时间&#xff0c;并且需要大量的内存存储训…