python实现截图识别文字(已打包成exe程序)

news2025/1/19 23:24:20

 

目录

1、简介

2、如何使用

3、完整代码

4、免费下载⭐⭐


在这里给大家安利一个自己开发的截图识别文字的程序!

程序使用的前提,是电脑本机装了Python环境!(版本不限)

1、简介

这段代码创建了一个屏幕截图工具的GUI应用程序,允许用户选择区域截图并进行文字识别。

它解决了以下问题:

  1. 提供了一个GUI界面,让用户选择屏幕上的区域进行截图。
  2. 使用Tesseract OCR进行文字识别,将截取的文本复制到剪贴板。
  3. 根据配置文件中的设置,可以自动删除截图。
  4. 它比微信提取文字更精确

下面是对比情况:

2、如何使用

首先会得到一个初始的文件夹,各个文件的作用如下所示(未提及的文件均不可动):

切记:仔细查看说明文档!

执行了初始化准备环境之后,得到的文件夹结果是:

运行了extraction.exe之后会得到一个窗口(这个用处不大):

看到这个就证明运行成功了。接下来就可以双击设置好的快捷键,开始截图:

这个就是截图的应用程序。

如果双击快捷键之后截图界面没有出来,则在自己电脑的状态栏打开即可。

3、完整代码

# 导入必要的模块
from datetime import datetime  # 用于获取当前日期和时间
from tkinter import *  # 用于创建 GUI 界面
import pyautogui  # 用于屏幕截图
from PIL import ImageGrab  # 用于处理图像数据
import os  # 用于文件和目录操作
import pytesseract  # 用于文字识别
import pyperclip  # 用于剪贴板操作

# 设置 Tesseract OCR 的路径和配置
tesseract_exe = r'.\Tesseract-OCR\tesseract.exe'
tessdata_dir = r'.\Tesseract-OCR\tessdata'
pytesseract.pytesseract.tesseract_cmd = tesseract_exe
tessdata_dir_config = '--tessdata-dir "{}"'.format(tessdata_dir)

# 创建一个名为 ScreenCaptureApp 的类
class ScreenCaptureApp:
    def __init__(self, root):
        # 初始化应用程序的根窗口
        self.root = root
        self.root.attributes('-fullscreen', True)  # 设置窗口全屏
        self.root.attributes('-alpha', 0.1)  # 设置窗口透明度
        self.root.title("Area capture")  # 设置窗口标题

        # 获取屏幕的宽度和高度
        self.screen_width, self.screen_height = pyautogui.size()

        # 创建一个 Canvas 控件用于显示截图区域
        self.canvas = Canvas(self.root, cursor="cross")
        self.canvas.pack(fill=BOTH, expand=YES)

        # 绑定鼠标事件处理函数
        self.canvas.bind("<ButtonPress-1>", self.on_press)
        self.canvas.bind("<B1-Motion>", self.on_drag)
        self.canvas.bind("<ButtonRelease-1>", self.on_release)

        # 初始化一些坐标和变量
        self.start_x = None
        self.start_y = None
        self.end_x = None
        self.end_y = None
        self.rect = None
        self.mask_rect = None
        self.image_path = None

        # 更新窗口大小
        self.update_window_size()

    # 更新窗口大小
    def update_window_size(self):
        screen_width = self.root.winfo_screenwidth()
        screen_height = self.root.winfo_screenheight()
        self.root.geometry("%dx%d" % (screen_width, screen_height))

    # 鼠标按下事件处理函数
    def on_press(self, event):
        self.start_x = self.canvas.canvasx(event.x)
        self.start_y = self.canvas.canvasy(event.y)
        if self.rect:
            self.canvas.delete(self.rect)
        if self.mask_rect:
            self.canvas.delete(self.mask_rect)
        self.rect = self.canvas.create_rectangle(self.start_x, self.start_y, self.start_x, self.start_y, outline="blue", fill="blue",
                                                 stipple='gray25', width=3)

    # 鼠标拖动事件处理函数
    def on_drag(self, event):
        cur_x = self.canvas.canvasx(event.x)
        cur_y = self.canvas.canvasy(event.y)
        self.canvas.coords(self.rect, self.start_x, self.start_y, cur_x, cur_y)
        self.update_mask(cur_x, cur_y)

    # 鼠标释放事件处理函数
    def on_release(self, event):
        self.end_x = self.canvas.canvasx(event.x)
        self.end_y = self.canvas.canvasy(event.y)
        # 计算截图区域的坐标
        if self.start_x < self.end_x and self.start_y < self.end_y:
            left = self.start_x
            top = self.start_y
            right = self.end_x
            bottom = self.end_y
        # ... (其他情况的计算省略)

        # 使用 ImageGrab.grab 截取屏幕图像
        screenshot = ImageGrab.grab(bbox=(left, top, right, bottom))

        # 获取当前脚本的目录和当前日期时间
        script_directory = os.path.dirname(os.path.abspath(__file__))
        current_datetime = datetime.now().strftime("%Y-%m-%d-%H%M%S")

        # 构建图像文件名
        file_name = f"xzlScreenshot-{current_datetime}.png"
        self.image_path = os.path.join(script_directory, "image/" + file_name)

        # 保存截图到文件
        screenshot.save(self.image_path)

        # 配置 Tesseract OCR 参数
        custom_config = r'--oem 3 --psm 6 -c preserve_interword_spaces=1'

        # 使用 pytesseract 进行文字识别
        text = pytesseract.image_to_string(screenshot, lang='+'.join(['eng', 'chi_sim']), config=f'--tessdata-dir "{tessdata_dir}" {custom_config}')

        # 将识别结果复制到剪贴板
        pyperclip.copy(text)

        # 读取配置文件并检查是否需要自动删除截图
        with open('config.txt', 'r', encoding="utf-8") as file:
            content = file.read()
        key_value_pairs = content.strip().split('\n')
        for i in range(0, len(key_value_pairs)):
            key = key_value_pairs[i].split('=')
            value = key[1]
            if str(key[0]) == "autoDeleteImg":
                auto_delete_img_value = value
                break
        if int(auto_delete_img_value) == int(1):
            if self.image_path:
                os.remove(self.image_path)

        # 关闭应用程序窗口
        self.root.destroy()

    # 更新遮罩效果
    def update_mask(self, cur_x, cur_y):
        if self.mask_rect:
            self.canvas.delete(self.mask_rect)
        self.mask_rect = self.canvas.create_rectangle(0, 0, self.root.winfo_screenwidth(), self.root.winfo_screenheight(), fill="black", )
        self.canvas.tag_lower(self.mask_rect)
        self.canvas.coords(self.mask_rect, self.start_x, self.start_y, cur_x, cur_y)

# 主函数,创建应用程序对象并运行
def main():
    root = Tk()
    app = ScreenCaptureApp(root)
    root.mainloop()

# 检查脚本是否作为主程序运行
if __name__ == "__main__":
    main()

4、免费下载⭐⭐

下载的安装包是不需要独立安装第三方模块的,都已经集成好了。

应用程序的压缩包已经上传到云服务器了,访问公网地址就可以下载了:截图提取文字应用程序压缩包.zip

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1107161.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

雷达基础导论及MATLAB仿真

文章目录 前言一、雷达基础导论二、Matlab 仿真1、SNR 相对检测距离的仿真①、Matlab 源码②、仿真1&#xff09;、不同 RCS&#xff0c;SNR 相对检测距离仿真2&#xff09;、不同雷达峰值功率&#xff0c;SNR 相对检测距离仿真 2、脉冲宽度相对所要求的 SNR 仿真①、Matlab 源…

【字符串匹配算法】KMP、哈希

STL O(mn) C中提供子串查询的函数可以使用std::string类的相关方法来实现。 find函数&#xff1a;可以查找一个子串在原字符串中的第一个出现位置。它返回子串的起始索引&#xff0c;如果找不到则返回std::string::npos。substr函数&#xff1a;可以提取原字符串中的一个子串…

代码随想录二刷 Day42

62.不同路径 简单题目自己就可以写出来&#xff0c;注意下创建二维vector的方法就可以&#xff0c; dp table如下 class Solution { public:int uniquePaths(int m, int n) {vector<vector<int>> dp(m,vector<int>(n,0));for (int i 0; i < n; i ) {dp[…

消息队列项目创建第二部分

消息队列项目创建第二部分 一、在硬盘上存储信息使用文件存储消息具体存放策略 垃圾回收&#xff08;JVM&#xff09;创建文件管理类——MessageFileManger创建统计文件数据和文件统计文件的读写操作创建消息对应的文件和目录创建一个统一处理异常 消息文件的读写消息的序列化和…

算法通关村第一关——链表经典问题之合并有序链表三种方法一层一层优化

算法通关村第一关——链表经典问题之合并有序链表三种方法一层一层优化 题目描述 将两个升序的链表合并为一个新的升序链表并返回&#xff0c;新链表是通过拼接两个给定的两个链表的所有节点组成的。 解题思路 第一种 新建一个链表&#xff0c;然后分别遍历两个链表&#…

记一次edu站点并拿下的过程cnvd

0x01 jeecg-boot介绍 JeecgBoot是一款基于代码生成器的低代码开发平台&#xff0c;零代码开发&#xff01;采用前后端分离架构&#xff1a;SpringBoot2.x&#xff0c;Ant Design&Vue&#xff0c;Mybatis-plus&#xff0c;Shiro&#xff0c;JWT。强大的代码生成器让前后端代…

k8s-17 k8s调度

调度器通过 kubernetes 的 watch 机制来发现集群中新创建且尚未被调度到 Node上的 Pod。调度器会将发现的每一个未调度的 Pod 调度到一个合适的 Node 上来运行。 kube-scheduler 是 Kubernetes 集群的默认调度器&#xff0c;并且是集群控制面的一部分如果你真的希望或者有这方面…

python如何连接数据库 ?一文详解pymysql的用法 。

使用Python连接数据库是常用的操作 &#xff0c;那么在Python代码中取操作数据库呢 &#xff1f; 接下来介绍一个包 &#xff1a;pymysql .它能帮我们在代码中连接MySQL数据库进行各种操作。 1.常用数据库模块 在做自动化测试时&#xff0c;我们经常会查库的需求 &#xff0c;…

解剖—顺序表相关OJ练习题

目录 一、删除有序数组中的重复项&#xff0c;返回出现一次元素的个数。 二、原地移除数组中所有数值等于val的元素 三、合并两个有序数组 四、旋转数组 五、数组形式的整数加法 一、删除有序数组中的重复项&#xff0c;返回出现一次元素的个数。 26. 删除有序数组中的重…

Service Mesh和Kubernetes:加强微服务的通信与安全性

文章目录 什么是Service Mesh&#xff1f;Service Mesh的优势1. 流量控制2. 安全性3. 可观测性 Istio&#xff1a;Service Mesh的领军者流量管理安全性可观测性 Linkerd&#xff1a;轻量级Service Mesh流量管理安全性可观测性 Istio vs. Linkerd实际应用结论 &#x1f388;个人…

vscode中4个json的区别和联系

在vscode中快捷键ctrlshiftp&#xff0c;然后输入setting&#xff0c;会出现下图几个选项 当不同设置之间出现冲突时&#xff0c;听谁的&#xff1a; Open Workspace Settings(JSON) > Open Settings(JSON) Open User Settings > Open Default Settings(JSON) Open Wo…

openstack 云主机 linux报 login incorrect

还未输入密码就提示login incorrect 不给输密码位置 完全不给输密码的机会 关机进入单用户 检查登录安全记录 vi /var/log/secure 发现 /usr/lib64/security/pam_unix.so 报错 将正常的机器提取/usr/lib64/security/pam_unix.so 比对MD5一致&#xff0c; 另外判断 libtir…

车载开发学习——CAN总线

CAN总线又称为汽车总线&#xff0c;全程为“控制器局域网&#xff08;Controller Area Network&#xff09;”&#xff0c;即区域网络控制器&#xff0c;它将区域内的单一控制单元以某种形式连接在一起&#xff0c;形成一个系统。在这个系统内&#xff0c;大家以一种大家都认可…

市值缩水90%以上,泛生子何以败退美股?

癌症是人类面临的最大健康威胁之一&#xff0c;也是医学界最难攻克的难题之一。随着科技的发展&#xff0c;癌症精准医疗逐渐成为治疗癌症的新方向&#xff0c;癌症精准医疗能通过对癌细胞的基因检测和分析&#xff0c;为患者提供个性化的治疗方案。然而&#xff0c;这一领域的…

redis(其它操作、管道)、django中使用redis(通用方案、 第三方模块)、django缓存、celery介绍(celery的快速使用)

1 redis其它操作 2 redis管道 3 django中使用redis 3.1 通用方案 3.2 第三方模块 4 django缓存 5 celery介绍 5.1 celery的快速使用 1 redis其它操作 delete(*names) exists(name) keys(pattern*) expire(name ,time) rename(src, dst) move(name, db)) randomkey() type(na…

VBA技术资料MF71:查找所有空格并替换为固定字符

我给VBA的定义&#xff1a;VBA是个人小型自动化处理的有效工具。利用好了&#xff0c;可以大大提高自己的工作效率&#xff0c;而且可以提高数据的准确度。我的教程一共九套&#xff0c;分为初级、中级、高级三大部分。是对VBA的系统讲解&#xff0c;从简单的入门&#xff0c;到…

实现实时美颜:主播直播美颜SDK的技术细节

在今天的数字时代&#xff0c;直播和实时互动成为了日常生活的一部分&#xff0c;而主播直播美颜SDK的出现为用户提供了更加精美的视觉体验。这项技术的背后有着复杂的技术细节&#xff0c;从图像处理到机器学习&#xff0c;本文将深入探讨主播直播美颜SDK的技术细节&#xff0…

四边形不等式

区间dp问题&#xff0c;状态转移方程&#xff1a; dp[i][j] min( dp[i][k] dp[k1][j] w[i][j] ) //w[i][j]是从i到j的&#xff0c;一个定值 不随k改变&#xff0c;而且w的值只和i j有关&#xff0c;是它们的二元函数。 其中i<k<j ,初始值dp[i][i]已知。 含义&#x…

第三类医疗器械经营许可证经营范围

在我国&#xff0c;医疗器械监督管理条例规定:医械经营企业要依据主营产品办理相应许可证。医疗器械根据其风险性又分为三类&#xff0c;一类医疗器械实行产品备案管理&#xff0c;第二类、第三类医疗器械实行产品注册管理&#xff0c;经营第二类、第三类医疗器械应当持有《医疗…

Day 2 Qt

#include "my_widget.h" #include "ui_my_widget.h"My_Widget::My_Widget(QWidget *parent): QWidget(parent), ui(new Ui::My_Widget) {ui->setupUi(this);//窗口的相关设置 // this -> resize(800,500);this -> setWindowTitle("QQ聊天…