ChatGPT的截图识别功能测评:开启图像中的文字与信息的新纪元

news2025/1/22 15:44:48

文章目录

    • 根据截图,识别菜品
    • 根据截图,识别数学公式
    • 根据截图生成前端UI代码
    • 可视化图像复现
      • 案例一
      • 案例二
    • 更多可以使用的方向

制作人:川川
辛苦测评,如果对你有帮助支持一下书籍:https://item.jd.com/14049708.html

根据截图,识别菜品

问一个麻婆豆腐看看?回复如下:
在这里插入图片描述
问一个红烧猪蹄看看?回复如下:
在这里插入图片描述
再来问一个红烧茄子,回复如下:
在这里插入图片描述

根据截图,识别数学公式

这里我选一个考研高数的选择题测试:
在这里插入图片描述
再选一个选择题:
在这里插入图片描述
既然都识别完全正确,给出答案更是我想要的,可以看到答案完全正确!
在这里插入图片描述

根据截图生成前端UI代码

提问:
在这里插入图片描述

给我生成代码:
在这里插入图片描述
运行效果如下,基本已经实现:
在这里插入图片描述

继续让他帮我复现一个UI:
在这里插入图片描述

根据代码,我得到结果如下UI结果:
在这里插入图片描述

可视化图像复现

案例一

例如这个图:
在这里插入图片描述
返回代码如下:

import numpy as np
import matplotlib.pyplot as plt

# 生成模拟数据
np.random.seed(0)

num_samples_per_group = 150

# 为G1生成数据
g1_dc1 = np.concatenate([np.random.normal(-0.05, 0.01, 90), np.random.normal(0.015, 0.01, 60)])
g1_dc2 = np.concatenate([np.random.normal(0.03, 0.02, 90), np.random.normal(0.08, 0.02, 60)])

# 为G2生成数据
g2_dc1 = np.random.normal(-0.04, 0.01, num_samples_per_group)
g2_dc2 = np.random.normal(0.005, 0.01, num_samples_per_group)

# 为G3生成数据
g3_dc1 = np.concatenate([np.random.normal(0.015, 0.01, 60), np.random.normal(0.045, 0.005, 90)])
g3_dc2 = np.concatenate([np.random.normal(-0.07, 0.01, 60), np.random.normal(-0.02, 0.005, 90)])

# 绘制图像
plt.scatter(g1_dc1, g1_dc2, color='blue', label='G1')
plt.scatter(g2_dc1, g2_dc2, color='green', label='G2')
plt.scatter(g3_dc1, g3_dc2, color='red', label='G3')

# 设置标题和轴标签
plt.title('Diffusion Map')
plt.xlabel('DC1')
plt.ylabel('DC2')
plt.legend()

# 显示图像
plt.show()

结果如下,可以看到基本实现,具体只不过就是数据的调整:
在这里插入图片描述

案例二

复现这个图:
在这里插入图片描述

返回代码如下:

import matplotlib.pyplot as plt
import pandas as pd

# 创建数据
data = {
    'sample': ['M1', 'M2', 'M3', 'M8', 'M9', 'M10'],
    'group': ['G1', 'G1', 'G1', 'G2', 'G2', 'G2'],
    'PC1': [0.5, -0.4, 0.2, -0.5, 0, 0.5],
    'PC2': [0.5, -0.4, 0.2, 0.3, 0, -0.2]
}
df = pd.DataFrame(data)

color_map = {'G1': 'blue', 'G2': 'red'}

# 绘制散点图
for group, color in color_map.items():
    mask = df['group'] == group
    plt.scatter(df[mask]['PC1'], df[mask]['PC2'], color=color, s=100, label=group)

plt.title('PCA Plot1')
plt.xlabel('PC1')
plt.ylabel('PC2')
plt.grid(True)
plt.axhline(0, color='black',linewidth=0.5)
plt.axvline(0, color='black',linewidth=0.5)
plt.legend()
plt.show()

运行如下,可以看到基本复现,完全OK:
在这里插入图片描述

更多可以使用的方向

  1. 文本识别:从截图中提取文本信息,这在处理图像中的文本时非常有用,尤其是当原始文档不可用时。
  2. 对象识别:识别截图中的特定对象,如人脸、动植物、产品或其他项目。
  3. 数据提取:从截图中的图表或图形中提取数据。
  4. 翻译:提取截图中的文本,并将其翻译成其他语言。
  5. 辅助视觉障碍人士:通过截图识别,帮助视觉障碍人士理解图像内容。
  6. 图像搜索:通过截图识别,可以进行图像搜索,找到相似或相关的图片。
  7. 图像编辑和增强:识别截图中的元素,以便进行图像编辑和增强。
  8. 教育与学习:通过截图识别,可以帮助用户学习和理解图像中的信息,例如,识别数学公式或科学图表。
  9. 解决问题:例如,在技术支持领域,用户可以通过截图分享他们的问题,而支持人员可以通过识别截图来提供帮助。
    10.比较和分析:比较不同截图中的内容,进行图像分析或者内容比较。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1054704.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

spring boot整合常用redis客户端(Jedis、Lettuce、RedisTemplate、Redisson)常见场景解决方案

Java操作redis有三种客户端供选择:Jedis、Lettuce、Redisson。 在实际项目中运用最多的客户端还是Redisson、RedisTemplate;其中RedisTemplate并非是一个新的redis客户端实现,RedisTemplate是Spring Data Redis中提供的封装好的redis操作模板…

闪击笔试题

选择题 ping命令不涉及什么协议? A:DNS B: TCP C: ARP D: ICMP B,ping基于ICMP协议,解析路由会用到ARP和DNS a、b、c三人参加学科竞赛,每个学科按一二三名次给x、y、z分,已知a得22分,b和c得9分&#xf…

进程控制以及相关原语的使用(创建,终止,阻塞,唤醒,切换)

1.基本概念 1.进程控制 进程控制的主要功能是对系统中的所有进程实施有效的管理,它具有创建新进程、撤销已有进程、实现进程状态转换等功能。 进程控制就是要实现进程状态转换。 2.实现进程控制(原语) 1.原语 原语是一种特殊的程序,它的执行具有原子性。也就是…

初阶数据结构(四)带头双向链表

💓博主csdn个人主页:小小unicorn ⏩专栏分类:数据结构 🚚代码仓库:小小unicorn的代码仓库🚚 🌹🌹🌹关注我带你学习编程知识 带头双向链表 链表的相关介绍初始化链表销毁链…

一文带你搞懂Redis持久化

Redis持久化 Redis的数据是存储在内存的,当程序崩溃或者服务器宕机,那么内存里的数据就会丢失。所以避免数据丢失的情况,需要将数据保存到其他的存储设备中。 Redis提供两种方式来持久化,分别是 RDB(Redis Database)&#xff1a…

格拉姆角场GAF将时序数据转换为图像并应用于凯斯西储大学轴承故障诊断(Python代码,CNN模型)

1.运行效果: 格拉姆角场GAF将时序数据转换为图像并应用于凯斯西储大学轴承故障诊断(Python代码)_哔哩哔哩_bilibili 环境库 只要tensorflow版本大于等于2.4.0即可运行 同样的模型应用于东南大学轴承数据集:格拉姆角场GAF将时序…

ios telegram iOS telegram二次开发

二次开发方案 一、方案的确定及要实现的效果 首先,最多的信息获取还是官方文档:https://lw.microstrategy.com/msdz/MobileUpdates/941_iOSU5/docs/mergedProjects/mobile_sdk/mobilesdk.htm 在本项目的一小部分,项目需求也是改来改去…

虚拟机中对已经存在的磁盘扩容

如图所示,将虚拟机中已经存在的磁盘进行扩容: 扩展之后重启虚拟机,然后输入命令:lsblk进行查看虚拟机大小;发现这个盘的大小已经改变,如果想要给某个卷组或者逻辑卷进行扩容的话还需要将这个磁盘进行新建分…

osg实现鼠标框选

目录 1. 需求的提出 2. 具体实现 2.1. 禁止场景跟随鼠标转动 2.2. 矩形框前置绘制 3. 附加说明 3.1. 颜色设置说明 3.2.矩形框显示和隐藏的另一种实现 1. 需求的提出 有时需要在屏幕通过按住键盘上的某个键如Ctrl键且按住鼠标左键,拖出一个矩形,实现框…

MongoDB 2023年度纽约 MongoDB 年度大会话题 -- 企业级从传统数据库到NOSQL,你会更好...

开头还是介绍一下群,如果感兴趣PolarDB ,MongoDB ,MySQL ,PostgreSQL ,Redis, Oceanbase, 等有问题,有需求都可以加群群内有各大数据库行业大咖,CTO,可以解决你的问题。加群请联系 liuaustin3 ,在新加的朋友会分到2群&…

Android学习之路(17) Android Adapter详解

Adapter基础讲解 本节引言 从本节开始我们要讲的UI控件都是跟Adapter(适配器)打交道的,了解并学会使用这个Adapter很重要, Adapter是用来帮助填充数据的中间桥梁,简单点说就是:将各种数据以合适的形式显示到view上,提供 给用户看…

读取一张图片各种颜色占比

提问之初 <small> 读取一张图片各种颜色占比 /storage/emulated/0/Pictures/Screenshots/Screenshot_20230725_195440.jpg有趣优雅热情沉着的代码与注释/每行每行 from PIL import Image # 导入PIL大法&#xff0c;这是处理图像的必备神器# 图片路径&#xff0c;此处为…

2023年哪款PDF虚拟打印机好用?

PDF文档想必大家都不陌生&#xff0c;在工作中经常会用到该格式的文档&#xff0c;那么有哪些方法能制作PDF文档呢&#xff1f;一般都是借助PDF虚拟打印机的&#xff0c;那么有哪些好用的软件呢&#xff1f; pdfFactory不仅为用户提供了丰富的PDF文档生成、打印功能&#xff0…

蓝桥杯每日一题2023.10.1

路径 - 蓝桥云课 (lanqiao.cn) 题目分析 求最短路问题&#xff0c;有多种解法&#xff0c;下面介绍两种蓝桥杯最常用到的两种解法 方法一 Floyd&#xff08;求任意两点之间的最短路&#xff09;注&#xff1a;不能有负权回路 初始化每个点到每个点的距离都为0x3f这样才能对…

00后老程序员不讲武德 偷袭 猿人学第二题解题记录 match/2

我是一个00后的老程序员&#xff0c;半夜00点有个Python群友发来一个题目&#xff0c;我以为是leetcode算法题呢&#xff0c;这不轻而易举、手到擒来、简简单单、有手就行&#xff0c;哪怕是博利叶排序我也能招架得住啊&#xff0c;结果发来一个链接。 题发出来了&#xff0…

GD32F10X ----RTC

1. RTC的简介 STM32 的实时时钟&#xff08;RTC&#xff09;是一个独立的定时器。STM32 的 RTC 模块拥有一组连续计数的计数器&#xff0c;在相应软件配置下&#xff0c;可提供时钟日历的功能。修改计数器的值可以重新设置系统当前的时间和日期。 RTC 模块和时钟配置…

BUUCTF-WEB-刷题记录

题目地址 https://buuoj.cn/challenges[HITCON 2017]SSRFme 代码理解 进入主页后发现是代码审计/ escapeshellarg — 把字符串转码为可以在 shell 命令里使用的参数— 抑制错误输出 mkdir — 创建目录 chdir 更改目录 shell_exec — 通过 shell 环境执行命令&#x…

第5章-宏观业务分析方法-5.3-主成分分析法

5.3.1 主成分分析简介 主成分分析是以最少的信息丢失为前提,将原有变量通过线性组合的方式综合成少数几个新变量;用新变量代替原有变量参与数据建模,这样可以大大减少分析过程中的计算工作量;主成分对新变量的选取不是对原有变量的简单取舍,而是原有变量重组后的结果,因此…

Spring注册Bean系列--方法1:@Component

原文网址&#xff1a;Spring注册Bean系列--方法1&#xff1a;Component_IT利刃出鞘的博客-CSDN博客 简介 本文介绍Spring注册Bean的方法&#xff1a;Component。 注册Bean的方法我写了一个系列&#xff0c;见&#xff1a;Spring注册Bean(提供Bean)系列--方法大全_IT利刃出鞘…

C++代码示例:排列数简单生成工具

文章目录 前言代码仓库内容代码&#xff08;有详细注释&#xff09;编译和运行命令结果总结参考资料作者的话 前言 C代码示例&#xff1a;排列数简单生成工具。 代码仓库 yezhening/Programming-examples: 编程实例 (github.com)Programming-examples: 编程实例 (gitee.com) …