人工智能丨视觉识别在自动化测试中的应用

news2025/1/31 0:13:52

视觉识别:自动化测试的新纪元

在当今快速发展的科技时代,软件测试正面对着日益复杂的挑战。作为其中一个关键领域,自动化测试不断寻求创新的方法,以提高测试效率和准确性。在这一背景下,视觉识别技术的引入为自动化测试带来了新的可能性和机遇。那么,究竟视觉识别在自动化测试中的应用有哪些呢?它又是如何改变我们测试的方式的呢?

视觉识别技术概述

视觉识别技术,通常被称为计算机视觉,是指通过计算机对图像或视频信息进行处理和分析,从中提取有用信息的过程。这项技术涉及到多个领域的知识,包括人工智能、机器学习和图像处理等。通过训练模型,计算机可“看见”屏幕上的元素,并能快速、准确地识别出按钮、文本框、图片等各种 UI 组件。

在软件测试中,视觉识别技术可以有效地帮助我们识别用户界面(UI)变化、验证布局的一致性、并提升测试用例的创建与维护效率。让我们深入挖掘视觉识别技术在自动化测试中的应用和益处。

视觉识别技术的应用方法

在这一部分,我们将详细探讨视觉识别技术在自动化测试中的五种具体应用方式,包括实现步骤和示例代码,让我们一起看看它们是如何工作的。

1. UI 元素识别

步骤:

  • 首先,选择一个用于测试的应用程序(例如,网站或移动应用)。
  • 然后,使用框架如 Selenium 或 Appium 开发基础的自动化测试脚本。
  • 接下来,整合视觉识别工具(如 OpenCV 或 SikuliX)来检测 UI 元素。

示例代码:

import cv2
import numpy as np
from selenium import webdriver

# 启动浏览器
driver = webdriver.Chrome()
driver.get('http://example.com')

# 截图并读取图像
screenshot = driver.get_screenshot_as_file('screenshot.png')
img = cv2.imread('screenshot.png')

# 使用模板匹配识别按钮
template = cv2.imread('button_template.png')
result = cv2.matchTemplate(img, template, cv2.TM_CCOEFF_NORMED)

# 查找位置和显示结果
threshold = 0.8
loc = np.where(result >= threshold)
for pt in zip(*loc[::-1]):
    cv2.rectangle(img, pt, (pt[0] + template.shape[1], pt[1] + template.shape[0]), (0, 255, 0), 2)

cv2.imshow('Detected', img)
cv2.waitKey(0)

2. 视觉回归测试

步骤:

  • 在基于视觉的自动化测试中,首先需要对应用程序的各个状态进行截图。
  • 随后,将这些截图与后续更改后的截图进行对比,以检查 UI 的一致性。

示例代码:

from PIL import Image
import numpy as np

# 打开两张图片
img1 = Image.open('old_screenshot.png')
img2 = Image.open('new_screenshot.png')

# 将图片转换成 NumPy 数组
arr1 = np.array(img1)
arr2 = np.array(img2)

# 对比两张图像的像素差异
difference = np.abs(arr1 - arr2)
if np.any(difference > 0):
    print("UI变化检测到!")
else:
    print("无变化.")

3. 动态元素验证

步骤:

  • 对于动态变化的 UI 元素(如轮播图),我们可以使用视觉识别来确保每一帧内容都被正确显示。
  • 编写测试脚本循环处理每个状态,并通过视觉识别验证。

示例代码:

# 确保使用具有动态元素的页面
driver.get('http://example.com/slideshow')

for i in range(1, 6):  # 假设有5个幻灯片
    driver.switch_to.frame("slideshow_frame")
    screenshot = driver.save_screenshot(f'slide_{i}.png')

    # 进行视觉识别验证
    img = cv2.imread(f'slide_{i}.png')
    template = cv2.imread(f'slide_template_{i}.png')
    result = cv2.matchTemplate(img, template, cv2.TM_CCOEFF_NORMED)

    if np.amax(result) < 0.8:
        print(f"幻灯片 {i} 显示有误!")
    driver.switch_to.default_content()  # 退回主页面

4. 屏幕元素对比

步骤:

  • 当网页或应用更新时,我们需要确认更新后的布局与设计师提供的设计稿一致。
  • 使用视觉识别,快速检查是否所有元素都有正确渲染。

示例代码:

# 获取新版本布局截图
driver.get('http://example.com/updated_version')
driver.save_screenshot('new_layout.png')

# 进行视觉对比
reference = cv2.imread('reference_layout.png')
new_version = cv2.imread('new_layout.png')

# 对比算法
similarity = cv2.matchTemplate(new_version, reference, cv2.TM_CCOEFF_NORMED)
if np.amax(similarity) < 0.8:
    print("布局不一致!")
else:
    print("布局一致!")

5. 视觉缺陷检测

步骤:

  • 当软件中存在图形或图像时,确保识别图像的缺损或错误。
  • 通过视觉识别确认图形内容的完整性。

示例代码:

# 假设检测图像内容的完整性
img = cv2.imread('graphic_content.png')
template = cv2.imread('expected_template.png')

# 测试内容完整性
result = cv2.matchTemplate(img, template, cv2.TM_CCOEFF_NORMED)
if np.amax(result) < 0.75:
    print("图形内容存在缺陷!")
else:
    print("图形完整无缺!")

视觉识别的亮点与好处

视觉识别在自动化测试中为我们带来的好处不容小觑。这项技术不仅提高了测试效率,也让我们能够更准确、更高效地捕捉到可能被遗漏的界面错误。以下是我们能够收获的一些主要亮点:

  1. 提高准确性:传统的定位方式往往依赖于控件的属性,而视觉识别则模拟了人类眼睛的视角,对图像的变化敏感。
  2. 适应性强:现代应用程序的界面往往复杂多变,视觉识别能更好地处理诸如位置变化、分辨率变化等挑战。
  3. 降低维护成本:通过减少对元素定位的依赖,能够显著降低因 UI 变化导致的测试用例维护工作量。
  4. 提升用户体验:确保所有关键界面元素在不同设备和浏览器中的正确显示,为用户提供一致的使用体验。
  5. 增强覆盖率:视觉检测可以轻松覆盖多种设备和平台,极大地提升了测试覆盖率。

视觉识别对软件测试职业发展的好处与前景

近年来,随着自动化测试技术的飞速发展,视觉识别技能越来越受到企业和应聘者的青睐。从职业发展的角度来看,掌握视觉识别技术将为我们的职业生涯开辟新的可能性:

  1. 职业转型机会:由于各大公司都在寻求自动化测试优秀人才,运用视觉识别能力的人才能在这个领域中脱颖而出。
  2. 核心竞争力提升:掌握这一新技术使得我们在众多求职者中更具竞争力,不仅能应对当今行业需求,也能适应未来技术变革。
  3. 推动团队创新:视觉识别技术的引入,也使团队能够在测试中使用新的思路,从而推动整体测试效率和质量的提升。
  4. 行业前景广阔:未来自动化测试的需求将持续增长,特别是在 AI 驱动的技术未来中,视觉识别将扮演重要角色。

常见问题 FAQ

1. 什么是视觉识别技术?

视觉识别技术是计算机通过图像或视频处理,识别和分析其中信息的过程。它可以用于检测UI组件、进行视觉回归测试等。

2. 如何在自动化测试中引入视觉识别?

可以通过使用工具如 OpenCV、SikuliX 或其他图像处理库,对 UI 元素进行识别和验证。

3. 视觉识别技术的必要性是什么?

在面对动态变化的 UI 元素及复杂应用时,视觉识别技术可以确保准确性并提高测试的覆盖率。

4. 我该如何培养视觉识别技能?

建议通过学习计算机视觉基础,运用相关工具进行实践,持之以恒地进行项目练习。

送您一份软件测试学习资料大礼包

推荐阅读

软件测试学习笔记丨Pytest配置文件
测试开发实战 | Docker+Jmeter+InfluxDB+Grafana 搭建性能监控平台
技术分享 | app自动化测试(Android)–元素定位方式与隐式等待
软件测试学习笔记丨Mitmproxy使用
软件测试学习笔记丨Chrome开发者模式
软件测试学习笔记丨Docker 安装、管理、搭建服务
软件测试学习笔记丨Postman基础使用
人工智能 | 阿里通义千问大模型
软件测试学习笔记丨接口测试与接口协议
软件测试学习笔记丨Pytest的使用

推荐学习

【霍格沃兹测试开发】7天软件测试快速入门带你从零基础/转行/小白/就业/测试用例设计实战

【霍格沃兹测试开发】最新版!Web 自动化测试从入门到精通/ 电子商务产品实战/Selenium (上集)

【霍格沃兹测试开发】最新版!Web 自动化测试从入门到精通/ 电子商务产品实战/Selenium (下集)

【霍格沃兹测试开发】明星讲师精心打造最新Python 教程软件测试开发从业者必学(上集)

【霍格沃兹测试开发】明星讲师精心打造最新Python 教程软件测试开发从业者必学(下集)

【霍格沃兹测试开发】精品课合集/ 自动化测试/ 性能测试/ 精准测试/ 测试左移/ 测试右移/ 人工智能测试

【霍格沃兹测试开发】腾讯/ 百度/ 阿里/ 字节测试专家技术沙龙分享合集/ 精准化测试/ 流量回放/Diff

【霍格沃兹测试开发】Pytest 用例结构/ 编写规范 / 免费分享

【霍格沃兹测试开发】JMeter 实时性能监控平台/ 数据分析展示系统Grafana/Docker 安装

【霍格沃兹测试开发】接口自动化测试的场景有哪些?为什么要做接口自动化测试?如何一键生成测试报告?

【霍格沃兹测试开发】面试技巧指导/ 测试开发能力评级/1V1 模拟面试实战/ 冲刺年薪百万!

【霍格沃兹测试开发】腾讯软件测试能力评级标准/ 要评级表格的联系我

【霍格沃兹测试开发】Pytest 与Allure2 一键生成测试报告/ 测试用例断言/ 数据驱动/ 参数化

【霍格沃兹测试开发】App 功能测试实战快速入门/adb 常用命令/adb 压力测试

【霍格沃兹测试开发】阿里/ 百度/ 腾讯/ 滴滴/ 字节/ 一线大厂面试真题讲解,卷完拿高薪Offer !

【霍格沃兹测试开发】App自动化测试零基础快速入门/Appium/自动化用例录制/参数配置

【霍格沃兹测试开发】如何用Postman 做接口测试,从入门到实战/ 接口抓包(最新最全教程)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2286660.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

BLE透传方案,IoT短距无线通信的“中坚力量”

在物联网&#xff08;IoT&#xff09;短距无线通信生态系统中&#xff0c;低功耗蓝牙&#xff08;BLE&#xff09;数据透传是一种无需任何网络或基础设施即可完成双向通信的技术。其主要通过简单操作串口的方式进行无线数据传输&#xff0c;最高能满足2Mbps的数据传输速率&…

苍穹外卖—订单模块

该模块分为地址表的增删改查、用户下单、订单支付三个部分。 第一部分地址表的增删改查无非就是对于单表的增删改查&#xff0c;较基础&#xff0c;因此直接导入代码。 地址表 一个用户可以有多个地址&#xff0c;同时有一个地址为默认地址。用户还可为地址添加例如&q…

openeuler 22.03 lts sp4 使用 cri-o 和 静态 pod 的方式部署 k8s-v1.32.0 高可用集群

前情提要 整篇文章会非常的长…可以选择性阅读,另外,这篇文章是自己学习使用的,用于生产,还请三思和斟酌 静态 pod 的部署方式和二进制部署的方式是差不多的,区别在于 master 组件的管理方式是 kubectl 还是 systemctl有 kubeadm 工具,为什么还要用静态 pod 的方式部署?…

MySQL分表自动化创建的实现方案(存储过程、事件调度器)

《MySQL 新年度自动分表创建项目方案》 一、项目目的 在数据库应用场景中&#xff0c;随着数据量的不断增长&#xff0c;单表存储数据可能会面临性能瓶颈&#xff0c;例如查询、插入、更新等操作的效率会逐渐降低。分表是一种有效的优化策略&#xff0c;它将数据分散存储在多…

接口技术-第6次作业

目录 作业内容 解答 1.假设在一个系统中&#xff0c;8255A的端口地址为184H-187H&#xff0c;A口工作于方式1输出&#xff0c;B口工作于方式1输入&#xff0c;禁止中断&#xff0c;C口剩余的两根线PC5&#xff0c;PC4位输入&#xff0c;如下图所示&#xff0c;试编写初始化…

(1)Linux高级命令简介

Linux高级命令简介 在安装好linux环境以后第一件事情就是去学习一些linux的基本指令&#xff0c;我在这里用的是CentOS7作演示。 首先在VirtualBox上装好Linux以后&#xff0c;启动我们的linux&#xff0c;输入账号密码以后学习第一个指令 简介 Linux高级命令简介ip addrtou…

网络直播时代的营销新策略:基于受众分析与开源AI智能名片2+1链动模式S2B2C商城小程序源码的探索

摘要&#xff1a;随着互联网技术的飞速发展&#xff0c;网络直播作为一种新兴的、极具影响力的媒体形式&#xff0c;正逐渐改变着人们的娱乐方式、消费习惯乃至社交模式。据中国互联网络信息中心数据显示&#xff0c;网络直播用户规模已达到3.25亿&#xff0c;占网民总数的45.8…

CSS(快速入门)

欢迎大家来到我的博客~欢迎大家对我的博客提出指导&#xff0c;有错误的地方会改进的哦~点击这里了解更多内容 目录 一、什么是CSS?二、基本语法规范三、CSS选择器3.1 标签选择器3.2 id选择器3.3 class选择器3.4 通配符选择器3.5 复合选择器 四、常用CSS样式4.1 color4.2 font…

对顾客行为的数据分析:融入2+1链动模式、AI智能名片与S2B2C商城小程序的新视角

摘要&#xff1a;随着互联网技术的飞速发展&#xff0c;企业与顾客之间的交互方式变得日益多样化&#xff0c;移动设备、社交媒体、门店、电子商务网站等交互点应运而生。这些交互点不仅为顾客提供了便捷的服务体验&#xff0c;同时也为企业积累了大量的顾客行为数据。本文旨在…

MySQL查询优化(三):深度解读 MySQL客户端和服务端协议

如果需要从 MySQL 服务端获得很高的性能&#xff0c;最佳的方式就是花时间研究 MySQL 优化和执行查询的机制。一旦理解了这些&#xff0c;大部分的查询优化是有据可循的&#xff0c;从而使得整个查询优化的过程更有逻辑性。下图展示了 MySQL 执行查询的过程&#xff1a; 客户端…

UE AController

定义和功能 AController是一种特定于游戏的控制器&#xff0c;在UE框架中用于定义玩家和AI的控制逻辑。AController负责处理玩家输入&#xff0c;并根据这些输入驱动游戏中的角色或其他实体的行为。设计理念 AController设计用于分离控制逻辑与游戏角色&#xff0c;增强游戏设计…

Git进阶之旅:Git 配置信息 Config

Git 配置级别&#xff1a; 仓库级别&#xff1a;local [ 优先级最高 ]用户级别&#xff1a;global [ 优先级次之 ]系统级别&#xff1a;system [ 优先级最低 ] 配置文件位置&#xff1a; git 仓库级别对应的配置文件是当前仓库下的 .git/configgit 用户级别对应的配置文件时用…

51单片机开发:定时器中断

目标&#xff1a;利用定时器中断&#xff0c;每隔1s开启/熄灭LED1灯。 外部中断结构图如下图所示&#xff0c;要使用定时器中断T0&#xff0c;须开启TE0、ET0。&#xff1a; 系统中断号如下图所示&#xff1a;定时器0的中断号为1。 定时器0的工作方式1原理图如下图所示&#x…

深度学习框架应用开发:基于 TensorFlow 的函数求导分析

深度学习框架应用开发&#xff1a;基于 TensorFlow 的函数求导分析 在深度学习的世界里&#xff0c;梯度计算是优化算法的核心。而 TensorFlow 作为一款强大的深度学习框架&#xff0c;为我们提供了简洁而强大的工具来进行自动求导操作&#xff0c;这极大地简化了深度学习模型的…

2025春晚刘谦魔术揭秘魔术过程

2025春晚刘谦魔术揭秘魔术过程 首先来看全过程 将杯子&#xff0c;筷子&#xff0c;勺子以任意顺序摆成一排 1.筷子和左边物体交换位置 2.杯子和右边物体交换位置 3.勺子和左边物体交换位置 最终魔术的结果是右手出现了杯子 这个就是一个简单的分类讨论的问题。 今年的魔术…

上海亚商投顾:沪指冲高回落 大金融板块全天强势 上海亚商投

上海亚商投顾前言&#xff1a;无惧大盘涨跌&#xff0c;解密龙虎榜资金&#xff0c;跟踪一线游资和机构资金动向&#xff0c;识别短期热点和强势个股。 一&#xff0e;市场情绪 市场全天冲高回落&#xff0c;深成指、创业板指午后翻绿。大金融板块全天强势&#xff0c;天茂集团…

01学习预热篇(D6_正式踏入JVM深入学习前的铺垫)

目录 学习前言 一、虚拟机的结构 1. Java虚拟机参数设置 2. java 堆 3. 出入栈 4. 局部变量表 1> 局部变量的剖析 2> 局部变量的回收 5. 操作数栈 1> 常量入栈指令 2> 局部变量值转载到栈中指令 3> 将栈顶值保存到局部变量中指令 6. 帧数据区 7. 栈…

【漫话机器学习系列】068.网格搜索(GridSearch)

网格搜索&#xff08;Grid Search&#xff09; 网格搜索&#xff08;Grid Search&#xff09;是一种用于优化机器学习模型超参数的技术。它通过系统地遍历给定的参数组合&#xff0c;找出使模型性能达到最优的参数配置。 网格搜索的核心思想 定义参数网格 创建一个包含超参数值…

https数字签名手动验签

以bing.com 为例 1. CA 层级的基本概念 CA 层级是一种树状结构&#xff0c;由多个层级的 CA 组成。每个 CA 负责为其下一层级的实体&#xff08;如子 CA 或终端实体&#xff09;颁发证书。层级结构的顶端是 根 CA&#xff08;Root CA&#xff09;&#xff0c;它是整个 PKI 体…

Elasticsearch+kibana安装(简单易上手)

下载ES( Download Elasticsearch | Elastic ) 将ES安装包解压缩 解压后目录如下: 修改ES服务端口&#xff08;可以不修改&#xff09; 启动ES 记住这些内容 验证ES是否启动成功 下载kibana( Download Kibana Free | Get Started Now | Elastic ) 解压后的kibana目…