如果你正在做AI测试,那么这十点你必须注意

news2024/9/21 19:05:50

AI是一个已经进入人类日常生活的新技术时代,例如Siri,Alexa语音接口等。通过大数据和数据科学实现数据存储的进步,使用户能够进行快速分析和数据检索。机器学习是一个新领域,机

AI是一个已经进入人类日常生活的新技术时代,例如Siri,Alexa语音接口等。通过大数据和数据科学实现数据存储的进步,使用户能够进行快速分析和数据检索。机器学习是一个新领域,机器使软件能够学习新事物,因为它不断将数据捕获到系统中。它是一个连续的数据馈送系统,可以帮助机器根据数据模式和启发式进行学习和行为。当涉及到AI系统的测试时,测试团队需要考虑以下10件事情。

 1)作为测试人员,人工智能测试与传统软件测试有何不同?
毫无疑问,具有AI的系统就是一个软件,但这种软件具有相应学习和改变其行为的能力。传统的软件功能测试涉及对给定输入集的预期输出与实际输出的测试。在人工智能的情况下,预期输出可能随着机器学习在一段时间内的进展而变化。因此,人工智能系统测试不同于传统的软件测试,测试人员应该准备好接受这种AI测试程序。

2)AI系统的测试输出是什么?
如前所述,对于同一组输入,人工智能中的输出并不总是相同。因此,理解系统的底层——机器学习模型,并相应地更新测试用例非常重要。测试人员应该了解当数据输入系统时机器将如何学习和表现。测试人员应该能够在正面和负面情景中测试AI系统的行为。

3)考虑测试AI系统的法律和道德要求
AI系统可能导致开发出可能对人类造成危险的致命机器人系统。在设计测试用例和场景之前,应该完全审查法律、道德和社会要求。测试人员有责任通过进行可能导致法律、道德和社会问题的负面测试来测试AI系统的这些方面。因此,AI系统测试非常关键,应该非常仔细地进行,以确保我们正在构建对人类有用的机器。

4)AI算法测试
在AI中,机器分析数据模式并使用这些模式来构建规则,也称为启发式规则。这是人类大脑所做的类似操作,有助于人类做出决定。机器在加载数据并分析模式后,它会了解模式,并在收到模式时自行更新模式。因此,机器的行为及其AI算法不会总是表现得相同,因此我们不能指望输出始终是100%完美的。它取决于机器基于数据模式在一段时间内发展起来的启发式方法。

5)测试数据以测试AI算法
机器学习是人工智能的一部分,机器根据数据的类型和输入的模式来构建自己的知识。测试人员应仔细选择他们的测试数据来测试机器学习,以便他们输送到机器的数据模式应该与AI系统的预期输出相匹配。

6)AI架构和设计
AI系统测试人员应该对AI架构以及系统设计有充分的了解。这是因为在知道输出随着输入数据模式到AI系统的变化而变化的事实之后,它将帮助测试人员设计其测试用例。因此,将AI系统作为黑盒测试应该涉及架构和系统设计方面的知识。

7)需要严格的测试 AI 系统
AI系统的行为与传统软件不同,因为它们具有学习能力,因为它们可以提供数据。因此,为了对AI系统进行深入分析,在以不同模式批量提供数据之后执行严格测试非常重要。更有意义的数据被馈送到机器,它将开发启发式,机器可以执行决策,这是测试人员可以准确测试机器行为的地方。

8)输入相同但输出与以前不同
这是 AI 系统的理解行为,测试用例不能被声明为失败,因为实际的功能测试应该基于模式、规则和启发式而不是针对同一组输入的行为。在人工智能机器中相应地学习和改变其行为。

9)输出管理至关重要
在AI中,可以通过向其提供数据模式来动态地改进AI算法。测试机制可以作为训练AI系统并立即研究其影响的机会。训练有素的机器即改进的算法可以直接用于生产。但是,我们需要确保机器具有所需的知识。

10)回归测试
该数据集可用于之前测试过机器模式的回归测试。但重复测试用例可能不会一遍又一遍地获得相同的结果。因此,除非它是为一个全新的人工智能机器做的,否则回归测试可能不那么有效。回归测试应该基于AI算法行为,对被馈送到系统的数据集的测试。

结论
AI测试不同于传统的软件测试,测试人员在测试任何AI系统之前应考虑上述要点。

正在做测试的朋友可以进来交流,群里给大家整理了大量学习资料和面试题项目简历等等....

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/659666.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

今天我们来说说MySQL的缓存机制

原文链接:http://www.ibearzmblog.com/#/technology/info?id5770c555acd4302f81d86976c06e2319 前言 当我们向数据库服务器发送一条SQL的时候,但数据库收到后就会执行,但是如果在短时间内都执行同一条SQL,如果每次数据库都会执…

CUDA和显卡驱动以及pytorch版本的对应关系

1 支持CUDA 的GPU 支持 CUDA 的 NVIDIA Quadro 和 NVIDIA RTX CUDA GPU | NVIDIA Developer您的 GPU 计算能力 您是否正在寻找 GPU 的计算能力然后查看以下表格。您可以在这里了解更多 计算能力 。 NVIDIA GPU 为全球数百万台台式机笔记本电脑工作站和超级计算机提供动力加速…

《计算机网络——自顶向下方法》精炼——4.4.3-4.4.5

学习是终身的职业。在学习的道路上,谁想停下来就要落伍。 文章目录 UPnP因特网控制报文协议(ICMP)IPv6IPv6数据报格式IPv4到IPv6的变革 UPnP 通用即插即用(UPnP)提供了一种让外部网络的主机与NAT内主机交换数据的方式…

六十分之十七———低头拉车后的抬头看路

目录 前言:一、目标二、计划三、完成情况四、提升改进(最少3点)五、意外之喜(最少2点)六、总结 前言: 距离上次的月总已经过去四个多月时间了,这段时间里又是一次阶段性的下沉和突破,于是也就有了现在的总结。 此时还想将自己17…

未来10年,网络安全人才就业的黄金期

随着大数据、物联网、人工智能等新技术的发展,信息技术与经济社会各领域的融合也更加深入。网络攻击行为日趋复杂、黑客攻击行为组织性更强、针对手机无线终端的网络攻击日趋严重,近几年有关网络攻击和数据泄露的新闻层出不穷。因此,随着国家…

Planning-oriented Autonomous Driving 解析

abstract 现代自动驾驶系统通常是模块化的序列任务,这种方式很容易造成累积误差和任务协调不足,因此设计一个端到端架构,从全局的视角出发为agent的交互提供互补的特征提取。 introduction (a) Most industrial solutions deploy separate …

【QQ界面展示-获取监听到的通知的具体内容 Objective-C语言】

一、获取监听到的通知的具体内容 1.刚才这个没说啊,给大家补充一下, 我们看一下,刚才我们只说了一个通知的发布、和移除吧, 刚才我们这里,只是说了一个通知的发布、和移除吧, 以及监听, 那么,大家有没有发现, 我们一开始,给大家介绍的时候,是不是有两个对象啊,…

关于手机Camera的硬件电路知识

前阶段,小白教同事测了些Camere的基本功耗。正愁不知道写什么的小白,突然想到了素材,于是乎便趁着周末雷雨天宅家之际,写一篇关于手机Camere的硬件文章。 手机Camera 一、工作原理 关于Camera,景物通过镜头生成光学…

CRM软件能否代替Excel进行客户管理?

很多销售习惯使用Excel表格来管理客户,觉得这样既简单又方便。但随着客户的增多,使用Excel表格管理客户会带来很多问题。因此,客户管理不用Excel表格用CRM软件,是一种更加明智的选择。 1、统一管理数据 数据是企业的命脉。一旦客…

Python二级综合应用题:通讯录管理

Python二级考试中的最后一题一般是压轴题,有一定的难度,而且分值也高。此题一般分为1~3个问题,步步为赢,才能更好地解决。遇到这种问题,首先是不要怕,能解决几步是几步。今天我们一个通讯录管理题来说明一下…

Unbuntu下载Clion并配置Cmake工具

Clion 下载CLion安装Cmake工具 下载CLion 如果使用的是Unbuntu系统,一行命令就搞定了 sudo snap install clion --classic其他系统的下载方法就不在这里记载了 安装Cmake工具 刚下好Clion的时候,打开之后,如果没有Cmake工具.Clion是不会帮…

父亲节礼物:用Python编写一个小型游戏

名字:阿玥的小东东 学习:Python、C/C 主页链接:阿玥的小东东的博客_CSDN博客-python&&c高级知识,过年必备,C/C知识讲解领域博主 目录 安装必要的库 绘制游戏界面 添加游戏元素 为游戏添加交互性 结论 一、父亲节的来历简介 二…

taskAffinity、launchMode 与 flag

1、官方文档 public static final int FLAG_ACTIVITY_CLEAR_TASK 如果在传递给 的意向中设置,则 此标志将导致与 在活动开始之前要清除的活动。即活动 成为原本为空的任务和任何旧活动的新根 都完成了。这只能与 结合使用。Context.startActivity()FLAG_ACTIVITY_NE…

Kubernetes Blog 更新:DaoCloud 为数字世界寻找全局最优解

“ 近日,一篇名为《「DaoCloud 道客」与 Kubernetes--为数字世界寻找全局最优解》的博文,在 Kubernetes 的全球官网上线(链接:https://kubernetes.io/case-studies/daocloud/),下面一起来了解一下具体内容…

ArcEngine二次开发0——入门(下载 部署 组件学习)

折腾一下ArcGIS Engine二次开发。 目录 1、开发环境配置2、部署一个ArcGIS Engine应用程序3、ArcObject组件学习4、报错及解决4、其他 1、开发环境配置 参考:https://blog.csdn.net/H48662654/article/details/113384150 (使用ArcEngine前,…

时序预测 | MATLAB实现SO-ELM蛇群算法优化极限学习机时间序列预测

时序预测 | MATLAB实现SO-ELM蛇群算法优化极限学习机时间序列预测 目录 时序预测 | MATLAB实现SO-ELM蛇群算法优化极限学习机时间序列预测效果一览基本介绍程序设计学习总结参考资料 效果一览 基本介绍 Matlab实现SO-ELM蛇群算法优化极限学习机时间序列预测 1.data为单变量时间…

拿捏指针(三)--- 对指针的高级认识(高级)

函数指针 函数指针的定义 通过对 对指针的基本认识 和 对指针的进阶认识 我们知道,整型指针是指向整型的指针,数组指针是指向数组的指针,其实,函数指针就是指向函数的指针。 和学习数组指针一样,学习函数指针我们也需…

【WebPack】前端工程化

文章目录 前端工程化一、前端工程化概念二、前端工程化优点三、前端工程化解决方案四、webpack 的基本使用4.1 什么是 webpack4.2 创建列表隔行变色项目4.3 安装 webpack4.4 配置 webpack4.5 自定义 打包入口与出口 五、webpack 的插件使用5.1 webpack 常见插件5.2 webpack-dev…

【Linux】进程优先级

目录 进程优先级什么叫做优先级?Linux优先级更改优先级 进程优先级 什么叫做优先级? cpu资源分配的先后顺序,就是指进程的优先权(priority)。 优先权高的进程有优先执行权利。配置进程优先权对多任务环境的linux很有用…

imx6ull固化和更新uboot、zImage和dtb方法---超详细总结

目录 一、固化系统 1. 使用mfgtool上位机固化系统 1.1 mfgtool固化系统到 SD 卡 1.2 mfgtool固化系统到 eMMC 1.3 mfgtool固化系统到 NAND FLASH 2.使用脚本固化系统 2.1脚本固化系统到 SD 卡 2.2 脚本固化系统到 eMMC 2.3 脚本固化系统到 NAND FLASH 二、更新系统 …