绿野仙踪不仅是童话,还是便宜又好用的产品测试法!

news2024/11/18 16:29:32

以 ChatGPT 为代表的大语言模型爆火后,推动了对话类人工智能产品的高速发展,我们已经看到了如智能助理、问答系统、自动写作等多种类型的个性化对话类 AI 服务。 AI 能力的提升让人们对智能 AI 产品的期望越来越高,相关产品的用户体验也因此变得重要起来。而用户测试是保障产品用户体验的重要方法,对于 AI 类产品也不例外。

但与传统使用图形界面的产品不同,以自然语言作为输入的对话类 AI 产品的用户测试仍然面临着一定的挑战。

图片

在传统图形界面中,用户的交互指令是相对有限的,因为界面中的按钮、菜单选项等都是有固定数量的,我们可以预期单个任务的用户交互路径数量。

然而,因人类语言系统的开放性,在对话类的 AI 产品中,用户为使用一个功能所给出的语音指令是无限的,这大大增加了测试的难度。尤其是在产品概念期和设计早期,在 AI 系统尚未实现全部功能时,如何通过有限的系统能力,应对无限的用户指令进行测试,了解用户对 AI 系统的真实、有效反馈就成为了问题。

在 AI 产品有了大量数据和长时间的训练,并达到稳定有效时,产品设计和开发者已经投入了大量的时间成本和人力成本,如果这时再进行用户测试发现体验不好,就会造成很大的损失。

那有没有什么办法提前验证 AI 驱动的产品,并提前了解它的用户体验呢?这时,绿野仙踪测试就派上用场了。

图片

这个名字来源于经典童话《绿野仙踪》(the Wizard of Oz),故事中的主角们遇到了一个无所不能的魔法师——奥兹国王,但这个国王其实只是一个没有任何法术的普通人,大家看到的一切都是他躲在帘子后面操作机器完成的。

图片

绿野仙踪测试法就是来自这,由真人在幕后扮演 AI ,从而使在前台的用户相信产品是通过人工智能技术来实现他们指定任务的。它的好处是用低成本的方式测试开发成本高的项目,非常适合用来在早期测试 AI 驱动的产品。

图片

早在 1984 年,就有人使用了绿野仙踪测试法,进行了经典的智能语音输入实验,成功展示了如何测试一个还不存在的系统。

图片

被试者被告知可以使用语音输入的方式在电脑上录入,但实际上他看见的所有呈现在电脑上的字,都是在另一间屋子中研究者输入的。即研究者能听到被试者说了什么,然后用键盘帮他打字。但整个过程,被试者都以为是电脑自动化完成的。

图片

一般我们需要两位研究者进行测试,一位担任主持人向参与的测试者介绍测试的大体流程,并在测试过程中进行观察和记录,另一位研究者在幕后担任“魔法师”。

测试开始前,要先确定被测试产品的概念,为它创建必要的图像、元素。同时,在测试的前期,需要明确“魔法师”与测试者的交互方式,即测试中使用哪些设备、技术?通过什么操控产品原型?

其他就如同传统的用户测试一样,需要准备用于测试的,能代表产品核心功能的任务,并准备好预演,确保研究员在测试现场能根据用户的各类语言指令迅速做出有效的响应。需要注意的是,绿野仙踪法对于“魔法师”有一定的要求,需要扮演这个角色的研究者训练有素,只可针对研究相关的特定场景和指令类型有所回应。

图片

通过这样的方式,在系统还未完善前,我们就能了解到用户对于这些功能的体验如何,以及使用这些功能时的心理模型、期望和用于下达交互指令的词汇。

例如让智能助手类 AI 创建一个群聊,用户会有多少类表达方式,这些在目前我们的产品功能定义中是否都覆盖了?或者在某些聊天场景中,有没有因机器人的智能程度不足,阻碍了用户的使用,这对于用户体验的影响是否严重。这些信息都可以通过绿野仙踪法在正式开发前就提前获得的。

图片

对于很多使用自然交互类的 AI 产品来说,绿野仙踪法是强大的测试工具。它让产品设计者可以不需要等到产品功能齐全,在低成本、低风险的环境中测试和完善用户界面。

同时,"绿野仙踪法"有助于建立更深入的用户参与度。通过在测试中使用虚拟环境和故事情节,测试参与者可以更好地理解产品的用途和潜在价值。他们能够更容易地将自己投入到产品的使用情境中,从而提供更为真实和有代表性的反馈。这有助于发现产品的潜在问题和改进点,使产品更符合用户的需求和期望。

换句话说,它加速了产品的开发过程,提高了产品的质量,同时使测试过程更富有创意和吸引力。通过这种方法,产品设计者可以更好地满足用户需求,创造出更具吸引力和竞争力的产品。

鼎道智联一直以 AI-Native 为目标,DingOS 也在努力为用户们带来更安全、绿色、便捷的操作体验,为开发者带来更开放的合作环境,为所有的使用者如果你也认可我们的想法,欢迎关注我们加入鼎道生态~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1142093.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

供应 JOSEF约瑟 跳位合位监视继电器 JZ-7GJ-S002XMC AC220V

品牌:JOSEF约瑟名称:跳位、合位、电源监视继电器型号:JZ-7GJ-S002XMC额定电压:AC220V功率消耗:≤1.1W触点容量:110V0.5A 系列型号: JZ-7GY-S002XMT跳位、合位、电源监视继电器; JZ-…

27 行为型模式-解释器模式

1 解释器模式介绍 //用于两个整数相加的方法 public static int add(int a , int b){ return a b; } //用于三个整数相加的方法 public static int add(int a , int b,int c){ return a b c; } public static int add(Integer ... arr){ int sum 0; for(Integer num : arr)…

降级熔断:如何屏蔽非核心系统故障的影响?

目录 前言 一、熔断是什么? 二、服务降级 三、雪崩是如何发生的 四、hystrix使用 五、降级机制要如何做 总结 前言 在“双十一”的巨大流量中,商品促销过程中出现了几次短暂的服务不可用,这给部分用户造成了不好的使用体验。事后&…

编译运行windows+OpenMVG+OpenMVS+vs2017

安装vcpkg过程需要翻墙!!! github下载代码 git clone https://github.com/microsoft/vcpkg git clone https://github.com/cdcseacave/VCG.git git clone https://github.com/cdcseacave/openMVS.git src安装vcpkg包 cd .\vcpkg .\bootstr…

电脑桌面可以设置半透明皮肤的待办事项软件推荐哪一款

无论你是在家工作还是在办公室,无论你是学生还是职场人士,每天都有许多任务等待着你。在这些琐事中,很容易遗漏一些重要的工作。那么,如何才能高效地记录和管理这些任务呢?生活和工作中的琐碎任务常常让我们感到忙碌而…

Hadoop、Hive安装

一、 工具 Linux系统:Centos,版本7.0及以上 JDK:jdk1.8 Hadoop:3.1.3 Hive:3.1.2 虚拟机:VMware mysql:5.7.11 工具下载地址: https://pan.baidu.com/s/1JYtUVf2aYl5–i7xO6LOAQ 提取码: xavd…

关于云主机root无法从VNC登录处理

一、问题描述 某次基线加固过程中,一线反馈离开工位后,返回时原root登录会话断开,使用普通用户无法切到root,尝试使用移动云控制台进行VNC登录,但也提示登录失败:报:incorrect auth 二、处理…

Nautilus Chain 联合香港数码港举办 BIG DEMO DAY活动,释放何信号?

在今年的 10 月 26 日 9:30-18:30 GMT8 期间,Nautilus Chain 联合香港数码港共同举办了 “BIG DEMO DAY” Web3 项目路演活动,包括Xwinner、Sleek、Tx、All weather、Coral Finance、DBOE、PARSIQ、Hookfi、Parallels、Fintestra 以及 dot.GAMING 等在内…

1763. 最长的美好子字符串

1763. 最长的美好子字符串 java代码&#xff1a; class Solution {public String longestNiceSubstring(String s) {int n s.length();int maxPos 0;int maxLen 0;for (int i 0; i < n; i) {int lower 0;int upper 0;for (int j i; j < n; j) {if (Character.isL…

(四)库存超卖案例实战——优化redis分布式锁

前言 在上一节内容中&#xff0c;我们已经实现了使用redis分布式锁解决商品“超卖”的问题&#xff0c;本节内容是对redis分布式锁的优化。在上一节的redis分布式锁中&#xff0c;我们的锁有俩个可以优化的问题。第一&#xff0c;锁需要实现可重入&#xff0c;同一个线程不用重…

Linux 应用程序CPU调度优化

缘起 实时操作系统&#xff08;Real-time operating system, RTOS&#xff09;&#xff0c;又称即时操作系统&#xff0c;它会按照排序运行、管理系统资源&#xff0c;并为开发应用程序提供一致的基础。实时操作系统与一般的操作系统相比&#xff0c;最大的特色就是实时性&…

如何通过员工工时管理降低企业成本?

作为当今快节奏商业环境的领导者或管理者&#xff0c;掌握员工的工作时间对于控制企业成本和确保每个人都各尽其责至关重要。 员工工时表软件就是这样一款工时跟踪管理解决方案&#xff1a;数字化的工时表有助于保护企业的财务不会被无节制的开支冲垮。然而&#xff0c;引入此…

windows PC virtualBox 配置

效果&#xff1a; oracle vitualbox 可以访问通PC主机&#xff0c;可以访问外网: 注意&#xff0c;如果docker0网络地址&#xff0c;和PC主机的网络地址冲突了&#xff0c;需要变更docker的网络地址&#xff1a; root/home/mysqlPcap/anti-tamper $ cat /etc/docker/daemon.js…

C++初阶1

目录 介绍&#xff1a; 一&#xff0c;命名空间 1-1&#xff0c;命名空间的定义 1-2&#xff0c;命名空间的使用 1-3&#xff0c;C标准官方命名空间 二&#xff0c;缺省参数 2.1&#xff0c;缺省参数分类 三&#xff0c;函数重载 四&#xff0c;引用 4-1&#xff0c;…

论文阅读——ELECTRA

论文下载&#xff1a;https://openreview.net/pdf?idr1xMH1BtvB 另一篇分析文章&#xff1a;ELECTRA 详解 - 知乎 一、概述 对BERT的token mask 做了改进。结合了GAN生成对抗模型的思路&#xff0c;但是和GAN不同。 不是对选择的token直接用mask替代&#xff0c;而是替换为…

中国两轮“技术派”绿源,为全球电动市场带来跨越式方案

历史越长的行业&#xff0c;遇到变革之时&#xff0c;需要经历的考验、做出的突破就越多。两轮电动车&#xff0c;这个非常本土化的赛道&#xff0c;就是如此。 中国是两轮电动车产销大国&#xff0c;自上世纪晚期开始&#xff0c;中国两轮电动车迅速发展&#xff0c;绿源等一…

【Linux】虚拟机部署与发布J2EE项目(Windows版本)

&#x1f389;&#x1f389;欢迎来到我的CSDN主页&#xff01;&#x1f389;&#x1f389; &#x1f3c5;我是Java方文山&#xff0c;一个在CSDN分享笔记的博主。&#x1f4da;&#x1f4da; &#x1f31f;推荐给大家我的专栏《微信小程序开发实战》。&#x1f3af;&#x1f3a…

优思学院|精益管理的八步法

精益管理是什么&#xff1f;所谓的精&#xff0c;即少而精&#xff0c;不投入多余的生产要素&#xff0c;只是在适当的时间生产必要数量的市场急需产品&#xff08;或下道工序急需的产品&#xff09;&#xff1b;所谓的益&#xff0c;即所有经营活动都要有益有效&#xff0c;具…

【C语言】字符函数与字符串函数

简单不先于复杂&#xff0c;而是在复杂之后。 目录 0. 前言 1. 函数介绍 1.1 strlen 1.1.1 介绍 1.1.2 strlen 函数模拟实现 1.1.2.1 计数器方法 1.1.2.2 递归方法 1.1.2.3 指针 - 指针方法 1.2 strcpy 1.2.1 介绍 1.2.2 strcpy 函数模拟实现 1.3 strcat 1…

TSINGSEE青犀睡岗离岗检测算法——确保加油站安全运营

众所周知&#xff0c;加油站是一个需要24小时营业的场所&#xff0c;由于夜间加油人员较少&#xff0c;员工极易处于疲劳或者睡眠状态&#xff0c;为保障安全和效率&#xff0c;通过TSINGSEE青犀睡岗离岗检测算法在加油站场景中&#xff0c;可以及时发现工作人员的疲劳状况&…