人机交互学习-10 评估的基础知识

news2024/11/15 1:44:27

评估的基础知识

  • 背景
  • 评估目标和原则
    • 评估目标
      • 评估的优点
      • 评估的目标
    • 评估原则
  • 评估范型和技术
    • “范型”与“技术”
    • 评估范型
      • 快速评估
      • 可用性测试
      • 实地研究
      • 预测性评估
      • 评估范型比较
    • 评估技术
    • 评估范型和技术的关系
  • 评估方法的选择
    • 区分评估技术的因素
    • 评估技术的分类
    • 评估方法组合
  • 评估步骤
    • 确定目标
    • 发掘问题
    • 选择评估范型和技术
    • 明确实际问题
    • 处理道德问题
    • 解释并表示数据
  • 小规模试验
  • 可用性问题分级
  • 评估
    • 评估之观察用户
    • 评估之询问用户和专家
    • 评估之用户测试

背景

  • 评估总是需要的
  • 什么是评估?
    系统化的数据搜集过程
    目的是了解用户或用户组在特定环境中,使用产品执行特定任务的情况
  • 评估不是设计过程中一个单独的阶段
    优秀的交互设计师应掌握如何在不同的开发阶段评估不同的系统

评估目标和原则

评估目标

评估的优点

  • 能够在交付产品之前(而不是之后)修复错误
  • 设计小组能够专注于真实问题,而不是假想问题
  • 工程师们能专心于编程而不是争论
  • 能够大大缩短开发时间
  • 销售部门可获得稳定的设计

评估的目标

  • 评估系统功能的范围和可达性
  • 评估交互中用户的体验
  • 确定系统的某些特定问题

评估原则

  • 评估应该依赖于产品的用户
    与专业技术人员的水平和技术无关
  • 评估与设计应结合进行
    仅靠用户最后对产品的一两次评估,不能全面反映出软件可用性的
  • 评估应在用户的实际工作任务和操作环境下进行
    根据用户完成任务的结果,进行客观的分析和评估
  • 要选择有广泛代表性的用户
    参加测试的人必须具有代表性

评估范型和技术

“范型”与“技术”

  • 范型与具体学科相关,对如何评估有很大影响
    可用性测试是一种评估范型
  • 每种范型有特定的技术
    可用性测试的技术有观察、问卷调查、访谈等

评估范型

  • 快速评估
  • 可用性测试
  • 实地研究
  • 预测性评估

快速评估

  • 设计人员非正式地向用户或顾问了解反馈信息,以证实设计构思是否符合用户需要
    可在任何阶段进行
    强调 “快速了解”,而非仔细记录研究发现,在设计初期了解用户对新产品的意见、在设计末期了解用户对图标设计的看法等
    得到的数据通常是非正式、叙述性的,可以口语、书面笔记、草图、场景的形式反馈到设计过程
    是设计网站时常用的方法
  • 基本特征:快速

可用性测试

  • 评测典型用户执行典型任务时的情况
    包括用户出错次数、完成任务的时间
  • 基本特征
    是在评估人员的密切控制之下实行的
  • 主要任务
    量化表示用户的执行情况
  • 缺点
    测试用户的数量通常较少
    不适合进行细致的统计分析

实地研究

  • 基本特征
    在自然工作环境中进行
  • 目的
    理解用户的实际工作情形以及技术对他们的影响
  • 作用
    探索新技术的应用契机
    确定产品的需求
    促进技术的引入
    评估技术的应用
  • 分类
    评测人员作为“局外人”
    评测人员也可作为“局内人”或测试用户

预测性评估

  • 专家们根据自己对典型用户的了解(通常使用启发式过程)预测可用性问题,也可使用理论模型
  • 基本特征
    用户可以不在场
    使得整个过程快速、成本较低
  • 启发式评估是典型的预测性评估方法
    注意:
    1)启发式原则应定制
    2)可能误导设计人员,且有些结果可能并不准确

评估范型比较

在这里插入图片描述

评估技术

  • 观察用户
    有助于确定新产品的需求
    也可用于评估原型
    挑战:如何在不干扰用户的前提下观察用户,以及如何分析大量数据
  • 询问用户意见
    简单,调查用户数量从几个到几百不等
  • 询问专家意见
    “角色扮演”方式评估
    同时专家会提出解决方案
  • 测试用户的执行情况
    可比较不同设计方案优劣
    通常在受控环境中进行
  • 基于模型和理论,预测界面的有效性
    常用技术如GOMS模型和KLM模型等

评估范型和技术的关系

在这里插入图片描述
每种范型有特定的技术

评估方法的选择

区分评估技术的因素

  • 评估在周期中的位置
    设计早期阶段的评估更快速、便宜
  • 评估的形式
    实验室环境or工作环境
  • 技术的主客观程度
    技术越主观,受评估人员知识的影响越大,如认知走查等
  • 测量的类型
    与技术的主客观性有关
    1)主观技术:定性数据
    2)客观技术:定量数据
  • 提供的信息
    低层信息:这个图标是可理解的吗?
    高层信息:这个系统是可用的吗?
  • 响应的及时性
    边做边说法可及时记录用户行为
    任务后的走查取决于对事件的回忆
  • 干扰程度
    直接响应测量可能会影响用户表现
  • 所需资源
    设备、时间、资金、参与者、评估人员的专业技术及环境等

评估技术的分类

在这里插入图片描述

评估方法组合

  • 评估方法的组合取决于项目待评估的具体特性
  • 常用组合:(一个经验性评估+边做边说或其他形式的可用性测试)
    1)启发式评估+边做边说等用户测试技术
    专家可通过启发性评估排除显而易见的可用性问题
    重新设计后,经用户测试,反复检查设计的效果
    2)访谈+问卷调查
    先对小部分用户进行访谈,确定问卷中的具体问题
  • 启发式评估vs.用户测试
    前者不需要用户参与
    二者发现的可用性问题不同,可以互补

评估步骤

DECIDE评估框架

  • 确定(Determine)评估需要完成的总体目标
  • 发掘(Explorer)需要回答的具体问题
  • 选择(Choose)用于回答具体问题的评估范型和技术
  • 标识(Identify)必须解决的实际问题,如测试用户的选择
  • 决定(Decide)如何处理有关道德的问题
  • 评估(Evaluate)解释并表示数据

确定目标

  • 评估目标决定了评估过程,影响评估范型的选择
  • 为什么要评估?
    产品设计是否理解了用户需要?
    最终界面是否满足一致性要求?
    调查技术的引入对用户工作的影响?
    探讨新产品应做的改进?
  • 举例
    1)设计界面时,需量化评价界面质量
    适合进行可用性测试
    2)为儿童设计新产品时,要使产品吸引人
    适合采用实地研究技术,观察儿童交谈

发掘问题

  • 根据目标确定问题
    目标:找出为什么客户愿意通过柜台购买纸质机票,而非通过互联网购买电子机票
    问题:
    用户对新票据的态度如何?是否担心电子机票不能登机
    用户是否能够通过互联网订票?
    是否担心交易的安全性?
    订票系统的界面是否友好?是否便于完成购票过程?
  • 问题可逐层分解

选择评估范型和技术

  • 范型决定了技术类型
  • 必须权衡实际问题和道德问题
    最适合的技术可能成本过高
    或所需时间过长
    或不具备必要设备和技能
  • 可结合使用多种技术
    不同技术有助于了解设计的不同方面
    不同类型数据可从不同角度看待问题
    组合有助于全面了解设计的情况

明确实际问题

  • 用户
    应选择恰当的用户参与评估
    1)能代表产品的目标用户群体
    2)可以先做测试,确定用户技能所属的用户群
    任务时间多长,20分钟休息一次
    可在任务执行前,安排用户熟悉系统
  • 设施及设备
    如需多少台摄像机录像,具体摆放在何位置
  • 期限及预算是否允许
  • 是否需要专门技能,没有可用性专家

处理道德问题

  • 应保护个人隐私
    除非获得批准,否则书面报告不应提及个人姓名,或把姓名与搜集到的数据相联系
    受保护的个人资料包括健康状况、雇佣情况、教育、居所和财务状况等
    可在评估前签署一份协议书
  • 指导原则
    说明研究的目的及要求参与者做的工作
    说明保密事项,对用户&对项目
    测试对象是软件,而非个人
    对测试过程的特殊要求,是否边做边说等
    用户可自由表达对产品的意见
    说明是否对过程进行录像,不能拍摄用户的面部
    欢迎用户提问
    用户有随时终止测试的权利
    对用户话语的使用应征得同意,并选择匿名方式
    己所不欲,勿施于人

解释并表示数据

  • 搜集什么类型的数据,如何分析,如何表示?——通常由评估技术决定
  • 可靠性
    给定相同时间,不同时间应用同一技术能否得到相同结果
    非正式访谈的可靠性较低
  • 有效性
    能否得到想要的测量数据
  • 偏见
    评估人员可能有选择地搜集自己认为重要的数据
  • 范围
    研究发现是否具有普遍性
  • 环境影响
    霍索恩效应

小规模试验

  • 对评估计划进行小范围测试
    以确保评估计划的可行性
    如检查设备及使用说明
    练习访谈技巧
    检查问卷中的问题是否明确
  • 小规模试验可进行多次
    类似迭代设计
    测试——反馈——修改——再测试
    快速、成本低

可用性问题分级

  • 评估结果总是可用性问题清单,以及改进建议
  • 方法一:基于量化数据的分级
    如多少人遇到该问题,耗费多少时间等
  • 方法二:问题严重性的主观打分,取平均值
    0:不是一个可用性问题
    1:一个表面的可用性问题
    如果项目时间不允许,可不予纠正
    2:轻微的可用性问题
    优先级较低
    3:重要可用性问题
    需要重视,给以高优先级
    4:可用性灾难
    产品发布之前必须纠正
  • 方法三:可用性分级的两个因素
    多少用户会遇到这个问题
    用户受该问题影响的程度
    在这里插入图片描述
  • 方法四:该问题只在第一次使用时出现,还是会永远出现
    举例:菜单条中的下拉菜单
    用户从不尝试下拉用图标表示的菜单
    有人告诉他们后,可马上知道如何克服该不一致性问题
    因此该问题不属于永久性的可用性问题

评估

评估之观察用户

  • 直接观察
    实验室观察
    现场观察
  • 间接观察
    日志和交互记录
  • 数据记录
    纸笔
    音视频
    日志和交互记录
  • 数据分析
    定性分析
    定量分析

评估之询问用户和专家

  • 访谈
    问卷调查
    和访谈的区别
    选用
  • 认知走查
    哪些特点
  • 启发式评估
    灵活运用

评估之用户测试

  • 用户测试的适用范围
  • 用户测试步骤
    各步骤文档的包含内容
  • 进行简单的数据分析
  • 设计和组织一个用户测试

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/656125.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

CTFshow-pwn入门-Test_your_nc

pwn0 靶场环境启动开,显示ssh连接。 直接打开ctfshow的pwn专用虚拟机来使用ssh连接。密码是123456。 连接之后,他会出现这样的一大堆的介绍性文字,不用管他,然他输出完就行。 中间还用各种语言说了一下“消灭人类暴政&#xff…

Python+Qt桌面端与网页端人工客服沟通工具

程序示例精选 PythonQt桌面端与网页端人工客服沟通工具 如需安装运行环境或远程调试&#xff0c;见文章底部个人QQ名片&#xff0c;由专业技术人员远程协助&#xff01; 前言 这篇博客针对<<PythonQt桌面端与网页端人工客服沟通工具>>编写代码&#xff0c;代码整洁…

java swing 购物系统 简要文档 idea eclipse双版本

java swing 购物系统 简要文档 idea eclipse双版本 安装包等资源项目源码项目安装包部署教程 图片演示添加商品类别界面添加商品界面查询商品界面未登录主界面管理员登录界面注册会员界面购买商品界面商品类别管理界面 核心代码CustomerAddInterFrm.javaMainFrm.javaManagerLog…

单片机基于 Linux 环境下的Makefile 工程管理和工具链配置

一、开发环境 开发板&#xff1a;stm32f407 编译环境&#xff1a;18.04.6 LTS 工具链&#xff1a;gcc-arm-none-eabi, gcc-arm-none-objcopy 二、工具链下载和安装 下载地址&#xff1a;&#xff08;下载64位linux版&#xff09; https://launchpad.net/gcc-arm-embedded/downl…

从零开始Vue项目中使用MapboxGL开发三维地图教程(五)加载点、线、面图层以及三维面图层(白模)

目录 1、加载点图层2、加载线和面图层3、加载三维面图层&#xff08;白模&#xff09; 1、加载点图层 开发地图应用时&#xff0c;加载POI等点状数据&#xff0c;显示文字或者图标信息&#xff0c;mapbox-gl对应使用的是符号图层&#xff08;symbol&#xff09;&#xff0c;下面…

Modbus通信介绍 网络高级工具使用

目录 Modbus简介 ModbusTCP协议格式 》1.报文头&#xff08;共7字节&#xff09; 》2.功能码 》3.数据 练习&#xff1a;读传感器数据&#xff0c;读1个寄存器数据&#xff0c;写出主从数据收发协议。 练习&#xff1a;写出控制IO设备开关的协议数据&#xff0c;操作1个…

ansible学习

在物理机查看环境&#xff0c;[kioskfoundation0 ~]$ cat /etc/rht 先清空当前环境&#xff0c;[kioskfoundation0 ~]$ rht-clearcourse 0 再切换rh294环境&#xff0c;[kioskfoundation0 ~]$ rht-setcourse rh294 验证环境是否切换成功&#xff0c;[kioskfoundation0 ~]$ cat…

230617已安装SqlServer2017Express,再安装一个SqlServer2017ExpressAdvanced试试

再安装一个 MsSqlServer 试试 再安装一个 MsSqlServer 试试, 这次用高级版 之前已经安装了 一个 MsSqlServer2017Express一个MsSqlServer2017LocalDB 现在再安装一个 MsSqlServer2017ExpressAdvanced 直接下一步 等待 下个页面列出了已经安装的MsSqlServer实例 之前已…

【群智能算法改进】一种改进的白鲸优化算法 改进白鲸优化算法 改进后的EBWO[2]算法【Matlab代码#42】

文章目录 【获取资源请见文章第5节&#xff1a;资源获取】1. 原始BWO算法2. 改进后的EBWO算法2.1 准反向学习QOBL策略2.2 旋风觅食策略 3. 部分代码展示4. 仿真结果展示5. 资源获取 【获取资源请见文章第5节&#xff1a;资源获取】 1. 原始BWO算法 白鲸优化算法 (BWO&#xff…

STM32pwm 时钟 配置 周期 频率 关系配置原理

一 概念 PWM&#xff08;脉冲宽度调制&#xff09;是一种常用的电子信号调制技术&#xff0c;用于控制电子设备中的电平和电流。它通过调整脉冲的宽度来控制信号的平均功率。 在PWM信号中&#xff0c;一个周期由一个固定的频率确定&#xff0c;称为PWM频率。每个周期内&#…

分布式锁服务关键技术和常见解决方案

前言 锁&#xff0c;核心是协调各个使用方对公共资源使用的一种机制。当存在多个使用方互斥地使用某一个公共资源时&#xff0c;为了避免并行使用导致的修改结果不可控&#xff0c;需要在某个地方记录一个标记&#xff0c;这个标记能够被所有使用方看到&#xff0c;当标记不存在…

Matter.js 插件:matter-wrap(世界是圆的)

theme: smartblue 本文简介 点赞 关注 收藏 学会了 记得以前看爆笑校园里有一集讲到&#xff0c;一个人对着前面开了一枪&#xff0c;过了一阵子弹打中他自己的后脑勺。作者想通过这个冷笑话告诉大家一件事&#xff1a;地球是圆的。 在 Matter.js 世界里&#xff0c;默认是没…

stable-diffusion-webui远程访问、插件在线安装

本篇文章可以解决以下问题&#xff1a;stable-diffusion-webui 安装插件报错、没有用户登录安全认证、云主机安装后无法远程访问。 成功安装stable-diffusion-webui后&#xff0c;可以通过命令 bash webui.sh 启动。启动后可以通过 http://127.0.0.1:7860访问。但无法进行远程…

QML快速上手1 - 预备知识

目录 前言QtQuick 预备知识二维坐标系textimagemousearea组件定位元件布局项输入元素 前言 此笔记及后续所有笔记均基于如下环境 Qt Quick 2.12Qt 5.12 参考文献&#xff1a; qmlbook 以下所有笔记均从上述qmlbook中选取精华得来&#xff0c;如果嫌英文太多或者原文太长&am…

【论文系列解读】MiniGPT-4: 增强视觉语言理解与先进的大型语言模型

Minigpt4 MiniGPT-4: Enhancing Vision-Language Understanding with Advanced Large Language Models MiniGPT-4: 增强视觉语言理解与先进的大型语言模型 (0) 总结&实测 minigpt是先提出来的&#xff0c;将视觉编码器和LLM对齐&#xff0c;blip2和它还是有蛮大区别的。…

Python中对基本文件操作

1.文件的作用 保存数据放在磁盘中 2.打开文件 fopen(‘文件’,‘w’)或者fopen(‘文件’,‘r’) 3.文件操作 3.1 写数据(write) 如果文件不存在那么创建&#xff0c;如果存在那么就先清空&#xff0c;然后写入数据 对象open(“文件”,w) 对象.write&#xff08;“写入数…

论文浅尝 | 用于推荐的知识自适应对比学习

笔记整理&#xff1a;俞洪涛&#xff0c;浙江大学硕士&#xff0c;研究方向为知识图谱表示学习 链接&#xff1a;https://dl.acm.org/doi/10.1145/3539597.3570483 动机 在基于知识图谱的推荐系统中&#xff0c;用户和项目的交互信息通常会在模型中占主导地位&#xff0c;而KG中…

OPA Gatekeeper对Kubernetes资源操作限制

OPA介绍 Open Policy Agent&#xff08;OPA&#xff0c;发音为“oh-pa”&#xff09;是一个开源的通用策略引擎&#xff0c;它统一了堆栈中的策略执行。OPA 提供了一种高级声明性语言&#xff0c;可让您将策略指定为代码和简单的 API&#xff0c;以从您的软件中卸载策略决策制…

第七十六天学习记录:计算机硬件技术基础:Intel系列微处理器

Intel系列微处理器概述 8086/8088微处理器 8086/8088微处理器是英特尔公司于1978年推出的16位处理器&#xff0c;在80年代是个非常流行的芯片&#xff0c;被广泛用于个人电脑和工作站。它是x86家族处理器的一员&#xff0c;被视为现代PC体系结构的基础。 8086/8088微处理器的…

对耳朵伤害最小的耳机类型,列举几款不入耳的骨传导耳机

骨传导耳机是最近几年火爆起来的耳机&#xff0c;它是将声音转化为不同频率的机械振动&#xff0c;通过人的颅骨、骨迷路、内耳淋巴液、螺旋器、听神经、听觉中枢来传递声波。与普通耳机相比最大的区别是声音不经过外耳道&#xff0c;避免了耳道长时间堵塞导致的中耳炎疾病发生…