在可用性测试中,我们使用用户在真实生活背景下会遇到的任务,以保证数据的准确性。话句话说,我们观察到的用户行为是有代表性的,这样我们发现的问题才是那些用户最有可能遇到的问题。
阶段1:确定任务
在你坐下来设计一系列任务之前,你很有可能已经经历下列阶段:
Dumas和Fox(2008, p1131)总结了最有可能在可用性测试中使用的任务,包括:
在这一步,你不必考虑如何描述任务,只要确保你的任务涵盖了所有你要测试的区域。
阶段2:设计任务
任务设计的好坏决定了可用性测试的信度和效度,以及数据的有用性。你应该思考:
任务的类型
任务可以分为两大类:
你要决定使用哪种任务以及什么时候使用它们。
情景任务或直接任务
情景任务(scenario task)是一个小型的用户故事:通常它有人物、背景和为达到目标所必需的细节。例如,测试手机浏览器及其底部菜单:
“这周六你准备举办一个晚餐聚会。你想在BBC的美食网站上找到咖喱鸡的食谱。”
直接任务(direct task)是完全工具性的。例如,使用上面的例子:
“从BBC的美食网站上找到咖喱鸡的食谱。“
我们通常使用情景任务。它模拟了真实的生活背景,参与者能够很快适应,因此也更有可能以自然的方式使用网站。这能大大减小用户测试的人为性。他们越是能够联系现实,测试结果就越可靠(Rubin, 1994; Dumas and Fox, 2008)。此外,有研究发现,情景任务对亚洲参与者更为有效(Shi, 2010)。
趣味研究:Apala Lahiri Chavan的研究发现,对于印度参与者,当使用宝莱坞风格的任务时,能够收集到更多的有用反馈。例如:
“你天真的小妹妹这周六就要结婚了。你刚得到消息说,准新郎其实已经结婚了!所以,你想尽快预定机票去找到你的妹妹,然后解救她。”
研究者发现,印度参与者面对陌生的主持人更不愿意发表批评,但一旦任务设计得就像一个电影故事,参与者会变得更加开放、更有话说。
封闭式任务和开放式任务
封闭式任务对参与者需要做什么做出了规定。这类任务有正确答案,可以测量参与者是否成功完成了任务。封闭式任务是最常用的任务类型。例如,测试电话的短信功能:
“你想发短信告诉包租婆你准备明天给她房租。包租婆的电话号码是:7921233290。”
开放式任务对于用户要做什么只有最少量的信息,也没有什么具体的指示。它给用户更多自由探索的空间。如果你想找出哪些区域用户会自发地与之互动,或者哪些区域对用户最重要,可以使用这类任务。
例如,在测试Ubuntu.com时,设计人员想知道为了解这个网站什么信息是用户来说是重要的。在这个例子中,开放式任务较为合适:
“你听到你朋友提到了‘Ubuntu‘的东西。你比较感兴趣,想要知道更多关于Ubuntu是什么以及它能提供你什么的东西。”
开放式任务有三大局限:
任务的表述
阶段3:设置任务顺序要有分寸
一般而言,任务本身是彼此独立,因为:(1)要保证灵活性,对不同参与者可能要改变任务顺序;(2)当参与者在前一个任务失败后,他们也能继续下一个任务。
然而,有时候我们会有意使用相互依赖的任务(进行下一个任务取决于参与者有没有成功完成前一个任务)。例如:
“你想要用一个应用写一份购物清单,其中包括所有食谱中需要的原料。”
这个例子中,参与者要找到笔记应用并输入原料。
然后会有一些与上面这个任务无关的任务,例如:
“你记得这周四上午10点在你的办公室与约翰有一个重要的会面。你想把它记载日历里,以防忘记。”
然后我引导参与者:
“你想在你的购物清单中再添加一份厨房卷纸。”
这需要参与者回到他们之前打开的应用,这样我们能了解到参与者是否知道在右边缘滑动可以去到正在运行的应用。换句话说,他们是否知道多任务运行的特性。
现在你就有了第一个版本的任务。完成之后,你要在界面上试验你的任务,检查它们是否合理。
总结
我们利用任务来研究界面的可用性和用户体验。任务质量决定了测试结果的有用性和准确性。下面是要点的总结:
有了任务列表后,还没有结束。
时间允许的话,要找人试验这些任务,确保它们是可理解的,任务顺序也没有问题。总是有值得改善的地方。
此外,一旦进入实际测试阶段,你会发现无论任务设计得多么完美,你都需要根据测试环境的变化快速做出反应和调整:我们无法预料参与者会做什么。因此,知道怎样在真实的测试条件下操纵任务是重要的。
References
Dumas, J.S. & Loring, B.A. (2008).Moderating Usability Tests: Principles and Practices for Interacting. SanFrancisco, CA: Morgan Kaufmann.
Rubin, J. (1994). Handbook of UsabilityTesting: How to Plan, Design and Conduct Effective Tests. New York: John Wiley& Sons.
Schaffer, E. (2002) Bollywoodtechnique, http://www.humanfactors.com/downloads/jun02.asp#bollywood
Shi, Q. (2010). An Empirical Study ofThinking Aloud Usability Testing from a Cultural Perspective. PhD thesis.Denmark: University of Copenhagen.
联系客服