可用性測(cè)試的權(quán)衡之道

作者：Bo-jian 2012-09-07 09:57:14

對(duì)于可用性測(cè)試，業(yè)內(nèi)人士存在一些普遍認(rèn)可的原則。它們神圣地如同自然科學(xué)里的理論，似乎我們只能對(duì)其言聽(tīng)計(jì)從、俯首稱臣才能踐行出“好的可用性測(cè)試”。其實(shí)，即便是科學(xué)，它的一個(gè)特征也是“可證偽性”——理論的正確性總是存在前提條件的。真理再向前一步就成為謬誤！

可用性測(cè)試中的原則同樣如此，需要根據(jù)目的、資源、環(huán)境的不同，靈活把握、權(quán)衡取舍，而非一味恪守某一個(gè)或某幾個(gè)原則，也許這才是可用性從業(yè)人員經(jīng)驗(yàn)重要性的體現(xiàn)。

一．任務(wù)設(shè)置：精細(xì) VS 寬泛

制定的任務(wù)過(guò)于精細(xì)，一般原則上是反對(duì)的。理由很清楚，如果你的任務(wù)精細(xì)到一步一步“引導(dǎo)”用戶進(jìn)行操作，那太不符合用戶現(xiàn)實(shí)中的使用情境，平時(shí)沒(méi)有人在旁邊“引導(dǎo)”用戶的每一步操作；而且過(guò)于控制用戶的操作步驟，用戶缺乏真實(shí)使用時(shí)的靈活性。

是不是我們?cè)O(shè)置的任務(wù)只能是寬泛的，不能細(xì)化呢？這就必須根據(jù)研究的目的來(lái)做抉擇。如果產(chǎn)品處在設(shè)計(jì)的初期，我們需要關(guān)注一些宏大的問(wèn)題（如：網(wǎng)站的整體架構(gòu)、導(dǎo)航和分類的合理性、頁(yè)面的邏輯關(guān)系），此時(shí)就需要通過(guò)寬泛而有彈性的任務(wù)，來(lái)查找宏觀層面的問(wèn)題。如果產(chǎn)品的設(shè)計(jì)已經(jīng)非常完善，開(kāi)始進(jìn)行細(xì)節(jié)的修改迭代，此時(shí)就需要通過(guò)設(shè)置相對(duì)具體的任務(wù)來(lái)查找特定的細(xì)節(jié)問(wèn)題（如：對(duì)某個(gè)命名的理解、按鈕的使用、鏈接的點(diǎn)擊、表單的填寫(xiě)）。按照《Don’t Make Me Think》一書(shū)的觀點(diǎn)：一般用戶使用互聯(lián)網(wǎng)產(chǎn)品時(shí)滿足于能用就行，不會(huì)尋求最好的使用方法；只掃描網(wǎng)頁(yè)，不會(huì)仔細(xì)閱讀。所以，如果完全寬泛有彈性地設(shè)置任務(wù)，雖然更吻合實(shí)際使用情況，但是很可能用戶直接跳過(guò)你想考察的細(xì)節(jié)。

實(shí)際工作中，由于時(shí)間和資源的限制，無(wú)法做到每個(gè)產(chǎn)品從設(shè)計(jì)初期到上線前后進(jìn)行多次可用性測(cè)試。可能在一次的可用性測(cè)試中即需要同時(shí)關(guān)注宏觀方面和細(xì)節(jié)上的問(wèn)題。此時(shí)，還是需要和產(chǎn)品經(jīng)理、交互設(shè)計(jì)師反復(fù)溝通，確認(rèn)測(cè)試的主要目的，同時(shí)通過(guò)對(duì)任務(wù)設(shè)置精細(xì)程度的權(quán)衡把握，使次要目的也盡量得以滿足。

不過(guò)，即便是想考察細(xì)節(jié)的任務(wù)，也要盡量避免“直接指導(dǎo)操作”式的語(yǔ)言描述方式，這樣能讓任務(wù)與真實(shí)使用情境不會(huì)相距太遠(yuǎn)。例如：想考察豆瓣讀書(shū)頁(yè)面【想要】按鈕是否能被看到、是否具備可點(diǎn)擊感。下面列出兩種表述方式，以作對(duì)比：

A.請(qǐng)找到您喜歡的那本書(shū)，并在該頁(yè)面點(diǎn)擊【想要】。（×）

B.請(qǐng)找到您喜歡的那本書(shū)，并在該頁(yè)面對(duì)其作個(gè)標(biāo)記。（√）

二．任務(wù)數(shù)量：多VS少

任務(wù)數(shù)量的多少與可用性測(cè)試考察范圍有關(guān)，與任務(wù)的精細(xì)程度也有關(guān)。如果對(duì)網(wǎng)站全站進(jìn)行考察和只對(duì)其中某個(gè)頁(yè)面、某個(gè)操作流程進(jìn)行考察，所需的任務(wù)數(shù)量自然不一樣。在同樣的考察范圍下，如果任務(wù)設(shè)置得越精細(xì)，所需任務(wù)數(shù)量也就越多。

Lindgaard和Chattratichart（2007）的研究發(fā)現(xiàn)任務(wù)數(shù)量與發(fā)現(xiàn)可用性問(wèn)題比例存在顯著的相關(guān)關(guān)系（r=0.82，p<0.01）。為了盡可能多地發(fā)現(xiàn)可用性問(wèn)題，我們就盡量多地設(shè)置任務(wù)給用戶嗎？

此時(shí)要考慮任務(wù)數(shù)量過(guò)多可能帶來(lái)的弊端：學(xué)習(xí)效應(yīng)和疲勞效應(yīng)，尤其是靠后的任務(wù)更可能會(huì)受影響。心理學(xué)實(shí)驗(yàn)中處理此問(wèn)題的方法是順序平衡，抵消影響。但是可用性測(cè)試中設(shè)置的場(chǎng)景和任務(wù)存在特定的先后次序，不適合采用順序平衡的方法。基于我們的經(jīng)驗(yàn)，還是通過(guò)對(duì)測(cè)試的任務(wù)數(shù)量進(jìn)行控制，確保正式測(cè)試環(huán)節(jié)最多不超過(guò)1小時(shí)，加上前后的歡迎語(yǔ)、訪談、問(wèn)答等，整個(gè)過(guò)程不超過(guò)1.5小時(shí)。

此外，任務(wù)數(shù)量的多少還會(huì)間接影響到測(cè)試所需參與者數(shù)量的多少。

三．用戶人數(shù)：5個(gè)足夠VS 5個(gè)不夠

Nielsen的研究發(fā)現(xiàn)，5個(gè)用戶可以發(fā)現(xiàn)80%以上的可用性問(wèn)題。這個(gè)結(jié)論得到許多人的推崇，因此稱之為“魔法數(shù)字5”。這個(gè)結(jié)論的來(lái)源依據(jù)是每個(gè)用戶平均可以發(fā)現(xiàn)30%的可用性問(wèn)題，且假設(shè)所有問(wèn)題都有同等被發(fā)現(xiàn)的概率。不過(guò)，當(dāng)設(shè)置的任務(wù)數(shù)量過(guò)多，且任務(wù)的精細(xì)程度和難度多種多樣時(shí)，這個(gè)前提有可能不成立。

Lindgaard和Chattratichart（2007）的研究發(fā)現(xiàn)測(cè)試用戶數(shù)量與發(fā)現(xiàn)的可用性問(wèn)題比例并不存在顯著的相關(guān)關(guān)系。這個(gè)結(jié)論似乎又支持我們選擇少量用戶進(jìn)行測(cè)試即可。

其實(shí)，在用戶招募階段，比用戶數(shù)量更需要重視是用戶的代表性的問(wèn)題。能否招募到有代表性的用戶將直接影響可用性測(cè)試的成敗。如測(cè)試一個(gè)醫(yī)療軟件產(chǎn)品，招募到醫(yī)護(hù)人員和患者作為測(cè)試用戶，那5個(gè)用戶可能就足夠了；但如果只招募到醫(yī)學(xué)實(shí)習(xí)生來(lái)測(cè)試，就必須超過(guò)5個(gè)以上的用戶（即便這樣，也未必能推論到整個(gè)產(chǎn)品的用戶群）。

由此看來(lái)，招募用戶的人數(shù)和任務(wù)的數(shù)量、精細(xì)程度、用戶的代表性也是息息相關(guān)的。參考Tom Tullis（2009）和本人經(jīng)驗(yàn)：當(dāng)可用性測(cè)試范圍限定在一定的范圍（20個(gè)任務(wù)內(nèi)、或30個(gè)網(wǎng)頁(yè)之內(nèi)），且招募到很強(qiáng)代表性的用戶，那么5個(gè)足夠了。如果存在著差別較大的亞群體，爭(zhēng)取做到每個(gè)亞群組有5個(gè)左右的代表性的用戶（當(dāng)然，目標(biāo)用戶的特征及分類應(yīng)該是在可用性測(cè)試之前的用戶調(diào)研階段就解決的問(wèn)題）；一次測(cè)試最多不會(huì)超過(guò)12個(gè)用戶。

四．用戶表現(xiàn)：行為VS言語(yǔ)

在可用性測(cè)試中強(qiáng)調(diào)對(duì)用戶操作行為的關(guān)注，是毋庸置疑的。因?yàn)椋?/p>

1.用戶的行為指標(biāo)更明確、具體、客觀，易觀察和記錄。

2.如果完全把關(guān)注點(diǎn)放在用戶的操作行為上，那么就無(wú)需跟用戶進(jìn)行多余的（指導(dǎo)語(yǔ)之外的）語(yǔ)言交流。類似于心理學(xué)研究規(guī)范，對(duì)實(shí)驗(yàn)或測(cè)試中的指導(dǎo)語(yǔ)進(jìn)行統(tǒng)一，對(duì)一切無(wú)關(guān)變量（包括主試的語(yǔ)言、體態(tài)表情）進(jìn)行控制，以減少對(duì)研究過(guò)程的干擾。

3.即便你直接詢問(wèn)用戶某些問(wèn)題，也極可能得到錯(cuò)誤的答案。30年前Richard Nisbett和Timothy Wilson的實(shí)驗(yàn)、2年前Peter Johansson在《science》的文章，都證實(shí)了某些情況下人們無(wú)法解釋清楚自己行為的真正原因。另外，用戶還可能揣摩主試的喜好，回答他們認(rèn)為主試期望的答案。

因此，有必要強(qiáng)調(diào)在可用性測(cè)試過(guò)程中關(guān)注的重點(diǎn)永遠(yuǎn)應(yīng)該是用戶的操作行為，而且盡量減少任何無(wú)關(guān)變量的干擾。但這個(gè)原則被有些人引申到極端，認(rèn)為只有觀察用戶的操作行為才有意義，其他信息都是無(wú)需關(guān)注的，甚至輕率地懷疑用戶的話都是不可信的。

可用性測(cè)試的主要目的雖然是發(fā)現(xiàn)問(wèn)題，但也需要了解問(wèn)題背后的原因，而僅僅依靠觀察用戶的操作行為是無(wú)法獲悉所有問(wèn)題背后的原因的，此時(shí)，我們就希望用戶能采用“出聲思維法”，出聲思維就是集中于如何與產(chǎn)品進(jìn)行交互的意識(shí)流。如果測(cè)試中的氛圍比較平等、自然、融洽，用戶又特別愿意表達(dá)，那么用戶就會(huì)在進(jìn)行任務(wù)操作同時(shí)，表達(dá)他們想做什么、打算如何做、背后的原因是什么。此時(shí)，不僅是操作行為、用戶表達(dá)出來(lái)的想法和原因、以及語(yǔ)言中透露出的疑惑、失望、不滿、驚訝、猶豫等情緒同樣是需要我們加以關(guān)注的。但是，有些用戶比較內(nèi)向，不善于主動(dòng)表達(dá)自己的想法，此時(shí)就需要主試跟他進(jìn)行簡(jiǎn)單的交流，以引導(dǎo)用戶說(shuō)出背后的原因（注：不是引導(dǎo)用戶說(shuō)出你期望得到答案）。

所以，在實(shí)際的可用性測(cè)試，基本應(yīng)該以關(guān)注用戶的行為為主，少量、適時(shí)地進(jìn)行詢問(wèn)交流也是需要的。但這個(gè)度如何把握呢？

1.當(dāng)用戶出現(xiàn)猶豫、驚訝、任務(wù)失敗（過(guò)程節(jié)點(diǎn)上出現(xiàn)自然而然地稍微中斷/暫停）的時(shí)候才進(jìn)行簡(jiǎn)單的詢問(wèn)。

2.詢問(wèn)采用一般疑問(wèn)句的句式，重復(fù)用戶剛才的行為表現(xiàn)（要具體客觀）：“你剛才沒(méi)有……，是嗎？”——雖然沒(méi)有直接問(wèn)“為什么”，但暗示了希望聽(tīng)到他進(jìn)一步的解釋。

3.如果用戶沒(méi)有自己主動(dòng)說(shuō)出原因，可以“順便”問(wèn)一下“為什么？”或通過(guò)身體前傾、目光注視等非語(yǔ)言方式來(lái)暗示用戶你希望能聽(tīng)到更多內(nèi)容。若用戶很快、堅(jiān)定地說(shuō)出原因，則該理由的可信度較高；如果用戶猶豫、或難以說(shuō)出原因，就不要繼續(xù)追問(wèn)。

除了上述的語(yǔ)言、情緒、行為都需要得到關(guān)注，還有一種特殊情況是需要聽(tīng)懂用戶“沒(méi)有說(shuō)的”語(yǔ)言。例如，我們預(yù)計(jì)網(wǎng)站的某二級(jí)導(dǎo)航標(biāo)簽和一級(jí)導(dǎo)航標(biāo)簽存在分類邏輯上的不合理；但用戶在測(cè)試中，導(dǎo)航相關(guān)的操作步驟進(jìn)行得很流暢，用戶也什么都沒(méi)說(shuō)。這通常表明用戶認(rèn)為這些是理所當(dāng)然的、不影響操作的——此時(shí)你需要聽(tīng)懂用戶“沒(méi)有說(shuō)的”語(yǔ)言。如果你簡(jiǎn)單粗暴地打斷用戶并詢問(wèn)：“你覺(jué)得這兩個(gè)導(dǎo)航標(biāo)簽如何？”，則變成了一種誘導(dǎo)性地提問(wèn)。

總結(jié)一下關(guān)于此部分內(nèi)容的實(shí)踐應(yīng)用：

1.用戶的操作行為永遠(yuǎn)是可用性測(cè)試的重點(diǎn)。

2.鼓勵(lì)用戶采用“出聲思維法”。

3.適時(shí)、少量地向用戶提問(wèn)，禁止對(duì)同一個(gè)問(wèn)題反復(fù)追問(wèn)“為什么”。

4.采用真正地“傾聽(tīng)”技術(shù)保持和用戶的交流狀態(tài)，而非通過(guò)過(guò)多的話語(yǔ)。

5.開(kāi)放、不預(yù)設(shè)立場(chǎng)地觀察、傾聽(tīng)用戶“沒(méi)有說(shuō)的”語(yǔ)言。

在可用性測(cè)試中考慮需要遵循的原則時(shí)，一定要理解它的適用條件，以及它和其它原則之間的互相影響，并結(jié)合本次用戶研究的目的、資源、環(huán)境綜合考慮，以盡可能形成一個(gè)最優(yōu)方案。由于博文長(zhǎng)度所限，先總結(jié)這么多，在下次的文章中會(huì)繼續(xù)總結(jié)其它幾方面的原則。

#p#

繼續(xù)討論可用性測(cè)試中各種原則的靈活運(yùn)用和注意事項(xiàng)。

五．發(fā)現(xiàn)問(wèn)題：真的 VS 假的

判斷發(fā)現(xiàn)問(wèn)題的真假，初看上去似乎不是個(gè)困難。多數(shù)或全部參與者都遇到的問(wèn)題毫無(wú)疑問(wèn)是明顯的可用性問(wèn)題。或許有人會(huì)建議，根據(jù)參與者中發(fā)現(xiàn)該問(wèn)題的人數(shù)比例來(lái)判斷：比例高是真問(wèn)題，比例低是假問(wèn)題。前半句話可以接受，后半句話則有待商榷。

雖然可用性測(cè)試是相對(duì)嚴(yán)謹(jǐn)?shù)挠脩粞芯糠椒ǎ瞧鋵?duì)無(wú)關(guān)變量控制的嚴(yán)格程度和真正的心理學(xué)實(shí)驗(yàn)還是有一定的差距；并且心理學(xué)實(shí)驗(yàn)對(duì)每組參與者數(shù)量的最低要求是30人，這樣得出的結(jié)論（數(shù)量比例）才具有推論至一般的意義。而可用性測(cè)試一般才8人左右的參與人數(shù)（盡管招募的參與者在質(zhì)的方面非常具有代表性），但卻無(wú)法把可用性測(cè)試中出現(xiàn)的所有數(shù)量比例簡(jiǎn)單推論至一般。8個(gè)參與者中有1人發(fā)現(xiàn)某個(gè)問(wèn)題，不代表現(xiàn)實(shí)中出現(xiàn)同樣問(wèn)題的真實(shí)用戶只有12.5%，更不代表這個(gè)問(wèn)題不是真正的/嚴(yán)重的可用性問(wèn)題。

問(wèn)題的真假除了根據(jù)問(wèn)題出現(xiàn)的次數(shù)比例，還有很重要的考慮點(diǎn)是：用戶“錯(cuò)誤行為”背后的認(rèn)知/思考方式是否合乎邏輯？

這里順便借用一下諾曼《設(shè)計(jì)心理學(xué)》里談到的理論：概念模型——系統(tǒng)表象——心理模型。概念模型可認(rèn)為是產(chǎn)品設(shè)計(jì)人員對(duì)產(chǎn)品的設(shè)計(jì)思想；系統(tǒng)表象可認(rèn)為是產(chǎn)品展現(xiàn)出的交互界面；而心理模型則是用戶按照既往經(jīng)驗(yàn)對(duì)如何操作該產(chǎn)品的設(shè)想。從這個(gè)角度來(lái)認(rèn)識(shí)，可用性問(wèn)題則是“概念模型、系統(tǒng)表象、心理模型”三者的不吻合或矛盾。

通過(guò)分析用戶行為背后的認(rèn)知是否符合邏輯，來(lái)判斷發(fā)現(xiàn)的問(wèn)題的真假，主要體現(xiàn)在以下幾點(diǎn)：

1.“概念模型、系統(tǒng)表象”的不一致

產(chǎn)品設(shè)計(jì)人員突然發(fā)現(xiàn)，界面的交互形式根本沒(méi)有反映出他原先的設(shè)計(jì)思想！

2.“系統(tǒng)表象、心理模型”的不一致

（1）用戶的思維方式受已有的同類產(chǎn)品的影響，并內(nèi)化接受，而新產(chǎn)品的“系統(tǒng)表象”和已有同類產(chǎn)品并不一致。

（2）用戶在日常生活經(jīng)驗(yàn)中形成了許多并不科學(xué)地通俗理解世界的方式（比如通俗物理學(xué)、通俗心理學(xué)），但產(chǎn)品設(shè)計(jì)人員沒(méi)有意識(shí)到用戶在以這樣一種“自認(rèn)正確”的錯(cuò)誤方式來(lái)理解和使用產(chǎn)品。

如果發(fā)現(xiàn)的可用性問(wèn)題屬于以上情況，那么即使只有一個(gè)參與者碰到，它也非常可能是一個(gè)真正的可用性問(wèn)題。

例如：讓用戶登錄購(gòu)彩網(wǎng)站，查看自己上次購(gòu)彩結(jié)果。大多數(shù)用戶點(diǎn)擊【個(gè)人中心】去查看，有2個(gè)用戶點(diǎn)擊【開(kāi)獎(jiǎng)公告】去查看，發(fā)現(xiàn)只有開(kāi)獎(jiǎng)號(hào)碼，沒(méi)有任何購(gòu)彩結(jié)果信息后，再去點(diǎn)擊【個(gè)人中心】。僅2個(gè)人出現(xiàn)了稍微的偏差，而且很快就找到了正確的頁(yè)面，這貌似應(yīng)該不算什么問(wèn)題。

但若追究其行為背后的邏輯，并與其他用戶的反饋（“我上次買的號(hào)碼沒(méi)有直接顯示出來(lái)？”“這里看不到開(kāi)獎(jiǎng)的號(hào)碼啊？”）聯(lián)系起來(lái)，可以判斷用戶的心理模型和產(chǎn)品的系統(tǒng)表象不一致。用戶希望能同時(shí)對(duì)照著開(kāi)獎(jiǎng)號(hào)碼和自己買的號(hào)碼很方便地核對(duì)，而網(wǎng)站卻割裂兩部分放在不同的頁(yè)面，因此需要將這2個(gè)用戶碰到的問(wèn)題當(dāng)作真正的可用性問(wèn)題來(lái)對(duì)待。

六．研究方法：定性 VS 定量

可用性測(cè)試，很多時(shí)候被認(rèn)為是一種定性研究方法；但也有人說(shuō)它是一種定量研究方法。究竟是怎么回事呢？

個(gè)人認(rèn)為，可用性測(cè)試實(shí)質(zhì)上結(jié)合了定性和定量?jī)煞N方法的特點(diǎn)，到底哪種成分更多，要看你的使用目的以及細(xì)節(jié)上如何操作。

定量研究的思路是基于對(duì)一定數(shù)量樣本的測(cè)量，以將研究所得的結(jié)論推廣至總體。除了強(qiáng)調(diào)樣本的代表性，還對(duì)樣本的數(shù)量有具體的要求，同時(shí)會(huì)考慮抽樣誤差、置信度、置信區(qū)間的度量。并且定量研究過(guò)程中非常注重對(duì)某些自變量操控、及無(wú)關(guān)變量的控制。

而定性研究重視對(duì)主觀意義的理解（如背后隱藏的原因），采用解釋建構(gòu)的方法，比如訪談法等。

平時(shí)工作中以“形成式可用性”測(cè)試為主，即便它稍微偏向于定性研究，但在允許的范圍內(nèi)，我個(gè)人還是盡可能地遵循著定量研究的方法去實(shí)施。這樣整個(gè)測(cè)試過(guò)程的嚴(yán)謹(jǐn)性能得到保證，結(jié)論的客觀程度相對(duì)更高（近幾個(gè)世紀(jì)來(lái)，量化研究一直是科學(xué)研究的主要范式，也正是這個(gè)原因）。具體做法如下：

1.在任務(wù)的設(shè)置上：因?yàn)閰⑴c者可能存在差別較大的亞群體，不可能要求完成完全相同的任務(wù)。但必定會(huì)設(shè)置大部分基本的、都需要完成的公共任務(wù)，再針對(duì)不同亞群體設(shè)置少量的特殊任務(wù)。在后期統(tǒng)計(jì)分析的時(shí)候，基本的公共任務(wù)則可以進(jìn)行數(shù)量化的統(tǒng)計(jì)，并橫向比較。

2.在測(cè)試過(guò)程中：關(guān)注參與者完成任務(wù)時(shí)的相關(guān)行為，用數(shù)字來(lái)記錄（以0、0.5、1分別表示失敗、幫助/提示下成功、成功）。主試盡量少地言語(yǔ)及體態(tài)姿勢(shì)的干擾，只在必要時(shí)進(jìn)行適當(dāng)?shù)匮哉Z(yǔ)交流。

3.在報(bào)告呈現(xiàn)：對(duì)任務(wù)完成情況（效率、完成率）統(tǒng)計(jì)呈現(xiàn)，對(duì)不同任務(wù)的完成情況進(jìn)行比較，對(duì)亞群體間的任務(wù)完成情況進(jìn)行比較，對(duì)所有可用性問(wèn)題按數(shù)量化指標(biāo)進(jìn)行排序等。或者比較迭代前后獨(dú)特問(wèn)題的頻次是否減少，以及嚴(yán)重程度高的等級(jí)里面可用性問(wèn)題數(shù)量的變化情況。

4.測(cè)試過(guò)后，我們通常還會(huì)收集用戶自我報(bào)告式的數(shù)據(jù)，作為“感知可用性”的一個(gè)總體反映。

（1）推薦使用系統(tǒng)可用性量表（SUS），因?yàn)橛醒芯勘砻鱏US在少量樣本時(shí)即可產(chǎn)生較為一致的評(píng)分結(jié)果。

（2）為減少用戶在填寫(xiě)這些量表時(shí)的反應(yīng)心向，不要求填寫(xiě)任何個(gè)人信息，且主試最好暫時(shí)回避。

（3）只統(tǒng)計(jì)分析所有參與者SUS量表總分的平均值，切勿再拆分比較亞群體之間的差異，因?yàn)榧幢阈判Ф仍俑叩牧勘恚?dāng)樣本量極小時(shí)都會(huì)變得很不靠譜！

七．問(wèn)題優(yōu)先級(jí)：?jiǎn)沃笜?biāo) VS 多指標(biāo)

除了在可用性測(cè)試過(guò)程中，最終報(bào)告也必須體現(xiàn)出量化、客觀地特點(diǎn)。例如，報(bào)告發(fā)現(xiàn)的可用性問(wèn)題的列表，我也會(huì)以量化的方式排列出問(wèn)題的優(yōu)先級(jí)別。

這樣做的好處在于：首先，發(fā)現(xiàn)的可用性問(wèn)題肯定有一些比另一些更嚴(yán)重；其次，考慮到產(chǎn)品和設(shè)計(jì)人員的精力和資源總是有限的，必須幫助他們梳理出最亟需整改的問(wèn)題。站在別人的角度考慮問(wèn)題，這樣他們才能更“友好地”接受我們的報(bào)告。

可用性問(wèn)題列表的排序，涉及到采用單指標(biāo)還是多指標(biāo)、以及指標(biāo)分為幾級(jí)的問(wèn)題。

先就量化的客觀性而言，“出現(xiàn)頻率”指標(biāo)是最客觀、最易量化的；而其它三個(gè)指標(biāo)都需分析人員的主觀判斷。

就指標(biāo)的代表意義而言，“嚴(yán)重程度”、“出現(xiàn)頻率”與用戶體驗(yàn)最相關(guān)，與用研人員的職責(zé)也最相關(guān)。另兩個(gè)指標(biāo)可能更多地是產(chǎn)品人員的職責(zé)。

就指標(biāo)的價(jià)值而言，多個(gè)指標(biāo)的綜合顯然比單一指標(biāo)更有價(jià)值。

基于上述考慮，實(shí)際工作中我會(huì)選擇“嚴(yán)重程度”和“出現(xiàn)頻率”兩個(gè)指標(biāo)的綜合，作為可用性問(wèn)題的優(yōu)先級(jí)指標(biāo)。“嚴(yán)重程度”分為3級(jí)，而不是5級(jí)（分析人員主觀判斷時(shí)，3級(jí)指標(biāo)的誤差率要低于5級(jí)指標(biāo)）；“出現(xiàn)頻率”采用計(jì)算的具體數(shù)值，而非4級(jí)分類。這兩個(gè)指標(biāo)合并時(shí)，采用1：1的權(quán)重，具體公式為：

問(wèn)題優(yōu)先級(jí)=嚴(yán)重程度的級(jí)別+出現(xiàn)頻率的具體值×3

八．報(bào)告呈現(xiàn)：優(yōu)點(diǎn) VS 問(wèn)題 VS 建議

當(dāng)產(chǎn)品設(shè)計(jì)人員辛辛苦苦做出的產(chǎn)品卻被你報(bào)告上羅列的各種問(wèn)題批評(píng)得一無(wú)是處時(shí)，即便理智上認(rèn)可你的成果，情感上也很難接受。因此報(bào)告中列出哪怕一條最重要的優(yōu)點(diǎn)，也會(huì)讓產(chǎn)品設(shè)計(jì)人員感到欣慰、感受到你中立的態(tài)度，增加對(duì)報(bào)告的接納程度。列出優(yōu)點(diǎn)的另一個(gè)好處是，在測(cè)試中被參與者多次自發(fā)提及的優(yōu)點(diǎn)確實(shí)帶給用戶某種驚喜；當(dāng)你在報(bào)告中再次強(qiáng)調(diào)時(shí)，可以避免在后期迭代開(kāi)發(fā)中丟失掉原本的優(yōu)點(diǎn)。

問(wèn)題的列舉肯定是報(bào)告中非常重要的部分，但切勿羅列出清單就草草了事，因?yàn)椋?/p>

1.某個(gè)（些）問(wèn)題和另一個(gè)（些）問(wèn)題是有關(guān)聯(lián)的，但是報(bào)告中的問(wèn)題列表部分卻割裂了這些聯(lián)系。

2.產(chǎn)品設(shè)計(jì)人員無(wú)法一直參與旁聽(tīng)/觀察可用性測(cè)試的過(guò)程，導(dǎo)致對(duì)報(bào)告中文字描述的問(wèn)題缺乏感性認(rèn)識(shí)。

3.只提問(wèn)題卻不提供解決方案，就不是“建設(shè)性地提問(wèn)”！

因此，我們需要在可用性測(cè)試報(bào)告的后半部分提出針對(duì)重要問(wèn)題的解決方案。其目標(biāo)并非是強(qiáng)迫產(chǎn)品設(shè)計(jì)人員一定要采納我們提出方案，而是：（1）把一些相關(guān)問(wèn)題聯(lián)系起來(lái)看，（2）加深報(bào)告閱讀者對(duì)于問(wèn)題的感性認(rèn)識(shí)和背后原因的理解，（3）使整個(gè)報(bào)告的思路更清晰、完整，（4）我們還可學(xué)到一些交互設(shè)計(jì)和產(chǎn)品的知識(shí)。

總之，可用性測(cè)試施行起來(lái)既簡(jiǎn)單又復(fù)雜。簡(jiǎn)單是因?yàn)椴还苣闳绾问┬校K究能發(fā)現(xiàn)一些問(wèn)題；復(fù)雜則在于發(fā)現(xiàn)可用性問(wèn)題的質(zhì)量、重要性、對(duì)測(cè)試的利用效率、對(duì)產(chǎn)品設(shè)計(jì)人員的幫助程度可能相距甚遠(yuǎn)。一次成功的可用性測(cè)試體現(xiàn)在從前期策劃、測(cè)試過(guò)程、后期報(bào)告等整個(gè)過(guò)程中是否遵循了這些原則，并在某些難以兩全的原則面前做到合理的權(quán)衡取舍。

原文鏈接：網(wǎng)易UEDC 上篇下篇

責(zé)任編輯：林師授來(lái)源：網(wǎng)易UEDC