成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

可用性測(cè)試的權(quán)衡之道

開(kāi)發(fā) 測(cè)試
對(duì)于可用性測(cè)試,業(yè)內(nèi)人士存在一些普遍認(rèn)可的原則。它們神圣地如同自然科學(xué)里的理論,似乎我們只能對(duì)其言聽(tīng)計(jì)從、俯首稱臣才能踐行出“好的可用性測(cè)試”。其實(shí),即便是科學(xué),它的一個(gè)特征也是“可證偽性”——理論的正確性總是存在前提條件的。真理再向前一步就成為謬誤!

對(duì)于可用性測(cè)試,業(yè)內(nèi)人士存在一些普遍認(rèn)可的原則。它們神圣地如同自然科學(xué)里的理論,似乎我們只能對(duì)其言聽(tīng)計(jì)從、俯首稱臣才能踐行出“好的可用性測(cè)試”。其實(shí),即便是科學(xué),它的一個(gè)特征也是“可證偽性”——理論的正確性總是存在前提條件的。真理再向前一步就成為謬誤!

可用性測(cè)試中的原則同樣如此,需要根據(jù)目的、資源、環(huán)境的不同,靈活把握、權(quán)衡取舍,而非一味恪守某一個(gè)或某幾個(gè)原則,也許這才是可用性從業(yè)人員經(jīng)驗(yàn)重要性的體現(xiàn)。

一.任務(wù)設(shè)置:精細(xì) VS 寬泛

制定的任務(wù)過(guò)于精細(xì),一般原則上是反對(duì)的。理由很清楚,如果你的任務(wù)精細(xì)到一步一步“引導(dǎo)”用戶進(jìn)行操作,那太不符合用戶現(xiàn)實(shí)中的使用情境,平時(shí)沒(méi)有人在旁邊“引導(dǎo)”用戶的每一步操作;而且過(guò)于控制用戶的操作步驟,用戶缺乏真實(shí)使用時(shí)的靈活性。

是不是我們?cè)O(shè)置的任務(wù)只能是寬泛的,不能細(xì)化呢?這就必須根據(jù)研究的目的來(lái)做抉擇。如果產(chǎn)品處在設(shè)計(jì)的初期,我們需要關(guān)注一些宏大的問(wèn)題(如:網(wǎng)站的整體架構(gòu)、導(dǎo)航和分類的合理性、頁(yè)面的邏輯關(guān)系),此時(shí)就需要通過(guò)寬泛而有彈性的任務(wù),來(lái)查找宏觀層面的問(wèn)題。如果產(chǎn)品的設(shè)計(jì)已經(jīng)非常完善,開(kāi)始進(jìn)行細(xì)節(jié)的修改迭代,此時(shí)就需要通過(guò)設(shè)置相對(duì)具體的任務(wù)來(lái)查找特定的細(xì)節(jié)問(wèn)題(如:對(duì)某個(gè)命名的理解、按鈕的使用、鏈接的點(diǎn)擊、表單的填寫(xiě))。按照《Don’t Make Me Think》一書(shū)的觀點(diǎn):一般用戶使用互聯(lián)網(wǎng)產(chǎn)品時(shí)滿足于能用就行,不會(huì)尋求最好的使用方法;只掃描網(wǎng)頁(yè),不會(huì)仔細(xì)閱讀。所以,如果完全寬泛有彈性地設(shè)置任務(wù),雖然更吻合實(shí)際使用情況,但是很可能用戶直接跳過(guò)你想考察的細(xì)節(jié)。

實(shí)際工作中,由于時(shí)間和資源的限制,無(wú)法做到每個(gè)產(chǎn)品從設(shè)計(jì)初期到上線前后進(jìn)行多次可用性測(cè)試。可能在一次的可用性測(cè)試中即需要同時(shí)關(guān)注宏觀方面和細(xì)節(jié)上的問(wèn)題。此時(shí),還是需要和產(chǎn)品經(jīng)理、交互設(shè)計(jì)師反復(fù)溝通,確認(rèn)測(cè)試的主要目的,同時(shí)通過(guò)對(duì)任務(wù)設(shè)置精細(xì)程度的權(quán)衡把握,使次要目的也盡量得以滿足。

不過(guò),即便是想考察細(xì)節(jié)的任務(wù),也要盡量避免“直接指導(dǎo)操作”式的語(yǔ)言描述方式,這樣能讓任務(wù)與真實(shí)使用情境不會(huì)相距太遠(yuǎn)。例如:想考察豆瓣讀書(shū)頁(yè)面【想要】按鈕是否能被看到、是否具備可點(diǎn)擊感。下面列出兩種表述方式,以作對(duì)比:

A.請(qǐng)找到您喜歡的那本書(shū),并在該頁(yè)面點(diǎn)擊【想要】。(×)

B.請(qǐng)找到您喜歡的那本書(shū),并在該頁(yè)面對(duì)其作個(gè)標(biāo)記。(√)

可用性測(cè)試的權(quán)衡之道

二.任務(wù)數(shù)量:多VS少

任務(wù)數(shù)量的多少與可用性測(cè)試考察范圍有關(guān),與任務(wù)的精細(xì)程度也有關(guān)。如果對(duì)網(wǎng)站全站進(jìn)行考察和只對(duì)其中某個(gè)頁(yè)面、某個(gè)操作流程進(jìn)行考察,所需的任務(wù)數(shù)量自然不一樣。在同樣的考察范圍下,如果任務(wù)設(shè)置得越精細(xì),所需任務(wù)數(shù)量也就越多。

Lindgaard和Chattratichart(2007)的研究發(fā)現(xiàn)任務(wù)數(shù)量與發(fā)現(xiàn)可用性問(wèn)題比例存在顯著的相關(guān)關(guān)系(r=0.82,p<0.01)。為了盡可能多地發(fā)現(xiàn)可用性問(wèn)題,我們就盡量多地設(shè)置任務(wù)給用戶嗎?

此時(shí)要考慮任務(wù)數(shù)量過(guò)多可能帶來(lái)的弊端:學(xué)習(xí)效應(yīng)和疲勞效應(yīng),尤其是靠后的任務(wù)更可能會(huì)受影響。心理學(xué)實(shí)驗(yàn)中處理此問(wèn)題的方法是順序平衡,抵消影響。但是可用性測(cè)試中設(shè)置的場(chǎng)景和任務(wù)存在特定的先后次序,不適合采用順序平衡的方法。基于我們的經(jīng)驗(yàn),還是通過(guò)對(duì)測(cè)試的任務(wù)數(shù)量進(jìn)行控制,確保正式測(cè)試環(huán)節(jié)最多不超過(guò)1小時(shí),加上前后的歡迎語(yǔ)、訪談、問(wèn)答等,整個(gè)過(guò)程不超過(guò)1.5小時(shí)。

此外,任務(wù)數(shù)量的多少還會(huì)間接影響到測(cè)試所需參與者數(shù)量的多少。

三.用戶人數(shù):5個(gè)足夠VS  5個(gè)不夠

Nielsen的研究發(fā)現(xiàn),5個(gè)用戶可以發(fā)現(xiàn)80%以上的可用性問(wèn)題。這個(gè)結(jié)論得到許多人的推崇,因此稱之為“魔法數(shù)字5”。這個(gè)結(jié)論的來(lái)源依據(jù)是每個(gè)用戶平均可以發(fā)現(xiàn)30%的可用性問(wèn)題,且假設(shè)所有問(wèn)題都有同等被發(fā)現(xiàn)的概率。不過(guò),當(dāng)設(shè)置的任務(wù)數(shù)量過(guò)多,且任務(wù)的精細(xì)程度和難度多種多樣時(shí),這個(gè)前提有可能不成立。

Lindgaard和Chattratichart(2007)的研究發(fā)現(xiàn)測(cè)試用戶數(shù)量與發(fā)現(xiàn)的可用性問(wèn)題比例并不存在顯著的相關(guān)關(guān)系。這個(gè)結(jié)論似乎又支持我們選擇少量用戶進(jìn)行測(cè)試即可。

其實(shí),在用戶招募階段,比用戶數(shù)量更需要重視是用戶的代表性的問(wèn)題。能否招募到有代表性的用戶將直接影響可用性測(cè)試的成敗。如測(cè)試一個(gè)醫(yī)療軟件產(chǎn)品,招募到醫(yī)護(hù)人員和患者作為測(cè)試用戶,那5個(gè)用戶可能就足夠了;但如果只招募到醫(yī)學(xué)實(shí)習(xí)生來(lái)測(cè)試,就必須超過(guò)5個(gè)以上的用戶(即便這樣,也未必能推論到整個(gè)產(chǎn)品的用戶群)。

由此看來(lái),招募用戶的人數(shù)和任務(wù)的數(shù)量、精細(xì)程度、用戶的代表性也是息息相關(guān)的。參考Tom Tullis(2009)和本人經(jīng)驗(yàn):當(dāng)可用性測(cè)試范圍限定在一定的范圍(20個(gè)任務(wù)內(nèi)、或30個(gè)網(wǎng)頁(yè)之內(nèi)),且招募到很強(qiáng)代表性的用戶,那么5個(gè)足夠了。如果存在著差別較大的亞群體,爭(zhēng)取做到每個(gè)亞群組有5個(gè)左右的代表性的用戶(當(dāng)然,目標(biāo)用戶的特征及分類應(yīng)該是在可用性測(cè)試之前的用戶調(diào)研階段就解決的問(wèn)題);一次測(cè)試最多不會(huì)超過(guò)12個(gè)用戶。

四.用戶表現(xiàn):行為VS言語(yǔ)

在可用性測(cè)試中強(qiáng)調(diào)對(duì)用戶操作行為的關(guān)注,是毋庸置疑的。因?yàn)椋?/p>

1.用戶的行為指標(biāo)更明確、具體、客觀,易觀察和記錄。

2.如果完全把關(guān)注點(diǎn)放在用戶的操作行為上,那么就無(wú)需跟用戶進(jìn)行多余的(指導(dǎo)語(yǔ)之外的)語(yǔ)言交流。類似于心理學(xué)研究規(guī)范,對(duì)實(shí)驗(yàn)或測(cè)試中的指導(dǎo)語(yǔ)進(jìn)行統(tǒng)一,對(duì)一切無(wú)關(guān)變量(包括主試的語(yǔ)言、體態(tài)表情)進(jìn)行控制,以減少對(duì)研究過(guò)程的干擾。

3.即便你直接詢問(wèn)用戶某些問(wèn)題,也極可能得到錯(cuò)誤的答案。30年前Richard Nisbett和Timothy Wilson的實(shí)驗(yàn)、2年前Peter Johansson在《science》的文章,都證實(shí)了某些情況下人們無(wú)法解釋清楚自己行為的真正原因。另外,用戶還可能揣摩主試的喜好,回答他們認(rèn)為主試期望的答案。

因此,有必要強(qiáng)調(diào)在可用性測(cè)試過(guò)程中關(guān)注的重點(diǎn)永遠(yuǎn)應(yīng)該是用戶的操作行為,而且盡量減少任何無(wú)關(guān)變量的干擾。但這個(gè)原則被有些人引申到極端,認(rèn)為只有觀察用戶的操作行為才有意義,其他信息都是無(wú)需關(guān)注的,甚至輕率地懷疑用戶的話都是不可信的。

可用性測(cè)試的主要目的雖然是發(fā)現(xiàn)問(wèn)題,但也需要了解問(wèn)題背后的原因,而僅僅依靠觀察用戶的操作行為是無(wú)法獲悉所有問(wèn)題背后的原因的,此時(shí),我們就希望用戶能采用“出聲思維法”,出聲思維就是集中于如何與產(chǎn)品進(jìn)行交互的意識(shí)流。如果測(cè)試中的氛圍比較平等、自然、融洽,用戶又特別愿意表達(dá),那么用戶就會(huì)在進(jìn)行任務(wù)操作同時(shí),表達(dá)他們想做什么、打算如何做、背后的原因是什么。此時(shí),不僅是操作行為、用戶表達(dá)出來(lái)的想法和原因、以及語(yǔ)言中透露出的疑惑、失望、不滿、驚訝、猶豫等情緒同樣是需要我們加以關(guān)注的。但是,有些用戶比較內(nèi)向,不善于主動(dòng)表達(dá)自己的想法,此時(shí)就需要主試跟他進(jìn)行簡(jiǎn)單的交流,以引導(dǎo)用戶說(shuō)出背后的原因(注:不是引導(dǎo)用戶說(shuō)出你期望得到答案)。

所以,在實(shí)際的可用性測(cè)試,基本應(yīng)該以關(guān)注用戶的行為為主,少量、適時(shí)地進(jìn)行詢問(wèn)交流也是需要的。但這個(gè)度如何把握呢?

1.當(dāng)用戶出現(xiàn)猶豫、驚訝、任務(wù)失敗(過(guò)程節(jié)點(diǎn)上出現(xiàn)自然而然地稍微中斷/暫停)的時(shí)候才進(jìn)行簡(jiǎn)單的詢問(wèn)。

2.詢問(wèn)采用一般疑問(wèn)句的句式,重復(fù)用戶剛才的行為表現(xiàn)(要具體客觀):“你剛才沒(méi)有……,是嗎?”——雖然沒(méi)有直接問(wèn)“為什么”,但暗示了希望聽(tīng)到他進(jìn)一步的解釋。

3.如果用戶沒(méi)有自己主動(dòng)說(shuō)出原因,可以“順便”問(wèn)一下“為什么?”或通過(guò)身體前傾、目光注視等非語(yǔ)言方式來(lái)暗示用戶你希望能聽(tīng)到更多內(nèi)容。若用戶很快、堅(jiān)定地說(shuō)出原因,則該理由的可信度較高;如果用戶猶豫、或難以說(shuō)出原因,就不要繼續(xù)追問(wèn)。

除了上述的語(yǔ)言、情緒、行為都需要得到關(guān)注,還有一種特殊情況是需要聽(tīng)懂用戶“沒(méi)有說(shuō)的”語(yǔ)言。例如,我們預(yù)計(jì)網(wǎng)站的某二級(jí)導(dǎo)航標(biāo)簽和一級(jí)導(dǎo)航標(biāo)簽存在分類邏輯上的不合理;但用戶在測(cè)試中,導(dǎo)航相關(guān)的操作步驟進(jìn)行得很流暢,用戶也什么都沒(méi)說(shuō)。這通常表明用戶認(rèn)為這些是理所當(dāng)然的、不影響操作的——此時(shí)你需要聽(tīng)懂用戶“沒(méi)有說(shuō)的”語(yǔ)言。如果你簡(jiǎn)單粗暴地打斷用戶并詢問(wèn):“你覺(jué)得這兩個(gè)導(dǎo)航標(biāo)簽如何?”,則變成了一種誘導(dǎo)性地提問(wèn)。

總結(jié)一下關(guān)于此部分內(nèi)容的實(shí)踐應(yīng)用:

1.用戶的操作行為永遠(yuǎn)是可用性測(cè)試的重點(diǎn)。

2.鼓勵(lì)用戶采用“出聲思維法”。

3.適時(shí)、少量地向用戶提問(wèn),禁止對(duì)同一個(gè)問(wèn)題反復(fù)追問(wèn)“為什么”。

4.采用真正地“傾聽(tīng)”技術(shù)保持和用戶的交流狀態(tài),而非通過(guò)過(guò)多的話語(yǔ)。

5.開(kāi)放、不預(yù)設(shè)立場(chǎng)地觀察、傾聽(tīng)用戶“沒(méi)有說(shuō)的”語(yǔ)言。

在可用性測(cè)試中考慮需要遵循的原則時(shí),一定要理解它的適用條件,以及它和其它原則之間的互相影響,并結(jié)合本次用戶研究的目的、資源、環(huán)境綜合考慮,以盡可能形成一個(gè)最優(yōu)方案。由于博文長(zhǎng)度所限,先總結(jié)這么多,在下次的文章中會(huì)繼續(xù)總結(jié)其它幾方面的原則。

#p#

可用性測(cè)試的權(quán)衡之道

繼續(xù)討論可用性測(cè)試中各種原則的靈活運(yùn)用和注意事項(xiàng)。

五.發(fā)現(xiàn)問(wèn)題:真的 VS 假的

判斷發(fā)現(xiàn)問(wèn)題的真假,初看上去似乎不是個(gè)困難。多數(shù)或全部參與者都遇到的問(wèn)題毫無(wú)疑問(wèn)是明顯的可用性問(wèn)題。或許有人會(huì)建議,根據(jù)參與者中發(fā)現(xiàn)該問(wèn)題的人數(shù)比例來(lái)判斷:比例高是真問(wèn)題,比例低是假問(wèn)題。前半句話可以接受,后半句話則有待商榷。

雖然可用性測(cè)試是相對(duì)嚴(yán)謹(jǐn)?shù)挠脩粞芯糠椒ǎ瞧鋵?duì)無(wú)關(guān)變量控制的嚴(yán)格程度和真正的心理學(xué)實(shí)驗(yàn)還是有一定的差距;并且心理學(xué)實(shí)驗(yàn)對(duì)每組參與者數(shù)量的最低要求是30人,這樣得出的結(jié)論(數(shù)量比例)才具有推論至一般的意義。而可用性測(cè)試一般才8人左右的參與人數(shù)(盡管招募的參與者在質(zhì)的方面非常具有代表性),但卻無(wú)法把可用性測(cè)試中出現(xiàn)的所有數(shù)量比例簡(jiǎn)單推論至一般。8個(gè)參與者中有1人發(fā)現(xiàn)某個(gè)問(wèn)題,不代表現(xiàn)實(shí)中出現(xiàn)同樣問(wèn)題的真實(shí)用戶只有12.5%,更不代表這個(gè)問(wèn)題不是真正的/嚴(yán)重的可用性問(wèn)題。

問(wèn)題的真假除了根據(jù)問(wèn)題出現(xiàn)的次數(shù)比例,還有很重要的考慮點(diǎn)是:用戶“錯(cuò)誤行為”背后的認(rèn)知/思考方式是否合乎邏輯

這里順便借用一下諾曼《設(shè)計(jì)心理學(xué)》里談到的理論:概念模型——系統(tǒng)表象——心理模型。概念模型可認(rèn)為是產(chǎn)品設(shè)計(jì)人員對(duì)產(chǎn)品的設(shè)計(jì)思想;系統(tǒng)表象可認(rèn)為是產(chǎn)品展現(xiàn)出的交互界面;而心理模型則是用戶按照既往經(jīng)驗(yàn)對(duì)如何操作該產(chǎn)品的設(shè)想。從這個(gè)角度來(lái)認(rèn)識(shí),可用性問(wèn)題則是“概念模型、系統(tǒng)表象、心理模型”三者的不吻合或矛盾。

可用性測(cè)試的權(quán)衡之道

通過(guò)分析用戶行為背后的認(rèn)知是否符合邏輯,來(lái)判斷發(fā)現(xiàn)的問(wèn)題的真假,主要體現(xiàn)在以下幾點(diǎn):

1.“概念模型、系統(tǒng)表象”的不一致

產(chǎn)品設(shè)計(jì)人員突然發(fā)現(xiàn),界面的交互形式根本沒(méi)有反映出他原先的設(shè)計(jì)思想!

2.“系統(tǒng)表象、心理模型”的不一致

(1)用戶的思維方式受已有的同類產(chǎn)品的影響,并內(nèi)化接受,而新產(chǎn)品的“系統(tǒng)表象”和已有同類產(chǎn)品并不一致。

(2)用戶在日常生活經(jīng)驗(yàn)中形成了許多并不科學(xué)地通俗理解世界的方式(比如通俗物理學(xué)、通俗心理學(xué)),但產(chǎn)品設(shè)計(jì)人員沒(méi)有意識(shí)到用戶在以這樣一種“自認(rèn)正確”的錯(cuò)誤方式來(lái)理解和使用產(chǎn)品。

如果發(fā)現(xiàn)的可用性問(wèn)題屬于以上情況,那么即使只有一個(gè)參與者碰到,它也非常可能是一個(gè)真正的可用性問(wèn)題。

例如:讓用戶登錄購(gòu)彩網(wǎng)站,查看自己上次購(gòu)彩結(jié)果。大多數(shù)用戶點(diǎn)擊【個(gè)人中心】去查看,有2個(gè)用戶點(diǎn)擊【開(kāi)獎(jiǎng)公告】去查看,發(fā)現(xiàn)只有開(kāi)獎(jiǎng)號(hào)碼,沒(méi)有任何購(gòu)彩結(jié)果信息后,再去點(diǎn)擊【個(gè)人中心】。僅2個(gè)人出現(xiàn)了稍微的偏差,而且很快就找到了正確的頁(yè)面,這貌似應(yīng)該不算什么問(wèn)題。

但若追究其行為背后的邏輯,并與其他用戶的反饋(“我上次買的號(hào)碼沒(méi)有直接顯示出來(lái)?”“這里看不到開(kāi)獎(jiǎng)的號(hào)碼啊?”)聯(lián)系起來(lái),可以判斷用戶的心理模型和產(chǎn)品的系統(tǒng)表象不一致。用戶希望能同時(shí)對(duì)照著開(kāi)獎(jiǎng)號(hào)碼和自己買的號(hào)碼很方便地核對(duì),而網(wǎng)站卻割裂兩部分放在不同的頁(yè)面,因此需要將這2個(gè)用戶碰到的問(wèn)題當(dāng)作真正的可用性問(wèn)題來(lái)對(duì)待。

六.研究方法:定性 VS 定量

可用性測(cè)試,很多時(shí)候被認(rèn)為是一種定性研究方法;但也有人說(shuō)它是一種定量研究方法。究竟是怎么回事呢?

個(gè)人認(rèn)為,可用性測(cè)試實(shí)質(zhì)上結(jié)合了定性和定量?jī)煞N方法的特點(diǎn),到底哪種成分更多,要看你的使用目的以及細(xì)節(jié)上如何操作。

定量研究的思路是基于對(duì)一定數(shù)量樣本的測(cè)量,以將研究所得的結(jié)論推廣至總體。除了強(qiáng)調(diào)樣本的代表性,還對(duì)樣本的數(shù)量有具體的要求,同時(shí)會(huì)考慮抽樣誤差、置信度、置信區(qū)間的度量。并且定量研究過(guò)程中非常注重對(duì)某些自變量操控、及無(wú)關(guān)變量的控制。

而定性研究重視對(duì)主觀意義的理解(如背后隱藏的原因),采用解釋建構(gòu)的方法,比如訪談法等。

可用性測(cè)試的權(quán)衡之道

平時(shí)工作中以“形成式可用性”測(cè)試為主,即便它稍微偏向于定性研究,但在允許的范圍內(nèi),我個(gè)人還是盡可能地遵循著定量研究的方法去實(shí)施。這樣整個(gè)測(cè)試過(guò)程的嚴(yán)謹(jǐn)性能得到保證,結(jié)論的客觀程度相對(duì)更高(近幾個(gè)世紀(jì)來(lái),量化研究一直是科學(xué)研究的主要范式,也正是這個(gè)原因)。具體做法如下:

1.在任務(wù)的設(shè)置上:因?yàn)閰⑴c者可能存在差別較大的亞群體,不可能要求完成完全相同的任務(wù)。但必定會(huì)設(shè)置大部分基本的、都需要完成的公共任務(wù),再針對(duì)不同亞群體設(shè)置少量的特殊任務(wù)。在后期統(tǒng)計(jì)分析的時(shí)候,基本的公共任務(wù)則可以進(jìn)行數(shù)量化的統(tǒng)計(jì),并橫向比較。

2.在測(cè)試過(guò)程中:關(guān)注參與者完成任務(wù)時(shí)的相關(guān)行為,用數(shù)字來(lái)記錄(以0、0.5、1分別表示失敗、幫助/提示下成功、成功)。主試盡量少地言語(yǔ)及體態(tài)姿勢(shì)的干擾,只在必要時(shí)進(jìn)行適當(dāng)?shù)匮哉Z(yǔ)交流。

3.在報(bào)告呈現(xiàn):對(duì)任務(wù)完成情況(效率、完成率)統(tǒng)計(jì)呈現(xiàn),對(duì)不同任務(wù)的完成情況進(jìn)行比較,對(duì)亞群體間的任務(wù)完成情況進(jìn)行比較,對(duì)所有可用性問(wèn)題按數(shù)量化指標(biāo)進(jìn)行排序等。或者比較迭代前后獨(dú)特問(wèn)題的頻次是否減少,以及嚴(yán)重程度高的等級(jí)里面可用性問(wèn)題數(shù)量的變化情況。

4.測(cè)試過(guò)后,我們通常還會(huì)收集用戶自我報(bào)告式的數(shù)據(jù),作為“感知可用性”的一個(gè)總體反映。

(1)推薦使用系統(tǒng)可用性量表(SUS),因?yàn)橛醒芯勘砻鱏US在少量樣本時(shí)即可產(chǎn)生較為一致的評(píng)分結(jié)果。

(2)為減少用戶在填寫(xiě)這些量表時(shí)的反應(yīng)心向,不要求填寫(xiě)任何個(gè)人信息,且主試最好暫時(shí)回避。

(3)只統(tǒng)計(jì)分析所有參與者SUS量表總分的平均值,切勿再拆分比較亞群體之間的差異,因?yàn)榧幢阈判Ф仍俑叩牧勘恚?dāng)樣本量極小時(shí)都會(huì)變得很不靠譜!

七.問(wèn)題優(yōu)先級(jí):?jiǎn)沃笜?biāo) VS 多指標(biāo)

除了在可用性測(cè)試過(guò)程中,最終報(bào)告也必須體現(xiàn)出量化、客觀地特點(diǎn)。例如,報(bào)告發(fā)現(xiàn)的可用性問(wèn)題的列表,我也會(huì)以量化的方式排列出問(wèn)題的優(yōu)先級(jí)別。

這樣做的好處在于:首先,發(fā)現(xiàn)的可用性問(wèn)題肯定有一些比另一些更嚴(yán)重;其次,考慮到產(chǎn)品和設(shè)計(jì)人員的精力和資源總是有限的,必須幫助他們梳理出最亟需整改的問(wèn)題。站在別人的角度考慮問(wèn)題,這樣他們才能更“友好地”接受我們的報(bào)告。

可用性問(wèn)題列表的排序,涉及到采用單指標(biāo)還是多指標(biāo)、以及指標(biāo)分為幾級(jí)的問(wèn)題。

可用性測(cè)試的權(quán)衡之道

先就量化的客觀性而言,“出現(xiàn)頻率”指標(biāo)是最客觀、最易量化的;而其它三個(gè)指標(biāo)都需分析人員的主觀判斷。

就指標(biāo)的代表意義而言,“嚴(yán)重程度”、“出現(xiàn)頻率”與用戶體驗(yàn)最相關(guān),與用研人員的職責(zé)也最相關(guān)。另兩個(gè)指標(biāo)可能更多地是產(chǎn)品人員的職責(zé)。

就指標(biāo)的價(jià)值而言,多個(gè)指標(biāo)的綜合顯然比單一指標(biāo)更有價(jià)值。

基于上述考慮,實(shí)際工作中我會(huì)選擇“嚴(yán)重程度”和“出現(xiàn)頻率”兩個(gè)指標(biāo)的綜合,作為可用性問(wèn)題的優(yōu)先級(jí)指標(biāo)。“嚴(yán)重程度”分為3級(jí),而不是5級(jí)(分析人員主觀判斷時(shí),3級(jí)指標(biāo)的誤差率要低于5級(jí)指標(biāo));“出現(xiàn)頻率”采用計(jì)算的具體數(shù)值,而非4級(jí)分類。這兩個(gè)指標(biāo)合并時(shí),采用1:1的權(quán)重,具體公式為:

問(wèn)題優(yōu)先級(jí)=嚴(yán)重程度的級(jí)別+出現(xiàn)頻率的具體值×3

八.報(bào)告呈現(xiàn):優(yōu)點(diǎn) VS 問(wèn)題 VS 建議

當(dāng)產(chǎn)品設(shè)計(jì)人員辛辛苦苦做出的產(chǎn)品卻被你報(bào)告上羅列的各種問(wèn)題批評(píng)得一無(wú)是處時(shí),即便理智上認(rèn)可你的成果,情感上也很難接受。因此報(bào)告中列出哪怕一條最重要的優(yōu)點(diǎn),也會(huì)讓產(chǎn)品設(shè)計(jì)人員感到欣慰、感受到你中立的態(tài)度,增加對(duì)報(bào)告的接納程度。列出優(yōu)點(diǎn)的另一個(gè)好處是,在測(cè)試中被參與者多次自發(fā)提及的優(yōu)點(diǎn)確實(shí)帶給用戶某種驚喜;當(dāng)你在報(bào)告中再次強(qiáng)調(diào)時(shí),可以避免在后期迭代開(kāi)發(fā)中丟失掉原本的優(yōu)點(diǎn)。

問(wèn)題的列舉肯定是報(bào)告中非常重要的部分,但切勿羅列出清單就草草了事,因?yàn)椋?/p>

1.某個(gè)(些)問(wèn)題和另一個(gè)(些)問(wèn)題是有關(guān)聯(lián)的,但是報(bào)告中的問(wèn)題列表部分卻割裂了這些聯(lián)系。

2.產(chǎn)品設(shè)計(jì)人員無(wú)法一直參與旁聽(tīng)/觀察可用性測(cè)試的過(guò)程,導(dǎo)致對(duì)報(bào)告中文字描述的問(wèn)題缺乏感性認(rèn)識(shí)。

3.只提問(wèn)題卻不提供解決方案,就不是“建設(shè)性地提問(wèn)”!

因此,我們需要在可用性測(cè)試報(bào)告的后半部分提出針對(duì)重要問(wèn)題的解決方案。其目標(biāo)并非是強(qiáng)迫產(chǎn)品設(shè)計(jì)人員一定要采納我們提出方案,而是:(1)把一些相關(guān)問(wèn)題聯(lián)系起來(lái)看,(2)加深報(bào)告閱讀者對(duì)于問(wèn)題的感性認(rèn)識(shí)和背后原因的理解,(3)使整個(gè)報(bào)告的思路更清晰、完整,(4)我們還可學(xué)到一些交互設(shè)計(jì)和產(chǎn)品的知識(shí)。

可用性測(cè)試的權(quán)衡之道

總之,可用性測(cè)試施行起來(lái)既簡(jiǎn)單又復(fù)雜。簡(jiǎn)單是因?yàn)椴还苣闳绾问┬校K究能發(fā)現(xiàn)一些問(wèn)題;復(fù)雜則在于發(fā)現(xiàn)可用性問(wèn)題的質(zhì)量、重要性、對(duì)測(cè)試的利用效率、對(duì)產(chǎn)品設(shè)計(jì)人員的幫助程度可能相距甚遠(yuǎn)。一次成功的可用性測(cè)試體現(xiàn)在從前期策劃、測(cè)試過(guò)程、后期報(bào)告等整個(gè)過(guò)程中是否遵循了這些原則,并在某些難以兩全的原則面前做到合理的權(quán)衡取舍。

原文鏈接:網(wǎng)易UEDC 上篇 下篇

責(zé)任編輯:林師授 來(lái)源: 網(wǎng)易UEDC
相關(guān)推薦

2010-08-12 17:22:06

網(wǎng)站運(yùn)維可用性

2024-08-13 15:42:19

2024-02-27 09:48:25

Redis集群數(shù)據(jù)庫(kù)

2013-02-18 09:21:38

可用性測(cè)試

2017-08-24 17:05:06

2012-02-13 23:20:18

linux集群高可用

2011-04-15 12:30:51

網(wǎng)站可用性WEB

2016-07-14 10:38:51

2012-07-04 11:21:07

OpenStack

2014-05-14 09:43:01

SUSE私有云

2013-08-28 10:30:39

vSphere

2012-09-04 13:43:31

SQL Server

2021-05-24 09:15:42

Go熔斷熔斷器

2013-11-19 17:50:33

Linux輔助軟件

2009-04-16 15:34:35

SQL Server

2011-02-17 08:49:49

WebHTMLCSS

2017-03-07 16:49:45

2018-02-28 07:31:51

數(shù)據(jù)中心可用性IT設(shè)備

2011-02-18 17:54:36

網(wǎng)站首頁(yè) PET

2013-12-04 09:52:50

hadoop
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 免费在线观看av网站 | 亚洲欧美视频 | 99久久久无码国产精品 | av无遮挡 | 成人欧美一区二区三区黑人孕妇 | 国产亚洲第一页 | 99久久婷婷国产亚洲终合精品 | 日韩欧美高清 | 国产乱码精品1区2区3区 | 亚洲精品国产一区 | 美女视频h | 免费一级黄 | 精品视频免费在线 | 人人干人人看 | 亚洲精品日本 | 亚洲国产成人精品一区二区 | 亚州无限乱码 | 黄网免费看 | 性视频一区 | 四色永久| 国产9 9在线 | 中文 | 国产精品久久久久久久免费大片 | 在线高清免费观看视频 | 亚洲毛片在线 | 久久久五月天 | 午夜在线视频一区二区三区 | 毛片一区| 一区二区三区四区在线视频 | 免费久久久久久 | 国产精品久久久久无码av | 亚洲精品一区中文字幕 | 狠狠操婷婷 | 91成人 | 日韩欧美在线免费观看视频 | 午夜无码国产理论在线 | 欧美在线a | 国产精品福利久久久 | 秋霞国产 | 亚洲美女在线视频 | 亚洲一区二区视频 | 日韩色在线 |