卡片分類法解析:究竟要測試多少用戶?

2021-01-15 人人都是產品經理

在卡片分類測試中,使用過多的測試用戶會使回報率遞減,但測試至少 15 個用戶,效果將是傳統可用性測試的 3 倍之多。

官網和內網設計(注1)中最大的挑戰之一就是信息架構:在哪會發生什麼?一個經典的錯誤類型就是根據如何查看內容來構建信息空間——這往往會導致公司各個部門或信息提供商擁有不同的子網站。

可以通過創建反映用戶查看內容的信息架構的方式,來提高可用性測試,而不是簡單地鏡像組織結構。在每項企業內部網絡調研中,我們發現,當企業重組內部網反映員工工作流程時,生產力會高效增長。而在電子商務中,當產品出現在用戶期望找到的類別時,銷售量會增加。

所有這一切都很棒,但如何找出用戶對信息空間的看法,以及他們認為每個項目應該如何進行呢?為了研究這種心智模式,主要的方法是卡片分類法:

在索引卡上寫下每個主要項目的名稱(以及簡短描述)。沒錯,就是那種舊式的紙卡片。(注意不要使用讓用戶產生偏向的術語。)隨意打亂卡片後交給用戶。(招募測試者的標準,建議:他們必須是典型用戶,等等)要求用戶將卡片分分類,將同一類的在一起。用戶可以根據自己的喜好進行分類,包括類型的數量、類型的大小,等等。可選的額外步驟包括:要求用戶將已有的分類分成更大的組、給不同的組和類命名。之後可以針對用於導航標籤、連結、標題和搜尋引擎優化的單詞和同義詞,給出建議。

由於卡片分類不使用技術,這些 1995 年的組卡方式,在當今看來,也並未過時。

一、研究進展

富達投資集團擁有一支非常棒的可用性測試團隊,由人機界面設計高級副總裁 Thomas S. Tullis 博士領導。Tullis 和合著者 Larry Wood 發布過一項研究結果,該研究測量了在卡片分類練習中測試各種用戶數量的權衡曲線。

首先,他們測試了 168 位用戶,有了非常可靠的結果。然後,他們通過分析總體樣本的隨機子集,使用較小用戶群對卡片分類研究的結果進行模擬。例如,要模擬 20 個用戶的測試結果,他們從 168 個用戶中隨機抽取了 20 個用戶,並僅分析該小組的卡片分類數據。通過選擇多個類似的樣本,可以估計來自不同數量用戶測試的平均結果。

卡片分類研究中主要的定量數據是一組相似度分數,用於度量用戶對不同物品評分的相似度。如果所有用戶將兩張卡片分成同一組,那麼由卡片代表的兩個項目將具有 100% 的相似度。如果有一半的用戶將兩張卡放在一起,一半放在不同的組中,那麼這兩個項目的相似度為 50%。

我們可以通過研究的相似性得分與測試大量用戶群所得分數的相關程度來評估較小的卡片分類研究的結果。(提醒:相關性從 -1 到 +1 ,相關性 1 表示完全一致;0 表示無關;-1 表示相互對立。)

二、需要多少用戶?

對於大多數可用性研究來說,我建議測試 5 個用戶,因為這就能夠讓你獲得足夠的數據了,在測試中你能夠了解大部分可用性問題。但是,對於卡片分類,5 位用戶的結果與最終結果之間只有 0.75 的相關性。這個結果還不夠好。

測試 15 個用戶才能達到 0.90 的相關性,這是一個更加合適的範圍。在 15 個用戶之後,不但收益會遞減而相關性的增加也不明顯:測試 30 人相關性達到 0.95 ——這當然更好,但通常不值雙倍的錢。超過 30 名用戶幾乎沒有任何改進:測試 60 人相關性達到 0.98,這麼做無疑是一種浪費。

Tullis 和 Wood 建議使用 20-30 個用戶進行卡片分類測試。根據他們的數據,我的建議是測試 15 個用戶。

為什麼我建議測試更少的用戶?我認為,大多數情況下,0.90(15 個用戶)或 0.93(20 個用戶)的相關性已經足夠好了。如果你有一個大型的、資金充足的項目(比如一個涉及 10 萬名員工的內部網絡,或者一個收入為 5 億美刀的電子商務網站),我當然希望測試 30 人使相關性達到 0.95。但大多數用戶研究資源非常有限,在 3 個不同的定性可用性測試中,每個測試 5 個用戶——共 15 人進行的測試更為合適。

三、讓用戶盡情表達

我不建議純粹基於以卡片排序的相似性組織的信息架構進行設計。在決定哪裡有什麼的具體細節時,應該儘可能多地運用在測試階段獲得的定性數據。卡片分類的大部分價值來自聽取用戶的評論,因為是他們對卡片進行分類:你要知道,了解為什麼人們將某些卡片放在一起,能夠更深入地了解他們的心理模型,而不是單純地將卡片分類到同一組中。

四、為什麼需要更多的用戶進行卡片分類?

我們知道對於大多數可用性研究,5 個用戶已經足夠了,為什麼卡片分類卻需要 3 倍的參與者才能達到相同的水平?因為它們在兩個關鍵點上有所不同:

用戶測試是一種評估方法:我們已經有了一個設計,我們試圖找出它是否與人性和用戶需求相匹配。雖然人們在能力(領域知識,智能和計算機技能)方面存在很大差異,但如果某個設計因素產生問題,在測試一些用戶之後,就會發現這些問題。低端用戶可能會比高端用戶遇到更嚴重的問題,但除非你正在進行測量研究(這需要更多用戶),否則難度的大小並不是問題所在。你需要知道的是,設計元素如果不適用於人,就應該改變它。卡片分類是一種生成方法:我們還沒有設計,我們的目標是找出人們如何思考某些問題。不同人的心智模式和他們用來描述相同概念的詞彙存在很大的差異。我們必須從一定數量的用戶那裡收集數據,才能獲得穩定的用戶偏好畫像,並確定如何適應用戶之間的差異。

如果你有一個現有的官網或內部網,測試一些用戶會告訴你信息架構是否給人們帶來了問題。所以要從頭開始創建新的結構,必須抽取更多人進行測試。

幸運的是,你可以將這兩種方法結合:首先,使用生成性研究為設計確定方向。其次,設計一份草稿,最好使用紙質原型,並進行評估研究以改進設計。因為可用性評估速度快而且便宜,所以你可以做多次;並且還為你最初的創造性發現提供了質量保證。這就是為什麼你不應該浪費資源來壓縮卡片分類那最後 0.02 相關性的原因。在隨後的用戶測試中,你會發現任何小的錯誤,這比卡片分類研究的規模增加一倍或三倍都要便宜得多。

五、研究的不足

富達研究有兩個明顯的不足:

這只是一項研究。有多家公司的數據會更好。該分析純粹是定量的,側重於相似性的統計分析,忽略用戶評論和其他定性數據。

不過,這兩個不足卻不足以致命。我認為這是一項開拓性的研究,對網絡可用性知識做出了巨大貢獻。但是,由於該研究存在缺點,如果用不同的信息空間複製它,並且同時分析定性數據與定量數據,將會非常有用。聽起來像是一個很好的研究生論文的選題,這個選題研究的是與真實世界影響相關的事物。

儘管數據多會讓人感到欣慰,但我對富達研究的結論充滿信心,因為它們與我多年來從事卡片研究的觀察結果相符。我一直說,有必要為卡片分類測試更多的用戶,而不是傳統的可用性研究。我通常會推薦大約 15 位用戶進行測試,不過在預算緊張或用戶特別難招募(只有 12 位用戶)的時候,也有不錯的結果。

有好多中方法,在定量研究過程中,會誤導你。因此,如果你看到一個單獨的定量研究與定性研究中已知的所有結論相矛盾,一個謹慎的做法是忽視新研究並假定它很可能是假。但是當一項定量研究證實了已知的信息時,它很可能是對的,並且可以使用新的數據作為合理的預測值,即便這基於你現有的可憐的數據。

因此,當前的建議是在大部分卡片分類中測試 15 位用戶,在有資金支持的大型項目中測試 30 位用戶。

參考:

Tullis, Tom, and Wood, Larry. (2004) How Many Users Are Enough for a Card-Sorting Study?, UsabilityProfessionals Association (UPA) 2004 Conference, Minneapolis, MN, June 7–11, 2004.

注釋:我希望擴大網站的思考範圍到產品和服務層面

相關焦點

  • 手機百度5.2:用戶可隨需定製星座、體育卡片
    坐擁5億用戶的手機百度,近日重磅推出5.2版本,該版本重點優化了首頁卡片功能,新增「星座」、「體育」等熱門卡片,用戶可隨時根據需求定製自己偏好的信息。自手機百度在5.0版本上線卡片功能以來,已經有很多用戶對「卡片」形成了使用依賴,例如天氣、股票、實時熱點等都是備受用戶歡迎的卡片。
  • 富相窮相十字分類法
    五行形相分類前文中已有詳細的敘述,這裡不再贅述,此處首先從十字分類法講起。所謂的十字分類法,是將人的面相比附為十個字的字形的分類法。十個字分別是:圓、田、由、風、用、木、同、王、甲、申。這種相法只適合於面部。具體如下:五、用:用字臉的人,左右面頰不均衡,一邊腮骨大而一邊腮骨小,形成歪面。其人性格矛盾,對物質欲望的追求不平衡,喜用與自己財富不相稱的物件。
  • 星羅卜測試:選擇一張卡片,引領你走向適合自己的職業道路
    如果你對目前自己的職業感到迷惘,或許中塔君下面這個測試可以給你一點頭緒,抱著一種「嘗試」的心態來做下面的這個職業測試吧,沒準!它能給你一些職業道路的方向。下圖中有6張包含不同隱喻的卡片,根據你的第六感選擇一張能帶給你愉快和趣味的卡片。
  • 上海數字人民幣開展試點測試:「硬錢包」卡片配水墨屏窗口 實現...
    打開APP 上海數字人民幣開展試點測試:「硬錢包」卡片配水墨屏窗口 實現脫離手機支付 孤城 發表於 2021-01-06 09:19:32
  • DNF:遠古卡片冊很坑人,垃圾粉卡跌至冰點,卡片合成或許有機會
    DNF:遠古卡片冊機率坑人,垃圾粉卡跌至冰點,卡片合成或許會是機會不過旭旭寶寶就在體驗服測試過,這卡片冊的機率真心坑,粉卡的機率的確是高,魂卡也是有的,但是出的魂卡也沒用,因為都是一些不值錢的魂卡,一張一兩百萬,還不如一些值錢的粉卡的。
  • 野生動物的種類與分類法
    依據生物學的新發展不斷改進和完善動物分類法,仍然是動物學發展中的重要問題。如蛋白質類型的不同,遺傳物質DNA的相似性以及免疫學和動物行為學都為動物分類提供了一些新的準則。電子計算機的應用,更有利於分類數據的處理,提高了分類的科學性和速度。遙感技術的應用和新動物品種的發現,也為動物分類增加了新內容。
  • 米兔卡片學習機又出新卡片,AR技術助力啟蒙教育
    六一兒童節的時候小米推出了米兔卡片學習機,它集成了刷卡以及AR等技術為幼兒啟蒙提供輔助。看到米兔新品發布便第一時間為我家剛剛上幼兒園的二寶入手了一隻米兔卡片學習機。當時隨機標配了四盒卡片,這段時間已經把這些卡片玩了不知道多少遍,已經有些膩煩。
  • 小米上新,智能語音+AR場景,米兔卡片機器人體驗!
    對於小米這家手機廠家來講,它在國內的關注度都非常高,旗下一舉一動都會成為用戶熱議以及媒體關注的焦點。經過8年時間的發布,如今的小米公司已經不能同日而語,它們除了一直在大力發展自己的手機品牌以外,也在為喜愛它們的用戶,量身定製一些物美價廉的周邊產品。而今天我要和大家分享的這款小米新品,就是由於小米公司吉祥物,米兔為原型設計研發的智能產品,它的名字叫做米兔卡片學習機。
  • 60後大叔融資2千萬:用AI解析生日密碼 上線兩周用戶營收均過萬
    用戶輸入生日信息後,APP會從「性格特點」「行為模式」等維度給出個性化的解析報告。如用戶想進一步得到完整解析報告,可線上付費使用。  「密碼派」APP自12月5日上線以來,用戶量和營收均已過萬,該項目已於今年12月初完成天使輪和Pre-A輪融資,數額為2000萬元。  註:楊凱程承諾文中數據無誤,為內容真實性負責。鉛筆道作客觀真實記錄,已備份速記錄音。
  • 富相窮相十字分類法,看自己臉型是符合哪個字?(下)
    五行形相分類前文中已有詳細的敘述,這裡不再贅述,此處首先從十字分類法講起。所謂的十字分類法,是將人的面相比附為十個字的字形的分類法。十個字分別是:圓、田、由、風、用、木、同、王、甲、申。這種相法只適合於面部。
  • 性格測試,標籤分享,社交虛榮讓我們充當了免費水軍
    這個H5測試,是網易音樂M2團隊的作品,通過網易音樂APP進行操作,幾道簡單的動態問答做完後,通過分享給朋友或發送朋友圈,獲取性格卡片,同時測試結束網易音樂還會根據你的測試類型,為你推薦最適合你的音樂,整個活動有清晰的邏輯,形成了閉環。
  • 《12星座鬥地主》全卡片詳解
    個人感覺這是最實用的卡片,飛機可以拆成三帶,也經常會湊成炸彈牌炸彈卡:消耗3點遊戲點數,本局出現炸彈牌!經過多次測試,選擇這卡贏牌的空間很大,並且是加倍贏取的,關鍵時刻可以用一下神龍卡:消耗1點遊戲點數,本局出現順子!
  • 趙名輝塔羅牌測試:我和他的緣分有多少?
    可能你很喜歡他,很想跟他在一起,但是不知道你們的緣分到底有多少未來到底能不能真的在一起,那麼本次我來測試一下吧。塔羅牌測試規則:首先不看答案解析,放鬆心情,默念此次問題,從下面圖的四張牌中選擇一張符合你們當前的感情狀態的牌,或者憑感覺和印象選擇一張,最後看答案解析。
  • 面相分析: 富相窮相十字分類法,看自己臉型是符合哪個字?(上)
    五行形相分類前文中已有詳細的敘述,這裡不再贅述,此處首先從十字分類法講起。所謂的十字分類法,是將人的面相比附為十個字的字形的分類法。十個字分別是:圓、田、由、風、用、木、同、王、甲、申。這種相法只適合於面部。
  • 銀行給了臨額,究竟要不要用?
    臨額到期之時,會先扣卡片的可用額度,可能會出現可用額度為負數的情況,這就是額度為負的兩種情況:臨額與超限額。 臨額幅度大,還款日前一定要還清,否則不建議使用。 臨額用多少,建議按個人需求來,如果是為了提額,建議用一半即可,無需全部用完。 一般臨額有了,固額也就不遠了,算是提額的前兆,但要不要用還得看自身情況,大部分銀行的臨額還算比較好得,一般正常刷卡2-3個月即可。
  • 心理測試:第一眼看到什麼,測試感情路上你還要受多少傷?
    不過,每個人的境遇不同,戀愛的目的也有很大區別,這也決定了每個人在愛情中還要受多少次傷才能修得正果。那麼,你在感情路上還要經歷多少波折才能遇到和你一生一世的人呢?測試開始:題目:第一眼看到什麼,測試在愛情中你還要經歷多少次傷害?
  • 「讓孩子快樂地學習」-米兔卡片學習機
    但要想好好教導孩子是一件非常困難的事情,孩子對枯燥的學習沒有絲毫興趣,如果強迫學習還會適得其反,可能會使孩子對學習產生牴觸心理。如何才能正確的教導孩子,不讓孩子對學習產生牴觸,輸在起跑線上呢?今天給大家推薦一個教娃神器-米兔卡片學習機,解決孩子學習沒有興趣、發音不標準等問題。
  • 在線卡片製作App小確信:臺北而生的小確幸
    傳統的紙質卡片在這個行動時代中正在漸漸消失,那不如打破卡片的概念,讓情誼繼續傳遞下去。小確信是一款可以在線製作卡片的App,傳遞確實而微小的小確幸。說到星座,創始人Jeremy告訴獵雲,剛開始他只做了節慶和祝福兩部分,但後來很多女生給出了加星座版塊的建議,她們的建議代表了女性用戶的需求。「那就加囉。」他笑著說。隨便點開一個版塊,會出現很多小清新的卡片的模版,這些卡片共有八百多張,都由 Jeremy與他的學生聯合完成。
  • 10 億人都在看的公眾號,要變成「今日頭條」了?
    文章卡片式展示在經歷了朋友圈設計升級、微信訂閱號懸浮窗之後,公眾號的列表界面也終於迎來了升級,一次的巨大的升級。在最新版本的微信訂閱號列表中,可以看到推送的文章變成了一張張精美的卡片,每個公眾號的文章卡片信息依然是按照時間發送的順序排列以「信息流」的形式展示。和舊版的公眾號界面相比,卡片式的陳列放大了圖片,比純粹的文字顯得更有吸引力。
  • 為用戶著想 聯想M8900DNF一體機測試
    聯想最近發布的M8900DNF多功能一體機,則在以往產品的基礎之上,把人性化的一面更近了一步,讓用戶使用起來更順手。需要指出的是,聯想M8900DNF需要很多屏幕右側導航鍵、選擇鍵的操作,對於不熟悉的用戶需要適應,不過好在有屏幕中文的提示。