在數據分析數據挖掘領域有一句經典話:數據和特徵決定了機器學習的上限,而模型和算法只是逼近這個上限而已。問卷的分析的結果都是基於問卷數據分析得到的,如果在問卷設計階段就出現了問題,所以很多關鍵信息是獲取不到的,所以說問卷的設計非常的重要。
下邊介紹問卷設計的方法,問卷的設計一般是分為兩個部分的。
第一部分是基本信息部分,一般就是關於調查對象的基本信息的問題,比方說年齡、年級、職業、性別、薪水等級、教學年齡、生活費水平等等,這部分是結合問卷調查的對象群體特徵維度以及自己論文研究的方向進行確定的。調查的對象為學生群體的話,基本信息應該是包含年級、年齡、性別、出生日期、班級、專業等等信息。
第二部分是重點需要研究的每個維度的題目。這個部分的題目一般都是採用的李克特量表的方式來做的,使用李克特量表原因主要是使用量表的形式,可以量化每個維度的數據,方便後續的比較大小,判斷相關性等分析。比方說題目選項設定為"非常同意"、"同意"、"不一定"、"不同意"、"非常不同意"五種回答,分別記為1,2,3,4,5,這個時候代表著數值越大越不同意,數值越小代表越是同意。
然後,問卷在設計的時候要做好維度的劃分,維度劃分是不少同學最頭疼的地方。每個維度的題目一般在5個左右,維度內部的題目基本是用不同的語言表達相同的含義,不同的維度要有明確的劃分,不能一個問卷下來所有維度的所有題目都是類似的含義。問卷維度的劃分一定要結合自己論文研究的方向。問卷設計中還可以通過設定反向題目的方法,避免問卷填寫者不思考,然後所有題目填寫的數據都一樣的情況發生。
介紹一個比較簡單的方法,如果問卷研究的方向有現成的可以參考的成熟的問卷,建議直接使用成熟的問卷,成熟的問卷一般在發放收集後的數據信度和效度都會比較好。這樣可以避免踩到問卷設計過程中的坑,避免因為設計問卷不好造成的重新設計發放手機問卷的重複工作。(無數血淚史的經驗)。
問卷有了,然後就可以通過在線發放問卷的工具發放問卷。為了保證調查用戶的質量,應該儘量精準的找到調查的對象,可以通過線上和線下結合的方式。