《應用心理學》主要刊登反映心理學各個領域的研究及其應用的最新成果,介紹國內外心理學的最新動態。特別歡迎認知心理、管理心理、工程心理、教育心理、社會心理、心理測量、醫學心理、心理衛生與諮詢、體育運動心理、文藝心理、司法心理及心理學在其他領域的運用等方面的論文。
即日起,應用心理學雜誌社將對發表於《應用心理學》的優秀心理學研究論文進行推送,關注我們,你將獲得最新最棒的心理學研究動態!
文章信息:
跳出傳統假設檢驗方法的陷阱——貝葉斯因子在心理學研究領域的應用
發表於《應用心理學》2018年 24卷 3期
寫在前面:p值
p值是指在一個概率模型中,統計摘要(如兩組樣本均值差)與實際觀測數據相同,或甚至更大這一事件發生的概率。換言之,是假設檢驗中零假設成立或表現更嚴重的可能性。p值若與選定顯著性水平(0.05或0.01)相比更小,則零假設會被否定而不可接受。
(圖片來源:https://xkcd.com/1478,一幅諷刺濫用
p值的漫畫)
p值誤我?
在你使用p值時,是否還在為研究結果的不穩定而疑惑?是否還在為如何回應審稿人,對傳統推論統計獲得的數據分析結果表示不信任而煩惱?是否還在為假設檢驗中「不顯著」的統計結果不能有力地支持虛無假設而感到擔憂?近日,《應用心理學》期刊上發表的一篇關於統計方法與驗證手段的文章《跳出傳統假設檢驗方法的陷阱——貝葉斯因子在心理學研究領域的應用》,相信能夠為有以上體驗的研究者帶去一些見解與幫助。
該文章開頭圍繞傳統假設檢驗的不足與誤用所帶來日益嚴重的「可重複危機」,和國外著名學術期刊對這一問題的重視與回應,引出了近來心理學界較為推崇(如《Psychonomic Bulletin & Review》雜誌2018年第一期專欄)的貝葉斯因子分析方法。
貝葉斯因子是什麼?
貝葉斯因子,可以視作貝葉斯統計對經典假設檢驗的一種替代方法,定義為兩種相互競爭的假設(通常是一個虛無假設和一個備擇假設)的似然概率比。在推論統計過程中,其數值大小能描述兩種假設成立可能性的相對高低,反應當前數據傳遞了多少支持證據。使用貝葉斯因子進行推論,具有概念清晰,可為虛無假設成立提供證據,比p值更嚴格地考察大樣本容量下的實驗效應,並可結合理論假設的先驗概率與樣本數據進行綜合推斷等諸多優點。
貝葉斯因子的計算
文章主要介紹了兩款計算貝葉斯因子的常用軟體:R語言中的BayesFactor軟體包,和基於這個軟體包、具有良好操作界面的JASP。
BayesFactor工具包由Richard D. Morey等人共同開發,是一款仍在實時更新的R語言工具包。它可用於計算各種簡單實驗設計下的貝葉斯因子,具體適用類型包括列聯表、單樣本或雙樣本t檢驗設計、單因素或多因素方差分析和線性回歸模型。
JASP是一個免費開源、具有圖形操作界面的統計分析軟體。相比於BayesFactor工具包而言,這是一個功能更全面、操作更友好、對熟悉使用SPSS軟體的研究人員更易上手的軟體。除傳統的統計檢驗功能外,它還能實現諸如探索性因素分析、主成分分析、結構方程模型等功能。
在文章的附錄部分作者也提供了腳本與示例數據供讀者簡單練習與操作。
貝葉斯因子與心理學研究
文章最後還概述了貝葉斯因子應用過程中的注意事項:
1. 貝葉斯因子的數值是相對的,而不是絕對的。
2. 貝葉斯因子比p值更加嚴格,但仍有可能被操縱。
3. 貝葉斯因子無法根本性解決「發表偏倚」(publication bias)的問題。
希望大家能有分析有比較地,以更全面的視角,看待貝葉斯因子在心理學研究中的應用。
參考:
1 《應用心理學》2018年24卷第3期論文《跳出傳統假設檢驗方法的陷阱——貝葉斯因子在心理學研究領域的應用》
http://www.appliedpsy.cn/CN/abstract/abstract206.shtml
2 Psychonomic Bulletin & Review雜誌2018年2月25卷第1期專欄
https://link.springer.com/journal/13423/25/1/page/1
作者|顧全(浙江大學)
編輯|張旭暉(浙江大學)