反思統計方法在心理學領域的應用

2021-01-12 中國社會科學網

  對於心理學實證研究而言,統計方法是一種極為重要的工具。但在這種工具被頻繁使用的背後,心理學研究工作者對這種工具的「源頭和底層」缺乏深入探究。這導致統計方法未能在心理學中回歸其本身的價值和意義。

  統計方法是心理學的重要支撐

  心理學作為一門獨立學科,其中一個重要的研究方法支撐就是統計方法。百餘年來,統計技術的發展不斷推動著心理學科的進步。在眾多的心理統計技術中,基於樣本統計量推斷總體參數的統計推斷,在心理統計的應用中佔據著核心地位,為基於對有限樣本的觀測結論上升到一般的科學原理提供了可能。

  在心理學研究中,統計推斷的有效性往往通過p值來衡量。長久以來,統計推斷的哲學預設、基於p值的統計推斷與科學推斷的關係,以及濫用p值的可能危害,並沒有得到心理學家的足夠重視。這導致的結果是,由費希爾(R. Fisher)所倡導的「將p=0.05作為一個主觀但實用的水平來判斷結果的顯著性」成了判斷一項研究最終價值的鐵律。

  統計推斷,主要包括假設檢驗、預測、統計回歸及統計建模等。其中應用最為廣泛的是奈曼(Jerzy Neyman)、皮爾遜(Egon S. Pearson)等人提出的以客觀概率為基礎的假設檢驗,這通常又是其他統計推斷理論的基礎。假設檢驗在心理學研究的應用中,有一個極為重要的指標——p值,即統計顯著性。許多心理學實證研究工作者試圖通過比較理論預測和觀測數據來評估和檢驗假設,這項工作所依賴的統計依據就是基於p值的零假設顯著性檢驗,主要包括Z檢驗、T檢驗、方差分析、卡方檢驗及非參數檢驗等。

  米爾(P. Meehl)指出,「由於心理學的研究對象很複雜,使得建構精確的理論變得非常困難」。他對比了「軟」的心理學和其他「硬」科學是如何檢驗各自理論的,認為硬科學的研究者往往預測某個特定的值,他們希望可以接受零假設。而心理學研究者通常設立的零假設是,不同條件下無差異或變量不相關,他們希望零假設可以被拒絕。當這個單點假設被證實時,心理學家就認為自己的理論得到了證實,或至少經受住了考驗。而零假設的「拒絕」需要一個工具,p值正是這樣一個工具。

  p值遇到挑戰

  近年來,p值不斷受到批評與質疑,這些批評與質疑主要針對假設檢驗固有的局限及研究者的誤解誤用。而這兩個問題同樣存在於p值在心理學領域的應用中。

  一方面,假設檢驗作為一種統計方法,本身存在問題。穆德(J. Mulder)等人在反思心理學統計方法時總結了對假設檢驗主要的三個方面的批判,分別是:不能用於量化支持零假設的證據;p值往往高估了與零假設相反的證據——鑑於目前關於心理學可重複危機的討論;p值是依據極端結果在樣本空間上的分布計算的,其大小取決於所抽到的樣本。此外,假設檢驗的過程中需要根據樣本推斷總體,而這很可能會犯兩類錯誤,即在零假設為真時拒絕接受零假設,以及在零假設為假時接受零假設。

  另一方面,假設檢驗在心理學研究中存在誤解誤用的問題。比如,「p=0.0002」和「p=0.02」之間的差異與「p=0.049」和「p=0.051」之間的差異相比,前者明顯大於後者。但在心理學研究中,前者都被視為達到「統計顯著性」水平,後者卻因「p=0.05」的界限被劃分到不同的顯著類型中,而與此對應的研究結果也被劃分為兩類。其次,受「p<0.05」即「統計上顯著」的影響,心理學研究者會更加傾向於報告「統計上顯著」的結果,而對報告「不顯著」的結果有所顧慮。另外,在心理學研究中,p值的統計學意義和對研究的實際意義常常被模糊了,人們常常將「統計顯著性」同「結論有價值」相等同。p值的本質是概率,只能作為研究假設是否可靠的一個推論依據,而不是研究結果本身。統計的顯著性不能衡量研究結果本身的意義和價值。如哈伯德(R. Hubbard)等人所言,科學推斷是一個比統計推斷寬泛得多的概念。但在心理學的實際研究中,統計的顯著性(即p<0.05)就等同於研究結果本身的顯著性。也就是說,在心理學的研究中,研究結果純粹取決於統計本身,而較少關注研究本身的性質及其與統計工具的契合性。

  反思p值使用

  近年來,美國統計學會(ASA)對p值及其相關問題進行了反思。在《邁向超越「p<0.05」的時代》一文中,美國統計學會對p值的使用提出了四條建議:接受不確定性、深思熟慮、開放和謙虛。這四條建議對於統計方法在心理學中的使用和發展同樣具有借鑑意義。

  第一,接受不確定性。我們需要重新認識到,統計推斷從來不等同於科學推斷。心理學研究報告中應拒絕使用「p<0.05」作為判斷研究結果是否有意義的絕對標準,謹慎使用「p<0.05」「統計上是顯著的」「*」或其他類似的不嚴謹表達。使用「p<0.05」很容易使統計意義和實際語言意義相混淆,造成「統計上顯著」即「實驗假設為真」的假象。當研究者不再迷信「p<0.05」時,統計更能在心理學中發揮其應有的作用。心理學實證研究的意義並非由某個統計度量是否小於一個特定的閾值來判斷,而是由研究者及研究的整個設計來判斷。

  第二,深思熟慮。在做研究之前,心理學研究者應清晰把握該研究領域的現狀,明確研究的目的,嚴格、謹慎地設計研究計劃,並在已有理論的基礎上,通過文獻綜述、專家意見、同行評閱等方式對研究的可行性及結果進行分析,以增強研究的客觀性和有效性。麥克沙恩(B. McShane)等人認為,深思熟慮的研究應該考慮「相關的先驗證據、機制的合理性、研究設計和數據質量、現實世界的成本和收益、發現的新穎性,以及其他因研究領域而異的因素……而不優先考慮p值或其他統計度量」。

  第三,開放。心理學研究因其研究對象的特殊性,即使用同樣的研究方法並儘可能地控制各類變量去複製同一項研究,其結果也很難相同。因此,在心理學研究中應主張「一種現象,多項研究方法」,這樣更有利於我們從不同的角度審視當下的研究。在報告研究結果時,研究者不僅需要報告p值,也要報告統計檢驗力、效果量及置信區間等;不僅需要報告對研究結果有利的數據,也要報告不利但重要的數據;不僅需要報告所有數據的分析,還要求提供所有獲得的結果。為了科學出版和研究傳播的完整性,在決定呈現或突出哪個結果時,不應該考慮p值是否超過某個具體的閾值。對研究結果的全面報告將有利於增強隨後引用該研究成果的研究、報導和新聞等內容的客觀性。

  第四,謙虛。心理學作為一門研究人性的學科,其研究結果受到媒體和公眾的廣泛關注。研究者要清楚地認識到不同的讀者會從不同的利益立場理解研究結果。因此,在撰寫論文時更應作為一個中立者謹慎地報告研究及研究結果的局限性,以免誤導公眾。另外,統計工具自身具有局限性,p值、置信區間和其他統計度量都是不確定的。心理學研究者不能通過單一的研究得出一個確定性的結論,而應該保持謙虛,鼓勵他人用不同的方法重複自己的研究。

  總體而言,我們主張的是,在心理學研究中研究者並不需要停止使用p值指標或任一統計方法,而是需要在使用之前明確所使用統計方法本身的局限以及在心理學應用中需要特別關注的地方,從而讓心理學研究的「源頭和底層」更為清晰。只有這樣,心理學研究才更加能夠經受時間和實踐的考驗。

  當然,任何事物的發展都是螺旋式的上升,而不是一條直線。做出改變不僅需要時間,也需要心理學會、心理學期刊及出版社編輯、心理學研究工作者、教師群體等協同合作。心理學會及各分支學會應做好「上傳下達」的工作;心理學期刊及出版社編輯應嚴格把關論文的質量;心理學研究工作者在撰寫論文時應接納「接受不確定性、深思熟慮、開放、謙虛」的建議;教師群體應適當調整自己的教學內容,從而走出「我們使用『p<0.05』是因為老師這樣教,老師這樣教是因為我們這樣做」的循環。只有各機構共同發力,才能讓統計方法在心理學領域回歸本位。

 

  (本文系國家社科基金項目「心理學學科分裂危機的理論根源及整合的哲學基礎研究」(18BZX048)階段性成果)

  (作者單位:西北師範大學心理學院)

相關焦點

  • 實驗統計測量複習方法指導—心理學考研人的福音,乾貨滿滿!
    (2)心理學實驗的方法,主要包括經典的心理物理法、反應時法等。這一部分是現代心理實驗的基礎方法,一定要理解透徹。(3)各個具體心理領域的實驗,包括注意、知覺、記憶、學習等內容,是對心理實驗方法的具體應用。第一部分的內容是實驗心理學最核心、最重要的內容,也是心理學考研中考的最多的部分。我們需要通過對這部分的學習掌握心理學實驗的邏輯、各變量的操縱以及如何進行實驗設計。
  • 基礎心理學與應用心理學專業區別
    一般看來,基礎心理學並不在熱門專業之列。一方面,由於認知心理學是一門需要終身研究體會的學科,碩士學歷還稍顯欠缺,認知心理學可作為轉向應用心理學和發展與教育心理學甚至其他領域的一個「跳板」。另一方面,我國高校和科研院所對這類人才的需求是比較穩定的,而且待遇有保障。
  • 一位心理學工作者的心聲:從心理學視角反思不一樣的2020
    心理學主要是研究個體心理和群體現象的這麼一門學科,所以呢,這就讓我們和人和社會貼的很近。特別是近幾年,你會發現在各個熱點話題或者事件中,都會有心理學的身影。就事論事來講,這是件好的事情。因為科學,專業。不論是在事件點評還是在熱點分析上,首先是有理論依據可追尋,有大量的實驗數據可佐證。這讓我們人類個體以及人類社會,思維越來越理性,行為越來越規範。
  • 艾森克論文60年後被撤稿,暴露出心理學研究怎樣的弊端?
    如果不進行對心理學研究論文造假根源的研究,心理學研究的方法不改進,那麼,論文造假事件,艾森克當然不是第一個,但也絕不會是最後一個。因此,艾森克論文被撤稿事件應該引起學術界對研究方法及論文發表程序的深刻反思。
  • 後現代主義思潮對中國本土社會心理學的啟示
    總的來說, 後現代心理學主張研究者應該擴大心理學的研究視野, 樹立大心理學觀;提倡加強心理學理論研究, 深化心理學的實際應用;推崇心理學研究的多元化, 推動心理學的本土化研究和跨文化研究。 (2) 目前, 現代主流心理學研究中存在著對科學實證主義的盲目崇拜, 對實證法以外的研究方法予以排斥。
  • 心理學專業-江西師範大學
    培養目標心理學專業(專升本、函授)招收已經取得專科畢業書的各類人員。本專業培養具有良好思想道德品質,進一步系統地掌握本科水平的心理學學科學科領域的基本理論、基本知識和基本技能,掌握心理學科的發展趨勢和應用前景,具有一定的心理學教學技能、科學研究和實際工作能力,具有較高的人文素養和教師職業素質,能夠在科研部門、教學機構、教育培訓機構及其他企事業單位從事基礎教育、科學研究、心理學教育教學及管理等心理學相關工作的創新型和實踐型人才。
  • 教育心理學的研究方法都有哪些?
    教育心理學研究的具體方法技術很多,而基本的研究方法可以概括為描述的定量研究方法和解釋的質性研究方法。1.觀察法觀察法是一種有目的、有計劃地觀察記錄被研究對象行為活動的研究方法。觀察法是科學研究中應用最廣泛的一種研究方法。科學的觀察方法先要解決「觀察什麼」「如何觀察」「如何記錄」這三個問題。觀察法可分為自然觀察法和實驗室觀察法,常常要藉助儀器設備記錄被研究者的心理與行為。根據觀察要求的不同,又可以將觀察法分為長期觀察和定期觀察。觀察法是搜集研究資料的初步方法。
  • 提升中國特色心理學研究水平
    東南大學應用心理研究所所長馬向真認為,我國社會轉型呈現出的社會心態與行為,無法用西方心理學進行解釋。本土化的根本方向和目標就是完善中國心理學的知識體系。近年來,學界圍繞社會變化、經濟變革、文化變遷等系列主題探討轉型的影響,推動了當今中國社會心理學研究的繁榮發展。
  • 2008年心理學考研統考大綱詳解之實驗心理學
    一、實驗心理學在專業課複習中的重要性  (一)學科地位   實驗心理學是一門相當重視科學研究的方法論的學科。如果說普通心理學是整個心理學科領域的基礎的話,實驗心理學則是整個科學心理學的基礎。它已經成為科學心理學研究的代表和主力。
  • 2016心理學考研五大院校盤點
    心理學系的科研領域涉及較廣泛的方面,包括實驗心理學,認知心理學,認知神經科學,生理心理學,心理統計與測量,發展心理學,人格與社會心理學,情緒心理學,比較心理學,臨床心理學,醫學心理學,工業與管理心理學,消費與廣告心理學,人力資源管理、工程心理學等,這一綜合特性為培養心理學高等基礎與應用心理學人才奠定了重要基礎
  • 理學門類——心理學專業解讀
    心理學是交叉學科,研究內容極其複雜,發生在多個層面,受多種因素影響;心理學從社會學、人類學、數學、統計學、物理學、生理學、生物化學、遺傳學、計算機科學、神經科學等多個學科領域借鑑研究方法和研究手段,因此心理學學生能夠擁有廣博的知識面,掌握多學科研究方法。另一方面,心理諮詢是實踐性很強的活動。除去專業知識外,還需要廣泛學習其他領域知識,不斷提高諮詢技巧和能力。
  • 通過記憶哲學反思人類增強
    當前,記憶增強已成為反思人類增強的一個新興點。以往人們討論人類增強較為依賴身體與心靈以及技術與人類的二元論假設,而哲學對二元論長久的批判也說明了這一假設存在的問題。這一假設更容易為多數人所接受,但接受並不意味著合理。隨著記憶作為克服身心二元論的一種方法被柏格森提出,也隨著與記憶修改和增強有關的記憶科學的迅猛發展,記憶哲學成為一個較好的可以選擇的視域。
  • 嘮嘮北體專業那些事兒——被誤解的心理學
    心理學是一門研究人類心理現象及其影響下的精神功能和行為活動的科學,包括基礎心理學與應用心理學兩大領域,其研究涉及知覺、認知、情緒、思維、人格、行為習慣、人際關係、社會關係等許多領域,也與日常生活的許多領域——家庭、教育、健康、社會等發生關聯。
  • 「開課通知」人大統計學院概率論與數理統計專業:《多元統計》本周...
    請各位學員提前安排好工作和時間,務必準時上課,精彩課程不容錯過,現將具體事宜通知如下:中國人民大學統計學院上課時間:2020年7月11日-12日(上午9:00-下午4:30)上課形式:在線學習(千聊平臺)講授課程:《多元統計分析》授課老師:孫怡帆(中國人民大學統計學院,副教授)參考教材:高惠璇,《應用多元統計分析》,
  • 好書推薦:心理學入門經典書籍《心理學與生活》
    如果要問心理學入門所必讀的經典書目有哪些,可以羅列出很多。但是如果只能推薦一本,那一定是這本菲利普·津巴多的《心理學與生活》這本書都有哪些來頭,讓人如此推崇呢?首先,《心理學與生活》是美國史丹福大學多年來使用的教材,也是在美國許多大學裡推廣使用的經典教材,被ETS推薦為GRE心理學專項考試的主要參考用書。其次,還是被許多國家大學的「普通心理學」課程選用的教材。
  • 《比的應用》教學反思
    《比的應用》教學反思一、教材分析按比例分配是小學六年級的教學內容。學生在此前已經學習了平均分、分數乘法應用題、比的知識,這些知識是學生解決按比例分配的應用題的基礎。,這道題不僅僅是對上面解題方法的一個鞏固,而且也有一定程度的提升(三個數的比)。通過以上兩個問題,讓學生感受到「按比分配更公平」而不是「平均分配」。比的應用有很多,所以,我又出示了新問題「按比分配更健康」,引導學生解決生活的健康飲食—葷素搭配。「健康飲食葷素比2:7,葷菜36克,素菜多少?」
  • 萃歐波蘭留學-心理學專業解讀:心理學專業學什麼
    很多學生對心理學的認識誤區在於,認為心理學只需要哲學思辨、思考、溝通交流即可。實際並非如此,心理學是一門社會科學,是理科。換句話說,嚴謹的科學實驗流程同樣適用於這個專業——提出假說、測量、統計、分析、重複實驗得出結論……心理學領域也在隨著時代的發展逐步加強自身的科學範式,即用數據說話。
  • 兒童心理學研究方法有哪些?
    兒童心理學研究方法有哪些? 核心提示: 小孩子的想法跟成年人是完全不一樣的,因此家長在跟孩子交往的時候需要知道兒童心理學研究方法,目前常見的研究方法有四種,分別是觀察法、實驗法、臨床法和測驗的統計法。
  • 心理學研究實驗到底能不能複製?
    心理學領域的「複製性危機」成為了全世界範圍的轟動話題。去年,為了確定心理學研究實驗的「可複製性」,由270名科學家組成的非營利機構「開放科學中心」(Center for Open Science)試圖重現100個已發表的研究結果。而超過半數的研究結果以失敗告終,即無法複製。
  • 2017年考研心理學大綱詳解(五):實驗心理學
    一、實驗心理學考查目標  1、掌握心理學實驗研究的基本原則與基本過程  2、掌握心理學實驗研究的技術與方法  3、具備實驗設計和撰寫研究報告的能力心理學實驗研究的一般程序   選擇、簡答 理解,需熟練記憶 心理學實驗的變量與設計 心理學實驗的含義與基本形式   選擇 了解 心理學實驗與理論