凡是搞計量經濟的,都關注這個號了
郵箱:econometrics666@sina.cn
所有計量經濟圈方法論叢的code程序, 宏微觀資料庫和各種軟件都放在社群裡.歡迎到計量經濟圈社群交流訪問.
Source: 唐世平,復旦大學特聘教授、陳樹渠講席教授,《公共行政評論》(廣州)2015年第4期
上一日,咱們引薦了加權DID, IPW-DID實證程序百科全書式的寶典,後面,咱們又引薦IV回歸係數比OLS大很多咋回事, 怎麼辦呢?,這些都收到圈友們積極反響。今天,咱們要引薦的是一些關於社科研究方法方面具有爭議性質的文章,比如研究經濟學需要掌握哪些方法論?寫論文的初期-中期-晚期, 模型-思想是如何權衡取捨的。
在政治學方法論發展的進程中,(KKV,1994)是一部地位獨特的著作,由其出版所引發的方法論大辯論,特別是其中「定量與定性之爭」,帶動了整個政治學界對方法論的深入理解及方法創新。這篇文章圍繞上述「定量與定性之爭」問題,闡述了作者對方法論的理解。具體而言,文章重點批評了一些學者(包括KKV在內)錯誤地認為:「尋求因果解釋」的最重要途徑,就是用定量方法甄別「原因的影響」。對文章作者而言,這是一個對研究方法相當狹隘的理解,但也沒有任何捷徑可以超越兩者之爭,只有懂得多種技巧並理解它們各自的長處和短處,才能夠在面對實際的研究問題時,靈活運用不同的方法組合,比較好地解決研究問題。
一、引言及幾點聲明
毫無疑問,在政治學的方法論發展進程中,(KKV,1994)是一部有特別地位的作品。但是,這本書的特別地位不是因為它都對,而恰恰可能主要是因為它的核心立場是如此極端的錯誤,以至於許多學者,包括許多傑出的計量統計學者,起來群起而攻之從而引爆了後來的方法論辯論(特別是:Brady & Collier,2004/2010)。而這一輪由(KKV,1994)帶動的方法論大辯論,特別是其中的「定量與定性之爭」,確實帶動了整個政治學界對方法論的理解的深入,以及方法論的創新(Mahoney,2010)。
在展開之前,需要做幾點說明。
首先,鑑於「定量與定性之爭」的內容紛雜,我在此不羅列,更不評論,這場爭論中的任何細節。這一方面是因為我只能在其他地方才可能仔細討論這其中的某些關鍵細節,而另一方面是因為我的立場一直是「(我們需要)超越定性與定量之爭」。但是,我必須強調一點,「定量與定性之爭」最最核心的問題在於「尋找因果解釋」到底是試圖尋找「Causes of Effects(結果的原因)」,還是僅僅是試圖甄別「Effects of Causes(原因的影響)」上。定量研究的優勢在於通過甄別「Effects of Causes(原因的影響)」,從而確立某些因素對於某一類社會結果有影響(或者貢獻)與否。而定性研究的優勢在於試圖獲得對某一類社會結果的我們直覺意義上的「因果解釋」,比如,為什麼「大革命會發生在某些國家」?或者「為什麼某些革命成功了,而某些革命失敗了」?顯然,我們絕大部分人士都會同意這樣的立場:我們通常所說的「因果解釋」是後一種意義上的「因果解釋」,即「Causes of Effects(結果的原因)」。而儘管確立某些因素對於某一類社會結果是否有影響(或者貢獻)是重要的,但是這麼做只是尋求「因果解釋」的一部分。而許多偏好定量技術的學者則錯誤地認為,「尋求因果解釋」和甄別「Effects of Causes(原因的影響)」完全等同(Goertz & Mahoney,2012:Chap.3;也見下面對KKV的具體批評)。由此,這些人士也錯誤地強調,「尋求因果解釋」的最重要方法就是用定量方法進行「因果推斷(Causal Inference)」,或者說是甄別「Effects of Causes(原因的影響)」。
其次,我對任何一類方法並沒有特別的偏愛。這是因為任何一類方法都有它的長處和短處,而沒有全能的方法。因此,我認為,只有懂得多種技巧,並且理解他們各自的長處和短處,我們才能夠在面對實際的研究問題時,靈活運用不同的方法組合併比較好地解決問題。
再者,社會科學中的方法其實遠遠不止定性和定量兩種。按照我的分類,社會科學中的方法至少有六個大類的方法(更早一點的討論,見:Abbott,2001,2004)。但是,我確實同意:定性分析、QCA(Qualitative Comparative Analysis)①、定量分析是最重要的數據分析方法。
最後,儘管我對方法論的理解仍是一個「學習進行時」,我自己獨立以及和我的合作者一起運用過的方法基本覆蓋了社會科學中的所有方法大類,包括:ABM(Agent-based Modeling,代理人基建模)、GIS(Geographic Information System,地理信息系統)、SNA(Social Network Analysis,社會網絡分析)、QCA(Qualitative Comparative Analysis,定性比較分析)②、定性分析、定量分析、概念分析(Conceptual Analysis)③、Formal Modeling(包括博弈論、經濟學模型)以及ISM(Interpretative Structural Modeling,解釋結構模型)。事實上,我和我的團隊還在試圖為解決社會科學中的某些具體的研究問題而發展一些新的方法。但是,我不是一個「唯數學化而數學化」的人:我始終認為,我們發展任何新的方法都是為了解決具體的研究問題,而不是為了讓東西好看或不讓人看懂。
在這篇文章裡,我將主要闡述我對方法論的理解,而不做太多的解釋,許多文獻也將不詳細列出。更加詳細的討論只能在其他的地方才能展開。
二、對KKV的簡短評價
前面提到,(KKV,1994)對定量和定性兩類方法的立場是非常極端的,也是錯誤的。具體地說,(KKV,1994:3)認為:
我們的看法是:定量、定性的區別,頂多在研究風格與特定技術上。至於背後雙方分析問題的邏輯,其實沒任何不同。這類邏輯雖然在定量研究中,一般會被解釋得非常清楚,有時還用符號來幫助表述。但在做得好的定性研究裡頭,絕對也能到類似的推理邏輯。所以,不論定量或定性,如果能在研究設計的過程中,更加注重上面說的推理邏輯,研究肯定都能做得更出色。
從這一點來看,(KKV,1994)應該說是一部非常不幸的作品。這其中的最核心原因有三。
首先,這三位作者儘管都是學界大佬,但他們對方法論的理解都是不夠完整的。具體地說,加裡·金(Gary King)幾乎不懂定性分析,而他對定量技術的偏愛又讓他不能批判性地看待定量技術的缺陷。而羅伯特·基歐漢(Robert Keohane)和雪梨·維巴(Sidney Verba)則不僅基本不懂定量,而且也不太懂定性分析(至少按現在的標準看)。如此一來,(KKV,1994)一書對方法論的理解有嚴重的偏差也就不難理解了。
其次,(KKV,1994)沒有提及任何對定量方法的許多當時就有的深刻批評,而是一味強調定量方法的優勢。④我這裡要特別強調,這些批評定量方法的人士都是對定量和定性有非常好的理解的人士。我這裡僅列出兩位:安德烈·阿伯特(Andrew Abbott)和大衛·弗裡德曼(David A.Freedman)。
安得烈·阿伯特對定量方法有重要的貢獻:定量方法中的兩個重要方法「序列分析(Sequence Analysis)」和「最優匹配(Optimal Matching)」都是他首先發展出來的(而「序列分析」背後的原理,是生物學中DNA序列測定的思維和邏輯!)。但是,阿伯特非常清楚定量方法的缺陷。在他(Abbott,1988)發表在「社會學理論(Sociological Theory)」雜誌上的「超越廣義線性模型(Transcending General Linear Model)」一文中,阿伯特指出了,作為定量分析所主要依據的「廣義線性模型」,有賴幾個根本性假設的成立:①實體均展現屬性(Entities with Attributes);②單調的因果影響(Monotonic Causal Flow;③單一的變量意義(Univocal Meaning of Variables);④不存在序列影響(Absence of Sequence Effects);⑤獨立等因果假說(Causal Independence and Related Assumptions);⑥超越於時空背景[Independence Context(In Their Space and Time)]。但在現實社會中,上述每一點均不無疑問,因此,阿伯特進一步認為,正是這些廣義線性模型的根本性假設的缺陷,使得社會科學家不能夠更好地理解世界。
弗裡德曼就更是職業的統計學家(他曾經當選過美國統計學學會的主席)。1991年,弗裡德曼發表了一篇廣受讚譽的文章Statistical Models and Shoe Leather(收錄在:Freedman,2010)。在這篇文章中,他指出,在許多的場合,一味地試圖用不同的統計技巧去甄別觀察數據中的因果關係(而這基本上是加裡·金的立場)是不可能完成的任務。要想從觀察數據中甄別出相對確定的因果關係,需要各種各樣的邏輯思維(包括定性思維),而統計技巧只是其中的一種工具而已。
我還可以列出(KKV,1994)中存在的許多更加具體的問題。這裡,我只列出五個。①(KKV,1994:第六章)一味強調增加觀察樣本。但是,許多社會科學的最重要的問題本就是一個小樣本的問題。因此,這些問題的觀察樣本不可能被增加,也不應該被增加。比如,要討論現代化在西歐的起源,就不可能去增加樣本:在1500-1700年間,有可能成為世界上第一個現代化國家的西歐國家只有四個(葉成城、唐世平,2015)。這背後的根本性原因是我們面對的不是實驗數據,而是有限的觀察數據。②(KKV,1994:85-87)對機制的理解可以說是荒謬的。③和許多定量人士一樣,(KKV,1994:87-89)對用交叉項(Interactive)來捕捉因素之間的相互作用的局限性沒有足夠的認識,因而根本就沒有認識到QCA技術的價值(Ragin,2000)。④KKV幾乎完全忽略了數據的測量問題(見下面的討論)。⑤最後,也是最為致命的是,儘管(KKV,1994:75-85)在定義「Causality(因果關係)」時多處引用了(Holland,1986),但卻忽視了(Holland,1986:954)非常強調的一點,即,「給出因果解釋(Formulating a Causal Explanation)」和[KKV最關心的]「因果推斷(Causal Inference)」是不同的。前者要遠比後者複雜,儘管後者通常是前者不可或缺的一部分(也見:Goertz & Mahoney,2012:chap.3)。⑤
為此,我特別建議,所有的青年學子都應該把(KKV,1994)和對其的批評的集成,即亨利·布拉迪(Henry E.Brady)和大衛·科利爾(David Collier)合編的Rethinking Social Inquiry(Brady & Collier,2004/2010)一起看。事實上,我鼓勵大家先看看(Brady & Collier,2004/2010),這樣才不會被(KKV,1994)過多地誤導。而我再次強調,我批判(KKV,1994)不是為了批評定量分析方法。事實上,我和我的同事的許多研究都在運用定量分析方法。但是,我們不認為定量分析是唯一可行和可靠的因果分析方法;而我們也總是基於問題和數據來選擇方法,而不是倒過來。
三、超越定性與定量之爭:評價一項研究的共同標準
我認為,任何一項實證研究,無論其使用的方法如何(即,無論是定性與定量還是它們的組合以及其他的方法),我們對它的水平的評價應該有基本統一的評價標準。我認為,以下幾條標準是最重要的(見表1)。
(一)問題是不是真實的?問題是否重要?問題的提出是否妥當?
評價一項研究的價值,首先是它的問題的水平。這一項至少包含以下三個方面。
首先,研究問題必須是一個真實的問題,而不是一個假的問題。比如,「上帝為什麼先造就男人,然後再造就女人」就不是一個真實的問題,而是一個虛假的問題。無論自然科學還是社會科學都是實證科學。因此,我們只研究來自於真實世界的真實問題。
其次,這個研究問題是否重要?如果一項研究用了非常高妙的技巧,但是卻在研究一個非常無聊或者渺小的問題,那這項研究就不太重要。最後是問題的提出的方式是否妥當。
(二)對問題的解釋的理論化的水平
接下來則是理論化的水平。無論一項研究使用的方法是定性、定量還是其他,其理論化的水平都應該是評價它的第二重要的標尺。
在這裡,需要特別強調的是:「提出實證假說(Formulating Empirical Hypothesis)」不是「理論化(Theorization)」。而現在,許多定量和定性研究其實幾乎沒有理論化,只有羅列了幾個實證假說而已。這一不幸結果背後的主要原因是將「提出實證假說」和「理論化」等同起來的錯誤理解。
簡單地說,除非你面對的是一個極其簡單的問題(比如,為何人在餓的時候就想吃東西?),「提出實證假說」並不構成「理論化」。也就是說,提出幾個可以驗證的實證假說——無論是定量的還是非定量的——都不是「理論化」本身:至少,這樣的做法的「理論化」程度是非常不夠,甚至是非常低的。
在(絕)大部分時候,理論需要解釋可能出現的「實證結果(Empirical Outcomes)」。因此,理論應該支撐實證假說,或者說是,假說應該從理論推導而來。而沒有理論支撐的假說只是對數據有可能展現出的相關性的猜測而已。不幸的是,現在的許多定量研究,它們的所謂理論部分只是羅列了一些(定量的)假說,然後就是(垃圾)回歸結果。它們所給出的回歸結果不容易理解,是否穩健也非常難以確立。我想,大家對這樣的低俗實證研究的態度多半是「嗯,哈哈」。⑦
這背後還有一個關鍵原因。理論的一個核心作用就是約束實證假說的提出:從理論推導出來的假說不能隨意修改。而不受理論約束的實證假說其實很容易和實證結果相互「事後自圓其說」。也就是說,對具體的實證結果(無論是定量的還是定性的)的事後(Ex Post)解釋不是「理論化」,至少不是好的「理論化」:因為要「事後自圓其說」實在太容易了。
只有這樣,我們才能理解為什麼如果從一個理論推導出的多個實證假說得不到實證支持的時候,我們就要對這個理論本身持更加謹慎甚至懷疑的態度。因為一個好的理論必須做到邏輯自洽,並且整合了多個因素和機制。
學界有一種說法是「Ideas are Cheap(想法不值錢)」。事實上,好的思想永遠是稀缺的。現在的問題是大家都走向了低水平的理論化。這不可避免地導致許多實證研究的低俗化。
因此,最好是先發展出一個好的理論,然後再從這個理論推出(好的)實證假說,即有理論支撐具體的(實證)假說。只有這樣作出來的實證結果才有趣,才相對可靠⑧。相反,如果一項定量實證研究沒有好的理論,不僅我們難以判斷它給出的統計結果是否可靠,我們甚至都不知道需要度量什麼樣的東西,怎麼度量,更談不上給出特定的統計模型。特別強調,同樣的標準適用於定性研究。
以對內戰特別是族群衝突的研究為例。一些非常有影響的早期工作(如:Collier & Hoeffler,1998,2004;Fearon & Laitin,2003)幾乎沒有理論,或至少是像樣的理論。因此,毫不奇怪,他們的許多結果都備受質疑甚至被推翻。相反,我們對族群衝突的研究則一直是以理論為嚮導(Tang,2011,2015)。因此,我們給出的實證假說是清晰的,因而實證假說是否得到支持也是清晰的(參見:Tang & Li,2015;熊易寒、唐世平,2015)。
歸根結底,沒有理論貢獻的定量研究只是(更加複雜的)相關性描述而已,它和一個描述性的定性研究相比,並不一定好到哪去,或至少是好得有限。
(三)實證假說是不是基於理論之上?
有了第二點要求,我們就很容易理解第三個要求:實證假說需要建立在好的理論之上。
具體說來,定量分析(以及QCA)的實證假說必須包含以下兩個部分:因素(含時空)、因素之間的相互作用。因為絕大部分社會結構都是多個因素相互作用造就的,獨立的變量變得相對沒有太多的意義(當然,某些變量本身就是幾個變量的「交互項」)。如果可能的話,定量的假說還應該包括「因果路徑(Causal Pathways)」,因為定量研究的某些方法可以幫助我們甄別不同的「因果路徑」[比如,是Mediating(傳導),還是Moderating(調節),還是兩者都有]。定量方法和QCA均無法真正驗證機制,因而可以不要求它們的實證假說提出機制。
定性研究的實證假說則必須有以下三個部分:因素(含時空)、因素相互作用以及機制。因為只有定性研究可以解決機制問題(而這也是定性研究的核心優勢之一),因此定性研究的假說應該儘可能包含機制。
定量方法和QCA的優勢在於甄別因素以及因素組合,從而幫助我們判定不同的「因果路徑」哪一個更有可能是正確的。但是,定量方法和QCA都無法驗證機制。相比之下,定性方法的獨特優勢在於可以解決機制問題,儘管它也可以幫助我們甄別因素以及因素組合。因此,越來越多的好的研究是定性、定量以及其他方法的結合。
(四)數據的可靠性:概念化、度量操作、整體數據質量
任何研究的結論的可靠性都至少部分取決於它使用的數據的可靠性:再複雜的方法也無法從根本意義上解決數據質量的問題,而數據質量的問題不僅僅是缺失值的問題。大體說來,數據的可靠性主要由三個方面決定:概念化、具體的度量操作以及整體的數據質量。
比如,巴巴拉·格迪斯(Barbara Geddes)(Geddes,2003)對威權政體的分類有概念性的分類錯誤,所以是不能直接用的⑨。
其次,某些東西可能無法通過問卷度量,或者用問卷度量得到的結果是高度偏差的。比如,你要調查中國公民對日本作為一個國家的態度,問卷調查的數據恐怕都是不可靠的,無論你是面對面調查還是電話,還是網際網路。比較可靠的度量可能是:某一個地區的日系汽車銷售量、保有量;以及這個地區去日本旅遊的絕對人數和相對比例。而在做回歸的時候,至少需要控制以下變量:是否遭遇過抗戰的戰火;是否遭到過日本殘酷的「三光」政策;日本佔領時間;是否有日系汽車合資企業、人均GDP、離海岸線的距離等等。
再者,不是所有的數據集都可以拿來直接運用,因為這些數據集本身有非常嚴重的問題。比如,World Governance Index(WGI)就是一個有大問題的數據集。類似有大問題的數據集還包括著名的「世界價值觀調查(World Value Survey,WVS)」。
最後,某些數據集則包含了太多的不相干的觀察(Irrelevant Observations or Cases)。直接運用這樣的數據獲得的統計結果通常會高估某一些因素的顯著性。因此,這樣的數據集也不可以拿來直接運用,而是需要對樣本進行細緻的截取和挑選。這方面,派屈克·麥克唐納(Patrick J.McDonald)最近對「民主和平論」的統計證據的攻擊值得大家好好學習(McDonald,2015:19-26)。
(五)最後才是具體的方法使用
如果是定量研究,這些方面包括具體的數據處理方式、具體的回歸工具是否妥當、回歸模型是否正確、具體的回歸技巧、結果的穩健性、回歸結果的Interpretation(理解)、是否排除了競爭性解釋等。
如果是定性研究,這些方面包括具體的案例選擇、是否包含了負面案例、具體的歷史證據的考證、具體的實證證據的使用、「過程追蹤」是否妥當、是否排除了競爭性解釋、對結果的理解等。
四、定量分析的一些基本原則
許多定量方法論的人士已經討論了一些基本的原則(比如:Ray,2003;Achen,2005),告誡我們在從事定量研究時不要犯一些根本性的錯誤。以下的討論中,有引用的地方表明我發展了既有的一些討論,或者只是強調。而沒有引用的觀點則基本上是我認為目前的許多定量研究方法討論還沒有注意到或者強調不夠的地方。
(一)首先也是最重要的,無論使用何種方法,一個研究者都必須對他想研究的問題有確實的了解。
比如,對國內戰爭的延續,特別是族群政治的延續的許多研究都是那些對戰爭沒有一些基本的理解的所謂的「衝突專家」做的。而因為度量的便利,這些研究,通常只有「結構」因素,而沒有人的因素。這些人士恐怕基本不知道支撐一場戰爭有多難,也沒有幾個真正讀過克勞塞維茨、孫子兵法以及毛澤東的著作。又比如,最近很時髦(而且幾乎都發表在頂尖雜誌)的「基因社會科學」,其實都是一堆不懂得從基因到人的行為有多麼長的距離而完全「讓數據說話」造就的垃圾,最後都會成為學術界的笑話。
(二)基於對研究問題的深入了解以及對文獻的良好把握,發展出一個好的理論。這個問題我在其他地方已經詳細討論過,此處不再贅敘。
(三)千萬不要想用定量分析來解決一切研究問題。(這是我希望大家都多學一些不同類別的方法的核心原因。)事實上,如果你只想用定量分析來解決研究問題,你很容易犯以下錯誤:
①你會忘記,某些問題幾乎不可能用統計技巧解決⑩。
②成為數據(集)的囚徒:沒有數據(集)就沒有研究了。有些問題可能沒有現成的數據,也有可能是不會有可靠的數據,或者是至少不會有特別好的能用於回歸的數據。
③對文獻過於挑剔。比如,可能對一部分文獻很熟悉(特別是定量的),但是對其他的研究,或者不依賴定量技術的研究不夠熟悉。
④太想快速發文章,而對理論化以及數據質量等問題重視不夠,最後欲速而不達。
(四)忠於你的理論以及從理論推導出來的實證假說。
(五)拿到數據後,不要直接就去「跑」回歸,最好先通過描述性統計對數據有基本的了解。
(六)弄懂定量方法背後的基本邏輯。
定量方法的最核心的問題可能並不是具體的操作技巧,而是理解一類方法的基本核心邏輯(儘管不是我們每一個人都能完全弄懂背後的數學推導)。
①比如,不能用兩個類別變量或者級別變量,或者一個類別與一個級別變量做交互項(Interactive)。這背後的邏輯很簡單:這樣做出來的交互項很多時候都是「混淆不同類別(Categorical Conflation)」。(11)
②許多人士認為,穩健性檢驗主要是通過加入更多的控制變量,因為怕遺漏了許多應該控制的變量。但是,這種不假思索的對遺漏變量的恐懼事實上是一個「Phantom Threat」(Clarke,2005)。只有當遺漏變量有可能影響因變量時,才是必須控制的,特別是這些變量是可能的競爭性理論的核心自變量時。如果遺漏變量影響自變量,這個變量可能是一個更深層的變量,它就不能被當成普通的控制變量使用;如果一個變量是「傳導(Mediating)變量」或者是「調節(Moderating)變量」,這也不能被當成普通的控制變量使用。
(七)弄懂特定定量技巧背後的邏輯和特殊要求。
一些特定的技巧有特定的假設,而這些假設是否成立需要驗證。比如Survival Analysis(生存分析)的模型就有許多需要檢驗的假設。因此,不能拿到數據後不假思索地做回歸。
(八)最後才是具體的操作。
我推薦以下幾個基本的步驟:這些步驟讓你自己和讀者都能更加直觀地理解你的回歸結果。
①先來一個最簡潔的模型(Ray,2003;Achen,2005):核心自變量,最好單獨做一個回歸,除非一些控制變量是理論上必須控制的。比如,以人均GDP增長率(無論是PPP,Constant還是Current Price)為應變量的經濟增長回歸模型,必須控制人口增長率、起始GDPpc、資本投資率。
②考慮到數據背後的時空問題。沒有時空,就沒有社會事實和自然事實。但是,對於時空這兩個極其重要的變量,目前絕大部分的定量和定性研究都沒有特別好的把握,甚至都沒有意識到這個問題。麥克唐納(McDonald,2015)對「民主和平論」的挑戰是最近少數的例外:他的這項工作不僅充分考慮到了時空的作用,而且有非常好的理論化。
③充分考慮到不同自變量之間的相互作用。只是一個自變量獨立的回歸模型越來越受到質疑:因為絕大部分社會結果都是多個因素相互作用的結果。因此,交互項變得越來越流行起來。做交互項時最好這麼做:假定有兩個自變量A和B,它們可能相互作用而導致結果。那麼,你應該給出以下的回歸模型和結果:A;B;A+B;A,B,AB(最後這個才是標準的交互項模型)。這樣的結果將會是非常清晰的:即便你在最終的論文或者書稿中不報告前面的三個模型結果,你也應該這麼做。不過,如果你的理論強調三個以上的變量的相互作用,那麼交互項的技術恐怕也不適合:三個以上的變量的相互作用的回歸結果非常難解。
④充分考慮到不同自變量之間的不同的「因果路徑(Causal Pathways)」,並且測試這些不同的「因果路徑」。這方面的具體工具非常多,不再贅敘。
⑤最好甚至必須有Horse-race Model(賽馬模型)。即,把你的解釋變量和其他競爭性解釋理論的核心解釋變量放在一起相互競爭(這裡要特別強調,基於其他競爭性解釋理論的核心解釋變量不是常規意義上的控制變量)。如果你的變量依舊顯著,而其他競爭性解釋理論的核心解釋變量,那麼你的結果會更加可靠一些。沒有控制競爭性理論的核心變量的回歸結果,至少是差強人意的。
五、定性分析的一些基本原則
和定量研究一樣,關於定性研究的討論也已經非常深入(比如:Mahoney,2010;Collier,2011)。以下的討論中,有引用的地方同樣表明我發展了既有的一些討論,或者只是強調。而沒有引用的觀點則基本上是我認為目前的許多定性研究方法討論還沒有注意到或者強調不夠的地方。
另外,因為我對定性方法的頭兩點要求和我對定量方法的頭兩點要求一樣(即,「對問題的深入了解」和「好的理論」),我直接進入原則的第三條。
(三)和定量研究一樣,偏好定性研究的學者也不要想只用定性分析來解決一切研究問題。事實上,如果你只想用定性分析來解決研究問題,你很容易犯以下錯誤:
①你會忘記,某些問題幾乎不可能用定性技巧解決。比如,如果你想把一個只是基於因素的理論的適用性最大化,那麼定性分析方法肯定有相當局限性的。
②對文獻過於挑剔。比如,你可能只熟悉一部分的定性文獻,但是對其他的研究,特別是依賴於定量技術的研究則不夠熟悉。
③太想快速發文章,但是對理論化以及如何才能做出好的定性研究等問題重視不夠,最後欲速而不達。
(四)相比較來說,定性研究的理論發展更加強調討論超過兩個以上因素的相互作用,時空的約束以及機制的作用,因此需要更系統和更強的邏輯思考。不幸的是,現在許多定性研究的理論化水平變得和許多庸俗定量研究一樣低級,從而喪失了定性研究的核心優勢之一。
①定性研究的理論發展必須系統全面和嚴謹地展示邏輯。許多定性研究不能讓人滿意,一個重要的原因是沒有全面展示理論的邏輯。比如,一個簡單的2*2表,至少有四種組合。好的理論化必須展示這四種組合的邏輯。而如果是2*2*2的因素組合,那就有八個組合。好的理論化必須展示這八種組合的邏輯。如果這其中的某些組合可以合併[關於合併的方法的討論,見(Elman,2005)],那也要說明,不能省略。
②定性研究的理論必須討論因素和機制之間的相互作用,而不僅僅只是因素之間的相互作用。如果定性研究的理論只是討論因素之間的相互作用,同樣是丟掉了定性研究的核心優勢之一,等於自廢武功。
(五)選擇合適的案例:案例是用來服務於支持自己提出的理論和推導出來的假說。
①最好的案例選擇當然是「全樣本」案例選擇。定性研究同樣可以做到「全樣本」案例選擇。但是,定性研究的「全樣本」案例不是拿數據集過來用,而是通過時空約束,緊密結合研究問題,來最終確定全案例。比如,丹·史萊特(Dan Slater)(Slater,2010)就研究了二戰後東南亞不同的國家在構建國家基礎能力方面的不同:他的研究覆蓋了東南亞10個國家中的7個,因此非常接近一個全案例研究。類似的研究還有傅泰林(M.Taylor Fravel)(Fravel,2008)對新中國所有的領土爭端的研究,以及我們最近完成的對第一波現代化的研究(葉成城、唐世平,2015)
②如果不能做到全樣本研究,那麼案例至少要有兩個,而且最好是案例還可以出現時間上的對比維度。在至少要有兩個以上的案例的前提下,這些案例必須有兩類:正面案例(某種結果出現)和負面案例(某種結果沒有出現)。而最好的負面案例是必須可能出現某種結果卻沒有出現結果的案例。而完全沒有可能出現某種結果的案例是無關的案例,這和定量中的無關的觀察是一樣的。
(六)忠實於自己提出的理論和推導出來的假說。
①如果是一個簡單的2*2因素組合,那麼,這四種組合的案例都應該涉及。而如果是2*2*2的因素組合,那麼這八個組合的案例也都應該涉及。除非現實世界確實沒有出現某種組合。許多不好的定性研究的一個通病是,只有極端案例(即,所有變量都取最大值或者最小值的情形),而其他更加複雜和細微的情形都幾乎沒有討論。
②許多定性研究最後的歷史敘述只是敘述歷史。殊不知,定性研究的最重要操作原則之一乃是用理論和假說來規制歷史敘事:歷史敘事必須展現因素的相互作用和機制的運行,並且導致或者不導致某一個社會結果。這才是定性研究特別強調的「過程追蹤」。換句話說,過程追蹤不是簡單的歷史敘事,而是通過展現因素的相互作用和機制的運行,從而展現自己的理論和假說是否得到驗證。過程追蹤和歷史敘事是不同的。
(七)最後才是具體的操作。我推薦以下幾個小的技巧和要求:這麼做能夠讓你自己和讀者都能更加直觀地理解你的案例比較分析。
①一定要用圖表的方式將你的理論中強調的因素和機制的相互作用展現清楚。
②定性分析中最核心的方法是「有控制的比較案例分析(Controlled Comparative Case Analysis)」。而比較案例分析就不能是一個案例(比如,一個國家的命運)和另外一個案例是相互獨立敘述的(比如,一個國家一章的寫法)。相反,比較案例分析要求我們通過理論和實證假說來規制案例的比較敘事。
③最好將幾個案例中的時間段以及重大時間列在一個表中。這樣非常便於讀者理解你的敘事脈絡,同時也利於你自己避免「迷失在」歷史敘事中。
④和定量研究一樣,定性研究同樣需要試圖排除或者至少削弱競爭性的解釋。事實上,因為定性研究本身對因素相互作用和機制的運行,以及歷史敘事的把握,在排除或削弱競爭性的解釋,定性研究具有定量研究幾乎不可能具有的優勢和能力。因此,建議大家對每一個案例都通過列表的方式來比較你的理論解釋和競爭性解釋。
⑤即便是定性案例分析,其中對因素和結果的度量和比較也應該用描述性數據來支持你的賦值和比較不同案例中不同因素和結果的差異。
六、不同方法的結合:以我們的族群衝突研究為例
1945以降,世界上的主要大規模衝突絕大部分不是國家之間的衝突,而是國家內部的衝突。而族群衝突又是造成最大規模傷亡的國內衝突。因此,無論如何看待,族群衝突都是都是當今社會科學中最為重要的研究話題。
在發展了一個族群衝突的廣義理論的同時(Tang,2015),我們還發展出了一個特定的子理論。這個子理論認為,石油的「族群—地理位置或者分布(The Ethno-geography of Oil,Especially Its Location)」才是決定石油是否導致或者加劇族群衝突的關鍵。具體地說,我們認為:在一個國家內部,如果少數族群的聚集區域有一定數量的石油資源,那麼這個少數族群就容易和中央政府發生矛盾;如果這個少數族群此前就和控制中央政府的多數族群有過流血衝突因而怨恨的話,那麼這個少數族群和多數族群之間就有可能發生族群衝突;如果在少數族群聚集區域中的石油是在衝突過程中被發現的話,石油的發現將加劇既有的族群衝突。
因此,這個理論有以下推論:其他條件一致的情形下,少數族群聚集區域有石油(這時候,多數族群聚集區是否有石油不重要),這個少數族群將更容易和多數族群(及其控制的國家)發生衝突。而如果少數族群聚集區域沒有石油(這時候,多數族群聚集區是否有石油同樣也不重要),或者少數族群和多數族群是混雜居住的,那麼石油對一個國家內部的族群衝突都沒有影響。整個邏輯可以用下表表述:
依據這個理論,通過將族群的分布和石油的分布在GIS平臺上進行疊加,我們構建了一個新的「石油的族群地理分布數據集」。然後,我們用這個數據集對我們的理論進行驗證,結果統計結果高度支持我們的實證假說,因而也就高度支持我們的理論(Tang & Li,2015)。
接下來,我們還用定性案例分析,進一步支持我們的統計分析結果,並且展現我們提出的幾個核心機制的作用(熊易寒、唐世平,2015)。我們的定性分析不是堆砌史料,而是用我們的理論來約束歷史材料的使用:社會科學的研究中,特別是定性研究中使用歷史材料不是剪裁或者篡改歷史,而是體現了社會科學更加注重理論的貢獻。
很顯然,我們的這個核心自變量,石油的族群一地理位置,其實是一個基於理論的、交互項上的定類變量(14)。這再一次表明,所有的定量都基於定性思考,特別是在理論化、形成假說,概念化層次以及測量的層次。理論化的水平決定你的變量概念化以及操作化設置水平。
我們的討論還表明,以前把族群和非族群問題混在一起討論,把不同的自然資源都混在一起討論(如:Collier & Hoeffler,1998,2004;Fearon & Laitin,2003),都是不對的。這些早期工作的巨大缺陷背後的一個重要原因就是因為他們幾乎沒有任何理論。我們的新理論還可以覆蓋寶石、其他高度集中的礦產資源。因此是一個礦產資源和族群衝突的廣義理論。
總而言之,我們對族群衝突的研究充分體現了我們對方法論的理解。首先,我們的實證假說建立在好的理論之上。其次,我們定量假說包含因素(含時空),特別是因素之間的相互作用。我們的定性研究的假說包含了三個部分:因素(含時空)、因素相互作用、機制。而因為只有定性研究可以解決機制問題,我們的定性案例研究特別試圖展現我們認定的機制的作用。最後,我們的結果,無論是定量還是定性,都顯得非常明晰。總之,我們的這項研究充分體現了定性、定量以及其他方法的結合的方法論優勢。
七、結語
以上是我對社會科學的方法論一些個人理解。我希望,大家看到,我和我的同事們一方面在不斷學習和發展新的方法,也在具體的實證研究中實踐我們對方法論的理解。
最後,我想強調的是,目前社會科學主要使用的數學方法都是比較「單調」(即不外乎博弈、統計、經濟模型),甚至是比較「小兒科」的。因此,我們要想超越歐美的社會科學,一個可能的努力方向就是在社會科學中引入或者發展一些新的數學方法。比如,我們在發展新的fmQCA軟體的時候,就借鑑了電路設計中電路簡化的算法。而為了解決數據集的設計問題,我們把ISM技術引入到社會科學。總之,「復旦大學複雜決策分析中心」的一個核心目標就是發展一些新的分析平臺和工具(包括軟體),而這些成果將會陸續發布。當然,再次強調,我不是「唯數學而數學」的人:我們發展新的方法都是為了解決具體的研究問題。
*感謝耿曙、呼和那日松、李輝、唐敏、徐軼青、王凱等學者的批評和建議。
注釋:
①和QCA的發明者查爾斯·拉金(Charles D.Ragin)的理解不同的是,我認為QCA其實更加接近定量分析,至少在甄別因素以及因素組合(或者說,相互作用)上是如此。和定量分析一樣,QCA也不能讓我們甄別機制。
②既有的軟體以及我們自己新開發的軟體
③經過相當長時間的摸索和理解,我現在認為,「概念分析(Conceptual Analysis)」事實上是一個獨立的方法:它有自己的一套規則和做法。很遺憾,我無法在這裡展開討論。
④加裡·金對定量統計分析方法的局限性的認識不足也許來自於他對觀察數據對研究方法的約束的認識不足。定量分析的根本基礎來自生物學(特別是群體遺傳學)、醫學以及後來的實驗心理學。這其中最重要的奠基性工作是羅納德·費布爾(Ronald Fisher)(英國統計學家、理論遺傳學家)在1920和1930年代完成的工作。但是,費希爾面對的數據主要都是(田間)實驗數據。而社會科學家面對的數據絕大部分都是觀察數據,而非實驗數據。
⑤這個問題非常複雜,我只能在其他的地方再作更詳細的討論。
⑥當然,如果是一篇純粹的方法論文章,我們對它的評價標準就不一樣了。現在的普遍問題是,儘管定性研究的水平也是參差不齊的,但是因為定性研究相對不那麼容易發表了,許多水平其實也非常低的定量研究就容易得以發表了。
⑦由於大家越來越抵制低俗的定性研究(比如,講幾個花絮性的故事),因此,比較而言,現在的情況是,低俗的定量研究要比低俗的定性研究更容易被發表。這一趨勢在國際刊物上尤其明顯。
⑧這方面,(McDonald,2015)的研究可以說是最近的一個範例。
⑨他們最近的修正,見:(Geddes et al.,2014)。
⑩見詹森·西欶特(Jason Seawright)和撒德·鄧寧(Thad Dunning)在(Brady & Collier,2014/2010)中的討論。
下面這些短連結文章屬於合集,可以收藏起來閱讀,不然以後都找不到了。