從圖可見在這些刊物上發表的論文在過去年中使用定量方法的比例總體有大幅增長,在近年內取代定性方法成為發表論文最主要的研究方法佔到了50%以上。這表明,由美國學術界主導的「頂級」學術刊物的確呈現了注重定量研究的特點。
所以無論是從學科調查結果或者基於國際關係學者的觀察和感受,定量方法的重要性和廣泛性不容忽視。學習和使用定量方法已成為國關學者職業訓練的必備內容。無論國關學者是否決定在其研究中使用定量方法,定量方法無疑都需要被放入研究者的工具箱中,以備不時之需。同時在中國學術「走出去」的大背景下,國際關係學者也需要在國際學術刊物上發表研究成果,正確使用定量方法將成為中國學者在國際上展示研究和發揮影響的重要條件。
02
常見的錯誤理解和操作
儘管定量方法在國際關係研究中的使用越來越廣泛尤其是在高水平發表中佔導地位,但很多人對定量研究的理解和使用都存在著一些偏差和誤區。這些偏差和誤區,有的來自定量方法批評者,有的來自倡導者。對定量方法的錯誤理解和使用可能對定量研究本身的發展、甚至對國際關係實證研究的發展造成嚴重的負面影響,因此有必要予以特別指出和分析。
1、定量研究不需要國際關係理論支撐
有些定量研究的批評者認為,定量研究從數據和統計模型出發,得到實證分析結果,不需要運用國際關係理論進行分析。定量研究者只需掌握數據分析工具和統計知識及軟體的使用無須有紮實的國關理論功底和深人的理論思考。
恰恰相反國際關係定量研究的前提是清晰的國關理論。統計建模要求研究者對與研究問題相關的理論有全面的掌握和深入分析以提出簡潔的假設並控制替代解釋的幹擾。得到統計分析結果後研究者還必須對實證結果進行理論上的解讀和評估。因此定量研究不能沒有理論相反,若沒有理論的話則不需要、也不可能進行定量研究。
當然,定量研究不適合複雜的或模糊的理論,不適合大理論(也即範式意義上的理論),也不適合思辨性質的理論。定量方法本身也不發展理論它只檢驗理論但在使用定量方法的研究中研究者通常要根據理論、邏輯和觀察先發展理論,再用定量方法來檢驗理論。
2、定量分析過度簡化以至於遠離現實、失去意義
定量方法的批評者經常對定量方法的高度簡化表示不滿認為高度簡化的統計模型距離現實太遠以至於其可信性和實用性讓人懷疑,甚至認為定量研究者是一些對政治現實毫無感覺和興趣的人。
但模型對現實進行簡化,並非使用統計方法的結果而是國際關係或政治學理論(如果我們還需要理論的話)本身就是對現實的高度簡化,簡化到能夠讓研究者在紛繁複雜的現實中把握並提取其感興趣的關係,進行分離研究。當高度簡化的理論形成之後定量方法的統計建模只是對理論進行數學或統計表達而已。在這一步驟中研究者根據理論假定和數據類型選擇統計模型而當理論被表達為統計模型後,簡化都具有高度透明性,並且,謹慎的定量研究者也將會對這些假定進行系統檢査。
3、國際關係數據質最低,基於這些數據的定量研究不可靠
有一些學者對定量方法和統計模型本身並不反對和懷疑,但是基於對國際關係數據的檢查發現國際關係學的數據本身的問題很多,從而令這些學者對定量研究表示擔憂和對定量分析結果表示質疑。
誠然,國際關係領域中的很多數據都涉及宏觀加總數據和欠發達國家的數據缺失、測量誤差以及概念化困難等問題極為常見。但是在整個社會科學領域完美的數據幾乎沒有,任何學科(包括自然科學)的數據都存在這樣或那樣的棘手問題。統計學中大量的理論與工具的誕生和發展正是為了處理各種數據問題,而且,統計方法和模型的發展往往是由數據中的棘手問題所驅動的。國際關係中的數據問題多而複雜,恰恰意味著國際關係學者應該學習並掌握更多的統計知識和工具。同時也意味著國際關係學者可能對統計學本身的發展和為別的學科定量分析在方法上做出貢獻。而且在定量方法中數據和統計模型的運用只是為了證偽理論和假設,而證偽在實際研究中具有暫時性。一個沒有被現階段數據和統計技術所證偽的假設在將來有了新數據、新方法之後還要接受持續的檢驗。因此本著「證偽」的目的數據的不完美並不是避免使用定量方法的理由。
4、定量方法是最科學的研究方法
這一誤解來自定量方法的熱情鼓吹者。他們將提倡科學方法等同於提倡使用定量方法甚至將定量方法的使用看成是判斷一個研究是否為「科學研究」的標誌。但是科學研究本身是由一套程序來定義的,而這套程序與定量方法相關的部分只有實證檢驗這一個環節;即使是在實證檢驗中,定量方法也只是理論檢驗的方法之一。定性方法,如比較案例研究、過程追蹤、田野調查、訪談、檔案分析等,都可以成為理論檢驗的方法也是科學研究中的常用方法。而何種檢驗方法更好,是由研究的具體問題、理論和實證信息數據的形式情況所決定的。定量方法由於具有高度的透明性、可重複性和系統性享有很大優勢,但這並不意味著定量方法在具體的研究中總是最好的選擇。
5、定量方法就是從數據分析中得出解釋
這種誤解認為定量方法就是用數據說話,在數據分析的基礎上得出對問題的解釋。持有這種認識的不僅是定量方法初學者,一些較為有經驗的定量研究者也經常流露出這種數據挖掘(data-mining)的認識。
這一誤解在大數據時代更有其肥沃的土壤。在當今信息爆炸的時代,使用統計方法和計算機軟體對海量數據進行信息提取和分析,被證明具有很高的預測準確性和實用價值。一些政冶科學家也在從事數據挖掘和機器學習的研究。但是,即使是基於海量數據的數據挖掘也只是對相關關係進行發現,而不能發現因果。因果關係在認識論上有特定的要求,本質上是演繹性質而非歸納得出,而數據挖掘從本質上是歸納性質的研究。一些定量方法的研究者不從演繹的邏輯和理論推理出發得到理論,卻從數據和模型出發,基於實證分析的結果來得出某種解釋,這是對定量研究方法的錯誤使用。避免從數據和統計結果出發來建立理論或發展解釋嚴格遵守定量方法是一種理論檢驗而非理論發展(發現)的方法這是一條必須遵守的重要原則。
6、統計技術越高級、統計模型越複雜定量方法就越可靠
定量研究者中不乏一些技術論者。這些人簡單而武斷地憑藉統計技術的高低來判斷定量研究的質量。定量方法作為工具要為研究目的服務。統計模型的選擇和統計技術的運用,由研究目的和數據形態決定。方法的優劣不可以從方法本身來判定,而要以它是否服務於目的來評估。當研究者具有簡明的理論假設和高質量的數據可能簡單線性模型和多元回歸就是最好的方法;而研究者如果在理論部分和數據搜集上漫不經心期待用複雜的統計模型和技術來做出高質量的研究則幾乎是不可能的。在定量研究中,若簡單模型夠用則儘量使用簡單模型。研究者不應為了要造成深奧的印象或炫耀統計技術而捨近求遠選用複雜的模型和技術。
03
實證研究中的定量方法
人們通常的印象是,定量研究就是數據處理和統計軟體運用在學術論文或專著中表現為使用大量數學公式、統計圖表和統計術語的運用等。數據、軟體、數學公式、圖表、統計術語等確為定量方法的表徵但這些外在的表現並不是定量方法的定義特徵。
1、什麼是定量方法
定量方法是對經驗數據包括實驗性數據和觀察數據進行統計推論、從而對理論假設進行檢驗的過程。定量方法服務於實證主義研究。實證主義研究承認客體與主體的分離,以分析為主,旨在對客觀世界進行發現。實證主義從本體論和認識論上都區別於社會科學研究中的「闡釋」或「批判」傳統。作為實證研究的一種定量研究的方法和思想不適用於闡釋性和批判性研究,只有採取實證主義的本體論和認識論才可能、也才有必要遵循定量的研究路徑和方法。但是,定量研究只是類型眾多的實證主義研究的一種,只要是承認研究的目的是為了認識客觀世界現象而非在規範意義上對現象進行闡釋和批判的,都是實證主義研究,而無論研究是採用了定性、定量還是歷史的方法。
要正確認識定量方法在科學研究中的作用有必要對科學研究做進一步說明。演繹和證偽是科學方法的兩大決定性特點。理論並非完全來源於對現實觀察的歸納。基於再多事件的觀察也不可能上升為普遍的理論,理論的得來必然是演繹的結果,而理論的源泉究竟是現實世界還是某種神秘的靈感科學方法論傾向於不予討論。科學研究理論的演繹性質決定,定量方法不用於理論創造。這一點聽上去也許讓定量方法的推崇者感到沮喪。不過科學研究是一個循環的過程,當定量方法發現了與理論相悖的事實時(或稱為證偽),研究者必須重新思考並修正理論。但理論的修正仍要經歷一個重新演繹的過程而不能夠基於定量分析的實證結果也即不能基於對現實的歸納。
定量方法是科學研究中進行假設檢驗的方法之一。科學方法主要由一套明確的程序來定義主要是根據這套程序來發展解釋性和演繹性的理論假設並用實證證據來檢驗理論假設。定量方法服務於科學研究,但科學研究不一定只使用定量方法,因為定性方法也可用於假設檢驗。定量方法只對理論進行檢驗,這是科學理論演繹特性的要求。這一點嚴格區分了使用定量方法的科學研究和進行數據挖掘的統計研究。在社會科學尤其是國際關係學中,數據挖掘被認為是非理論性的,也是非科學的方法。
儘管大數據時代的到來讓一些學者開始從數據出發發現重要的相關關係,以便更好地進行預測但因果解釋仍然是社會科學包括國際關係學的真正追求。在科學哲學和方法論的意義上,關於證明與證偽以及證偽的判定等存在著長期的爭論。並非所有人都認同卡爾波普爾(Karl Popper)的證偽思想也並非所有用於科學研究的方法都意在證偽。但是定量方法卻嚴格地用於證偽,這在很大程度上是由於定量方法目前使用的統計檢驗思想和原理本就是嚴格建立在演繹認識論基礎上的證偽方法。
具體來說定量方法開始於待檢驗的假設該假設是關於概念之間清晰的因果關係,而這種關係通常是或然性(probabilistic)而非決定性(deterministic)的。對假設中的概念進行概念化後,定量方法要求把「概念」翻譯為「變量」,從而將理論問題轉化為統計問題。概念轉化為變量後即可以進行測量,測量要求系統化和標準化。確定了測量方法之後,研究者對現實進行觀察和信息收集,形成數據這些數據被稱做變量的體現(realization)。變量可以是定量的變量或定性的變量但在定量研究中一概採取數值形式。定性變量的取值沒有數值上的意義,只有類別或排序意義。數據的類型由變量類型決定,而數值則由明確的測量系統生成。研究者進而對數據進行統計分析,無論是複雜或簡單的分析,其目的和最終結果都是對假設進行檢驗並根據事先確定的標準,做出是否拒絕(reject)假設的決定。整個定量研究程序,要求概念定義測量數據生成數據分析假設檢驗等各個環節保持高度的透明,並以其他研究者能夠重演(replicate)這一程序並取得相同結果為要求——即無論什麼樣的研究者如果遵從該研究給定的定義、測量方法、數據生成和數據分析方法,能夠得到相同的結果。
2、什麼不是定量方法
定量方法必須建立在數值數據的基礎上但不是所有對數值數據進行分析的研究都是科學研究意義上的定量方法。定量方法必須對具有一定普遍性和演繹性的理論進行實證檢驗。一些研究儘管進行了大量的數據分析並運用了複雜的統計模型,卻由於缺乏對演繹性理論的追求而不能夠稱為定量研究。常被誤認為是定量研究、但實際上卻不是的主要有以下兩類:
第一類是僅止於數值描述或統計描述的實證研究。這類研究通常可見於各種報告如《中國對外援助白皮書》、《世界銀行發展報告》等,或是案例分析、過程追蹤或歷史回顧中的大量數據描述例如,彼得克拉格倫德(Peter Kragelund)關於幾類非傳統援助國的介紹和比較中運用了大量的援助分布數據,文中也有大量圖表對數據進行歸類和分析但這一研究屬於描述性研究而非定量研究。這類研究運用了大量的數據,有些數據甚至是原始數據,而且也對數據進行了一定的統計分析,如平均值、標準方差、增長率等,也有大量的圖表報告但是數據描述和分析在這些研究中作為對事實的陳述和分析不含統計推論因此不是定量方法。當然,在定量研究中,往往要給出統計描述但統計描述本身並非出示任何實證證據,而在於增加數據特徵的透明度和便於其他研究者評判統計模型的選擇是否恰當。定量研究不止步於統計描述而必須進一步進行統計推論。統計推論即是從樣本到總體的推論從可觀察到不可觀察的推論,從已知到未知的推論,而推論的目的是要進行假設檢驗。
第二類大量使用數值數據和複雜統計方法、但卻並非定量研究方法的研究是計算機模擬。這類研究使用計算機生成的數據進行分析由於數據不是實證數據,並非來自於現實世界,因此這類研究不是實證研究,使用的統計方法就不能夠被稱為定量方法。進行模擬的主要目的在於發現理論中的邏輯謬誤或統計模型中的技術問題。因為數據的生成過程完全由研究者設計並控制研究者確知在這些數據生成過程中的各種參數值,運用研究者發展的理論模型或統計模型去推論這些參數值可以檢驗這些理論和模型在邏輯或技術上的謬誤。但定量研究要求運用實證數據,即是研究者無法確知的實際過程來檢驗理論,這種檢驗並非檢驗理論或模型自身內部的嚴密性和技術誤差,而是檢驗理論與現實是否相矛盾。計算機模擬在研究中具有重要性,因為一個內部具有邏輯矛盾的理論在進行實證檢驗前就可以被淘汰或修正,或者一個具有技術問題的統計模型會造成檢驗偏差這些都可以在模擬研究中得到排除,從而使得定量分析的假設檢驗更少犯錯。這類方法在統計學、工程學、經濟學及其他學科包括政治學)已經得到廣泛運用但其目的是為了提高定量研究的質量,本身並非定量研究。筆者於2010年發表於《政治分析》(Political Analysis)雜誌上的文章發展了分析長面板數據的非線性動態模型用大量的計算機生成的數據進行蒙特卡洛試驗,目的在於檢驗新模型和算法的可靠性及其相對於傳統模型的優勢儘管這樣的研究使用了複雜的統計知識和大量的數據,但仍然不能算是實證研究;其中細的方法可以稱為統計方法但卻不是「定量方法」。大量的統計學、計量經濟學和政治學方法的論文都屬於此類不是嚴格意義上的定量研究。
04
定量方法的實施步驟
對研究方法的理論探討雖然有其重要性,但方法只有在使用中才有其價值,也只有在操作中人們才能夠真正理解其背後的本體論和認識論基礎。本文這一部分對定量方法的使用步驟進行逐一討論,希望在討論中進一步對上文中提到的一些常見誤解進行澄清,同時也為初學者提供一個定量方法使用的簡單指南。
定量方法有一套相對確定的程序每一個步驟都需要遵循一些具體的原則。需要強調的是』沒有任何理由相信定量研究比定性研究甚至描述性、闡釋性研究更接近真理;也沒有任何理由認為定量研究比其他研究方法更可能排除謬誤。定量研究方法的真正優勢在於它透明程度高、較容易為研究同行重演並評判從而有助於凝聚學術共同體的智慧和努力,以推進科學發展的進程。對定量方法在使用過程中所要遵循的原則和準則,學界具有高度的共識,即對程序公開與信息透明的要求。
下文在討論定量研究方法時將比較多地運用到兩個國際關係定量研究的實例。其中一個是國際安全方面的研究,弗吉尼婭福特納(Virginia Page Fortna)發表在《國際研究季刊》上的《國際維和行動是否有助於維護內戰後的和平狀態》(簡稱《維和與內戰》)。另外一個實例是海倫米爾納(Helen V.Milner)和久保田惠子(Keiko Kubota)發表在《國際組織》上的一篇國際政治經濟學的文章《為什麼走向貿易開放?發展中國家民主化和貿易政策轉變》在下文中用《民主化與貿易開放》代指),主要分析民主化對貿易政策開放程度的影響。選取這兩個例子的主要原因是它們發表的刊物為國際關係學頂級刊物,並且兩篇文章分屬國際安全和國際政治經濟學兩個領域同時它們有較高的引用率是很多國際關係學研究生課程的必讀材料。需要指出的是在政治學方法論上這兩個例子的研究並非完美在本文中不是作為範例,而是作為實例來幫助說明定量研究的步驟。
1、第一步:確定研究問題是否適用定量方法
在此必須再次強調定量方法適用的研究問題非常有限並具有特定的要求。許多極具重要性的研究問題並不能使用定量方法來研究。定量方法不適合一切規範性問題,比如解答「什麼是公正的國際政治經濟秩序」、「人權高於主權還是主權高於人權」、「發達國家是否負有在經濟上援助不發達國家的義務」等問題。此外,由於定量方法主要用於對具有一定普遍性的、在一定程度上重複發生的現象的解釋性研究,因此如果研究問題是還原一個特定事件本身或對特定現象進行個別解釋,則無法使用定量研究。例如古巴飛彈危機的決策過程是怎樣的?什麼因素導致了冷戰結束?等等。這些研究問題要求對具體的事件現象進行還原或做出具體的解釋。它們的研究結果也許能夠幫助解釋相似事件但研究本身並不追求普遍性。此類問題最常見的(也許是最合適的)研究方法是歷史研究的方法,對史料進行鑑別分析和綜合歸納。
第一,定量方法只適用於特定的研究問題。這類問題必須是關於具有一定抽象性的、可測量的概念之間的關係。波普爾所定義的「概念」必須是具有絕對普遍性的概念。但是在實際的國際關係研究中定量方法往往只要求具有一定抽象性的概念—一個概念是多個現象的抽象,但在範圍上可以有時空限定。如戰爭是一個具有普遍性的概念,顯然符合定量研究的要求。但是,中美貿易不是一個普遍性的概念因為它受到「中美」的限定,不符合波普爾對概念的定義。但在實際研究中,中美貿易卻具有一定的抽象性它可以包含自中美有貿易關係以來每年的相互貿易活動定量研究可以用於包含這類概念的研究問題。
第二,定量方法要求概念具有可測量性。一些研究問題涉及難以測量的概念,進行定量研究前,必須將這些概念轉化為可測量的概念(或者研究者必須找到合適的代理概念)。例如,研究問題是文化傳統如何影響國際合作。文化傳統包含太多的意義是一個難以測量的概念,如果可以用其他可測量的概念作為代理概念』定量方法才能用於研究此問題。
第三,定量方法要求研究的概念間關係具有清晰性、方向性和明確性。關係可以是線性、非線性、獨立關係或條件關係等可以具有或然性,但必須清晰而明確。線性要具有明確的方向,非線性要具有變化特徵,條件關係要明確條件是什麼以及條件的影響方向等。如果概念之間的關係錯綜複雜、枝節橫生,以至於從因到果的路徑無法給出一個可以明確陳述的簡潔關係這樣的研究就不適合用定量研究。
2、第二步:將理論形成待檢驗的假設
研究中的核心理論往往包括不止一環的因果鏈條,定量方法可以用於檢驗所有的因果環節,也可以只檢驗兩端概念之間的關係。比如理論「概念導致概念是通過對概念和概念的順序影響」,即因果鏈條為X→Z1→Z2→Y。使用定量方法進行假設檢驗時,本著證偽的原則,待檢驗的假設可以只為X→Y,中間環節可以不加檢驗。但是,如果需要證偽理論的整個邏輯鏈就要將每一個鏈條形成一個假設,即待檢驗的假設有三個:X→Z1,Z1→Z2,Z2→Y。定性研究注重整個因果過程研究(如過程追蹤方法),但大部分定量研究只是對兩端概念之間的關係進行檢驗,因為定量研究的主要目的不是「證明」而是「證偽」。如在《維和與內戰》一文中待檢驗的核心假設是「維和行動延長了內戰後的和平狀態」;而《民主化與貿易開放》的待檢驗核心假設為「發展中國家政治民主化帶來更為開放的貿易政策」。這兩個假設背後的理論都有不止一環的因果鏈條。例如,在「發展中國家貿易開放將有利於勞動力要素所有者」這一前提下《民主化與貿易開放》一文的理論邏輯鏈條為「政治轉型(X)導致勞動要素稟賦所有者政治影響力上升(Z1)導致更開放的貿易政策(Y)」。如果要「證明」的話,到和到都必須要檢驗。但證偽則可以只檢驗X→Y。
確定了待檢驗的假設之後,定量方法的使用者需要將理論假設用統計假設的形式表達出來。雖然在論文寫作中這一部分通常被省略,但待檢驗的假設要求能夠表達成以下數學形式:
E(Y)=f(X)
其中E(Y),是待解釋現象的期望值。在定量研究中,一般只對現象的普遍特徵E(Y)進行解釋,而不解釋具體的一個現象(表示為觀察到的y1),這也是為什麼定量研究必須是有一定程度普遍性的研究——對一類現象的共有特徵而非一個現象的特殊部分進行研究。公式中,f(X)是X的函數而方程的性狀就是待解釋的現象Y和解釋現象X之間的關係。研究者的理論是對這種關係是什麼(f(X)的性狀)以及為什麼的研究,而待檢驗的假設就是用觀察到的具體現象y1,y2,…yn及相應的x1,x2…xn,來檢驗X和Y之間的關係是否為f(X)。因此,函數f(X)是待檢驗的假設。
這裡我們又回到定量研究能夠勝任的理論必須十分清晰並髙度簡化這一點上。待檢驗的假設是X和Y之間的關係f(X)。要使用統計方法對這一假設進行檢驗,方程f(X)的性狀不能過於複雜,否則將無法進行統計上的假設檢驗。使用定量方法的研究通常情況是對X的變化帶來E(Y)的增減進行理論、邏輯和實證研究在數學上面表達為,函數是增函數還是減函數,也即是其一階導數是正還是負: