本文旨在扼要介紹量化法律實證研究範式下,發現因果關係的六種主要研究設計。
量化法律實證研究範式剛經歷了因果革命:如果研究無法作因果推論(causal inference),只能發現相關性(correlation),或只是作描述統計(descriptive statistics),就很難登在美國第一流的期刊。
這對我國大陸和臺灣地區的法學研究者都有影響。
一方面,如果法學研究者想用英文在國際法律實證期刊發表實證研究成果,必須要遵守美國學界的遊戲規則,跟上最新的研究脈動。雖然像Journal of Empirical Legal Studies這樣的頂尖SSCI期刊,並不要求因果推論,還可以接受研究者以高質量的數據與分析,作描述統計,或者發現相關性,但完全不宣稱發現因果關係——只要論文有七分證據不說八分話。
而如果要投稿到實證法經濟學(empirical aw and economics)的期刊,則大部分的編輯或評審人比較有興趣知道因果關係。這是因為,在美國的法律實證研究,經過了大約20年的發展,許多該做的描述研究已經完成;而在統計學界,因果推論的數學理論或統計工具也已經發展完備。
數據越來越多,只是單純描述已經無法滿足法律與社會科學的研究者,他們想要知道因果關係。知道因果關係並沒有錯,但是做起來當然並不簡單。
掌握了因果關係,就是掌握了筆者和王鵬翔的文章所說的「差異製造事實」(difference-making facts)。
差異製造事實就是因果關係:一旦知道A會導致B,或者是P的出現會增加Q上升或下降的機率,就可以在制定政策或法律時,用為推論的基礎。換言之,差異製造事實,或因果關係,具有規範性(normative)的意涵。
譬如,一個很經典的刑法學研究題目:警察人數增加是否會降低犯罪率,還是多聘警察無助於減少犯罪。
這個看似非常單純的問題,卻不容易有簡單清楚的實證答案。統計相關分析的結果,往往是警察人數上升跟犯罪率或犯罪人數的上升有正相關。
其背後的原因可能是犯罪率先上升,而警察就被調到犯罪率上升的地區來防治犯罪,或者是有新的警察被聘用來防治犯罪。但是也有可能是《莊子》所說的「聖人不死,大盜不止」,即警察的來臨刺激了犯罪的出現。後者或許有一點無稽,但是即使相信前者,警察人數上升對於打擊犯罪的效果如何,仍不得而知。
到底應該增加警力,還是降低貧窮,或是提供社會福利,才是打擊犯罪最有效並低成本的手段?此時就需要好的因果推論。
但另一方面,華文法學通行之處,法律實證研究才剛開始發展;法律實證研究的學者還在摸索,也還在與其他法學者溝通、磨合。一開始就跳過其他法學者能接受、理解的描述統計,直達因果推論,在各方面都不容易。
所以,或許華文法學世界的法律實證研究者,需要「兩面手法」的寫作策略,以中文和英文下筆時,針對不同的閱讀受眾寫作不同內容與取向的文章。
要作因果推論,有六種方式在行內比較被接受,以下分別介紹之。
在法律實證研究的方法論文獻中,此種「研究設計」(research design)的妥當與否,被認為是法律實證研究的關鍵。如果讀者在英文文章中讀到「識別策略」(identification strategy)一詞,就是指研究者認定因果關係的研究設計。
我們可以做自然的現場實驗(mtural field experiment)或者是實驗室中的實驗(lab experiment),
這兩種實驗的重點都是,將接受檢驗的人隨機分為兩組,使這個實驗組與對照組裡的人,在各個能夠觀察到並可能影響人類行為的各種特徵分布都一樣,例如性別、年紀,甚至宗教、居住地區等特徵。
當然可以有不同的實驗組去實驗不同的刺激(stimulus;在實驗情境中可以指涉treatment),是否會造成不同的行為反應;此時仍然要將受試者隨機分為不同的群組。
在實驗中,因為實驗組跟對照組只有刺激不同,由實驗設計者所操控,所以要知道行為的結果是否源自實驗的刺激,就非常容易,甚至只需要比較行為反應的平均差異即可。
自然的現場實驗在經濟學界以約翰·利斯特(JohnList)的研究最為知名。
利斯特和史蒂文·萊維特(StevenLevitt)等教授,用自然的現場實驗來探究提升學生學習成果的較佳方式。之所以稱為自然的現場實驗,是因為研究就在教育現場(學校教室)完成,並不是將老師和學生放到經濟學實驗室答考卷。現場實驗的參與者,基本或完全不會感覺自己在參與實驗,但其身為實驗組或控制組又是隨機分派的結果。
實驗結果發現,無論是要給老師教學激勵,還是給學生專心或努力的激勵,在「不給錢」(控制組)、「先給錢,考不好收回」、「考得好給錢」(後兩者為實驗組)之間,「先給錢,考不好收回」在美國的中學最有效,原因是行為法經濟學的「損失厭惡」(loss aversion)理論——同樣金額的金錢誘因,損失的痛苦大於獲得的快樂,所以「先給錢,考不好收回」較為有效。
年輕學者劉莊,最近在法經濟學最頂尖的期刊,發表了一篇精彩的論文,討論了實驗室中的實驗。劉莊以現任的中國法官做實驗受試者,案件爭點是傷害罪的被告身懷巨款遭搶時奮力反擊。該被告行使正當防衛是否阻卻違法。
實驗組的法官在發下的材料中得知:刑事被告防衛時所奪回的錢是賄款;控制組的法官沒有獲得此種信息。兩組法官又各被分到三種情形:直接決定刑度、先說理再決定刑度、決定刑度再說理。
直接決定刑度的法官,實驗組法官判決刑度顯著高於控制組法官;先說理再決定刑度的法官,實驗組與控制組的法官所宣判的刑度在統計上沒有顯著差異。因為是否為賄款與是否為正當防衛無關,劉莊的實驗說明了,要求法官先說理再決定刑度,有助於幫助法官驅除下意識的道德偏見。
斷點回歸(Regression Discontinuity)是比較兩群團體之表現是否不同;而團體之界分是某個外在、武斷的區分標準造成。
一個公司法上的經典例子是美國知名的公司法律實證研究學者伯納德·布萊克(Bernard Black)等人對於韓國公司的研究。
韓國的公司法在1999年強化了資本額兩兆韓元之上公司的董事會獨立性。兩兆韓元是恣意決定的結果(如果立法者刻意為了避開管制某間公司而設定此標準,則斷點回歸就失靈了),很多公司的資本在兩兆韓元之上與之下,也不當然跟治理機制選擇有關,但是就因為資本額的差異使標準之上的公司受管制,標準之下的公司不受管制。
這個方法的重點是,研究者必須比較資本額剛好是在兩兆韓元上下的公司,不能去比較九百兆韓元或者是比較一百萬韓元的公司,因為那些公司本來就跟其他公司差異很大。
另一個例子:瑞恩·巴布(Ryan Bubb)想探究政府政策或法定製度是否影響人民行為,於是比較非洲加納和象牙海岸兩國邊界的人民。
兩國邊界在20世紀初劃定時,有約一半是依據武斷的直線,將不少同一種族的人劃分到兩個不同國家。研究當時,兩個國家、同一種族的人的習慣物權法仍然相似,但法定的財產權制度以及農業政策卻大不相同。
利用武斷國界造成的不連續,即可探究農業政策是否影響農民的人力資本投資,以及立法制定的財產權制度是否影響實務(前者答案為是,後者答案為否)。
雙重差分(difference indifferences)的研究設計中,通常有兩個地區,一個地區受到某種管制或外生因素的影響,另外一個地區沒有;而受管制的地區又分為管制前和管制後,所以一共有四個區塊(表1的1、2、3、4)。
研究者在乎的區塊是受管制的地區(2)受影響後的轉變;而其他三個區塊(1、3、4)則是比較的基準。
所謂雙重差分,就是指[(2-1)-(4-3)]之差。此種方法背後的預設,必須要滿足的基本條件是:受管制地區跟未受管制地區在受管制前(1、3)其實是基本相似的,至少兩者的趨勢即便不同也要平行。
雙重差分可以用筆者最近的一篇文章來說明。該文觀察我國臺灣地區2011年「公司法」修法,改變董事選舉投票規則的影響。在2011年之前,「公司法」的默認規定(defaultrule)是累積投票制(cumulative voting),但容許公司可以選擇別的投票方式;一共有20家公司改採了多數決(majority voting)。
在2011年的時候,立法機關突然通過了新的法案,只修正這個制度,將累積投票制又改回強制規定(mandatory rule);有18家公司受到了外生衝擊(2家在修法前自行改回累積投票制),但其他八百多家公司卻沒有受到影響,因為他們本來就採用累積投票制。
研究者要區別的就是在修法前、後,受影響的公司與不受影響的公司之間,是否可以看出強制要求對少數股東有利的投票方式,增加少數股東的董事、監事席位。
該文發現,只有立法之後第一次的董事、監事選舉季節,控制股東掌握的席次比率降低,但在之後的3年則沒有產生統計上顯著的影響。
「工具變量」(instrumental variable)在經濟學領域裡面非常常見,但是工具變量可能也是最不容易掌握、讓人「自我感覺良好」的一種方法。
伯納德·布萊克就曾經回顧既有文獻,批評了知名學者仍使用了錯誤或不夠精緻的工具變量方法。
工具變量為實證研究解決「雞生蛋、蛋生雞」問題的方法,例如前述相關性研究發現高犯罪率地區有比較多的警察,但高相關性無法告訴我們是警察多導致高犯罪,還是罪犯多的地方會加強警力。要知道孰為因孰為果,就需要藉助工具變量。
舉例而言,好的工具變量可以影響警力變化,但不會直接影響犯罪多寡,只會藉由警力的變動而影響犯罪率。在林明仁的研究當中,他選擇了「美國各州的消費稅率變化」作為工具變量。他的邏輯是消費稅率些微增加,不太可能直接影響殺人放火的頻率;但州政府稅收增加往往就會多聘警察、維持治安。故若發現消費稅率上升,犯罪率就下降,則可證明警力增加有助於打擊犯罪。
而林明仁教授的發現是:大概百分之十的警力增加可以減少10%的犯罪率。
林明仁的指導老師,芝加哥大學知名的經濟學家史蒂文·萊維特則是用工具變量研究此問題的先驅。他使用美國每四年的選舉周期作為工具變量。因為在選舉之前,現任的州長會有誘因要提升警力,降低犯罪率,以增加連任機率,因為選民都很關心治安問題。
四年一次的州長選舉應該不會直接影響到犯罪率,除非有人因為看太多政論節目而被逼上梁山或憤而鋌而走險,否則選舉和犯罪率理論上沒有關聯。但是州長選舉會跟警力增加、治安變好有關,前者是後者的驅動原因。這個研究也發現,警力增加確實降低犯罪率。
簡言之,工具變量與研究者有興趣的解釋變量有密切關係,但工具變量和被解釋的變量理論上無直接關係。透過這兩重關係,使用「兩階段最小平方法」(Two stage Least Squares),就可以使用工具變量以得到好的因果推論(警察出、天下平)。
第五種因果推論的方法是「配對」(matching)。配對背後的思維是:沒有辦法做實驗,也沒有外在突然發生的衝擊(exogenous shock)使研究者可以做斷點回歸分析,或雙重差分。
研究者就只剩下大千世界給的各種現象與數據,這些數據中可能有潛在作為實驗組和對照組的研究對象,但是他們並不是被隨機分配去獲得實驗組的刺激,或被分配到沒有受到刺激的對照組。也就是說,實驗組和對照組可能有很多影響刺激本身是否導致結果的其他的「幹擾因子」(confounding factor)。
「隨機控制實驗」(randomized controlled trials)是因果推論的黃金標準,無法做到黃金標準的實證研究,也會希望鍍金,K數越高越好,務求逼近隨機控制實驗。舉例來說,筆者正在研究律師代理對於當事人的影響。
研究者想要分析,有律師代理和沒律師代理的案件,其訴訟結果有無不同;或者有資深律師代理和有資淺律師代理的案件,結果是否有差異。
但研究者無法通過直接了當比較這兩種案件的判決結果,就直接算出律師代理的效果。原因是當事人是否有律師代理,或者是否聘請資深律師代理,並不是隨機分配的結果,而是自己選擇(self-select)所致。
例如,比較有錢的當事人,會聘請資深的律師,或者比較有經驗的當事人知道要聘請律師,或者比較嚴重的、涉及金額比較大的案件的當事人會聘請律師。而案件大小、嚴重程度、當事人經驗等,都可能會影響訴訟的結果,所以如果只看(資深)律師代理的效果,就會不當忽略其他因素的幹擾。
而配對方法就是刪除這兩群案件當中無法互相匹配的案件,或者調整權重。例如有律師代理的案件有幾億元訴訟標的之訴訟,而沒有律師代理的案件最高的爭訟金額卻只有幾百萬元,則前者就必須調整權重,或排除在分析外。
更精確言之,整個配對方法的分析步驟,是把可觀察到的、刺激出現前就已經確定下來的變量(observable,pre-treatment variables),用於邏輯斯回歸模型(logistic regression model),實驗組=1,控制組=0。
此回歸模型可以計算出「propensity score」傾向指數,即每一個觀察值(observation)成為實驗組的機率。
當然,實際上研究者已經知道哪些是實驗組,哪些是控制組。此種作法的邏輯是:雖然有些觀察值受到刺激,有些沒有,但在刺激出現前,兩群觀察值各自接受刺激的機率分布應該一樣,才能逼近隨機控制實驗,把受試者隨機分成兩組的結果。排除極端案件或減低權重,有助於將實驗組與控制組的「propensity score」分布調整成越近越好。
最後再跑一個(加權的)回歸模型,以計算出「實驗組接受刺激的平均效果」(average treatment effect on the treated』ATT)。
最後要再次強調,要做配對,必須只能選擇刺激產生影響之前的變量,而不能選刺激產生後還會變化的變量。
例如以研究律師代理效果而言,如果案件是與車禍有關,則在請律師之前確定下來的案件特徵,譬如說車禍受傷嚴重程度,原告的年收入、被告的年收入等案件的特徵可以拿來作為配對的變量。
但如果是原告主張多少錢,或者是被告作出如何之抗辯,則可能就已經受到了原告是否請律師和請什麼樣律師的影響,所以不適合也不應該拿來做配對的變量。
事件研究法(eventstudies)使用股票價格、債券價格的變動來量度法律變化或其他事件的效果。事件研究法假設市場有效率,股市、債市會反應所有信息的影響。
因為假設市場有效率,所以信息會在短時間內就被反映到股價和債券價格中,所以事件研究法通常只觀察幾天內的價格變化。和前述其他因果推論方法一樣,受影響者被稱為實驗組,未受影響者是控制組。
舉一個歷史事件研究為例。
18世紀初,英國有若干法律給予法官職位保障或提高薪資,因而提升了司法獨立與司法質量。更好的司法,是否如理論所預測,可以藉由保障合同、產權,敦促政府還債,從而促進經濟發展?
如果有此種效果,股票和債券市場應該會歡迎此種立法(提案)而應聲上漲。在18世紀初時,有股價的公司只有幾家,包括英格蘭銀行、東印度公司等;而諸如英格蘭銀行是大英帝國的大債權人,所以會樂見司法獨立。
研究者以英國的股價作為實驗組,在荷蘭阿姆斯特丹交易的英國公司股價作為對照組,計算相關司法獨立法案的消息,是否產生「非尋常的股價」(abnormal return)。研究發現,某些司法獨立議案,確實產生統計上顯著的正影響。
本文是因果推論方法的快速梳理。
實證方法的技術一直持續演進,什麼才是有效、可靠的因果推論,都有發生範式移轉的可能。希望法律實證研究的入門讀者能由本文儘量深入淺出的介紹中,獲得啟發;但讀者千萬不要認為方法僅止於此。
或許不少本文讀者並不準備親自從事法律實證研究,而只是想多了解一種法學方法論。對這些數量更多的讀者,本文最大的啟發是:因果推論並不能從兩個事實的前後發生順序就推知,而必須透過嚴謹的研究設計和數據分析才能獲得。
日常口語中,大量法學規範論證中,充滿了許多不假思索或想當然的因果推論。
有任何法律實證研究概念的讀者,必須時時謹記在心:
不要把他人缺乏因果推論架構的因果宣稱為真理,而自己在分析目的與手段關聯時,也不能以「腦補」方式蓋棺論定。
推薦閱讀
張永健、程金華:法律實證研究的方法坐標丨中法評