近日,因為審稿,以及收到的審稿報告,想起一些話,說給大家聽聽。
前兩天,我將自己寫的一份審稿報告和收到的一份審稿報告放在一起,在學生面前曬了曬。我對學生說,你們或早或遲,會成為審稿人,也會在各種報告會上批評別人的文章,那麼,我希望你們記住兩個C和兩個P:constructive、professional、careful、polite。
審稿總是要批評的,批評是容易的,難的是建設性的批評。特別是對於實證研究,世人皆知,模型誤設(mis-specification)、度量誤差(measurement error)、內生性(endogeneity)是三個繞不過去的問題,從這三個角度去批評文章,基本不會錯。但是,一份審稿報告如果只談這三個方面的問題,怕是恰恰說明審稿人除了教科書之外,對所審的文章沒有更深的理解。更重要的是,一篇文章的模型形式應基於理論與文獻,變量的度量應該是在研究之前已經充分考慮的問題,內生性的解決並不容易,有經驗的作者不會在這方面一點也不考慮。作為審稿人,我更願意告訴作者這樣一些信息:
他有一個研究中閃亮的地方,他沒有意識到;他遺漏了重要的文獻;他可能能夠找到某個數據,從而可以看看從X到Y的某個機制,甚至可以檢驗幾種機制哪個更重要;或者,從X到Y的機制不是作者所說的那樣,在歷史和現實中,故事是另一種可能性,更接近真實的制度背景;我可能還會建議作者,在一篇學術論文中,不要將政策建議講得那麼多;我還會建議作者對於文章的引言部分換個寫法,會使得他的工作更加重要和有趣。……我會儘量要求自己所提的建議是可以做到的,從而使審稿意見具有「建設性」。我不會對一篇研究收入差距對某個事物的影響的文章說,收入差距是內生的,你應該用實驗數據去做,因為用實驗方法來改變收入差距,不說是不可能的,也至少是不道德的。我也不會建議作者運用自然實驗的數據來研究戶籍的影響,因為我知道,隨機地給農民工發放城鎮戶籍,這件事從來沒有過。
對於耗費了經濟學家大量精力的內生性問題,我想多說兩句。我絕對認為克服內生性偏誤是重要的,也是研究者應該努力去做的。不過,我的想法是,計量經濟學方法和因果關係識別在理論上並無直接對應關係。計量的研究策略(包括實驗方法、IV、regression discontinuity、propensity score matching、DID等等)都只是用來避免(或緩解)由遺漏變量或雙向因果關系所產生的估計偏誤的。在使用了這些方法之後,研究者所看到的相關性更接近因果關係,而其是否真是因果關係,仍然需要看理論邏輯。因此,我不認為運用OLS方法分析截面數據的研究就一定不好,事實上,只要研究策略得當(比如運用了實驗或自然實驗的方法),從而保證了核心解釋變量的外生性,OLS恰恰是最好且有效的估計。一些頂級雜誌的文章也常常在OLS的基礎上,運用一些研究邏輯來排除某些作用機制,從而更好地接近因果推論。另外,一些開創性的研究往往是從看相關性起步的,此類研究的重要意義往往在於提出了具有創見的問題,當然,如果能夠用更接近於因果分析的研究策略,則是錦上添花。
是不是可以簡單地從研究方法來判斷研究的價值?方法是重要的判斷標準,但恐怕不能作為唯一標準。舉個例子吧:黨員到底代表什麼?是能力還是權力?要回答這個問題,可以用同卵雙胞胎數據,做一下雙胞胎之間的數據差分,那麼,同卵雙胞胎的能力作為遺漏變量就被差分掉了。如果同卵雙胞胎之間一個是黨員,一個不是,兩者之間的收入有差別,那說明黨員的確不只代表能力。如果同卵雙胞胎之間的黨員身份差別沒帶來收入差別,那就只能說,通常在截面上看到的黨員身份回報只是因為黨員的平均能力更高而已。
最近,我審的一篇文章運用截面數據的OLS分析發現了黨員身份和教育水平之間有替代性,做法是將兩者相乘做個交互項,並發現,在收入方程裡這個交互項的係數是負的。對此,我當然可以批評作者,說教育和黨員都是內生的,然後,建議他應該用雙胞胎數據做一下。可是我沒有,因為我相信,在理論上,黨員身份和教育水平是否是相互替代的,這是個有價值的理論問題,恰恰因此,即使黨員和能力相關,那麼,當收入決定方程遺漏了能力的時候,也遺漏了能力與教育的交互項,如果真是這樣,即使是用雙胞胎數據進行差分,在殘差項裡的能力與教育的交互項也是差分不掉的。而從理論上來說,如果黨員身份和教育水平是相互替代的,即使其係數存在遺漏變量偏誤,只要符號方向不錯,那麼,就可以質疑「黨員僅是能力的代表」這一說,因為如果真是這樣,並且文獻已經告訴我們能力與教育是互補的,那麼,黨員和教育就不會是互替的。由於看到了這一點,我建議作者將這一發現及其對於理解黨員身份的性質的文獻的貢獻作為自己的亮點來說。
順便再說說理論和實證的關係。有人認為,必須要在實證前面加個數學模型才能將機制講清楚。甚至認為,在統計相關性之前,加上個數學模型才可以確認因果關係。讀者不妨自己統計一下,在經驗研究性質的經濟學論文中有多少比例的文章並沒有一個數學模型。比較一下有數學模型的和沒數學模型的論文就知道,不能簡單地批評說,沒有數學就是沒有理論。即使沒有數學,實證研究對於模型設定、變量選取等等,仍然需要依賴於「理論」。
但是,至少有兩種情況,使得實證文章中並不需要寫一個用數學表示的理論模型。第一,既有的理論已經很成熟,實證要做的,只是看從X到Y的淨效應有多大,到底哪種機制是成立的;第二,實證所要看的機制實在是太直接,不需要用一個數學模型表述的理論,而這個有待檢驗的關係本身是否成立才是研究者關心的,比如說,如果我們想檢驗一下教育裡的「同群效應」(peer effect),即一個人的學習成績是否受到其同學成績的影響,這個看似簡單的關係在實證檢驗中卻非常難做,而且這個「同群效應」是教育經濟學的基石。更廣泛地來說,基於社會互動的人類行為的相互依賴性是社會經濟學(social economics)的基石。那麼,對於一個X到Y的統計關係,是否必須以一個數學表述的理論來作為其因果推論的前提呢?如果你的答案是肯定的,那麼,我就要追問兩個問題,對於一個統計上的X與Y的正相關關係,我們可以寫一個X影響Y的理論,也可以寫一個Y影響X的理論,我們是否僅以此就能確認在統計上的關係到底是X到Y的因果鏈,還是反過來?與利用某種實證研究策略(包括實驗方法、IV、regression discontinuity、propensity score matching、DID等等)看到了X對Y的影響相比,一個數學表述的理論加上「從X到Y」的相關關係,是否更能用來確認X與Y之間誰因誰果?
說完constructive,再說professional就容易了。正如陳凱歌在電影《和你在一起》中批評他學生說的那句,「都對,但是不好。」專業的審稿報告就應該是富有建設性的,這說明,在審稿人的研究內,他知道他審的這項研究可以做得更好,而且這不是外行話。為此,好的審稿人不應輕易地接受非自己熟悉的領域的審稿要求,否則,說外行話就在所難免。我對「professional」的理解就是,審稿人與作者同樣知道,甚至比作者更知道研究的前沿在什麼地方,什麼地方是可以做得更好的。技術永遠是手段,而不是目的本身。好的審稿人不應該只是告訴作者存在某項技術,而是清楚地知道一種技術(或者研究策略)是否適用並且可行,從而值得推薦給作者。
對了,我不應該忘記說一句,好的審稿人還應該有一項非常重要的職業精神,那就是審稿的時間不要超過雜誌所要求的時間,至少我自己一直這樣要求自己,因為我將接受審稿的邀請作為對雜誌和作者的承諾。不過,非常遺憾的是,我自己曾經有過兩次經歷,文章的兩輪審稿經過了近2年時間。沒有任何一家中文雜誌說這是允許的,只能說,這是審稿人不夠有職業精神。尤其是當我看到審稿人花了近兩年的時間完成的審稿報告裡,提醒我被解釋變量(Y)的度量誤差會引起係數估計的「衰減偏誤」,我只好提醒自己「笑比哭好」,因為,事實上,「衰減偏誤」只會在解釋變量(X)存在度量誤差時出現。
其實,所謂「careful」的第一個要求,就是審稿時不要自己出錯。在我看過的中文雜誌的審稿報告中,另一個常常出現的錯誤是,審稿人提出作者的解釋變量之間存在共線性。其實,如果解釋變量完全沒有共線性,那麼,就不需要多元回歸技術來分析問題了,遺漏變量問題也就不是問題了。當然,高度相關的解釋變量同時放在模型裡,會使各變量的係數出現不顯著的情況,這時,請不要輕易丟掉其中的一個(或幾個),否則,當你這樣做時,雖然剩下的變量係數顯著了,但它的係數卻可能存在估計偏誤,因為,你把與它相關的變量放到模型的殘差項裡去了。通過減少解釋變量的個數來增強模型中解釋變量的顯著性,這只能在問題足夠重要、樣本又非常小,而且作者只關心係數的方向時才可以,不過,現在這很難成為讓人接受的理由。此外,好的審稿報告,不妨仔細幫作者找他文章中的錯誤,包括文字、格式與標點,更不用說表述上的欠妥之處了。
最後,Please be polite。你可以拒絕審一篇稿,如果你實在覺得文章沒有改好的可能,寫審稿意見也是浪費時間。我對於自己接受審稿邀請的文章,絕不會說其中存在的錯誤夠得上「愚蠢」、「幼稚」之類的形容詞。特別是對於那些剛剛在職業生涯上起步的年輕學者來說,告訴他哪些地方可以做得更好,就夠了,審稿報告不需要任何形容詞。我自己也犯過錯,在發表了的文章裡,還存在著因為不夠仔細而導致的不可原諒的錯誤。不過,我總是覺得,有錯是可以改的。只要不是明知故犯,更不能知錯不改。
我寫這篇隨想是要對國內的審稿提點建設性的批評,就象我認為寫審稿報告也儘量建設性一樣。學者的基本職責是知識的生產和傳播,而其方式無非三種:第一種是自己創作;第二種是培養學生,讓學生延續自己的創作;而審稿則屬於第三種,即通過幫助他人來生產和傳播知識。在這個意義上,審稿是值得學者投入精力的事,儘管這只是在創造某種正的外部性。正的外部性之所以成為「外部性」是因為這項工作不能直接給自己帶來回報,所以,太認真也難免顯得有點傻。不過,學術就是這樣的職業,傻事做不做,做得如何,完全看你自己。不管怎樣,作為審稿人,不需要向任何人證明你比別人聰明,如果真要證明點什麼,你就去證明,你的意見可以切實地幫助作者做得更好。我就是這樣想的。
作者:陸銘:上海交通大學特聘教授、博士生導師、中國發展研究中心主任、上海市政協委員。