原創 許琪 學術與社會 來自專輯《博士論文背後的故事》專欄
【石頭引】每一代學人都有自身的學術成長環境,80後學者在成長曆程中,受到了較好的學術訓練,通常各種研究方法的訓練也都比他們的前輩更精通一些。這也就意味著,在學術競爭日益激烈、求職日益困難的環境中,多掌握一門手藝,也就多一層保障。量化研究方法今後對於新一輩的學人來說,越來越重要。即便不從事量化研究,最好也要有對於量化研究的賞析能力,本期繼續邀請了量化研究的新銳學者許琪博士,他在社會學領域的頂級期刊都有發表,希望他的經驗對大家的學術發展有所啟迪。
微信公眾號的推送規則變了,不再按照時間順序,所以,請大家給「學術與社會」加上星標,並且及時點「在看」,以免錯過精彩文章。
【作者簡介】許琪,1987年出生,先後在中國人民大學和北京大學獲得本科和博士學位,美國密西根大學人口研究中心訪問學者,現為南京大學社會學院副教授。主要研究方向為:婚姻與家庭、人口社會學、社會分層與流動。近年來在Demographic Research、Chinese Sociological Review、China Economic Review、《社會學研究》、《社會》、《中國人口科學》等中英文核心期刊發表論文二十餘篇。博士論文獲評「北京大學優秀博士論文」、「餘天休社會學優秀博士論文」提名獎。
【寫在前面】感謝雨磊老師的邀請。雨磊老師我仰慕已久,但其實只見過一面。我清晰地記得那是2019年10月,我赴約參加「慄林論壇」,在從社科院乘坐大巴去慄林山莊的路上見到了江湖人稱「石頭君」的雨磊老師。與想像中的形象不同,雨磊老師是一個非常豪爽的人,所以談話也進行得頗為愉快,聊到興處,雨磊老師主動提出讓我為《博士論文》專題寫一篇稿子的想法,我也興然應允。今年6月,雨磊老師再次向我約稿,盛情難卻,我立刻著手準備這件事情。不過,現在回想博士論文的寫作過程,那已是七年前的事,很多細節已記不清了。但如果再往前回想我的求學經歷,很多場景依然歷歷在目。因此,我想以《我的社會學定量研究之路》作為這篇博士論文札記的題目,希望我的這段經歷能對那些有志於從事社會學研究,特別是社會學定量研究的「後浪」們有所幫助。
一、我與社會學的邂逅
我與社會學結緣,完全是因為偶然。中學時期,我是一個標準的理科生,我的願望是在將來成為工程師、科學家、程式設計師,甚至是一名廚師。但不幸的是,我的父母並不希望我從事這些工作,他們希望我能去學金融。而且更加不幸的是,當時(其實現在也是)有這種想法的家長還不在少數。當全社會的家長都認為自己的小孩應該去學金融的時候,金融專業的分數線自然居高不下,我參加高考那年,人民大學金融專業的分數線甚至超過了北京大學的錄取線,因此我被調劑了,而被調劑的專業就是社會學。
可以想見,當我背著行囊來到人民大學報到的時候,我的心情是何等的複雜。社會學是什麼?學了能做什麼?這些疑問充斥著我的大腦。但很快我就發現,跟我有同樣疑問的人還不少,因為我的同班同學之中,絕大多數也是被調劑的。就這樣,一群志不在社會學的人開始聚在一起學習社會學。這群人中的大多數後來沒有從事與社會學研究相關的工作,但也有少數人堅持了下來,而我就是其中之一。
促使我堅持下來的原因有很多,其中一個重要原因,就是人大的社會學課程設置與我的理科背景非常契合。與很多學校的社會學本科培養方案不同,人大的社會學訓練對數理統計的要求很高。我印象中本科上過的與數學和統計直接相關的課程就有近30學分,而且學校強制要求,社會學專業的本科生也要學習高層次微積分、線性代數和數理統計,這個規定害苦了我的很多文科同學,但卻讓我這個理科生佔盡了便宜。憑藉數學上的優勢,我的成績在班上一直名列前茅,因此順利拿到了推免到北京大學讀研的資格。更為重要的是,人民大學這種偏重定量的培養方式使我這個理科生逐漸對社會學產生了好感,與此同時,也為我後來走上社會學定量研究之路奠定了基礎。
二、開啟社會學定量研究
在人民大學度過了四年本科生涯之後,我來到了北大社會學系繼續深造。起初,我並沒有做學術的打算。我現在依然記得,在我跟碩士導師邱澤奇教授第一次見面的時候,邱老師問我想不想讀博,我斬釘截鐵地回答說不想,因為在我當時看來(其實現在看也是),讀博就是一條「不歸路」。不過很快,一段特殊經歷促使我毅然決然地踏上了這條不歸路。
2008年秋天,在我拿到北大社會學系的推免資格後不久,正當我在策劃大四的糜爛生活該如何開啟的時候,邱老師的一個電話徹底摧毀了我的計劃,也徹底改變了我的人生。當時,邱老師帶領的團隊正在從事「中國家庭追蹤調查(CFPS)」的籌備工作。大家現在都已知道,這個調查是全國規模最大的追蹤調查項目,但當時這個項目還在籌備階段,人手嚴重不足,作為負責人的邱老師就到處找人幹活,我這個剛入門不久、人又在北京且似乎「無所事事」的學生自然就成為了邱老師的重點招募對象。因為是導師交辦的第一個任務,我雖然有些不情願,但也只能答應下來。在答應之初,我並不了解CFPS是什麼,我要做什麼。直到後來,我才慢慢發現,我正在參與的是一個非常「高大上」的調查,而我在本科學到的那點皮毛根本就不夠用。為了不負老師所託,幹好這份工作,我只有不斷學習。從2009年開始,我每年都會報名參加「北大-密大」聯合學院的暑期班,以學習最新的調查技術和數據分析方法,而CFPS的實戰需要也能使我迅速將課堂學到的知識應用於實踐。就這樣,在不知不覺中,我的定量研究水平有了明顯提高,我也逐漸開始喜歡上了做抽樣調查以及利用抽樣調查數據開展社會學研究。除此之外,參加CFPS調查的另一個好處是使我有幸接觸到了很多國際定量社會學研究領域的「大牛」,特別是當時還在密西根任教的謝宇教授。謝宇教授是CFPS項目的國際學術委員會主席,因為CFPS的緣故,他經常來北大開會,借著開會的機會,他也會邀請青年學生做報告。我有幸參加了幾次謝老師組織的研討會,而且頗令人意外的是,謝老師對我的研究給予了比較高的評價,這極大地提升了我從事社會學定量研究的信心。最後,更加重要的是,參加CFPS使我能比其他人更早地熟悉和使用這個數據。大家都知道,從事定量研究的關鍵是要有一個高質量的數據,而CFPS就是這樣一個數據。我在學術生涯早期的發表以及我的博士論文使用的都是這個數據,所以,參加CFPS項目不僅為我打開了學術研究的大門,而且為我開展定量社會學研究提供了極大的便利。
因此,受CFPS項目的影響,我逐漸改變了我的人生規劃。2010年,我主動找到邱老師,向他表達了讀博的意願。邱老師很高興,不過因為他已經用完了招生名額,所以只能把我推給系裡其他老師。幸運的是,這個「接盤」的竟然是著名人口學家、同時也是國內定量研究方面的專家郭志剛教授,這真是讓我喜出望外!在師從郭老師之後,我的定量社會學研究之路也正式開啟。
三、確定研究方向
讀博之後的頭等大事就是要確定一個研究方向,這真是讓我傷透了腦筋。我想,包括我在內的很多社會學定量研究方向的學生,在一開始接觸最多的領域就是社會分層。因為在各大主流的社會學分支領域之中,社會分層是定量化水平最高、同時也是定量方法應用最廣泛的領域,很多教材在介紹定量分析方法的時候,舉的例子也是社會分層。所以在一開始,我打算以社會分層作為博士階段甚至未來整個職業生涯的研究方向,為此,我還通讀了《中國社會科學》、《社會學研究》、《社會》以及國外幾個主流社會學期刊上自2000年以來所有關於中國社會分層的研究文獻。但在讀完之後,我赫然發現,學術界關於中國社會分層的研究已經非常全面和深入,我除了能用新數據來驗證一些舊觀點之外,已經沒什麼可以繼續往下做的了。每次一念及此,我整個人的感覺就非常不好。為了能讓自己好起來,我決定,一定要換一個研究方向。但問題是,換成什麼好呢?
正當我為找不到研究方向而發愁的時候,和郭老師的幾次閒聊卻提供了意外的收穫。郭老師是一個很喜歡聊天的人,他每次見到我,都要聊很久他在研究婚姻、家庭和生育等問題時的發現和趣聞。起初,我對婚姻家庭的興趣並不大,但為了能跟導師有話可聊,我也開始關注這方面的研究。而這一關注下去,我赫然發現,婚姻家庭倒是一個很有趣且很值得通過定量方法深入研究的領域。實際上,早在上世紀80年代,我國的很多社會學前輩就做了不少城鄉家庭的問卷調查(如「五城市家庭調查」、「七城市家庭調查」等),且產出了一批成果;但遺憾的是,這一研究傳統在上世紀90年代中期以後突然就中斷了,此後就很少有高質量的定量研究成果出現,而我的手邊恰好一個專門針對中國家庭的CFPS調查數據。想到這裡,我有了一種豁然開朗的感覺。因此,我立刻圍繞婚姻家庭搜集文獻和分析數據。在選定了居住方式、代際關係和婚姻穩定性這幾個CFPS調查數據中資料比較豐富的研究問題之後,我寫了幾篇論文,並在2013年試探著給《社會學研究》和《社會》這兩個國內社會學領域的權威期刊各投了一篇稿子,頗令人驚喜的是,這兩篇稿子竟然全部被接收了。嘗到甜頭的我也開始繼續挖掘CFPS數據,並將研究領域拓展到了家庭教育、家務分工、性別觀念等其他方面,但這些研究都相對零散,如何圍繞一個核心問題創作一篇高質量的博士論文是我接下來需要攻克的另一個難題。
四、博士論文寫作
在博士圈中,流傳著一個對Ph.D.的有趣解讀,即「永久性頭部傷害」(Permanent Head Damage)。從某種程度上說,這個解讀是非常準確的,因為讀博確實令人頭疼,而博士論文無疑是最令人頭疼的一項。我的博士生涯總共只有三年,而這篇博士論文從定題到最終定稿就花了一年半,在這一年半中,我體重輕了30斤,頭髮也不知掉了多少。
說到這裡,一些讀者可能會覺得奇怪,定量論文不是坐在電腦前跑跑數據就能寫出來了嘛,哪有這麼誇張!如果你真是這種想法,那麼你一定是對定量存在很大的誤解。誠然,很多定量研究者分析的是二手數據,不像定性研究者那樣需要做田野,但二手數據在給定量研究者帶來便利的同時,也極大地限制了研究的深度和範圍。
首先,二手數據不是根據自己的研究設計量身定製的,所以,自己想要的變量沒有,或者測量很糟糕,這是定量研究中再尋常不過的事情。其次,國內目前可用的二手數據大多是綜合性調查數據,綜合性調查的好處是什麼都問,但缺陷是沒有一樣問得很深。這帶來的一個問題就是,定量論文很難寫長,因為數據資料不足以支撐起一篇長論文。我們知道,國內社會學界對博士論文的長度是有一定要求的,如不少於10萬字,這就產生了一個矛盾。要解決這個矛盾,一個通行的辦法是在一篇定量博士論文中討論2-3個相關聯的問題,但這樣做是有風險的,因為火候一旦掌握不好,一篇完整的博士論文就變成了論文集。最後,使用二手數據經常遇到的另一個問題是,很多你不知道的人也在用它做研究,有時你要做的研究已經被人做過了。即便在文獻中沒有發現,也有可能在你做研究的途中,一篇類似的文章突然就發表出來了,這實在是一件很令人懊惱的事情。
綜上所述,用二手數據做定量博士論文是很難的,研究者需要找到一個數據能做的、別人沒有做過的、且內容能足夠支撐起一篇博士論文篇幅要求的題目。為了能找到這樣一個題目,我絞盡了腦汁,最終,我從費孝通先生提出的「反饋模式」中獲得了靈感,即:圍繞中國家庭中父母對子女的養育和子女對父母的反哺這一對問題開展研究。選擇這個題目的妙處在於:首先,它是由一個概念引申出來的兩個問題,因此要比只研究一個問題在內容上豐富得多;其次,CFPS數據中包含子女教育和家庭養老這兩個專門的問題模塊,因此數據足夠我完成這項研究;最後,這兩個問題涉及的面很廣,因此,雖然前人圍繞這兩個問題做過不少研究,我還是有進一步拓展的空間。
確定選題之後,接下來要做的就是要找到研究的聚焦點。通過閱讀文獻和分析數據,我決定從性別這個角度切入。具體來說,我試圖結合現代化與人口轉變的宏觀背景來研究傳統的「反饋模式」在性別這一個維度上的變化。我發現,無論是家庭對子女的教育投資還是子女對父母的反饋,中國家庭都出現了一種性別平等化的趨勢,而這種趨勢一方面與家庭資源的迅速積累和性別觀念的平等化有關;另一方面,也與計劃生育政策執行以來家庭生育水平的下降和人口流動的增加有關。
說到這裡,我已經基本介紹完了我博士論文的核心內容。不過在介紹的時候,我主要是在談「想」的過程,而沒怎麼說「做」的經過。實際上,任何定量論文都是一邊做、一邊想的。我之所以突出「想」而淡化「做」是因為我發現,很多人在做定量研究的時候,做得太多,而想得太少。大家需要注意的是,做定量研究不是整天看數據、跑模型,對研究問題的理論思考和概念提升也很重要,甚至更加重要。從這個角度來說,定量研究和定性研究有相通之處,只不過定量研究更加技術化一點,這種技術化的外表在一定程度上掩蓋了它作為一項社會學研究本身對理論的內在要求。
五、對定量研究的幾點體會
從北大社會學系拿到博士學位之後,我來到南京大學社會學院工作,我也開始從只是自己做定量研究變為需要在自己做的同時教別人怎麼做定量研究。這種身份的轉變也促使我去總結和思考我的定量研究經歷,以期從中找到一些竅門來幫助到更多的學生。
我想,做好定量研究首先要過的是心理關。首先,你要打心裡喜歡它,因為如果不是發自內心的熱愛,是很難堅持下來的。其次,你要耐得住寂寞,因為做定量研究經常要跟冷冰冰的數字打交道,其過程是很枯燥乏味的。第三,你要有足夠強的抗打擊能力,因為數據是很頑固的,它不會按照理想的設定呈現結果,所以你的想法中十之七八可能都做不出來。最後,也是最重要的是,不能太功利。一些學生對定量懷有很多不切實際的幻想,比如認為定量研究可以使用他人採集好的二手數據,不用做田野;認為定量研究出成果快,比做定性容易等。出於這些幻想,他們轉向了定量;但最後發現,根本不是那麼回事。定量研究可以使用二手數據不假,但你可以用,別人也可以用,如果你沒有花費比別人多的心思,怎麼能做出好研究呢?此外,認為做定量研究可以更快發論文也是不對的,實際上,是只有手速快的人才能在定量研究的道路上生存下來,因為二手數據都是公開的,如果你始終慢人一步,好的題目早就被別人做完了,哪會輪得到你?所以,大家千萬不要抱著功利的心態來做定量研究,否則,除了碰一鼻子灰之外,什麼也得不到。
其次,做定量研究需要有天賦,更需要努力,但絕不能「用力過猛」。天賦和努力的意思我想大家都明白,我不用多說,我在這裡想說的是什麼叫「用力過猛」。我在教學中,有時會發現一個現象,就是學生很用工、很努力,成日成夜地跑數據、算模型,但研究就是沒什麼進展,這多半就是「用力過猛」所致。導致這個問題的主要原因就是我之前說的「做得太多、想得太少」。做研究是需要思考的,做定量研究也是。但很多初學者意識不到思考的重要性,只是一味地去分析數據,認為只要不斷深挖,總能從數據中挖出點寶貝出來。但這種沒頭蒼蠅似地亂搞一通是很難有重大發現的,有時即便發現了,研究者也注意不到。所以我的建議是,做定量研究時要注意適當地停一停,停下來的目的就是讓自己清醒一下,搞清楚自己是不是在沿著正確的方向,有時候換個方向會有一種「柳暗花明又一村」的感覺。
第三,做定量研究需要學方法,但決不能只學方法。對定量研究感興趣的人都知道,統計方法是定量研究區別於其他研究的一大特色,也是很多人學習定量研究時的一大障礙。為了克服這一障礙,很多學生會把大量的時間和精力投入到方法的學習中,但方法學過頭了也會出問題。首先,它會擠佔原本應用在文獻閱讀、理論訓練等方面的時間,導致所做的研究只有方法,沒有理論關懷,因而也失去了社會學研究本身的意義。其次,花太多時間學方法也會導致學生刻意在研究中使用一些根本不需要的複雜方法。這時候,方法已不再是為問題服務,問題反而成了向他人展示我會這種方法的工具。在我看來,定量研究需要用方法,所以一定要學方法,但首先需要明確的一點是,方法只是我們探究社會問題的工具。因此,做定量研究與做其他社會學研究一樣,首先要學會的是良好的問題意識和開闊的理論視野,只有這樣才能提出好問題,學會的方法也才能有用武之地。
最後,做定量研究必然要使用數據,但在使用數據之前,首先要問一下自己,你是否真的了解你所用的數據。如前所述,由於採集一手定量數據需要耗費大量的人力和物力,現在幾乎所有定量研究都在使用二手數據。一般來說,嚴謹的二手數據分析需要在正式分析之前評估一下數據質量,但很多初學者不會這麼做,他們經常是拿到數據以後就開始算模型,這是非常危險的。我曾在CFPS項目組擔任了長達五年的研究助理,這段經歷告訴我數據中會存在各種各樣意想不到的問題,即便是CFPS這樣有嚴格質量控制的大規模調查數據也不能倖免。所以,我在指導學生的過程中,常常會提醒他們要注意拷問數據,只有像熟悉自己的雙手那樣熟悉數據,才能規避數據中的各種陷阱,否則,胡亂做回歸模型,「假數真算」的結果只能是騙人騙己。
以上是我近些年來從事社會學定量研究和教學的一些心得體會,希望對那些有志於從事定量研究的讀者有所幫助!
原標題:《《博士論文》第84期 許琪:我的社會學定量研究之路》
閱讀原文