喬曉春:規範科學的社會科學研究,如何用數據說話

2020-09-16 社會學吧

來源:中國婦女報

8月14日,北京大學喬曉春教授在山東女子學院舉行題為「如何做規範、科學的社會科學研究——以性別研究為例」的網絡視頻講座。喬曉春教授認為:社會科學研究者要知道如何用數據說話,學會和用好研究方法。「用數據說話」有一定規矩,需要遵循一定的程序,包括發現問題、提出假設、收集數據、分析數據、檢驗假設和得出結論。

確定研究問題、開展文獻綜述與研究設計

確定研究問題、開展文獻綜述、做好研究設計是社會科學研究的前提和基礎工作。

——提出好的研究問題。好的研究問題有兩種視角,一是理論視角,二是經驗視角。理論視角就是已有理論已經指明了研究方向,你要做的就是沿著這個方向往前走。理論提供了對社會現象的解釋,再把這種解釋轉換為研究假設,這樣的研究從描述理論說起。以性別研究為例,西方婦女研究的理論學派給出了研究方向,我們可以從中找出研究問題,比如,為什麼越來越多高學歷女性不想結婚?為什麼越來越多年輕女性不想生孩子?生孩子是否真的導致了失業、工資減少、阻礙晉升……?經驗視角就是選擇老百姓關注的、社會上謠傳的、自己感興趣的問題,這樣的研究從講故事說起。

——文獻綜述。文獻綜述首先要識別有效研究,剔除無效研究。文獻綜述不是要「述」,而是要「評」。文獻綜述要處理好「別人已經做」和「你將要做」的關係,「你將要做」是目的。另外,文獻綜述不是回顧和羅列別人做了什麼,而是要發現別人哪裡做的不對,找出別人沒做過的地方。

——研究設計。社會科學設計取決於研究目的或要回答的問題。不同問題有不同的理論框架,涉及不同的關係、不同的變量,不同收集數據的方式、使用不同的模型等。研究設計相當於寫開題報告,好的研究計劃相當於已經完成了研究的90%。做研究設計的主要問題:一是核心變量的概念界定和操作化界定模糊或者錯誤;二是數據只涵蓋研究對象,而忽略對照組;三是用截面數據,將「數量關係」當做「因果關係」來研究。

對真實世界的抽象描述與操作化

確定研究問題、做好研究設計之後,要將學過的理論轉化為數據分析計劃,進一步將研究問題操作化。

——對真實世界的抽象(模型和數據)描述。科學研究一般要從真實世界到理論模型,從理論模型到精細模型,從精細模型到操作模型。由於學習理論和學習方法的分離,不會把學過的理論轉化為數據分析計劃是常見的科學研究問題。過渡模型(精細模型)被稱為基於理論的數據分析。模型的最優和理論的最優,有時是兩回事,甚至會有矛盾。我們應堅持理論優先原則,避免理論脈絡的不清晰導致操作模型關係混亂、重要變量缺失或被忽略。

——做一個好的測量。做一個好的測量的目的是將事實轉換成數據。數據是事實的抽象,方便分析和處理。存在能否測準的問題。第一是測量工具是否存在問題,從而影響測量的信度和效度;第二是被測量對象的牴觸性反應,導致測不準的問題。測量對象包括兩類事實:一類是直觀事實,如性別、年齡、受教育程度等;二類是抽象事實,如幸福、痛苦、孝順、抑鬱等。一個好的測量應該採用社會公認的測量尺度和工具,儘量避免使用自己開發和創造的測量工具。

抽樣與統計推論

很多研究是通過以樣本推論總體的方式實現的,這其中涉及界定研究總體、抽樣方法選擇、統計推論等步驟。

——明確研究對象和總體。任何一項研究都必須有一個明確的研究對象,可以是全國、或一個省、一個市、一個縣、一個街道,甚至可以是一個學校。研究一定是針對研究的整體,結論是針對樣本所代表總體下的,不存在針對樣本的研究。研究者必須在論文中明確表述研究總體,以及樣本是否對總體有代表性。

——樣本必須對總體有代表性。樣本和總體的差異是隨機帶來的,不是人為帶來的選擇性偏差。必須保證數據來自概率抽樣:隨機+總體已知(保證總體的每個單位都有被抽中的可能性且可能性是已知的)。概率抽樣有很多種方法,如簡單隨機抽樣、分層抽樣、整群抽樣、等距抽樣、多階段抽樣等。不同的抽樣方法解決的主要是三個問題:無偏差性、精確性和方便性。由於複雜抽樣絕大多數都不是等比例抽樣(不是自加權抽樣),通常都要做事後加權處理。研究者必須在論文中明確表述:數據是否是概率抽樣,是哪一種抽樣,是否做過加權處理,是否能夠代表總體。

——對總體的推斷問題。研究通常要反映「是什麼」(描述)和「為什麼」(解釋)兩個問題。這都是針對總體而言的。我們必須回答:樣本結果在多大程度上可以反映總體?樣本兩個變量存在差異,到總體是否仍然存在差異?樣本事實是否在總體上也是事實——對總體進行推斷。

——合理選擇樣本規模,保證結論有效。一項研究在開始研究以前就要判斷需要的樣本規模。樣本太少不行,估計不準;太多也不行,經費有限。樣本規模的確定要有科學依據——總體有差異且能夠證明有差異的可能性。方差越大,需要的樣本規模越大。

——多變量研究與模型的選擇和使用。很多研究都不關心模型假設,直接套用軟體計算結果,並依次下結論。實際上,數據只有在滿足模型假設時,模型才可以使用。不同目的,不同數據類型和結構,使用不同模型。

總體而言,科學研究的目的就是揭示客觀事實及其規律,反映一般性和普遍性規律。科學研究的方法就是如何反映客觀事實、如何揭示客觀規律。科學理論就是哪些規律已經被揭示出來了,哪些還需要後人繼續揭示。一個好的研究者需要不斷加強研究方法和理論的學習和訓練。婦女/性別屬於跨學科的社會科學研究,同樣離不開科學方法和理論的指導。

(作者為山東女子學院婦女研究與發展中心教授)

相關焦點

  • 中國社會科學研究有五種怪現象,它存在哪些「不科學」問題
    社會科學到底是不是科學?為什麼與自然科學相比,中國社會科學的地位比較低?中國社會科學研究與國際差距究竟有多大?3月25日下午,北大博雅講壇邀請北京大學人口所教授喬曉春,進行了題為《中國社會科學離科學還有多遠》的講座,講述中國社會科學存在的「不科學」問題。喬曉春在講座現場。
  • 討論「中國社會科學離科學有多遠」,必須跳出實證主義窠臼
    為什麼國內的社會科學研究會憑經歷感受和哲學推理下結論,而又容易陷入沒有意義的爭論呢?這既有客觀也有主觀方面的原因。從客觀方面說,喬曉春教授主張社會科學的研究遠比自然科學複雜得多:「人的行為決定因素是非常複雜的,不像自然科學的決定因素非常簡單,具有確定性關係,可以用一個數學函數明確地表現出來。」
  • Nature:FB和推特的數據是如何革新社會科學,改變世界的?
    同年,科技雜誌《連線》(Wired)發表了一篇文章,認為大數據時代將標誌著整套科學理論的終結。儘管被廣泛批評為過於簡單化,但該文章還是觸動了研究者的神經:十多年後,社會科學家多次援引《連線》(Wired)文章,以表明社會科學理論的相關性正在受到攻擊。但是大數據的趨勢只增不減。
  • 大數據應用於社會科學研究的價值與悖論
    隨著雲計算、物聯網、移動網際網路的廣泛應用,人類社會真正進入了大數據時代。通過大數據的運用,我們對人類社會獲得了更為廣泛和深入的認知,進而通過更為客觀和精確的方法,對人類社會進行更加科學和有效的探索和研究。大數據對當前社會科學研究產生了深刻的影響,使社會科學研究的視野和領域發生了革命性的變化。
  • 計算社會科學:一種新研究範式
    然而,由於大數據時代數據的生產和社會科學研究的數據挖掘成為兩個相對獨立的過程,研究與數據的生產關係被改變甚至倒置了——從生產數據轉向挖掘數據。因此,相對於傳統的小數據而言,大數據絕不僅意味著更多的數據,還意味著在產生方式、形態、維度、結構、分析方法、與科學研究的關係等方面都完全不一樣。從方法論來看,基於大數據的社會科學研究,實際上代表了一種全新的社會科學研究範式。
  • 大數據時代的社會科學研究新範式
    其四,大數據技術有助於趨近總體數據。傳統研究方法往往通過主觀判斷或科學抽樣對資料的代表性和誤差因素進行控制,在此基礎上構建量化描述、假設檢驗、參數估計等一系列方法體系。而大數據的總體逼近特徵不僅是對數據資源的擴展,其理論基礎和技術構架更為社會科學發展提供了結構性變革的可能性。
  • 推進大數據、人工智慧等信息技術與人文社會科學研究深度融合
    如央視新聞採用百度定位數據展示春運人口流動圖景;印度研製的MogIA人工智慧系統用網絡數據四次成功預測美國大選結果;谷歌研發的GFT流感趨勢預測系統基於用戶搜索記錄預測美國的流感趨勢;等等。過去用傳統數據進行研究具有很大的時滯性,而實時性數據的獲取,能夠有效提升人們發現世界的真實度,人文社會科學研究也可以得到更多有意義的結論。  第二,解讀人類行為規律。
  • 計算社會科學:發展現狀與前景展望
    從早期的自然哲學到中世紀的數學探索,逐步演變到當今的基於數值計算和模擬仿真的計算科學。進入21世紀,以大數據和人工智慧等為代表的新一輪科技革命的興起,拉開了被稱為第四代科學——(大)數據集約型科學發展的序幕。作為一門科學或學科的發端,CSS其實可上溯到20世紀中葉馮·諾依曼(John von Neumann)的經濟行為的可計算規範研究、赫伯特·西蒙(Herbert A.
  • 賀雪峰:理論資源與經驗研究——如何才能寫出一篇好的社會科學博士...
    當前一個階段中國社會科學主要目標應當是用古今中外尤其是用西方社會科學理論來理解中國現時代正在發生的偉大實踐,理解豐富複雜的中國經驗,通過理解中國經驗,就逐步形成了對中國經驗的一般性抽象概括提煉,也就形成了若干社會科學理論,再將這些理論放置到更廣泛的中國經驗乃至世界經驗中檢驗,從經驗中來,到經驗中去。做中國社會科學研究,要將西方社會科學理論和方法當作資源和工具而不是拐杖。
  • 李志民:自然科學與社會科學的區別
    自然科學是研究無機自然界和包括人的生物屬性在內的有機自然界的各門科學的總稱。社會科學是借用自然科學的方法,研究人類社會的種種聯繫的各學科總體或其中任一學科,如社會學研究人類社會,政治學研究政治、政策和有關的活動,經濟學研究資源分配。自然科學與社會科學既相互聯繫,又有所區別。其差異主要體現在如下幾個方面。
  • 社會科學研究方法大梳理!
    實證研究是基於「事實」的方式進行論證並有規範的研究設計和研究報告。在實際的研究過程中大多數時候是以一種研究方法為主,其他為輔,交叉使用的。以下內容是介紹每一種具體的方式。那麼資料搜集上來了?該如何分析呢?
  • COVID居家隔離期間如何收集定性研究數據
    COVID居家隔離期間如何收集定性研究數據新型冠狀肺炎在全球的大流行不只造成生命的消逝,居家隔離對科學研究也形成非常巨大的挑戰,尤其是需要接觸溝通搜集結果的定性研究,在這個要求社交安全距離的時刻格外難進行。
  • 經驗知識、自然主義與社會科學
    以認知科學、生物學、心理學等經驗科學為模式,自然主義為社會科學及其知識的科學性提供了有效辯護。由此,我們提出一種自然主義社會科學哲學,意在改變社會科學哲學的研究內容與方式,為理解社會科學的科學理性之本質提供一個統一框架。
  • 努力建設哲學社會科學的基礎學科——歷史學
    重視歷史、研究歷史、借鑑歷史,可以給人類帶來很多了解昨天、把握今天、開創明天的智慧。所以說,歷史是人類最好的老師。」 繁榮哲學社會科學,首先要繁榮哲學社會科學領域最基礎的學問——歷史科學。在這次哲學社會科學工作座談會上談到要加快完善對哲學社會科學具有支撐作用的學科時,習近平總書記把歷史學的位置列到哲學之後。我想這其中是有深意在焉的。
  • 用《量子心靈與社會科學》講物理學與社會科學的國際關係學者
    然而在「XX系YY專業ZZ方向」的表述作為專業身份標配表達的當下,在各學科理論和方法的系譜根深葉茂的當下,即使社科學人已經(如他們所聲稱的那樣)從理論入手,上升到方法論和本體論的程度,從科學哲學、機制論的譜系中梳理和解釋自己學思歷程;即使研究問題本身為多個學科所關注,相互借鑑的學科原本相鄰共生,專業讀者和普通讀者首先還是會略帶預設地考量:怎麼跨,才能讓本學科和跨界學科的讀者都心服口服?
  • 什麼是科學,什麼是社會科學,什麼是社會主義科學和資本主義科學
    這個真理也包括哲學和科學。比如,「籃球是圓的」這個真理,就不是放之四海而皆準的真理。因為,如果你用放大鏡來看籃球的「邊」,其實是凹凸不平,不是圓的;如果再過一定時間,這個籃球沒氣了,癟了,也就不是圓的了;如果籃球在擊地的瞬間,籃球其實也不是圓的……。
  • 建立科學權威、公開透明的哲學社會科學學術評價體系
    在此大背景下,建立科學權威、公開透明的哲學社會科學學術評價體系,加強科研誠信建設尤為迫切。經過研究探索,評價院提出了AMI綜合評價指標體系,將定量和定性評價方法相結合,突出同行評議在評價中的作用。評價院提出的AMI綜合評價指標體系和推出的評價報告逐漸得到學界和社會的關注和應用。
  • 何謂社會科學
    第一種可能是自己確實是才疏學淺,尚未達到理解這些話語的能力,就如同一個小學生看不懂量子力學一樣簡單;第二種可能是該理論確實高深晦澀,所謂的高深首先得承認是因為隨著學科發展的不斷深入,鑽研的越來越深,自然會有很多複雜的理論產生,閱讀社科領域中最經典的那批著作,最明顯的一個感受就是接地氣,看盧梭的《社會契約論》和洛克的《政府論》你會發現分析是如此的生動,語言或華麗或平實,然而種種結論都可在生活中的經驗感受中得到驗證
  • 新時代哲學社會科學學術期刊的功能定位
    無論自然科學還是社會科學,國際上公認的頂級權威學術期刊,如《科學》《自然》等雜誌,其地位和影響的形成,蓋因其長期堅持極為嚴格的選稿用稿標準,所發表的論文基本上都是一流的原創性成果。提升期刊質量,首先就是要嚴格把好選稿用稿質量關,注重學術性、前沿性,強化原創性、思想性。    提升辦刊質量還需注意到,學術期刊作為學術傳播媒體,正面臨著傳播技術和平臺載體的巨大變革。
  • 【韓春雨撤稿】數據已經說話,生物學家們怎麼說?
    「談到重複研究時,有一點我們是知道的——它需要花時間來做。在NgAgo這個案例上,現在時候到了,數據已經說話。」 《自然-生物技術》在社論最後說。在《自然-生物技術》針對果殼網科學人的採訪說:「『數據已經說話』不僅描述了對於最初發表的數據的全面縝密的評估,也描述了對後續一系列有關NgAgo的報告的全面縝密的評估,評估所有數據後的結論是如今的撤稿是合適的。」