從質性研究到大數據方法:超越與回歸

2021-01-08 中國社會科學網

    內容提要:社會學質性研究方法和量化分析方法分別源於兩種不同傳統,演變為方法論的分離和對立。大數據的興起或許會給解決這種「兩張皮」的現狀帶來機遇。從質性研究方法、傳統量化分析方法到大數據方法,研究工具的變化某種程度上見證了研究對象——社會本體的變遷。大數據研究促使質性研究和量化研究走向融合,社會學的科學性與人文性也獲得了交匯的途徑,大數據方法是對既有研究方法的超越,也蘊含著社會學想像力的回歸。

    關鍵詞:質性研究/ 量化分析/ 大數據/ 方法論/ 社會學想像力/

    作者簡介:石英,陝西省社會科學院研究員,西安 710065

 

  社會學研究一向有定量、質性之爭,這兩種源於不同範式傳統的方法之爭,近些年似乎有分出高下的意味來。定量佔據主流及有意識地搶佔主流位置,質性研究方法在各方面似乎都顯現出弱勢。①如何看待不同的研究方法取向,尤其是能否理清社會學質性研究方法、傳統量化分析方法和正在興起的大數據方法之間的關係糾葛,對於未來研究當有借鑑。

  一、方法之爭及其範式起源

  討論不同方法的差異,有必要追溯學科發展的歷史起源及其傳統。社會學和人類學可以算是最相近的學科,就其早期形成的各自研究對象和領域而言,社會學研究工業社會、現代社會,人類學研究傳統社會、遊牧社會、「土著」社會。西方社會學的誕生與現代化、工業化的進展息息相關,社會學的創始人孔德一開始就將社會學置於以數學為基礎的自然科學大廈之最頂層,並將其命名為「社會物理學」(sociophysics),確立了實證主義、科學主義的方法導向。②而西方人類學的興起深受達爾文進化論的影響,與當時航海探險、殖民擴張的熱潮分不開。早期人類學者主要由航海家、旅行家、傳教士、商人等構成,以「他者」身份對「遠方的」原始部落、少數民族的異質文化開展考察,逐漸形成了人文主義、自然主義的方法特色。

  科學主義範式的社會學自誕生起就以自然科學為樣板,借鑑和遵循近代自然科學認知原理和方法論原則,逐步形成了一整套成熟的量化分析研究方法。最具代表性的是建立在統計學意義上的問卷調查研究,包括理論假設、調查設計、資料收集、量表測量、信度效度檢驗、統計分析等環節,一般通過人為控制和區分自變量、因變量,運用回歸分析等統計學方法,確定相關性,判斷因果關係,建構數學模型。這一過程中,重要的步驟之一是概念的操作化,也就是根據研究需要把概念變為一套可測量的、能夠用數字表述的信息。譬如用五分制量表測量人們的滿意度;將幸福感分解為主觀指標和客觀指標進行測量,以建構「幸福指數」。

  隨著大數據時代的到來,為區分起見,也有人把這種大多來源於抽樣調查、訪談、行政記錄和實驗設計等傳統統計方法的數據稱為「小數據」,把傳統的量化分析方法稱為「小數據」方法。一般來說「小數據」體積小、易於快速理解、數據的讀取分析和處理都相對簡單。③而大數據指「無法在可容忍的時間內用傳統IT技術和軟硬體工具對其進行感知、獲取、管理、處理和服務的數據集合」。數據科學家將大數據的特點總結為4個V:Volume、Variety、Velocity、Value,即體量浩大、模態繁多、生成快速、價值巨大但密度很低。具體到量級,大數據的量級已從GB到TB再到PB級,甚至開始以EB和ZB來計數。④

  質性研究方法包括參與觀察、個案研究、深度訪談、焦點小組法、民族志(人種志)方法、紮根理論、敘事研究、行動研究等一整套方法體系。質性研究方法從起源上可以追溯到15、16世紀的人類學研究,但作為一種系統的方法體系得到歸納總結,是直到20世紀70年代的事情。到20世紀初,社會工作領域興起的個案小組實務中,質性研究方法的應用被拓展到心理學、教育學領域;20世紀中葉,西方社會科學領域開始湧現各種「後現代」理論和思潮。社會學理論也從邏輯實證主義轉向闡釋和批判主義,社會學領域出現對量化研究的「反抗」思潮,這些思潮也影響、促成了質性研究方法的成熟。

  雖然量化研究方法源自西方的科學主義範式,同樣也是西方思潮產物的質性研究方法卻可以在古老的東方思維中找到哲學基礎。中國古代的自然哲學是以「天人合一」的整體觀和「陰陽對立統一」的辯證觀為基點的。以中華文化為代表的東方文化思維方式著眼整體思維,注重辯證思維,擅長關聯思維,習慣類比思維,突出直覺思維。20世紀初社會學、人類學傳入中國,中國最早的社會學家多從事人類學、民族學研究,如吳文藻、潘光旦等,早期社會學研究主要使用的方法之一也是基於人類學田野工作的質性研究方法。到1979年中國社會學恢復重建,在研究方法體系上則主要引進了美國的社會學量化分析方法,科學主義範式在中國社會學研究領域成為絕對主流。20世紀90年代中期,帶有西方「後現代」色彩的質性研究方法被介紹到中國,某種程度上與中國傳統文化思維方式內在契合,也喚起了中國早期社會學所形成的人文主義傳統。

  隨著我國社會學學科建設由恢復重建伊始的「拿來主義」到本土化中國化的探索越來越深入,源自不同傳統的質性研究方法和量化分析方法的分離和對立逐漸顯現且愈演愈烈。學界對兩種方法孰優孰劣以及「代表性」、「科學性」等問題莫衷一是。大數據時代的到來,為社會學研究打開了一扇新的窗戶,同時也為原本的方法之爭更添紛擾。⑤有觀點認為,大數據可能引發一場社會科學革命,⑥另有觀點則認為,大數據面臨著諸多挑戰。⑦人們擔憂,大數據的出現有可能把質性方法和量化方法「兩張皮」進一步撕裂為「三張皮」。在此背景下,也有學者認為「方法主義是今日學界危機的根源」,呼籲「破除方法主義迷信」。⑧

  應當看到,學術論爭、學派林立恰好是學科繁榮發展的表現,是學科走向成熟過程的必然。方法論爭源自「與生俱來」的不同研究傳統,面向未來也需要進一步探究其發展趨勢。

  二、工具演進、機器依賴及對象變遷

  從時間序列看,人類學方法的形成要稍早於社會學。質性研究方法雖然直到20世紀70年代才形成普遍認同的方法體系,但其實際的社會學應用卻要早於傳統量化分析方法。大數據方法的出現,則是直到今天才剛剛開始。因此按照出現時間的早晚,可以粗略地把社會學研究方法的發展脈絡歸納為「質性研究方法—傳統量化分析方法—大數據方法」。可以看到,這是一個由「純人工」到「機器」參與介入研究越來越多的過程。

  具有鮮明人類學田野色彩的質性研究方法,強調參與、體驗、感悟、在場、情景,設身處地、將心比心,依賴於直覺、聯想、類比、領悟。要求置身於現實的社會群體生活空間,研究人們的社會活動及社會關係。其研究特點決定了質性研究方法主要是基於人工的個體勞動,很大程度上依靠人腦的直覺。即使發展到現在,口述史、影像志、深度訪談等引入了現代錄音錄像設備、計算機編輯處理工具,人的「參與」、「在場」仍然是質性方法的基本要求和靈魂。

  傳統量化分析方法一開始也是「全人工」收集人們特定的社會活動及社會關係的數據,並進行分析和處理的過程。早期問卷調查基本是純手工操作,隨著計算機和信息技術的發展,機器編碼識別、統計分析軟體把過去複雜的統計計算變得輕而易舉,傳統量化研究逐漸由以人工為主過渡到機器參與成分越來越多。但是,現代社會大型調查研究即使計算機全程參與,也必須以研究者主觀設計、人為主觀賦值編碼為前提。也就是說,傳統量化分析方法始終是以人工為主,機器處理作為輔助手段的研究方法。

  大數據方法則依託於人類「數位化生存」的時代背景。正是雲計算、雲存儲、物聯網、二維碼、傳感器、GPS等網際網路技術的廣泛應用,微信微博新媒體的大規模使用,以及手機網絡支付手段的更加便捷化,人類社會的各種社交網絡、人際互動、經濟活動都被客觀記錄下來,留下「數字痕跡」,形成海量的大數據。正是由於數據量大到無法由傳統軟硬體處理,且數據具有多樣化的結構特徵,所以大數據的獲取不再是通過人工採集得來,而是由「機器爬梳」而來。大數據方法主要是通過機器學習,運用適當的算法,對數據自動進行學習,識別事物間的關聯性和規律。當然,數據爬梳、分析的背後也有「人」,但這裡的人已由臺前退居幕後,機器承擔了大量繁重的工作。

  從質性研究到傳統量化分析方法再到大數據方法,工具的變化某種程度上見證了研究對象——社會本體的變遷。從微觀層級的個體行動、人際互動,到宏大的社會系統或結構等,在不同的社會形態下有著不同的特徵。質性研究源自「田野」的方法無疑帶有濃厚的傳統社會印記;傳統量化分析對應著的是現代社會,如果說這兩種方法主要研究現實社會,大數據方法則顯然是網際網路時代信息社會的產物。在網絡愈益發達的今天,人們在網絡上的行為與現實行為具有越來越多的同一性,網絡上的個人、群體間的互動與行為,以及網絡上的組織結構都已經影響到現實社會,對人們的生產方式、生活方式、行為方式的影響之大前所未有。譬如手機及其他即時交流工具成為個人與社會交流交往的基本中介橋梁,隨之帶來了社會關係的變化;人工智慧改變了人類生產方式、生活方式,引發了職業分化的加速;物聯網、眾籌經濟正在促生新的社會價值觀;等等。這些都意味著傳統的社會關係、社會結構已經發生且仍在發生著深刻的變化。社會本體發生了改變,對於這些關係、行為、結構變化所形成的大數據進行研究,就具有現實重要性。從這一角度而言,大數據研究對於社會學的本體論意義大於方法論意義。

相關焦點

  • 現象學、民族志與個案研究:社會學的質性研究方法
    原創 理論志編輯部 Political理論志 本篇文章主要介紹社會學的質性研究方法,主要分為質性研究的起源和質性研究的主要研究方法兩個部分。在質性研究方法中,主要介紹常用的三種研究方法,分別是:現象學(phenomenology)、民族志(ethnography)以及個案研究(case study)。最後,筆者為大家附上了幾本基於質性研究方法的社會學書籍推薦。
  • 定量研究方法和質性研究方法的區別何在?
    研究方法作為知識生產的工具,其實跟背後的本體論是有很大的關係。我們完全可以不關注研究方法背後的本體論。很多人認為不需要關注,但是如果不關注的話,會導致研究方法的使用上會有很大的一個誤差。那麼定量研究方法和質性研究方法的區別何在?表面上看,一個是用數學,一個不用數學。
  • 質性研究的特點
    質性研究的本質特點在於其研究方法和理論相對於其研究對象的合適性,重視和分析不同的視角以及把研究者對研究的反思作為認知活動的一個組成部分。 方法和理論對於研究對象的適合性        不同學科都發展了各自的標準方法,這也是為了將自己區別於其他學科——比如說作為心理學核心研究方法實驗或者社會學中的問卷調查。
  • 當班主任與質性研究相遇
    7月10日,在北京小學大興分校報告廳舉辦的第二期教育質性研究工作坊學習成果研討會上,顧國銀的一個問題引起在座30多位班主任的共鳴。通過採用質性研究中的紮根理論,顧國銀完美地解決了這個難題。通過系統的資料收集和分析程序而被發現的理論被稱為紮根理論。
  • 開營日誌第七篇 | 王寧教授:窮究於理,成就於質——質性研究抽樣與...
    黎耀奇老師在第五屆博士訓練營第七課上主持二精彩內容質性研究VS定量研究質性研究與定量研究方法有很大不同,與定量研究的數學方法相較而言,質性研究方法往往給人不夠嚴謹的錯覺。那麼,質性研究方法是如何形成的呢?二者本質的區別是什麼?哲學科班出身的王教授一語點破:它們的哲學觀點不同。
  • 中國企業管理案例與質性研究論壇(2012)召開
    最後徐教授強調關愛研究需要勇氣,激勵大家做「讓社會和世界更好」的研究。第二場主題報告由美國羅格斯大學(Rutgers University)的華人學者、IACMR現任主席陳昭全教授為與會嘉賓介紹了質性研究的一種數據分析方法——內容分析法(Content Analysis)。陳教授在簡要介紹質性研究的優缺點以及與定量研究的差異之後,重點介紹了兩類基本的內容分析方法。
  • 清華公管:質性薈萃分析方法博士生學術訓練營成功舉辦
    維拉梅爾-託馬斯講授質性薈萃分析方法維拉梅爾-託馬斯主要從事灌溉和水管理、氣候變化適應性管理、公共池塘資源管理的溝通與信息、水-食物-能源連結、多中心治理、對話公共池塘資源理論和社會運動理論等領域的研究
  • 學堂在線《質性研究方法》課程學習筆記(五)
    質性研究方法中常用訪談法來搜集資料,為什麼要進行訪談?訪談方法又分為哪些種類?進行訪談需要哪些準備與步驟?訪談有哪些需要把握的標準與注意的問題?為什麼要訪談?質性訪談有一個假定,就是認為對他人的關照是有意義的,也是可知的。開放式訪談的目的,是去接近受訪者的觀照,找到一些我們無法直接觀察到的事件。
  • |質性研究資料分析
    責編 | 皮卡魚作者 | 大冉研究資料已經收集、整理好了(見護理研究——質性研究<4>資料整理(2)),咋進行深入分析呢?怎麼從大量的資料中提煉出來研究的主題呢?不同的研究方法,使用什麼分析方法呢?資料的分析方法與質性研究方法不同。
  • 從外語核心期刊看國內英語教學研究方法的新進展 ——以《外語教學與研究》和《外語界》為例
    具體研究問題包括:(1)樣本論文在不同研究主題上的分布情況如何?(2)樣本論文在量性、質性、質性與量性結合三類研究上的分布情況如何?(3)樣本論文在研究工具和數據處理上有何特點?同時使用了質性與量性方法的157篇論文都用相關程序(如SPSS)對數據進行了量化分析(t檢驗、F檢驗、結構方程模型、卡方檢驗,因子分析、方差分析、描述性統計、信度效度分析、ANOVA分析和回歸分析等),在此基礎上完成研究報告、得出結論。
  • 大數據環境下,輿情研究方法如何迭代?
    原標題:大數據環境下,輿情研究方法如何迭代? 編者按 傳統輿情是基於簡單信息的搜集整理工作。但數字時代數據量巨大、冗餘信息繁雜。在信息和數據形式不斷更新的情況下,輿情研究方法同樣需要迭代。當下,輿情研究方法存在哪些問題?複雜的數據環境對研究方法又提出了哪些新要求?一起來看。
  • 哪種方法治療間質性肺炎效果好呢?
    核心提示:間質性肺炎的治療方法。由於很多患者對於間質性肺炎這種疾病並不了解,所以一旦診斷出患病會很茫然,不知道怎麼辦。間質性肺炎是指肺泡間質出現了無菌性改變,它不會造成患者的急促死亡,但是不積極救治的話,引發肺纖維化等病,是會危及到生命的。因此了解此病並且積極的防治,是非常有必要的。那麼,如何治療間質性肺炎?哪種方法治療間質性肺炎效果好呢?北京政和中醫院呼吸科專家為我們講解。
  • 問答| 一致性藥物評價參與病例是否存在同質性?
    問答 | 一致性藥物評價參與病例是否存在同質性?問1.一致性藥物評價參與病例是否存在同質性?臨床研究結局指標要做到完全同質非常困難,研究中可以做到的往往是相對同質。
  • 第四屆全國間質性肺疾病學術會議紀要
    大會共收到論文154篇,來自全國各地的500多位代表參加了會議,10位在間質病研究方面頗有造詣的專家就各類瀰漫性間質性肺疾病的基礎和臨床研究做了精彩報告。 1. 與會專家就近年國內間質性肺疾病的前沿研究進展作了深人交流和探討,內容涵蓋間質性肺疾病的發病機制、診斷技術、治療及預後評價等方面。
  • 16種常用的數據分析方法-回歸分析
    通過進一步的研究發現:子輩的平均身高是其父輩平均身高以及他們所處族群平均身高的加權平均和。 伴隨著這一著名發現,「回歸」一詞首次被提出。 論文中把「回歸」現象稱為:均值回歸或者平庸回歸(reversion to the mean/reversion to mediocrity)。
  • 社會科學研究方法大梳理!
    | 質性研究一種在社會科學及教育學領域常使用的研究方法,通常是相對量化研究而言。質性研究實際上並不是一種方法,而是許多不同研究方法的統稱,由於他們都不屬於量化研究,被歸成同一類探討。其中包含但不限於民族志研究,人類學研究,論述分析,訪談研究等。
  • 肺癌合併間質性肺炎藥物治療研究進展
    張偉中醫大講堂∣一個有 溫度 的公眾號 間質性肺病(interstitial lung disease,ILD)是一種呼吸功能進行性惡化的疾病。在肺癌合併間質性肺病(lung cancer associated with ILD,LC-ILD)患者中,各種抗癌治療都可能誘導ILD的急性加重(AE-ILD)的發生。雖然合併ILD的早期肺癌患者可以通過手術進行治療,但術後有AE-ILD的風險。鑑於放療在LC-ILD患者中有著較高的急性加重風險,這類患者應避免使用局部放療。
  • 新型生物標誌物有助於診斷急性間質性腎炎
    一急性間質性腎炎是一種以腎小管出現炎症和腫脹為特徵的疾病。腎小管是腎臟中過濾血液的微小的門靜脈系統。當患上急性間質性腎炎時,腎小管不能正常地重吸收水和有用的有機物質,例如葡萄糖和胺基酸,或者不能將尿素和肌酸酐等廢物排出到尿液中。
  • 被深圳、重慶超越後,廣州如何回歸?
    2019年日均到發旅客51.8萬人次,最高日突破75.3萬人次,1至12月發送旅客1.49億人次,一年可搬空10座廣州城(2018年末廣州市常住人口1490.44萬人),54秒就可接發一列高鐵列車。除了在擁擠地鐵線路方面,廣州力壓京滬外,在周末與節假日的客流量方面,廣州同樣超越京滬。這種工作日不如京滬,休息日超越京滬的地鐵流量,和廣州仍然是一個強中心城市的結構有直接關係。
  • 紮根理論的起源、流派與一般性方法
    而Glaser則深受哥倫比亞大學量化研究權威拉扎斯菲爾德的影響,將量化分析的方法融人到紮根理論研究中,使得紮根理論的研究過程具有可追溯性,研究程序具有可重複性,研究結論具有可驗證性。這在一定程度上克服了傳統質性研究與量化研究之間的分歧,樹立了質性研究與量化研究相結合的典範,並最終使得紮根理論成為完整的方法論體系。