大數據時代的社會科學研究新範式

2020-12-12 中國社會科學網

大數據技術體系為推動社會科學借鑑自然科學成果、形成基於數據驅動的社會科學研究新範式提供有力支撐。

不同於自然科學,社會科學以人類社會現象為研究對象,其傳統研究範式在認知準確性方面飽受爭議。然而,大數據時代的到來為彌補這一缺陷提供了潛在的解決方案。隨著全球新一輪科技革命與產業變革的加速演進,數據來源、數據處理以及數據分析等數據相關技術發展迅速,特別是以統計學習、機器學習、深度學習乃至更為廣泛意義的人工智慧為代表的數據分析手段,正在帶來新的認知方式,為形成數據驅動的社會科學研究新範式提供有力支撐。

大數據概念特徵及內涵

大數據(Big Data)最早出現於2010年2月英國《經濟學人》雜誌有關信息管理的一篇專題報導。2011年5月,麥肯錫環球研究院在一份題為「大數據:下一個創新、競爭和生產力前沿」的報告中,將大數據定義為「大小超出常規資料庫工具獲取、存儲、管理和分析能力的數據集」。時下較流行的大數據定義是,需要新處理模式才能具有更強的決策力、洞察力和流程優化能力的海量、高增長率和多樣化的信息資產。在維克託·邁爾·舍恩伯格的《大數據時代》一書中,大數據技術被描述為:不再基於傳統隨機分析法,而採用所有數據進行分析的處理模式。海量性(Volume)、實時性(Velocity)、多樣性(Variety)和有效性(Volatility)成為大數據的典型特徵。這也是大數據定義中被廣為接受的3V、4V或nV。此外,大數據技術還包括數據收集(生產)、數據存儲、數據處理、數據分析及展示等各環節所需的專業知識和技能。這些多學科、跨學科交叉的知識技能集成在一起,共同構成大數據技術體系(或「數據科學」)。

自大數據概念被首次提出後,這一技術已在精準營銷、信息安全、智能製造、語義識別、文本分析等眾多領域的應用中取得豐碩成果。然而,社會科學領域的大數據應用更多停留在概念和模式複製階段。即便如此,學者們普遍認為,大數據的興起為社會科學學科體系的重構和研究範式的改變帶來新機遇。

有效應對人類社會複雜適應性

事實上,大數據及圍繞大數據利用形成的大數據技術體系,為有效應對人類社會活動的複雜適應性特徵提供了技術可行性,從而為推動社會科學借鑑自然科學成果、形成基於數據驅動的社會科學研究新範式提供有力支撐。

其一,大數據技術有助於對社會科學現象進行系統性掃描。傳統社會科學研究受限於資料收集、信息傳遞以及知識獲取的技術性因素,往往不可能對社會現象的全貌進行系統性定位和描述。其二,大數據技術有助於對社會問題進行動態跟蹤。社會科學問題往往具有實時性和演化性特徵,傳統研究方法難以對促使事物轉化的諸多內外因素進行實時跟蹤和反饋,在時間上滯後於事件的衍生和發展進程。其三,大數據技術有助於對事物發生發展的本質動因和多元影響因素進行系統解析。基於顯著性變量設定的傳統研究方法,在技術上無法對影響社會現象的全體要素進行資料收集和計算處理,被忽略要素的顯著影響、顯性突變或累積躍遷效應,可能導致研究結果的重大偏差。其四,大數據技術有助於趨近總體數據。傳統研究方法往往通過主觀判斷或科學抽樣對資料的代表性和誤差因素進行控制,在此基礎上構建量化描述、假設檢驗、參數估計等一系列方法體系。而大數據的總體逼近特徵不僅是對數據資源的擴展,其理論基礎和技術構架更為社會科學發展提供了結構性變革的可能性。

扭轉對於大數據的認知偏差

當前的大數據理論和大數據技術與為社會科學複雜適應性提供解決方案的目標仍有較大距離,具體存在以下主要障礙。第一,大數據名稱本身具有一定的誤導性。強調數據之「大」是大數據技術的首要內涵。然而,由於存儲和計算能力的大幅提升,數據收集已成為無明確目標的被動過程。這使得資料的價值密度呈指數化衰減,冗餘數據的處理成本不斷飆升,客觀上形成重數量、輕質量的現實缺陷。第二,大數據的有偏性和非一致性。大數據技術針對特定目標被收集起來的「一手」資料,仍然存在「選擇性偏差」。被動性收集的數據資料使得大數據技術僅能觀測和收集行為發生者的信息。因此,無法保證數據的無偏性和一致性。第三,重技術開發輕問題解決的傾向。大數據技術始於資料的收集、存儲、傳輸和計算,目前的應用也多在這些領域,更多集中於大數據技術開發,而非真正應用大數據解決實際問題。社會科學研究的本質是以問題為導向,應基於現實問題選擇恰當的數據和方法,而非生搬硬套大數據解決方案。第四,重微觀層面的精準定位,輕宏觀層面的總量。大數據在商業營銷領域的成果,使得人們更多地利用大數據對微觀個體進行精準定位、狀態識別和行為預測,而社會科學的核心仍是對社會現象的解析,必須打通微觀基礎與宏觀現實之間的邏輯關聯和傳導機制。第五,過分強調關係發現,輕視因果分析。這也是制約大數據技術發揮有效作用的關鍵問題。這一技術極大提升了收集資料的維度和深度,使得人們可以真正從全局和動態演化的視角審視社會現象和社會問題。但它排斥傳統研究基於因果關係建立的研究體系,試圖越過事物的作用機理而尋求社會現象認知的解決方案。因此,如果大數據技術不能扭轉偏差的認知模式,就很難在社會科學領域取得突破性進展。

推動社會科學研究智能化

總體而言,大數據時代的到來為社會科學發展提供了一個重要契機。社會科學研究有望突破傳統社會調查方法以及數理模型、推論統計和計量建模等傳統量化技術的限制。然而,社會科學發展不應該也不會完全局限於當前大數據概念的界定和技術限定。基於社會理論與社會現實問題,主動挖掘多元基礎數據,搭建社會主體間的聯繫網絡,充分利用人機結合的綜合集成模式,溯源社會現象的本源和邏輯傳導機制,從而對社會科學研究對象進行精準量化的結構解析和預測推演,使之成為社會科學未來發展的重要途徑之一,即數據驅動的社會科學研究新範式。

新範式為突破傳統社會科學研究被動尋找經驗證據的實證方法、建立搭載在數據資源基礎上的主動量化提供新的途徑。問題導向、數據出發、機制溯源、綜合集成、量化計算將是數據驅動的社會科學研究範式的基礎特徵。未來,社會科學研究範式將面臨重大變革,但並不會違背自身的學術本源;更多地應用大數據技術,但不會摒棄建立在定量統計方法上的經驗研究基礎;不斷深入而精準地刻畫微觀個體的行為和狀態,但不會忽略宏觀總量特徵和微觀—宏觀一體化的研究途徑;主要採用數據計算和模擬實驗的科學方法,但仍以人類智慧和專業經驗為指導。在上述基礎上,社會科學將從數據實證應用的研究範式逐步向數據驅動的研究範式轉變。

數據作為現代社會科學研究的基礎性支撐,不論是多源非結構化大數據還是統計抽樣數據,其核心都是解決與社會發展要求相匹配的現實問題。因此,未來有必要重點關注以下問題。

首先,建立科學的數據資源評估體系。大數據收集模式的創新並不能完全消除數據樣本的有偏或非一致。建立在大數定律和中心極限定理之上的科學抽樣方法,未來仍有著無可替代的適用性。因此,當前的首要任務應以社會問題為導向,建立較為系統的數據資源(質量)評價理論和評價方法,針對全域、多元、實時的非結構數據提出有效性判定標準,同時關注數據科學的倫理問題研究。

其次,解決大數據級別的總量累積問題。將微觀非結構數據科學系統地提煉匯總為不同層級的總量信息,是基於微觀大數據解構宏觀社會現象的基礎。數據信息的有效提煉在某種程度上也決定著大數據技術能否真正融入社會科學的研究體系。

再次,在數據分析基礎上提出解決方案。未來社會科學的發展應以多源數據為基礎,通過智能計算和專家智慧的結合,對社會現象進行量化解析,對社會問題提出科學治理體系和模式,最終建立社會科學「類工程化處置」的研究機制和範式。

最後,注重邏輯因果機制和機理的發現。大數據研究不能片面地關注相關性,更應注重對社會現象的本質動因進行發掘,科學回答「是什麼」「為什麼」的基本命題。因此,有必要利用多元化實時數據的關聯性優勢,準確釐清社會現象的因果機制,挖掘社會問題的邏輯機理,形成真正科學有效的治理方法和途徑,進而形成智能化的社會科學研究工具和平臺。

(本文系國家社科基金重點項目「數字經濟對中國經濟發展的影響研究」(18AZD006)、「綜合集成模擬實驗平臺的設計與構建研究」(18AJL006)階段性成果)

(作者單位:中國社會科學院數量經濟與技術經濟研究所)

來源: 作者:蔡躍洲 萬相昱

歡迎關注中國社會科學網微信公眾號 cssn_cn,獲取更多學術資訊。

相關焦點

  • 阿里雲:大數據時代比較教育研究範式的轉型
    吉姆·格雷這裡所謂的範式與庫恩的範式並不是同一個概念,他揭示的並不是科學研究的具體範式,而是一個時代科學研究的總體特徵。  (二)大數據時代科學研究的基本特徵  大數據作為科學研究的重要資源和動力,必然對科學研究產生深刻和深遠的影響,基於大數據的科學研究也呈現出區別於其他類型科學研究的一些特徵。  第一,科學研究的全樣本性。
  • 大數據應用於社會科學研究的價值與悖論
    隨著雲計算、物聯網、移動網際網路的廣泛應用,人類社會真正進入了大數據時代。通過大數據的運用,我們對人類社會獲得了更為廣泛和深入的認知,進而通過更為客觀和精確的方法,對人類社會進行更加科學和有效的探索和研究。大數據對當前社會科學研究產生了深刻的影響,使社會科學研究的視野和領域發生了革命性的變化。
  • 數據驅動教學:大數據時代教學範式的新走向
    摘 要:大數據時代的教學範式正在從經驗模仿和計算輔助教學走向數據驅動的教學。數據驅動教學的理論與實踐探索在全球範圍開始興起,國際動態主要體現在數據驅動教學相關計劃的啟動與實施、數據驅動教學相關會議的召開、數據驅動教學模式的研究與應用以及教師數據素養教育的開展等四個方面。
  • 新時代社科情報學研究的新挑戰、新舉措
    社科情報工作以自身所具有的科學性、服務性、社會性、政治性,在管理方式與組織模式上體現出特有的學科優勢與工作性質,在應對國家安全與大數據挑戰時,發揮著極為重要的作用,可以說社科情報研究及其工作正在進入一個新時代。
  • 大數據與人文社會科學研究的變革與創新
    原標題:大數據與人文社會科學研究的變革與創新 習近平總書記在談到如何繁榮發展中國特色哲學社會科學時,要求我們善於「運用網際網路和大數據技術,加強哲學社會科學圖書文獻、網絡、資料庫等基礎設施和信息化建設」,這為信息化時代的人文社會科學研究的方式變革與理論創新指出了正確的方向。大數據正在成為當前中國社會快速信息化的最重要表徵之一。
  • 探索新文科背景下循證社會科學新發展
    具體來看,主要包含四方面內容:一是循證醫學奠定了循證社會科學發展的理論淵源及基礎;二是學科發展從「單一學科」向「交叉學科」的演變趨勢助推了循證醫學和社會科學的交叉發展;三是數據密集型第四科學研究範式的到來為循證社會科學發展提供了堅實的大數據證據保障及驅動力;四是循證社會科學已經在科學決策、政府治理和智庫研究中得到重視及應用,學科價值在回應社會重大問題實踐層面得到了彰顯。
  • 藝術教育研究的新視野與新範式
    內容提要:大數據時代的到來,引發了教育的重大變革。  【基金項目】國家社會科學基金全國教育科學「十三五」規劃國家一般課題「基於可視化大數據分析的中小學中國畫教學評價體系建構研究」(BLA170231)的階段性成果。
  • 數據時代下,社會經濟發展的新範式及新機遇
    計算社會經濟學是指藉助人工智慧技術等現代科技手段,利用大數據、新方法來獲取並分析數據,從而研究與解釋經濟社會的一種新的範式。針對經濟社會各個領域的一些常見問題,比如: 衡量地區的經濟發展指標僅靠PPI、CPI、GDP這些宏觀指標就可以科學刻畫嗎? 生活的規律是成為學霸型人才的必要條件嗎?
  • 論文 | 陳雲松、吳曉剛、胡安寧、賀光燁、句國棟:社會預測:基於機器學習的研究新範式
    在此基礎上,本文從政策價值和學術價值歸納社會預測的學科意義,特別是充分呈現社會預測對於當代社會研究的主要貢獻領域和突破方向。同時,本文也對社會預測本身的範式價值進行討論:我們從方法論而非嚴格本體論的意義上主張,社會預測代表了社會科學研究一個新興的子範式。隨著大數據的出現以及計算機算力的不斷提升,機器學習的應用和社會預測的再定義將助推社會學定量研究乃至整個社會科學研究的範式突破。
  • 推進大數據、人工智慧等信息技術與人文社會科學研究深度融合
    新華社發  當代人文社會科學研究的新場景  ·大數據時代,從典型案例探析研究新動向      人文社會科學研究的真正價值源自於研究問題。把握人文社會科學研究的發展趨勢在於尋求研究問題的解決路徑。相同的研究問題可以從不同學科領域、不同角度以及不同側重點進行分析。在大數據時代,運用信息技術有助於人們更加深入透徹地了解人文社會科學研究中的新動向,例如,進一步跟蹤和關注以下具體研究問題。
  • 計算社會科學時代需要什麼教育學
    , 並即將進入一個「 計算社會科學時代」[1]。本文在探尋這些新範式、新理論、新技術的基礎上,主要圍繞教育活動、教育主體是否可以量化、是否可以進行數學化計算等問題進行哲學上的追問,並就計算教育學研究對象的設定、研究範式的選擇、研究結論的表達以及學科屬性等問題進行商榷,以期推進對這一研究的深入展開。
  • 新計算社會學:大數據時代的社會學研究
    新計算社會學:大數據時代的社會學研究 2016年04月05日 09:35 來源:《社會學研究》 作者:羅瑋 羅教講 字號 內容摘要:內容提要:本文在全面解讀、分析新計算社會學現有研究成果的基礎上
  • 讓教育研究範式在新的歷史起點上轉型
    在社會科學研究領域,也是如此。哲學研究範式的轉型,也會影響,甚至成為其它學科研究範式變革的先導。因為哲學範式總是時代思維方式的集中體現。進入新世紀以來,哲學界尤其是馬克思主義哲學研究,關於範式的創新與轉換問題已經成為一個前沿課題和熱點問題。目前,國內馬克思主義哲學研究主要有「文本考察」、「學理闡釋」、「現實引導」三種研究範式。
  • 以綜合集成方法論突破社會科學認知局限
    以大數據為核心支撐的新一輪科技革命,為社會科學研究提供了系統掃描、動態跟蹤、因果挖掘和總體逼近等技術突破的可能性,並可能引發社會科學研究範式的系統性、根本性變革;而變革的方向將可能更傾向於基於社會理論與社會現實問題,主動性地挖掘多元數據基礎,搭建社會主體間的聯繫網絡;更傾向於充分利用人機結合的綜合集成模式,溯及社會現象的本源和邏輯傳導機制,對社會科學研究對象進行精準量化的結構解析
  • 面向智能時代的教育社會實驗研究
    受益於新一代數字基礎設施的利用,教和學的數據激增。高性能計算、計算平臺和大數據分析技術的迅速發展為教學計算提供了技術基礎,促使智能時代的教育向數據驅動和個性化演進[16]。  新技術產生的改變不僅體現在教育的實踐層面,也對教育領域的研究帶來一些前所未有的挑戰。隨著信息化發展,當下世界的整體形態呈現出複雜性、易變性、不確定性、脆弱性等特徵[17]。
  • 探索定量社會學的新範式
    探索定量社會學的新範式 2017年11月15日 10:18 來源:中國社會科學網-中國社會科學報 作者:陳雲松 賀光燁 吳賽爾 字號 內容摘要:要走出雙重危機,在研究範式上,定量學人也應該有發展和突破
  • 宋萑:質性研究的範式屬性辨
    宋萑:質性研究的範式屬性辨 2018年12月10日 15:00 來源:《全球教育展望》 作者:宋萑 字號 關鍵詞:質性研究範式屬性;數據收集工具;經驗思辨;資料歸納;量化標準
  • 北大滙豐商學院線上研討會:大數據革命和經濟學研究範式
    本次研討會邀請發展中國家科學院院士、世界計量經濟學會會士、康奈爾大學經濟學與國際研究講席教授洪永淼主講,聚焦大數據革命和經濟學研究範式。研討會由上海交通大學安泰經濟與管理學院副教授許志偉主持。  北京大學深圳研究生院副院長、滙豐商學院副院長王鵬飛教授首先向參會者介紹了洪永淼教授。
  • 本土化與主體性:中國社會科學研究的方向
    實際上,當前中國社會學界反對的正是以美國定量研究為代表的西方社會科學研究方法對中國社會「不夠謹慎」甚至簡單粗暴的研究,反對的是一些研究缺少對中國數據「背後看不見卻有意義的背景知識和文化內涵」的理解。究竟是在社會科學一般意義上講範式,還是具體講研究範式,是有很大差異的。當前美國社會學與歐洲社會學的研究趣味和具體研究範式已有很大分殊,歐洲更重視定性研究和人文傳統,美國更重視定量研究。總體來講,西方社會科學已經建立了一個主要基於西方歷史文化宗教和經濟社會發展狀態的社會科學大廈。
  • 本土化與主體性:中國社會科學研究的方向
    實際上,當前中國社會學界反對的正是以美國定量研究為代表的西方社會科學研究方法對中國社會「不夠謹慎」甚至簡單粗暴的研究,反對的是一些研究缺少對中國數據「背後看不見卻有意義的背景知識和文化內涵」的理解。究竟是在社會科學一般意義上講範式,還是具體講研究範式,是有很大差異的。當前美國社會學與歐洲社會學的研究趣味和具體研究範式已有很大分殊,歐洲更重視定性研究和人文傳統,美國更重視定量研究。總體來講,西方社會科學已經建立了一個主要基於西方歷史文化宗教和經濟社會發展狀態的社會科學大廈。