作者:劉京臣(中國社會科學院文學研究所副研究員)
作為研究社會關係的一種實證研究方法,社會網絡分析(Social Network Analysis)已有近80年的歷史,近30年來逐漸成為人文社科研究的一種新範式。簡單地講,社會網絡分析主要關注兩點:一是點,即社會主體;二是由點連成的線,即社會主體間的關係。
「點」,主要指社會主體自身具有的諸如年齡、職業、性別、籍貫、教育程度等客觀信息,通常被視為「屬性數據」,是傳統統計學所關注的對象;「線」,即關係,指彼此因接觸、關聯而產生一種或多種聯繫,通常被視為「關係數據」(例如個體間的仰慕追求、商業間的貿易往來、職場中的層級以及親屬關係中的血緣姻親等)。社會網絡分析重點考察社會主體間的關係——因為關係並不屬於社會主體本身,而是依附主體間的聯繫、聯絡而存在。一旦聯繫、聯絡發生變化,關係也就會隨之發生動態變化。觀察關係,量化關係的變化,是社會網絡分析的目的之一。
社會網絡分析之前多應用於社會學、管理學、政治學、經濟學、神經科學、物理學、網絡輿情等領域,近年來開始有學者將其應用於文學研究領域。如嚴程博士《顧太清交遊網絡分析視野下「秋紅吟社」變遷考》藉助社會網絡分析來考察顧太清與沈善寶等十餘位詩友的往來詩作,將文獻中涉及的人物、時間和事件信息轉換成變動的人際網絡,並藉助Gephi軟體呈現出來;趙微博士《社會網絡分析與「〈大波〉三部曲」的人物功能》則對《大波》的兩種版本五部長篇小說文本中的人物關係與社會網絡進行了數據挖掘、中心性計算、可視化呈現與結果闡釋分析。這都是應用社會網絡分析古典文學與現代文學問題的有益嘗試。
眾所周知,社會網絡分析長於對「關係數據」進行計算與分析,在古代文史研究領域,目前最為知名的關係型資料庫首推由哈佛大學費正清中國研究中心與北京大學中國古代史研究中心等負責建設的「中國歷代人物傳記資料庫」(CBDB)。截至2017年8月,單機版共收錄中國歷代人物傳記資料417382條。CBDB旨在將計算機技術與人文社會科學研究相結合,系統性地對中國歷史上所有重要傳記資料進行數位化處理,提供檢視過去個體或群體生平的方法,為群體傳記學提供分析工具,同時也為社會網絡分析提供支撐。在CBDB看來,每一位被納入資料庫中的個體,都可以「視為被關係網絡界定且能夠被量化和分析的實體」,這樣,擁有41萬多條數據的CBDB自然成為對古典文學進行社會網絡分析研究的首選。
例如,目前CBDB共收錄了460位曾任職祠祿官的宋代士人,這些士人之間是否存有親屬、姻親關係,是否有師生關係,在職場上是否是上下級,是否存在官場奧援、薦舉保任抑或政治同盟、政治對抗等?如果不藉助現代技術手段,這些問題都難以在短時間內予以回答。現在,這些關係都可以依託CBDB「查詢社會網絡」功能統計出來。同時,CBDB還可對一些著述,例如墓誌、序跋、傳記、論說、書札等進行數據挖掘,除了梳理上述比較淺層的社會關係外,還可通過對文本的挖掘來梳理人物之間的社會關係。
在面對諸如明代江西進士群體、清代紹興姻親家族等大規模、長時段數據分析時,CBDB確實能夠提供數據支持。對一些個體或個案,CBDB處理起來更得心應手。我們擬分別選取唐代的韓愈與宋代的蘇軾為例,探討以CBDB為基礎的社會網絡分析應用與拓展。
錢基博、羅聯添、卞孝萱、張清華、劉真倫等先生對韓愈家族、師友、弟子等各類關係進行過考辨,為韓愈思想學術、文學創作、政治傾向等研究奠定了基礎。但以往研究呈現出來與韓愈相關的社會關係多是線性關係。通過CBDB來探索韓愈的社會關係,孫羽津博士發現,它不僅可以呈現孟郊、李翱、張籍、張徹、李漢等韓愈研究中的習見人物,也能呈現權德輿、獨孤鬱、宇文籍、房武等以往韓愈研究中未能深入或未被重視的各類人物,可以較為全面地勾勒出韓愈於貞元、元和之際的社會網絡,觸及諸如古文運動、儒學復興、永貞革新、牛李黨爭等一系列問題,或許可能成為新的學術生長點。
孫羽津還指出,以CBDB為代表的人物資料庫在現階段尚未實現窮盡式的數據挖掘,比如韓愈師承陸贄、歸登、殷侑及同年崔群、馮宿等信息尚闕如,而這些信息正是研究韓愈與貞元政治、中唐公羊學及與「龍虎榜」關係等問題的關鍵所在。對此,尚需不斷拓展文獻來源,特別是在五代兩宋時期的海量數據中挖掘、分析與韓愈相關的內容,將其進行分類、篩選,歸併到適合的關係脈絡中去,同時注重聯繫今人的各類考訂成果,以期整體性推進韓愈與中唐文學、思想、政治諸領域的研究。
同樣,關於蘇軾的社會關係,也有一些信息是CBDB尚未挖掘出來的。例如範祖禹曾在元祐五年正月十九日上《薦士劄子》,對蘇軾之剛正、才學極為賞識,據此劄子當增加一條範祖禹與蘇軾的聯繫。由於CBDB原始文獻有限,資源選取不夠全面,不能對傳主的生活軌跡進行全方位的梳理。同時,CBDB關係網絡的構建來自於文本中實體關係的提取,提取出來後獨立於文本存在,與文獻本身沒有形成映射關係。這就需要在CBDB的基礎上增加文獻來源。
我們可以充分利用關係型資料庫複雜的人、地、著作、時代、職官等交織的網絡關係,採用深度標引的方式,對碎片化後的文獻進行組織管理,從而實現人物生平事跡相關文獻的類聚、排比,組織形成立體交叉的知識網絡。簡單地講,就是利用大數據時代背景下的有指導分詞、無指導中文文本分析、文本挖掘等技術,構建以經典作家生平事跡為核心,映射、關聯具體文獻的關係型資料庫。
現階段,清華大學統計學研究中心自主研發的「基於統計學模型的無指導中文文本分析」技術,可以脫離先驗詞表的支撐,通過反覆計算學習,實現對古籍文本的詞語切分、專名提取,有相當準確率。同時,清華大學中國古典文獻研究中心已有的專名庫資源,可為統計學研究中心的文本挖掘提供一定的基礎,通過這種有指導與無指導相結合的方式,數據的處理將會更為便捷、準確、高效。相信有了這樣的技術支持,以CBDB為基礎,以清華大學統計學研究中心和清華大學中國古典文獻研究中心為依託,基於社會網絡分析的文本與人物研究將會取得新的進展。
《光明日報》( 2018年10月15日 13版)
[責任編輯:張悅鑫]