數字人文在古代文學研究中的初步實踐及學術意義

2020-12-13 中國社會科學網

  摘要:古代文學研究的資料離散和時空分離這兩大難題,人工較難解決。運用數字人文技術開發的文學編年地圖平臺,可實現瀏覽檢索、關聯生成、數據統計、時空定位和可視化呈現五大功能,為解決資料離散和時空分離兩大難題提供了可能。數字人文研究將改變古代文學資料查詢檢索方式,實現從電子文獻的分詞定位檢索到結構化資料庫的分類提取,從點狀檢索到網狀關聯,從逐條拷貝到分類打包;能把傳統的靜態文本變為可隨意組合的動態文本;能改變文學史的認知角度和方法,時間上細化文學史的時間粒度,空間上深化文學的空間層次。由數字人文激發的編年系地並重的理念,將改變作家年譜和文學編年史的書寫範式。數字人文技術,還可以自動對比識別作品間的互文關係,重建古代文學的歷史現場,提供古代文學閱讀欣賞的嶄新體驗。

  關鍵詞:數字人文 唐宋文學 編年地圖 結構化資料庫

  作者簡介:王兆鵬,中南民族大學文學與新聞傳播學院教授;邵大為,中南民族大學數字人文資源研究中心講師。(武漢 430074)

 

  數字人文(digital humanities)以多學科交叉的學術團隊為研究主體,以數據為基礎、平臺為支撐,運用數位技術方法來研究人文科學。近年來,數字人文在理論探討、應用研究、技術支持三個層面,取得了長足進步。而中國古代文學研究,以問題為導向,以內需為動力,積極運用數字人文技術方法來探索新途徑、拓展新空間,在平臺建設、文本分析、可視化研究方面,也取得可觀的實績。但中國古代文學的數字人文研究,目前還處在起步階段,倡導性呼籲、可行性論證和案例性分析較多,數字人文對古代文學研究究竟有什麼作用?能解決哪些傳統方法較難解決的問題?能在研究觀念上有什麼更新?尚未見系統思考和具體答案。我們數字人文資源研究團隊,在十多年的探索過程中,有一些甘苦和體會。茲以唐宋文學編年地圖平臺的實踐為中心,側重談談數字人文的地理信息系統和可視化技術在古代文學研究中的學術意義。

  一、實踐的目的:探討解決資料離散、時空分離的可能性

  古代文學研究,目前至少存在著資料離散和時空分離兩大難題,不藉助數字人文技術就較難突破和解決。

  文獻資料的離散,有「同類異處」和「異類分隔」兩種狀態。「同類異處」是指,同一專題、同一領域、同一學科的材料,往往分散在不同的文獻裡。紙本文獻如此,電子文獻亦然。加之載體和藏所的分散,同類同領域的文獻常常處在離散狀態。「異類分隔」,是知識分類造成的資料分離。由於人類知識的廣泛性、豐富性和複雜性,不同性質、不同領域的文獻資料總是分門別類收藏和存儲。比如,書寫梅花的文學作品,收藏在文學領域的總集、別集裡,而介紹梅花生物特性、栽培技術的知識,則在植物學著作裡。同一事物的相關文獻,因知識的分類不同,而隔絕在不同的知識領域。無論是「同類異處」還是「異類分隔」的文獻資料,人力都難以改變其離散狀態。

  古代文學研究的時空分離,體現在兩個層面。在觀念意識層面,是時間意識強烈,而空間意識淡薄。文學史研究,注重時間的變化進程,而忽視空間的離合分布;時間進程的描述多,作家活動、作品創作的地理空間分布的考察相對少。作家年譜、別集編年箋注和文學編年史之類的著作,注重時間編年而不注重空間系地,時間信息具體而空間信息模糊,時間感強而空間感弱。

  在實踐操作層面,受思維方式和紙本載體功能的限制,文學史和文學編年史的呈現,只能是單向呈現,而不能多向呈現。按照時間序列呈現文學史的發展歷程,就難以兼顧空間序列的分布和變化。如果按照空間序列來呈現各地文學圖景,又難以從時間序列上觀察和呈現一代文學的發展進程。簡言之,以時間為軸心,空間秩序就被割裂;以空間為軸心,時間的序列就被打斷。傳統的年譜著作和文學編年史,還有一個難以突破的障礙,就是無法超越時空的局限,只能呈現同一時空裡的作家活動和創作,而無法呈現不同時空中作家的活動和創作。在一本作家年譜裡,我們通常只能了解一個作家的活動,而難以了解同一時間裡多個作家在不同空間裡的活動。比如,我們從《杜甫年譜》知道,安史之亂前夕的天寶十三載(754),杜甫在長安,過著「朝扣富兒門,暮隨肥馬塵」的窘迫生活,但我們無法從《杜甫年譜》裡知道,這一年,李白在哪裡,岑參在哪裡,高適在哪裡,王維在哪裡。有時,我們知道一個作家在一個地方的活動狀況,而難以知曉更難以呈現不同時間裡不同作家在同一地方的活動情況。比如,我們知道,蘇軾曾謫居黃州五年,寫有《念奴嬌·赤壁懷古》和前後《赤壁賦》等名作,可在蘇軾之前和之後,哪些作家在黃州寓居過、寫有哪些作品,我們並不熟悉。蘇軾年譜,只包含蘇軾一生的活動情況,而不可能囊括蘇軾同代作家的活動詳情。《蘇軾年譜》可以告訴我們,蘇軾一生到過鳳翔、開封、杭州、密州、徐州、湖州、黃州、惠州、儋州等地,但不能告訴我們,在蘇軾生前和身後,還有哪些作家到過這些地方、寫有什麼作品。

  數字人文技術,怎樣解決資料離散和時空分離這兩大難題呢?運用數字人文技術開發的唐宋文學編年地圖平臺,就試圖實現文獻資料的集成化和文學編年史的時空一體化。

  唐宋文學編年地圖平臺,旨在集成性地囊括歷年來有關唐宋作家作品編年的成果信息,包括年譜、別集箋注、考訂論文等。要讓計算機能夠識別處理這些編年文獻資料,並在地圖中可視化呈現,需要經過數據建模、數據轉化、數據關聯和呈現三個階段。

  數據建模,是為數據挖掘、信息提取建立模板。而建立什麼樣的模板,取決於平臺的要素和功能。文學編年地圖平臺,包含時間、地點、人物(作家)、事件(活動和創作)、作品這五大要素,需要實現瀏覽檢索、關聯生成、數據統計、時空定位和可視化呈現這五大功能。不同要素只有形成一定的結構之後才能產生功能。因而,數據模板,需要圍繞時、地、人、事、文這五大要素來設計,使之成為關係型結構化資料庫。

  數據轉化,是根據數據模板,挖掘提取文獻資料中時間、地點、人物、事件和作品等有效信息,轉化為計算機系統可以識別、關聯和統計的數據。數據轉化,不是簡單機械地將來源文獻轉換為數據信息,而是從大量蕪雜的信息中進行挖掘提取。為保障底層數據的可靠性,首先要確保數據來源的可靠性,儘可能選擇那些獲得學界普遍認可的學術含量高的優質成果作為數據錄入的依據;其次要確保數據來源的真實性,要充分考慮文獻來源信息的規範性和完整性。由於來源文獻著述的目的不同,體例各異,難以滿足數據模板所需的各類信息,因而,數據錄入轉化時,需要補闕、正誤和標引,以提升數據的可靠性和完整性。

  補闕,主要補時和補地。補時,是補充來源文獻缺失的編年信息;補地,是增補來源文獻缺失或不詳的系地信息。正誤,主要訂正來源文獻的編年系地錯誤。

  古今年譜,考訂作家的生平行事和作品的編年系地,訛誤在所難免。比如,《黃庭堅年譜新編》載述,徽宗建中靖國元年(1101)春天,黃庭堅離蜀出川,沿長江東下。正月初離江安,過瀘州,三十日抵合江;二月三日,到達漢東(今湖北隨州);二月二十六日,到萬州;三月,至峽州。此行程不合常理。然年譜是依據黃庭堅《題校書圖後》所言:「建中靖國元年二月甲午,江西黃庭堅自戎州來,將下荊州,泊舟漢東市。」原來問題出在「漢東市」的理解和空間定位上。隨州,又名漢東郡,故宋人多用漢東指隨州,於是年譜作者很自然地想到這個漢東就是隨州,而沒有考慮到行程距離的可能性和空間的合理性。我們懷疑這個「漢東市」應是四川境內長江邊上的一個市鎮。經向年譜作者請教,作者在《大清一統志》裡查到江津縣西南一百五十裡的江邊有「漢東市」。重新確定「漢東市」在江津縣,黃庭堅的行程就豁然貫通。類似問題,在作家年譜和別集箋注中所在多有,因此數據錄入和覆核時,要時刻關注數據來源中有關作家作品所考時間的正確性和空間定位的合理性,否則容易出現編年系地數據的次生性錯誤,從而影響地圖定位的準確性。

  遇有異說,需取正棄誤。作家活動和作品編年,往往有不同的意見。或兩種年譜的編年結論相左,或年譜與別集箋注的看法不同。遇到這種情況,數據錄入或覆核時需要查找第三方文獻予以認定。比如,陸遊《送梁諫議》詩,《陸遊年譜》繫於紹興三十二年(1162)五月,《劍南詩稿校注》繫於是年冬。梁諫議,即梁仲敏,其請宮祠返裡的時間,李心傳《建炎以來系年要錄》有明確記載:「(紹興三十二年五月)丁未,右諫議大夫梁仲敏充敷文閣待制、提舉江州太平興國宮,從所請也。」因而《陸遊年譜》的系年更合理,數據覆核時依年譜訂正。

  標引,是對數據的性質、類型進行標註,以便計算機自動識別。客觀數據的標引,可以由計算機來操作,但主觀數據的標引,則需人力完成,至少需要人工幹預。由於大量的基礎數據還不完備,比如中國古代的人名庫、地名庫、官名庫、物名庫、篇名庫等還沒有完全建立,計算機無法自動比對識別原始文獻資料中哪些是人名、地名、官名、物名和篇名,也就難以全面系統地挖掘提取相關數據。而年譜、別集箋注、論文、編年史等來源文獻中有關作家活動和作品編年系地信息,不僅僅體現在專有名詞裡,也隱含在不同語境的語句裡,必須由人工來提取和標引。因此,數據的標引者、提取者和覆核者,必須是有中國古代文學專業背景的、熟悉中國歷史地理的專業人員,這樣才能保證所標引、提取數據的準確性和可靠性。

  數據關聯及呈現,是將各類數據進行融合,開發成關係型結構化資料庫。作家作品的數據通過編年和系地兩個屬性,可形成關聯數據。結合GIS(Geographic Information System,地理信息系統)地圖技術及軟體編程技術,將數據融合成一體,在地圖上按時間、地點、作家、作品等維度可視化呈現作家的活動行跡,既可按需展示某個時空局部的細節,又可縱橫概覽數百年的文學圖景。

  數據關聯融合後,文學編年地圖平臺就能可視化呈現作家行跡。既可以呈現一時一地一個作家一生的行跡,也可以展現不同時間多個地方多位作家的活動行跡。時空一體,在這裡得到初步實現。

  文學編年地圖平臺,按時間、地點、人物、事件、作品五個要素,將歷來分散的作家作品研究資料有機集成為資料庫,在一定程度上解決了文獻資料分散的難題,也在一定範圍內解決了時空分離的難題。時間和空間合而為一,時間被空間化,空間被地圖化。

  二、實踐的基礎:「系地」理念的發掘與確立

  數字人文技術在古代文學研究中的實踐,不單純是技術操作問題,而是需要古代文學研究觀念上的主動對接和雙向融合。二者的融合,是互補性的而不是替代性的。文學研究原本就有對接融合數字人文技術的學理基礎。就像一種植物能「嫁接」到另一種植物上,是由於二者具有相似或共同的機體機能。古代文學研究與數字人文技術能夠對接融合,是因為二者學理上具有共通性。只是這種共通性,長期沒有得到足夠的重視。

  以GIS技術為核心的數字人文,注重地理空間和人地關係。古代文學與數字人文結合的地圖平臺,想要在地圖上可視化呈現作家活動和文壇圖景,必須對作家活動和作品創作地點進行地理空間定位。這就需要古代文學研究,特別關注和落實人地關係,改變重時輕地的思維定式,確立時地並重、時空一體的觀念,以便文學研究與數字人文技術有效對接和深度融合。

  其實,時地並重、時空一體的觀念,早就存在於中國古代文學的創作和研究實踐中,只是沒有受到應有的重視。中唐時期,就已產生文學作品既編年又系地的意識。白居易贈元稹詩《十年三月三十日,別微之於灃上。十四年三月十一日夜,遇微之於峽中。停舟夷陵,三宿而別。言不盡者以詩終之。因賦七言十七韻以贈,且欲記所遇之地與相見之時,為他年會話張本也》,所言「記所遇之地與相見之時」,就體現出一種比較自覺的系地編年意識。記所遇之地,即系地;記相見之時,即編年,目的是作為人生歷程的記憶,「他年會話」時有所依憑。雖然他是就創作而言,但對後來作家年譜的編撰和詩文別集的編纂有著直接啟發和實質性影響。

  到了北宋,人們也意識到編輯詩文集應該編年又系地。蘇軾就有這樣的編年系地意識。元豐四年(1081),陳傳道為蘇軾編次《超然》《黃樓》二集,蘇軾回信時特地叮囑他,編詩集,不必分古體律詩,而應以時間為先後,「以日月次之,異日觀之,便是行記」。行記,即旅行日記。詩集按年月先後編次,多年之後,就可以當作行記來看。蘇軾雖然只是說按時間月日編次,但其中也隱含空間定位之意。因為詩人行跡所至,自然包含所至的地點區域,只是沒有特別強調系地而已。從詩集題作《超然集》《黃樓集》來看,實已隱含系地的意思。《超然集》當是輯錄蘇軾在密州時所作詩,而《黃樓集》是收錄在徐州所作詩。後來南宋楊萬裡自編詩集,分別題為《江湖集》《荊溪集》《西歸集》《南海集》《江西道院集》《朝天續集》等,一地一集,就是繼承蘇軾的依地分集法。在蘇軾的觀念裡,詩歌可以當作「行記」來閱讀,編年系地之後,能反映詩人特定階段的活動軌跡和心路歷程。這與白居易「欲記所遇之地與相見之時,為他年會話張本」的編年系地意識是一脈相承的。

  蘇軾早年自編《南行集》,其實已體現出這種意識。嘉祐四年己亥(1059),蘇軾將乃父和他兄弟倆在出蜀赴京途中寫的詩文編為《南行集》,其《南行前集敘》中既交代創作的時間和地點(己亥歲自蜀適楚的舟中),也具體記錄了結集的時間和地點(己亥歲十二月八日江陵驛),目的是「識一時之事」,以便「他日」能夠據此「尋繹」人生行跡。這與其後元豐四年所說詩集可當作「行記」的意識是一以貫之的。

  如果說蘇軾還只是隱隱然有編年系地的意識,那麼,賀鑄在整理編次自己的詩集時,就表現出明確而自覺的編年與系地並重的觀念。紹聖三年(1096),四十五歲的賀鑄「裒拾」平生所為詩歌自編成《慶湖遺老詩集》,特地為每首詩加上題注,標明創作時地,以記錄人生軌跡、留下生命印記。他在自序中強調:

  隨篇敘其歲月與所賦之地者,異時開卷,回想陳跡,喟然而嘆,莞爾而笑,猶足以起予狂也。

  「隨篇敘其歲月與所賦之地」,就是在每篇詩歌題下標註創作時間和地點,如《黃樓歌》題註:

  熙寧丁巳,河決白馬,東注齊宋之野。彭城南控呂梁,水匯城下,深二丈七尺。太守眉山蘇公軾先詔調禁旅,發公廩,完城堞,具舟楫,拯溺療飢,民不告病。增築子城之東門,樓冠其上,名之曰黃,取土勝水之義。樓成水退,因合宴以落。坐客三十人,皆文武知名士。明年春,蘇公移守吳興。是冬,謫居黃岡。後五年,轉徙汝海。餘因賦此以道徐人之思。甲子仲冬彭城作。

  詩作的時間、地點、緣由、背景,敘述得清清楚楚。賀鑄編詩集時「隨篇敘其歲月與所賦之地」與白居易「記所遇之地與相見之時」的觀念,也是一脈相承、前後呼應。

  到了南宋初,正式出現了為空間定位的「系地」概念。鄭樵就著有《集古系時錄》十卷、《系地錄》十一卷,首次將「系時」(編年)與「系地」並舉。陳振孫《直齋書錄解題》說此二書「大抵因《集古》之舊,詳考其時與地而系之,二書相為表裡」。鄭樵將歐陽修《集古錄》裡的金石目錄,分別按時間先後和地區分布編成《系時錄》《系地錄》二書,相互參證,體現出明確的編年與系地並重觀念。雖然鄭氏是編次金石目錄,但與詩文別集的編次是相通的。《系地錄》詳載前代石碑所存地點方位,便於讀者尋訪。這與蘇軾編詩文集時所說「將以識一時之事,為他日之所尋繹」的目的相近。

  中國古代文學文獻中蘊藏著比較豐富的編年系地並重的學理資源。然而,自北宋以來形成的作家年譜撰述觀念,卻忽略了系地。現存最早的中國古代作家年譜,是北宋神宗元豐七年呂大防所撰《杜工部年譜》和《韓吏部文公集年譜》。呂大防開宗明義地說:「予苦韓文杜詩之多誤,既讎正之,又各為年譜,以次第其出處之歲月,而略見其為文之時。則其歌時傷世幽憂切嘆之意,粲然可觀。」所謂「次第其出處之歲月」,是為作家事跡編年;「為文之時」,是為作品編年,並沒有考慮系地。南宋紹興五年,文安禮撰《柳文年譜》,也是說:「予以先生文集與唐史參考,為時年譜,庶可知其出處與夫作文之歲月,得以究其辭力之如何也。」關注的也是譜主的行事編年。雖然這些年譜並非完全忽視譜主活動的地點,但編年意識自覺強烈,系地意識比較淡薄。加之年譜作者大多不熟悉歷史地理,連翁方綱這樣的大學者,「於史學地理,實非所長」,以至所著《元遺山年譜》對元好問活動和創作的地理缺乏應有的系地考訂,並時有疏誤。一般學者對歷史地理就更加生疏。清代地理學家顧祖禹曾感慨:《大明一統志》一向稱為善本,然「於山川條列,又復割裂失倫,源流不備。夫以一代之全力,聚諸名臣為之討論,而所存僅僅若此。何怪今人學者語以封疆形勢,則惘惘莫知」。編撰一代地理志的學者對山川地理、封疆形勢尚且莫知其詳,那一般學者對地理的陌生就更不用說了。受知識結構的局限,多數年譜作者不免重編年而輕系地。

  在古代文學與數字人文初步結合,受地理信息系統的人地關係觀念衝擊和碰撞之後,我們更加強烈意識到時空並重、編年與系地並重在古代文學研究中的必要性和可能性,更加注意從中國古代文學傳統中發掘梳理出「系地」概念,確立編年系地並重的理念。

  有了編年系地並重的理念,我們在數據建模時,才能在實踐上將時間信息和空間地理信息放在同等重要的位置考量,注重挖掘提取來源文獻中的編年信息和系地信息。由於受重編年輕系地觀念的影響,年譜、別集箋注和相關考訂論文等來源文獻時常缺失系地信息,我們在數據挖掘時,就儘可能補充完善作家活動和作品系地信息,特別是作家的任職地、經行地、出生地和創作地信息。

  作家的任職地信息,過去的年譜,時常缺乏應有的交代和考訂。古人做官,如果是朝官,任職地自然是在京城;如果是在地方州縣做官,任職地當然就在本州本縣。久而久之,形成習慣,任職地可以默認職官所在地。但是,有些路級官司,如宋代的安撫司、常平司、提刑司、轉運司等治所,並不在同一地方。如南宋江南西路安撫司在隆興府(今江西南昌),而提刑司在贛州(今屬江西);南宋荊湖北路安撫司在江陵府(今湖北荊州),轉運司則在鄂州(今湖北武漢),而常平司在鼎州(今湖南常德)。後人所撰古代作家年譜,有時沒有註明這些官司所在地,挖掘提取這些信息數據時,就需要查詢有關文獻予以補充。

  作家的經行地信息,諸如途經的山村驛館、湖泊橋梁等非行政區劃地名,因查考不易,有些年譜時或闕如。如孝宗乾道八年(1172)五月,周必大在返鄉途中過鄔子湖,作有《過鄔子湖》詩。然鄔子湖在何州何縣地界,《周必大年譜》未予考證。而據周必大《文忠集》卷171《乾道壬辰南歸錄》的記載,知周必大同時經過鄔子寨,再檢《輿地紀勝》卷26:「鄔子寨,在進賢縣東北一百二十裡。徐師川嘗有《鄔子值風雨》詩云:『重湖浪四起,支川舟不行。急雨夜臥聽,顛風晝眠驚。』」據知鄔子湖在隆興府進賢縣(今屬江西),進而將《過鄔子湖》詩系地於進賢。

  作家的出生地信息,一般年譜都不太在意。有些作家的出生地,確實不可考,有些則是可考而未考。這需要利用相關文獻予以考明。比如北宋葛勝仲的出生地,《葛勝仲年譜》就闕而未考。因史無明載,原書作者沒有特別留意葛勝仲的出生地。現重新檢閱有關文獻,發現葛勝仲的出生地其實可考。葛勝仲之父葛書思進士及第前,居家鄉江陰(今屬江蘇),熙寧六年(1073)進士及第後,為侍養父母,也未曾出仕,居鄉養親。而葛勝仲是在乃父進士及第前一年出生,自當生於家鄉江陰。數據錄入時,便將葛勝仲出生地定位在江陰。

  作家的創作地信息,時或不詳。古人撰作家年譜,往往重作家活動編年,而輕作品編年系地。今人所撰年譜,也有這種情形。比如,趙效宣《李綱年譜長編》,注重譜主的活動編年,李綱的活動行止細化到每月每日,但對李綱作品的編年系地則不太在意。李綱《梁溪先生文集》中的詩文,基本上是按年編次,而《李綱年譜長編》就把李綱同一年所作詩文篇目編列在一起,至於每篇作品寫於何地、作於何月,不再細考。比如建炎二年(1128),李綱貶鄂州(今湖北武漢)居住。他從無錫梁溪出發,經江蘇宜興,過溧陽,歷安徽寧國,越歙縣,寓休寧,宿黟縣,至江西九江,登琵琶亭,訪陶淵明故居,過南康軍,越星子縣,上廬山,下德安,由武寧,出分寧,入湖北通城,寓崇陽。未到鄂州,就命移澧陽,於是經湖北蒲圻,趨湖南岳陽,渡洞庭湖,過華容,至澧州。沿途所作詩文,有一百多篇,《李綱年譜長編》原來只是列目一處,不分先後,不分地域。現廣泛查閱方志,可一一考證每篇詩文所涉地名的具體方位,結合譜主的交遊唱和,確定每篇詩文的寫作時日與地點,從而完整地呈現出李綱建炎二年的行程路線和創作歷程。

  只有全面細緻地為作家活動和創作進行空間定位的系地,文學編年地圖才能完整呈現作家的行跡和作品創作地的空間分布。地圖突顯的是空間,文學史注重的是時間,文學史與地圖融合,也就使時間與空間在文學編年地圖中實現立體的融合,使時間空間化,空間地圖化。借用清人顧祖禹的說法是:「以古今之方輿,衷之於史,即以古今之史,質之於方輿。史其方輿之嚮導乎,方輿其史之圖籍乎?」歷史與地理交相為用,時間與空間互為表裡。古代文學研究,既編年又系地,編年與系地並舉,作家活動創作的時間和空間地理信息雙重融合,中國文學的發展圖景得到完整立體的呈現,既可縱向觀察歷時性的文學發展進程,又可橫向了解共時性的文學地域分布。

  三、實踐的意義:更新古代文學研究的觀念和方法

  數字人文技術不僅可以解決以往文學研究中的具體問題,也可以促進古代文學研究更新觀念,改變方法,轉換範式。僅就文學編年地圖平臺的學術實踐而言,數字人文技術對於古代文學研究至少有五個方面的意義。

  其一,改變文獻資料的查詢方式 :從分詞檢索到分類獲取。

  數字人文技術的發展,將大大改變文獻檢索的理念和方法,目前通用的關鍵詞定位檢索將邁向智能化的主題檢索和語義檢索。文獻資料的分散狀態,可望逐步得到改善。同類異處的資料,將由同類聚合的方式解決;異類分隔的資料,用異類關聯的方式來解決。

  所謂「同類聚合」,是將相同或相近學科、領域的文獻資料進行集成式分類整理,開發成關係型結構化資料庫。不僅分散的資料能集成一處,而且能進行智能化檢索和統計分析。比如,正在建設的漢魏六朝文學編年地圖平臺,就力圖將漢魏六朝時期所有經史子集文獻、出土文獻及後世評論、研究文獻進行分門別類的集成式聚合,開發成關係型結構化文學資料庫。資料庫所收詩、賦、散文、小說等各體文學作品,都標引有寫作時間、地點、文體、分類等信息,可以檢索瀏覽、關聯生成、統計分析和可視化呈現。文學編年地圖平臺所含古代文學資料庫,旨在「同類聚合」,逐步解決「同類異處」的難題,也試圖通過「異類關聯」的方式,解決「異類分隔」的難題。

  所謂「異類關聯」,是指不同學科、不同領域的文獻資料,通過技術手段進行關聯。比如,要了解梅花的屬性和栽培技術,就可以通過文學編年地圖平臺的API接口,連結到其他平臺的生物學、植物學資料庫,搜羅並關聯到有關梅花的栽培技術、生物特性等文字信息和圖片音像文獻。如此,異類文獻也就變為同類文獻,可以隨時調用。

  數字人文技術,不僅能夠逐步解決文獻資料分散存儲的問題,還能根本改變資料檢索瀏覽方式:從分詞檢索到分類提取,從點狀檢索到網狀問題,從逐條拷貝到分類打包、一鍵下載。

  先說分類提取。以往的電子文獻檢索,都是按關鍵字詞定位檢索,檢索到的結果是零散的,需要逐條辨識後再下載拷貝。相較紙本文獻的查詢而言,這無疑是大大提高了效率,但一條條下載,還是相當費時費力。例如,我們在《文淵閣四庫全書》電子版中,以「(陶)淵明」為關鍵詞檢索 ,一次可以檢索到4404條結果。每條檢索結果,從打開查看原文到拷貝粘貼至自己的文檔裡,再添注每條文獻的來源版本信息,平均每條結果拷貝1分鐘,至少要耗費73個小時才能把4400多條結果全部拷貝下來。拷貝的這些資料,是零亂的,需要重新進行歸類整理。而關係型結構化文學資料庫,不僅可以按關鍵詞檢索瀏覽所需資料,更能分題分類檢索下載。比如,在文學資料庫裡查詢陶淵明的資料和數據,輸入名字後,可以一鍵下載全部與陶淵明有關的傳記史料、評論資料、接受資料、研究資料。因為資料庫已按人名將經史子集四部文獻和後世評論文獻、研究文獻資料分類提取並打包。以前需要數十小時才能獲得的電子文獻資料,今後數秒鐘就可以解決。

  再說網狀關聯。目前我們從電子文獻裡查閱到的資料,是各自孤立的一句話或一段話,是分散的知識點,彼此之間無法形成有機聯繫,也無法自動建立聯繫。而在關係型結構化文學資料庫裡,知識點可以相互關聯,建立1+N的關係,形成網狀結構。比如,輸入一個地名,可以查詢並關聯到與這個地名有關的人物、作品、事件,歷史上曾經在這個地方活動過的作家,在這個地方創作的作品和描寫這個地方的作品,都可以一次性呈現,無須一條條地下載拷貝。輸入一個作家名字,可以關聯他所有的生平傳記資料,他到過哪些地方,寫過哪些作品,哪些作家的作品提到他,當時和後世對他有哪些評論,有哪些研究成果,都可以分門別類、一目了然地呈現出來。輸入一篇作品名稱,不僅可以了解它的編年系地信息,還可以看到歷代有關它的評論,知悉後世有哪些和作、擬作或引用、化用。輸入一個官名,不僅可以知曉它的職掌、品級,還可以關聯出一個時代有哪些人做過這官職,再由人名關聯到相關事件、作品、地點。資料庫裡時間、地點、人名、篇名、官名、物名、事件可以任意組合,形成網狀知識結構。當下流行的檢索型文獻資源庫,隨著數字人文技術的發展,今後會逐漸轉型開發成關係型結構化的智能資料庫。

  其二,改變作品文本形態:從靜態固定到動態可變。

  紙質作品文本和通過紙質文本轉換的電子文獻,如《文淵閣四庫全書》電子版、《四部叢刊》電子版、《中國基本古籍庫》、中華書局《經典古籍庫》內的文獻,都是靜態固定、不可變動的。用數字人文技術,將作品文本開發成關係型結構化資料庫後,作品文本就轉換成能隨意組合的動態可變的文本。由於作品文本被有機分解成一個個的碎片化組件,諸如一個詞、一句話、一個段落或一篇完整的作品,用戶可以按照自己的需求進行個性化的重新編配,以便對作品進行分類比較研究。

  比如,關係型結構化的《全宋詞》資料庫,就可以按研究的需要進行不同角度的重編,可以分人、分時、分地、分調、分體、分題、分類來重編,而且是一鍵生成,同類作品瞬間就被編排一處。

  分人,是按詞人來分類重編。《全宋詞》原本是以詞人為中心,但詞人是按時間先後順序編排,而結構化的《全宋詞》資料庫,可以將同一群體、同一流派的詞人詞作編排在一起,比如將蘇辛派的詞人詞作編排一處,以便比較同一詞派內詞作詞藝詞心詞境的異同;還可以按詞人身份來編,如將宰相的詞作合編一處,狀元詞人的詞作匯為一類,以比較分析同類詞人詞作的異同。

  分時,是按時間來編排。可以將同一年或同一時段或同一季節所作詞編排一處,以便比較同一時段、季節內的詞作與詞人生活境遇、時代背景、地理環境的關聯性,看一年之內,哪個季節產出的作品最多,哪個季節寫的作品較少;不同季節的作品,季節感受和生命體驗有何不同。

  分地,是按地域來重編。如宋代詞人的籍貫,依照宋代的行政區劃,分路州縣三級,將各路州縣的作品編排在一起,便於了解各路州縣有哪些詞人詞作;也可以按今天的行政區劃,分省市縣三級地名編排,以了解各省市縣曾有哪些詞人詞作;還可以按詞作的創作地來分,將寫於同一地點的詞作編排在一起,看哪些地方產出的詞作較多,進而分析詞作內容與創作地的地理環境有何關係,是跟人文地理關係緊密還是跟自然地理關係更密切,同一地區的作品,是否有相近的地域特色,是否具有比較統一的情感基調或地理標誌。

  分調,是按詞調重編。將同一詞調的作品編排在一起,如將《浣溪沙》《水調歌頭》調的詞作彙編一處,以比較分析詞調的聲情,考察詞調的演變。

  分體,是按風格體式來編排。宋詞有福唐獨木橋體、花間體、白樂天體、南唐體、柳體、易安體、樵歌體、稼軒體、白石體等,將那些效仿某一體式的作品編列一起,便於比較其風格體式的特徵和形成衍變的過程。

  分題,是分主題、題材來重編。如將唱和詞、祝壽詞、懷古詞、詠物詞、情愛相思詞、田園鄉村詞、日常生活詞等編排在一起,以尋繹歸納同一主題詞作的藝術範式。

  總集型作品文本可以動態變化,研究型文本也可以動態變化。比如,紙本文學編年史,是單向一維的,只能按時間序列來呈現一個時代的文學活動和文壇面貌;作家個體的活動,被分散在不同的年度之中,看不到作家活動的連續性;每個地域的文學活動,也同樣被割裂和分散,不便了解一個地區文學場景的完整性。而資料庫形態的文學編年系地史,則是動態可變的,並且能在地圖上進行時空定位和可視化呈現。它的編排和呈現方式,既能以時間為軸心組合,也能以空間為軸心組合,還能以作者為軸心組合,至於分文體組合、分專題組合也比較方便。

  比如,以空間為軸心,可按行政區劃來排列,藉此了解全國各地有多少作家活動,哪個地方作家活動頻次較高。根據唐宋文學編年地圖平臺已錄入校定的數據統計,宋代開封府和臨安府兩地作家活動頻次最高,分別為13120人次和9170人次。這兩地原為北宋和南宋的都城,作家活動頻次最高,自在情理之中。而開封、臨安之外,作家活動人次較高的州府,依次是吉州(今江西吉安 ,3452人次)、建寧府(今福建建甌,1731人次)、潭州(今湖南長沙,1393人次)、建康(今江蘇南京,1078人次)、黃州(今湖北黃岡,1068人次)等地,就不免讓人感到意外。吉州、建寧、潭州、黃州等地,居然一度是文學重鎮,這跟哪些因素有關,是社會政治氣候造成,還是特定的地理環境、交通位置使然,值得深入探討。還可以按作品的空間類型來排列,如按作家的籍貫地、作家的活動地、作品的寫作地和作品的表現地點來排列,以比較分析哪些地方出產的作家較多,哪些地方來此活動的作家較多,靜態的文學版圖(佔籍地分布)和動態的文學版圖(活動地分布)有何異同,形成的原因何在。

  以時間為軸心的排列,是縱向歷時性的呈現;以空間為軸心的排列,是橫向共時性的呈現,二者構成縱橫交織、時空一體的文學圖景。陳寅恪曾提出:「苟今世之編著文學史者, 能盡取當時諸文人之作品, 考定時間先後、空間離合, 而總匯於一書, 如史家長編之所為, 則其間必有啟發, 而得以知當時諸文士之各竭其才智, 競造勝境,為不可及也。」陳先生所說的願景,如今初步變為現實。資料庫形態的《唐宋文學編年系地史》,既能呈現作家活動和創作的時間先後,也能顯示作家活動和創作的空間離合,多維立體地展現一代文學的發展圖景。傳統文學編年史的時空分離難題,在這裡得到破解。

  其三,改變文學史觀:從選擇性分析到整體性還原。

  數字人文,將從三個層面改變文學史觀念。

  一是從選擇性關注轉向整體性考察。傳統文學史和文學編年史,受紙本容量和價值觀念的雙重製約,總是選擇部分大作家、著名作家進入文學史場域,大量中小作家及其作品被忽略,只見少數作家的活動創作,看不到每個時期文壇的整體面貌。豐富繁茂的文學生態叢林,只剩下一些大樹和名貴樹種,文學原生態的多樣性、層次性、連續性、整體性被遮蔽割裂。

  而文學編年地圖平臺,力圖整體性呈現一個時代的文學場景。無論大作家小作家、不管是著名作家還是普通作家,只要有文學活動和創作,都一視同仁地呈現。每個作家進場、退場和在場的時間和空間,都完整無間斷地表述。每個時段每個地方的文學生態叢林,不僅挺拔著參天大樹,也點綴著各具生命情調的山花小草。大作家有大作家的意義,小作家有小作家的作用。究竟是大作家引領著小作家進步,還是小作家推動著大作家前行,只有對文壇的整體態勢進行深度分析後,才可能得出切近歷史真實的結論。

  文學生態圖景的整體性復原,目的是更細緻地觀察文學的發展進程。既可以從微觀角度,探討一個個經典作家是怎樣在高手如林的文學競技場中脫穎而出,也可以從宏觀角度探索一個時期的文學是怎樣逐步走向高峰狀態、又是怎樣從高峰狀態逐漸跌落低谷的,是什麼原因導致了高峰狀態的回落。比如,學界常以「詩國高潮」來描述盛唐詩壇,但盛唐詩壇是沿著怎樣的路線圖一步步走向詩國高潮的?什麼時候達到高潮,什麼時候退潮?當時公認的高峰狀態的標杆性詩人究竟是誰、標杆性作品又是哪些?至今沒有答案。

  這促使我們改變文學史觀念,從整體上考察盛唐詩壇發展的時間進程和空間格局的變化,而不僅僅是探討李白、杜甫、王維等少數幾位經典作家的經典化過程。把李白、杜甫作為盛唐詩壇的經典詩人、標杆詩人,這是後人的看法。盛唐人心目中的標杆性詩人究竟是哪幾位、標杆性詩歌作品究竟是哪幾篇?需要我們回到歷史現場進行動態的考察與還原。而這需要盛唐詩歌充分的編年系地數據作支撐。但目前文學編年地圖平臺的數據,受文獻來源的制約,還不足以全面反映盛唐詩壇的演進軌跡。這就需要我們做更多的基礎性文獻考訂工作,從而使文學編年系地數據更充分完備。充分完備的數據才能從時間維度全程展示文學的發展進程,從空間維度全景呈現文學的空間變化。文學史觀的變化,既能帶來理論視野的轉換,也會促進基礎研究的深入。

  二是從單向交往考察轉向複雜網絡建構。文學活動,不是孤立個體的行為,而是群體的互動。傳統的文學研究關注作家的交往活動,往往是個體作家之間單向的交往,如盛唐詩壇李白與杜甫、杜甫與王維、王維與孟浩然、高適與岑參的點對點的線性交往關係。但李白與杜甫、王維、孟浩然、高適、岑參之間有著怎樣的雙向互動、複雜交往,就不太為人注意。而據唐宋文學編年地圖平臺數據顯示,詩人的交往關係,比我們想像的更複雜,往往是重疊交叉、複雜多向的。比如,李白跟賈至、李邕、杜甫、王昌齡、孟浩然、賀知章、顏真卿、張旭、張說等143人有詩歌交往,杜甫和高適、岑參、李白、賈至、裴迪、李邕、元結、鄭虔、儲光羲、王維等167人有詩文往還,王維跟裴迪、祖詠、張九齡、錢起、杜甫、孟浩然、綦毋潛、高適、王昌齡、李頎等91人有活動交集,孟浩然與李白、張九齡、王昌齡、王維、包融、儲光羲、張說、劉慎虛、綦毋潛等46人來往密切,高適跟李白、李邕、杜甫、王昌齡、王之渙、儲光羲、顏真卿、崔顥等76人有交誼,岑參與杜甫、顏真卿、王維、賈至、儲光羲、高適、王昌齡等234人有交遊。李、杜、王、孟、高、岑這六大詩人的交往圈,互有重疊交叉。他們之間複雜的網狀關係,在傳統的文學史觀念裡,很少有人留意過它的存在及其文學史意義,也很少有人做過系統梳理。其實用傳統的方法也無法理順這麼複雜的關係網絡。

  現在運用數字人文技術,很容易理清這些詩人複雜的交往關係。只要將他們的交往活動數據導入Gephi軟體,詩人複雜多元的社會交往關係網絡圖就可以清晰地可視化呈現。徐永明曾以湯顯祖為例,展示過湯顯祖、屠隆和汪道昆三人的社會關係網絡圖。一位詩人跟哪些詩人有直接交往或間接交往,交往的頻次、交往的時空節點都一目了然。哪些詩人是單向交往,哪些是雙向互動且頻繁交往,誰是交往關係網絡中活躍的中心人物,誰是幾大交往圈中的連接點,都能清晰呈現。

  僅僅是這些詩人作家的社網圖(social network graph)呈現的文學史圖景,就比我們在文學史、文學編年史著作裡看到的少數經典作家孤零零的身影要豐富、有意味得多。依據作家社網圖,可以動態地考察不同年份、不同時期詩壇文苑詩人作家的互動過程和空間地域分布,觀察這些交往活動是點狀分布(集中在某幾個地區)、還是線性分布(流動分布在某條驛路要道沿線)、抑或是扇面分布(相對集中在一個或幾個區域、流域)。這些交往活動給文學版圖的移動變化帶來什麼樣的影響。利用作家社網圖,可以考察一個作家在動態交往過程中不斷走向成熟的創作歷程,接受過哪些名家的指教,得到過哪些前輩的鼓勵認可,受到過哪些同道的激發。這將改變我們的文學史觀念,使我們更加注重從文學交往關係中動態探討個體作家的成長史、每個時期的文壇發展史、文學空間版圖的變遷史。

  三是從宏觀社會分析轉向具體現場還原。傳統的文學研究,重視宏觀層面的社會文化環境分析,而常常忽略對作家生活地、創作地具體現場環境的關注。特定的作家生活地、創作地的現場環境,包括地形地貌等自然環境和風俗習尚社會事件等人文環境,會更直接地影響作家創作時的心態,與作品的創作空間、表現空間有著更直接的關聯。而數字人文則為文學歷史現場的還原與建構提供了理念引導和技術支持。比如,要研究範仲淹仁宗慶曆年間在西北邊塞所作《漁家傲》(塞外秋來風景異)詞,傳統的文學史觀念是引導我們去關注當時宋夏戰爭局勢和範仲淹的戰爭決策,而不會去關注範仲淹是在什麼樣的生活環境、地理環境中寫這首詞的,也不會關注此詞創作地的地理環境與詞的表現空間有什麼深層關係。而基於數字人文的文學編年地圖平臺,首先要追問和解決的是作品創作具體地點的空間定位。根據相關研究成果確定此詞的創作地點是在慶州之後,將當下地圖和歷史地圖圖層進行交叉對比,就可以發現慶州當時是與西夏接壤的位於宋夏戰爭前線的邊塞「孤城」。正因為是邊塞孤城,「四面邊聲」才讓將士們聞之悽然傷感。再切換衛星地圖,觀察慶州的地形地貌,結合當地的地景圖片,又可以真切地感受到範仲淹詞中所寫「千嶂裡」「孤城」的荒涼、逼仄和壓抑。還原範仲淹詞的歷史現場,才能透徹理解詞中表達的深層意蘊是述邊塞之勞苦,而非建功立業之豪情。

  回歸和還原作家的生活現場、作品的創作現場,是文學研究的必然需求。王夫之曾說創作必須有親身經歷和現場感受:「身之所歷,目之所見,是鐵門限。即極寫大景,如『陰晴眾壑殊』『乾坤日夜浮』,亦必不逾此限。非按輿地圖便可雲『平野入青徐』也,抑登樓所得見者耳。隔垣聽演雜劇,可聞其歌,不見其舞,更遠則但聞鼓聲,而可雲所演何出乎?」研究文學作品,同樣需要回到作家的創作現場、表現現場去切身感受作家「身之所歷,目之所見」,才能深得作者之用心、作品之奧妙。與王夫之同時的賀裳也說過相同的感受:「餘以柳詩自佳,亦於東坡有同病之憐,親歷其境,故益覺其立言之妙。」親歷其境後,更能體悟柳宗元、蘇軾詩之精妙。回歸和還原作家的生活現場和作品的創作現場,應該成為文學研究的「鐵門限」,而數字人文技術為還原文學現場提供了極大的便利。

  其四,改變文學時空的認知角度和方法:從一維轉向多維。

  基於文學編年地圖平臺的文學研究,將從時間和空間兩個維度改變我們的文學史認知。

  時間上,能細化文學史的時間粒度。傳統的文學史研究,多為長時段的觀察,很難進行短時段的探究,因為沒有系統翔實的作家作品編年為依據。長時段的研究,可以將具體的時間進程模糊處理。而短時段的研究,比如一年、三年、五年、十年的文學史研究,當無法確定這些年度產出過哪些作品時,就無法進行具體分析。而地圖平臺的編年系地數據,能翔實呈現每年文壇上有哪些作家在哪裡活動,每年產生了哪些文學作品。比如,據目前上線的唐宋文學編年地圖平臺數據統計,北宋元祐元年至元祐六年(1086—1091),每年在各地活動的作家,分別有1178、1332、871、718、725、856人次,每年產生的作品都在150篇以上,其中元祐元年有206篇,元祐六年有226篇。有了這些數據,觀察文學史的發展變化,就可以細化到一年、二年或幾年之間。今後研究或撰寫文學史,不再只有斷代文學史,還會有年度文學史,可以書寫一年、三年、五年、十年的文學史。「年度文學史」「時段文學史」研究,將會成為新的有待探索的學術領域。

  時段文學研究,可以不再依據社會政治史的分期來分段,而是按年度作品量的漲落變化進行分期觀察,重新審視和思考文學史的階段性變化。比如,唐詩有分三期、四期的,有分五期、六期的。我們可以利用唐詩編年數據來觀察唐詩作品量的年度變化曲線,對已有的各種分期進行檢驗,看哪一種分期更切合歷史發展的實際。以往研究只是感性認知,有了詩歌編年數據的支撐,就能更客觀地看出各個時期的變化曲線。哪個年份是文學變化的關鍵節點,哪個地方是文學變化的核心場域,今後都會有新的發現,從而有可能改寫詩歌史、文學史的發展進程。

  空間上,能深化文學的空間層次。編年地圖平臺,不僅強化了文學史的空間意識,更能深化對文學空間的認識:從靜態空間拓展到動態空間,從平面空間拓展到立體空間。

  靜態空間,是按作家籍貫劃分的空間。動態空間,是指作家的活動空間,包括作家的遊歷地和寓居地。以往的文學地理空間,多依據作家籍貫來劃分,是單一的、不變的、有限的。而動態空間是豐富的、多變的、廣闊的。比如,蘇軾青少年時期在家鄉眉山生活了20多年,只留下38首作品;進士及第後,離開故鄉到外地生活40多年,在92個州府創作了8058篇(首)作品。其中在黃州、惠州、儋州三個貶謫地分別創作了868篇、648篇、345篇作品,佔其一生作品總量的23%。貶謫地的生活環境較之出生地和寓居地對蘇軾創作的影響更深更大。不同謫居地的地域文化環境對蘇軾的心態和創作有何影響,作家的出生地、寓居地、貶謫地與其創作量的階段性變化有何關係,作家在各地逗留時間的長短與其創作量的漲落變化有何規律性關聯,唐宋時期作家的文學創作與其活動地理環境的關係有何變化,依據比較翔實的編年系地數據,就可以追問和探索這些問題。

  以往研究多從作家籍貫一個維度平面觀察文學空間,現在,我們可以從點、面、線三個維度立體探討文學空間。點,是對一州一縣或一省一市的文學狀況、文學活動進行考察;面,是探究一個較大的區域或流域,如長江流域、漢水流域、黃河流域、淮河流域、環太湖流域的文學圖景和發展進程;線,是通過一條條交通要道(驛路)來觀察不同時代、不同時期的文學風會及其變化。比如,唐代從長安經藍田、商洛過襄陽再到嶺南的這條南北走向的驛路上,王維、杜甫、皇甫冉、錢起、李嘉佑、張籍、韓愈、柳宗元、元稹、白居易、吳融等人都創作有詩篇,表現了各自不同的經歷和命運。考察這條驛路上往來的詩人詩作,既可以藉此考察唐代的交通路線、交通狀況,也可以深入探討交通條件、交通狀況對詩人生活和心態的影響。以前我們不知道有哪些詩人走過這條路,什麼時候、什麼環境下走過這條路,依據文學編年地圖平臺的大數據,就可以通盤掌握唐代詩人在這條艱難崎嶇驛路上留下的生命印記和人生體驗。又如杜甫《聞官軍收河南河北》所說的「即從巴峽穿巫峽,便下襄陽向洛陽」,是從蜀中到洛陽、長安的交通路線:先沿長江出峽,走水路到湖北江陵上岸後,再走陸路過襄陽,然後到洛陽、長安。杜甫所說的這條路線,宋代蘇軾就曾經走過。唐宋兩代交通條件和交通狀況有哪些變化,詩人在這條路上各留下哪些作品,途中的生活體驗、沿途所見自然風光和社會風氣有何異同,都值得我們去關注和探討。點、線、面的結合,可以開拓出文學研究的多重空間。

  可以預期,過去以時間為軸心的研究範式,將會逐漸轉向時空結合為軸心的研究範式。時間序列的文學史書寫範式和空間序列的文學史書寫範式將會攜手並進,從而建構文學史研究的新格局。

  其五,改變作家年譜和文學編年史的書寫範式。

  自北宋以來,作家年譜形成了重時輕地的基本理念和以時間為中心的「時間+人物+事件(活動)+作品」的四要素範式。受數字人文空間觀念的影響,重新確立編年系地並重的理念之後,年譜的撰述也應該改變傳統的觀念和範式,將四要素擴展為時地並重的「時間+地點+人物+事件(活動)+作品」五要素範式。作家活動和作品寫作的時間、地點信息要一併考實。而且,地點信息,不能滿足於落實到州縣級行政區,還要細化到具體的地點場所,以便重返歷史現場,深入勘查創作地點、場所的自然地理環境和人文環境,考察不同地理環境對作者創作心態的影響,分析地理環境與作品表現空間的關係,從而拓展文學研究的廣度和深度。

  確立編年系地並重的理念和年譜的書寫新範式,將為古代文學提供新的研究課題。我們用「時間+地點+人物+事件(活動)+作品」五要素來評量宋代以來的作家年譜,就可以發現,歷年來的年譜,都或多或少缺失系地信息。套用前些年「重寫文學史」的說法,有必要「重修年譜」,或借用清人李光廷《廣元遺山年譜》的說法,需要全面「增廣」年譜、增訂年譜的系地信息。

  跟重修年譜相關的,是增廣別集的編年箋注。一般的別集編年箋注,也是編年意識明確而系地意識模糊,主要致力於作品創作時間的推考,有些作品創作地點可考而未考,寫作場所能細化而未細化。比如,歐陽修《朝中措·送劉仲原甫出守維揚》詞,《歐陽修詞校注》考定它作於至和三年(1056) ,卻沒有考實其寫作地點。其實,此詞「輯評」中已引錄傅幹《注坡詞》的記載:「公在翰林,金華劉原父出守維揚,公出家樂飲餞,親作《朝中措》詞。」這段記載,明確說明《朝中措》是歐陽修至和三年任翰林學士時在汴京的家宴上所作。弄清此詞是在家中私宴所作,對理解詞人的創作心態和詞作主旨大有助益。歐陽修此詞本可系地而未系地,與史料文獻不足無關,史料原本就在眼前,更與箋注者的學識無關,而與箋注時重編年輕系地的傳統觀念有關,與編年校注的固有範式有關。這不是《歐陽修詞校注》一書的遺憾,而是歷來別集箋注的普遍情況。如果一一梳理並增廣訂補宋代以來別集箋注的系地信息,來一次「重訂別集」或「廣別集校注」,該有多少工作要做。今後的別集注釋體例,除了傳統的「編年」「校勘」「箋注」等項之外,還應加上「系地」一項,以完善注釋體系,增加注釋容量,拓展文獻視野。

  文學編年史著作,跟年譜和別集編年箋注一樣,需要更新傳統的重編年而輕系地的觀念,需要改變唯有編年、罕有系地信息的固有範式。文學編年史,需要增訂系地信息,以滿足和適應新時代古代文學研究的需求。重寫文學編年史,不只是增補已知的文學活動和作品創作的系地信息,還要考訂未知的文學活動和作品創作的系地信息,以完整呈現一個時代文學發展歷程的時間先後與空間離合。技術的進步促進學術觀念的更新,學術觀念的變革又帶來研究範式的轉換和研究領域的拓展。技術進步推動著學術變革與發展。

  四、展望和反思:自動識別作品的互文關係與重建文學歷史現場

  本文的主要目的,是討論數字人文解決古代文學研究中資料分散和時空分離兩大難題及其學術意義。但數字人文對於古代文學研究的作用和意義遠不止此,下面再作兩點展望:一是數字人文技術,可以自動比對識別作品之間的互文關係,從而為古代文學接受史研究帶來新的突破;二是可以重建古代文學的歷史現場,提供古代文學閱讀欣賞的嶄新體驗,拓展古代文學研究的全新領域。

  自動比對識別作品之間的互文關係,也就是尋找原作和後續作品之間的淵源性、傳承性和相似性。這可以從一個側面考察前代作家對後世作家的影響、後世作家對前代作家的接受。近年來的中國古代文學接受史研究,主要是依據已有的理論文獻,諸如詩話、詞話、文話、賦話等,來考察後代作家對前代作家的接受,而很難從創作實踐、具體作品中尋繹出完整的資料數據,來定量分析和定性描述前輩作家對後世作家的影響、後輩作家對前輩作家的接受。比如,黃庭堅和江西詩派詩人學杜甫是文學史常識,可要全面找出黃庭堅有哪些詩句是學杜甫的卻難以措手。歐陽修熟讀韓愈文章,文章作法也多學韓文。他的友人劉敞曾經開玩笑說:「永叔於韓文,有公取,有竊取,竊取者無數,公取者粗可數。」但歐陽修究竟哪些文章、哪些語句是學韓愈,找一兩個例證不難,難的是找出明學(「公取」)特別是暗學(「竊取」)的「無數」例證。杜詩、韓文,是宋代作家的入門讀物,但宋代作家究竟怎樣學杜學韓,哪些詩句文句是出自杜詩韓文,人力難以一一找出。創作層面的接受史研究無法推進,整個古代文學接受史的研究也就難以深入。

  而數字人文技術,可以在一定程度上逐步解決這個問題。那就是用模糊檢索技術和編輯距離算法,把兩個以上的文本放在一起比對,尋找出彼此相似的詩句或文句。比如,在搜韻網站的歷代詩詞資料庫裡,就可以自動分析、呈現並統計每首詩詞被後代詩人詞家引用、化用、仿作的語句及次韻的詩篇。以杜甫《登高》為例,在資料庫檢索到此詩後,點開「相似句子」和「同韻作品」兩個按鈕,就可發現14位明清詩人有次韻之作,多位後代詩人詞家仿作和化用詩中語句。其中「無邊落木蕭蕭下」一句,就有17人引用、化用。化用的詩句有「無邊落木響蕭蕭」「人間落木蕭蕭下」「天空落木蕭蕭下」「蕭蕭落木下寒溪」「蕭蕭落木下河幹」「天空落木下江濱」「天空落木下孤洲」「天空落木下秋畇」「天空落木下亭皋」「荒亭落木下亭皋」「風高落木無邊下」「無邊落木氣蕭騷」等。如果再加上題材的相似性、句法的趨同性和意境的近似性等條件,所得數據會更多更全。如黃庭堅《登快閣》詩中的「落木千山天遠大」就與「無邊落木蕭蕭下」意境相近,可以補入。當然,目前的技術還只能尋繹比對出顯性的語詞相似關係,隱性的語義關係、句法關係(字面不同而句法相同)識別率還比較低。隨著數字人文技術的日益進步,對不同作品之間的語義關係和句法關係的識別率將逐步提升。

  如果對這些引用、化用、追和、次韻的數據進行全面統計分析,就可以深入了解杜詩乃至唐詩的影響力及其在後世的接受度與變異性,從而突破接受史難以全面採集創作層面接受數據的瓶頸,為接受史研究提供系列性的新資料、新數據。有了新資料、新數據,當然就會有新發現、新觀點,突破接受史研究的困境。

  重建古代文學的歷史現場,是用虛擬實境技術(Virtual Reality),還原建構古代文學作品的創作現場或表現現場。VR技術飛速發展,早已走進考古、博物、檔案、建築、醫療、機械製造、刑偵、軍事等領域,而古代文學研究至今還沒有出現讓人滿意的VR產品和真正實景的AR產品。VR技術中,沉浸式VR系統、桌面式VR系統和體感式VR系統,在重建文學歷史現場、深度解讀古典詩詞意境方面,具有獨特的身臨其境的優勢。尤其是沉浸式VR技術,能夠讓讀者逼真感受和體驗到千百年前詩人所處的生活環境、創作環境及其情感心態。在當今讀屏、讀圖時代,我們尤其應該讓VR技術、AR技術與古代文學特別是古典詩詞結合起來,給讀者帶來全新的閱讀體驗。

  試舉一例,韓愈《左遷至藍關示侄孫湘》的「雲橫秦嶺家何在,雪擁藍關馬不前」兩句詩,字面上似乎不難理解,但為什麼馬到雪擁的藍關就不肯前行、不能前行了,僅憑閱讀經驗、日常生活經驗是很難想像的。我們用資料庫同類聚合的材料,看看韓愈另一首《南山詩》的回憶:「初從藍田入,顧眄勞頸脰。時天晦大雪,淚目苦矇瞀。峻途拖長冰,直上若懸溜。褰衣步推馬,顛蹶退且復。」再看白居易《初出藍田路作》的描寫:「停驂問前路,路在秋雲裡。蒼蒼縣南道,去途從此始。絕頂忽盤上,眾山皆下視。下視千萬峰,峰頭如浪起。」白居易是秋天經過藍田驛路,韓愈兩次都是深冬下大雪時走過。綜合韓、白詩可知,這段藍田驛路,是蜿蜒起伏在重巒疊嶂之間。大雪後,陡峭的山路都結冰了,如凍住的垂直瀑布(「懸溜」)。人下來推馬,好不容易推進一步,旋即就下滑倒退幾步。簡錦松教授曾經三次實地勘查藍田驛路,證實白居易和韓愈的詩完全是寫實。登上白居易所說「絕頂」七盤嶺,要攀爬三重絕頂稜線,山路極其陡峭險峻。如果運用VR技術,根據多幅實景照片,結合衛星地圖,參照唐人相關詩作,重建、再現韓愈「雲橫秦嶺家何在,雪擁藍關馬不前」的歷史現場,讀者更能真切體會韓愈受政治迫害後在冰天雪地裡翻越崇山峻岭時極度悲傷、極端無助的心情。那種現場感、親歷感,會帶給讀者與文字閱讀不同的浸入式閱讀體驗。

  把真實世界的場景和電腦圖形逼真地重合,利用大量的現場實景照片和全景照片以及考古成果、博物圖片、歷史地圖等,重建古代詩詞乃至散文、小說、戲曲作品中的歷史現場,可以讓讀者沉浸其中,獲得身歷其境的感受。在仿真場景中,讀者可以化身古代的作者或作品的主人公,以強烈的代入感體驗歷史情境。隨著VR技術的日益成熟和門檻降低,古代文學歷史現場的重建,不久將成為現實。

  我們也必須清醒地認識到,數字人文技術不可能解決古代文學研究的所有問題。僅就數據挖掘而言,有些問題,再好的技術也難以解決。比如,數據需求的海量化、完整性與數據來源的有限性之間的矛盾,就是技術無法解決的。文學編年地圖平臺,要求編年系地的數據越多越好、越完備越好。但是,編年系地的數據依賴於已有作家作品編年系地的研究成果,而作家作品的編年系地研究成果卻是有限的。唐宋兩代作家作品編年系地的研究成果,雖然相較其他時代而言還算豐富,但成果總量還是難以滿足數據完整性的實際需求。唐代作家有編年系地研究成果的僅一百餘家,宋代作家有編年系地研究成果的也不超過四百家。要解決這個供需矛盾,有待古代文學研究者的共同努力,推出更多編年系地研究的新成果。技術可以幫助我們古代文學研究者提高研究的效率,突破研究的局限,但不能替代我們應該做的基礎性工作。

  技術可以部分解決大數據的體量,但難以保障數據的質量。文學大數據,要求量大而質精。數據的精度,更需要人力來把關掌控。數據開發者,學術追求指數越高,對數據的精度要求也就越高。我們開發的文學編年地圖平臺,為保障數據的精確性和可靠性,雖然採取了精選優質文獻來源、由專業人員提取數據、數據提取時訂補來源文獻的缺失和錯誤、數據提取後實行覆核制等舉措,但數據精度,還有待提升。技術的不斷進步和突破,可以提升數據挖掘的精度,但最終還是要依靠人力來保障和把關。

  技術是被動的,需要我們研究者發揮主觀能動性,創造性地使用它。再好的VR技術,沒有古代文學研究者的參與設計,沒有對文學創作現場的深入勘查,沒有對作家創作心態的深刻理解,是無法準確完美地建構文學的歷史現場、復原作家的創作心境的。數字人文技術,需要人文學者的創造性運用,才能推動學術的進步。

  還有必要指出,數字人文不會影響或替代我們文學研究主體的文本解讀、審美感知。技術可以幫助我們「發現」潛藏在海量資料和數據底下的文學史事實,幫助我們做出事實判斷,但不能代替我們做審美判斷和價值判斷。技術可以節省、「解放」我們在學術研究過程中所需要的「體力」,但不能代替我們的「腦力」「智力」,不能代替我們思想和感悟。技術永遠是工具,是按照人的主觀意願而發揮作用。

  陳寅恪曾說:「一時代之學術,必有其新材料與新問題。取用此材料,以研求問題,則為此時代學術之新潮流。」數字人文為文學研究提供了新方法和新機遇,發掘新材料,研究新問題,開拓新範式,將成為我們這個時代學術的新潮流。

  (注釋略)

 

相關焦點

  • 當下中國「數字人文」研究狀況及意義
    但這並不能意味著,在2009年之前中國就沒有數字人文。我們將「數字人文」定義為一套提出、重新定義和回答學術問題的辦法,即,人文學者可以利用數位技術(尤其是電腦資料庫)作為外在的工具,來回答他們過去已經提出的學術問題,或者是受到數位技術和思維的影響,而提出的新課題,甚至產生新的研究範式[1]。實際上,在「數字人文」概念被翻譯到中國之前,中國早已有了數字人文實踐。
  • 中國古代文學研究:新時代新起點
    研究隊伍不斷壯大,研究領域不斷拓展,研究方法日趨多元和成熟,學科地位不斷加強,初步形成了古代文學研究的理論思考,在批判繼承中不斷推陳出新,在開放和理性中不斷走向成熟。劉躍進從學科發展變化的角度總結了古代文學研究取得的成績。他說:「上世紀80年代初期,古典文學研究剛剛擺脫僵化的社會學研究方法的束縛,藝術分析成為一時熱點。葉嘉瑩先生借鑑國外文藝理論,細膩地分析傳統文學藝術特色。
  • 改革開放40年來的古代文學研究:在開放中走向成熟
    「因此,今天我們站在40年的門檻回顧改革開放以來的古代文學研究成就,就具有非常特殊而重要的意義。」改革開放為古代文學研究帶來的發展契機1980年《文學遺產》復刊,這一事件可作為古代文學研究又登上學術舞臺的標誌性事件之一。
  • 比較視野中的數字人文對話與爭議 ——南京大學「比較視野中的數字人文反思」學術研討會綜述
    來自國內外英語文學、圖書館學、藝術學、比較文學、歷史學、新聞傳播學、博物館學、計算機科學、地理信息科學等學科的20多位嘉賓,在研討會上展開了充分的討論和交流,議題覆蓋數字人文的核心理論及方法論等理論化問題,也包括用於學術研究的工具、方法和工作流程等方法性問題,還包括數字人文項目的研究資金、可持續性和課程建設等相關體制及資源問題,並在討論中形成了一系列非常有趣而深入的對話。
  • 傅剛:中國古代文學研究者的研究目的、意義、方法
    以古代文學研究為例,中國學者的研究目的、方法和意義,是建立在中國傳統學術基礎之上的,這與國外漢學家有很大的區別。本文從七個方面論述中國古代文學研究者的研究,希望能夠在中國學術走向國際的同時,讓海外漢學家也能夠正確認識中國學者的研究。
  • 數字人文為人文學帶來什麼
    在人民大學出版社新近出版的《數字人文:改變知識創新與分享的遊戲規則》一書中,作者認為,數字人文是指充分利用計算機技術與人文學知識開展的合作性、跨學科的研究、教學和出版的新型學術模式和組織形式。數字人文是一種「全球性的、超越歷史和媒介的創建知識和意義的路徑」。作為一種開展研究、教學和出版的學術模式和組織形式,數字人文更強調的是一個動態的過程而非一個靜態的結果。
  • 《數字人文與文學研究讀本》將由清華大學出版社出版
    《數字人文與文學研究讀本》將由清華大學出版社出版來源:中宏網 2018-1-5《數字人文與文學研究讀本》近期將於清華大學出版社發行,這將是數字人文方法進入我國文學研究領域的第一個讀本。該讀本系由清華大學中文系、芝加哥大學Text lab、清華大學圖書館共同發起的「清華大學數字人文與文學研究國際工作坊」的論文集,這也是數字人文研究興起以來,國內首次舉辦以「文學研究」為主題的數字人文研究領域國際會議。據介紹,工作坊緣起於清華大學、芝加哥大學和《山東社會科學》雜誌社最早發起的數字人文與文學研究專欄。
  • 學科史視野中的人文知識轉型
    其倡導者認為,人文研究和新技術之間可以互相促進,人文學者應熟悉數據的管理和人文研究的可視化,注重建設性的思考和實踐。這對人文學術知識生產產生了一定的影響。有學者甚至認為有可能在各個人文學科之間、在人文學與其他學科之間創造出新的人類知識。這是我國發展新文科轉型的學科基礎和技術物質基礎。
  • 陳德江 | 指向人文素養發展的英語文學閱讀實踐與研究
    本文基於筆者主持的「閱讀英語文學作品 提升學生人文素養」課題研究,聚焦文學作品的閱讀實踐,具體闡述如何基於讀者反應理論,統籌規劃整本書閱讀,運用「讀-思-行」閱讀策略,指導學生閱讀、感受地道的語言、探究作品內涵、體驗中外文化差異、促進學生反思與交流,提高學生的語言能力和人文素養。
  • 回顧|哲學與數字人文研究工作坊:古籍整理、平臺搭建、知識譜系實踐及哲學文本分析應用
    《詩經》文獻的文章;王賀老師是上海師範大學副教授、數字人文中心副主任,在各大刊物上發表文章上百篇,在數字人文方面也很可觀;馬清源老師現就職於山東省圖書館,山東省圖有得天獨厚的館藏並且在資料庫方面也很有特色;趙薇老師在社科院文學所的研究方向之一是文學與數字人文,成果在海峽兩岸都有發表,也是《數字人文》學刊「基礎設施」欄目的主持人和編輯;宋學立老師是社科院歷史研究院古代史所副研究員,是全真教研究方面的專家
  • 流寓文學:古代文學研究新視角
    內容摘要:近年來,伴隨著文學地域性研究的熱潮,流寓文學逐漸引起學界的關注,尤其是在古代文學研究領域,從流寓角度來考察作家作品極大地拓寬了研究者的視野。  蔣寅:根據地域的不同,流寓文人給寄居地帶來的具體影響也不同,但同樣都有提升其文化品位的意義。對邊疆窮荒之地來說,流寓文人常是推動文化開發和發展的動力,唐代鄭虔貶台州,柳宗元貶柳州,宋代蘇東坡貶海南,都成為當地的人文始祖。而清代王漁洋仕宦揚州,歌詠當地名勝,更提升了揚州的文化品位,一句「綠楊城郭是揚州」喚起人們多少美好的憧憬!
  • 劉躍進:古代文學研究應超越中西,無問西東
    熟悉劉躍進的人都知道,他的治學生涯經歷了三次較大的轉變:從作家夢到學者夢,從現、當代文學到古代文學,從古代文學再到古典文獻學。也正是因為這數度轉變,才使得他在學術研究中有了更為宏闊貫通的視野和深切的問題意識。
  • 高端講壇新聞丨王兆鵬教授為思勉高研院「數字人文的理念和實踐」高端講壇開講
    2019年6月6日下午,中南民族大學數字人文資源研究中心主任王兆鵬教授應邀做客華東師範大學思勉人文高等研究院,在閔行校區人文樓3102會議室作了題為「唐宋文學編年地圖的現在時與將來時」的學術報告。
  • 「技術、媒介與人文:跨學科研究範式多元轉型」學術研討會在京舉行
    2020年12月4—6日,首都師範大學文學院與首都師範大學跨文化跨媒介研究中心舉辦的「技術、媒介與人文:跨學科研究範式多元轉型」學術研討會在京召開。大會由首都師範大學跨文化跨媒介研究中心主任易曉明教授主持。首都師範大學社科處處長王德勝處長致辭,強調了本次會議的重要意義並對學術研究的未來提出了展望。首都師範大學文學院院長馬自力教授在致辭中比較了中西方人文主義的不同,並指出技術對傳統人文範式具有的瓦解性,強調要進行積極應對。
  • 大數據視域下人文學科的數字人文研究
    20世紀90年代初,網絡的出現加速了數字學術從加工處理到網絡協作的轉變。90年代末,一些項目開始利用數位技術實現可視化、地理空間展示、模擬空間以及複雜系統的網絡分析。進入21世紀,大數據、VR/AR、雲存儲、移動終端相繼出現,數位化的證據和研究方法廣泛運用於學術性的研究、出版與儲存,形成了全新的數字學術環境,使我們進入了一個數位化的學術時代。
  • 新時代的古代文學學科建構
    比如傳統的中國古代文學,相對於文藝學、中國現當代文學、比較文學與世界文學等學科,由其學術傳統、研究方法、治學理念、文獻資料等方面的本土性所決定,較少受到國外其他人文學科的直接影響,向來自足性非常強。固然,受現代學術話語體系的影響,中國古代文學學科也在逐漸改變其形態,但其學術現代化的歷程是比較緩慢的。因此,相對於其他中文學科,就時代性特別是理論話語體系的建構而言,中國古代文學恰恰是最需要認真反思的一個學科。  中國古代文學學科的現代化歷程和內在建構實際上從近代已經開始。王國維、陳寅恪、胡適、魯迅、聞一多、錢鍾書等人的學術思想中,都不乏文化使命感和世界意識。
  • 推動古代文學研究
    由陝西師大文學院主辦的「中國古代文學發展高層論壇暨陝西師範大學中國古代文學博士點建立三十周年學術研討會」近日召開。來自國內外高校的70餘位學者共襄盛舉,並就相關學術問題進行深入研討。    文學觀念與文學發展是本次會議較為集中的議題。
  • 史睿談數字人文與現代文獻學研究
    《春明卜鄰集》,史睿著,鳳凰出版社2020年6月版,296頁,68.00元數字人文是一個近年頻繁見諸媒體的話題,也算是一個極具時代意味的名詞,您剛出版的新書《春明卜鄰集》中,有一組文章是針對數字人文的討論,您如何理解這個命題? 史睿:數字人文的研究,實際上是超越具體學科之上的思考,關注並思考人文學科現代轉化過程中「索引」的作用與意義。
  • 川大分析/ 古代文學導師簡介
    呂老師2000年承擔教育部人文社科基地「中國古代俗文學分體研究」子課題「中國古代歌謠研究」,2005年又進入985工程文化遺產與文化創新基地,2006年出版《中國古代民謠研究》,被聘為教授;2007年參與國家社會基金項目「宋代家族與文學研究」,2009年獲得教育部新世紀優秀人才支持計劃資助。同年與張劍、周揚波合著《宋代家族與文學研究》出版。
  • 數字人文時代英語專業的機遇與挑戰
    清華大學陳永國教授的主旨發言題目為《數字人文發展中文學的最後堅持》。他認為,文學在當下面臨的第一個現實就是電子文學的出現,電子文學所採取的審美策略的複雜性意味著文學批評者必須以對待紙質文學的熱情和專注對待網絡文學,但是要求採用新的批評方法。換言之,文學批評理論上各種範式和視角現在已經是強弩之末,不會有什麼新的發展。