哈佛大學歷史資料庫進中國,還說未來要記錄每個有史可載的人

2020-12-05 好奇心日報

中國歷代人物資料庫(CBDB),是由哈佛大學費正清中國研究中心、臺灣中央研究院歷史語言研究所、以及北京大學中國古代史研究中心合作開發的一個資料庫。通過收錄人物傳記,並對其中的語句進行分析,可以為歷史學者提供人物資料的查詢。

近日,CBDB 項目的負責人之一、哈佛大學副教務長包弼德(Peter Bol)來到中國,與一家中國公司中文在線籤約合作,希望藉助後者的技術來提升中國歷代人物資料庫的處理歷史資料的效率和準確度,提高用戶體驗,並且能夠將其推廣到更大眾的用戶群體當中。

CBDB 的前身是由美國學者郝若貝 (Robert M. Hartwell)於 1970 年代創立的歷史人物資料庫。利用早期 MS-DOS 系統下的資料庫軟體 dBase,郝若貝將大量的中文文獻數位化,使得研究者可以通過輸入關鍵詞,對文獻進行檢索,從而節省查找資料所需要的時間。

郝若貝自己從 CBDB 中收益良多。作為研究唐朝中期到元朝歷史的學者,他的研究成果以極其豐富的文獻引證而出名。這就得益於他大量搜集文獻,並將其製作成為資料庫的便利。他相信,由於中國歷史文獻極其豐富,包括龐大官僚機構炮製出的各類文件,也包括中國人的通信、祭文等多種日常應用文體,因此建立一個完備的、便於查閱的對於中國古代的歷史研究大有裨益。

在接受了郝若貝教授的捐贈之後,哈佛大學在這一資料庫的基礎之上建立了 CBDB。期間,技術更新換代,CBDB 也從原本的 dBase 換成了更新的資料庫系統 Access。同時,資料庫中的文獻也得到了大量擴充。截至 2017 年 4 月,CBDB 一共收錄了 37 萬份人物傳記資料。

近年來,CBDB 的兩個重大更新在於,首先對詞彙的含義進行了識別和篩選。例如,母親這個含義在漢語中可以表達為「母」,「媽」,「娘」等,而含有「母」這個字的「後母」,「養母」等詞卻不一定表達母親的含義,傳統的檢索功能因此效率會受到影響。CBDB 通過對這些詞彙進行編碼,從而使得一個查詢母親含義的人,能夠避開幹擾,獲得更精準的信息。

其次,CBDB 也和復旦大學的地理信息系統合作,以地圖的方式呈現相關信息。下圖就表示了 CBDB 收錄的 67000 人在中國地理上的分布。從中,歷史學家可以研究地理或者城市分布對於中國歷史的影響。

此次 CBDB 和中文在線籤約,其中強調的一點就是利用人工智慧技術,提高處理歷史資料的效率和準確度。這似乎就將利用人工智慧對於自然語言的處理技術,像 Siri 這樣的人工智慧技術能夠對用戶的呼叫作出回應,就是基於這樣的技術。

包弼德還提及的一點是,希望藉助中文在線將 CBDB 大眾化。 兩年前,在接受澎湃新聞採訪時,包弼德在被問及 CBDB 能否讓更多歷史愛好者接觸、研究歷史時回答:「關於降低門檻,如果這是真的,我會非常樂意見到;雖然至少到現在,這種情況還沒有出現,但如果出現了,也會是 CBDB 的一大貢獻。」

「除了在學術上應用以外,也把它推向公眾,使普通人也能夠更方便的了解中國歷史,尤其是歷史上的這些人物——他們的事跡、著作、生平等等一系列的貢獻。」在此次的發布會上,北京大學中文古代史研究中心史睿表示。

不過,包弼德對於 CBDB 在歷史研究中的作用表現得非常謹慎。「歷史研究永遠不止一種研究方式……前提是,你要有發現問題的能力,和清晰知道哪種方式,哪種工具能有助於你解決問題。」而 CBDB 未來的目標「就是將中國每一個有史可載的個人都錄入進這個系統裡」。

相關焦點

  • 包弼德談哈佛中國歷代人物資料庫:谷歌學術和中國知網過時了
    近日,筆者受澎湃新聞「私家歷史」頻道所邀,前往美國哈佛大學的量化社會科學學院,參觀了由哈佛大學費正清中國研究中心和東亞燕京學社運營維護的中國歷代人物傳記資料庫(China Biographical Database,下文簡稱CBDB)辦公室,向負責CBDB的項目經理王宏甦先生,牛津大學博士、CBDB項目博士後徐力恆先生了解資料庫的運營情況,並就相關議題採訪了哈佛大學東亞系包弼徳
  • 哈佛大學:名列前茅的孩子,出現最多的書單不是名著,而是歷史
    公務員是可以學習政治並位居第一的人,而商人,無論您是小生意的小販,還是富裕國家的商人,都屬於同一類別,並且屬於較低的類別。它與現代仍然有很大的不同。即便如此,對於普通家庭來說,如果他們在學校中表現出色並進入一所理想的大學,他們將擁有不同的未來。
  • 張志雲︱方德萬與中國海關史研究
    這種文本分析的研究方法,也在《潮來潮去》中有很明顯的體現。客觀地說,方德萬的學術根底,不是中國海關史,也不是相關的貿易史或金融史,而是中國共產黨史。他在南京第二歷史檔案館查檔時,副館長馬振犢請他去檢查一批英文檔案,確定其來源和價值,方德萬發現這正是中國海關檔案,而在此之前,中國海關的檔案主要收藏於哈佛大學和倫敦大學亞洲學院。雖然在發現這批檔案之前,方德萬可能從沒想過自己會開始研究中國海關,但是他當然了解這批檔案的價值。一回英國,他就找了一位年輕的副教授一起發掘這批檔案。
  • 哈佛大學藝術博物館包浩斯資料庫上線,可檢索作品達3.2萬件
    哈佛大學藝術博物館包浩斯(Bauhaus)資料庫近日上線,可檢索藝術作品和物件達3.2萬件,資料庫中還可以找到一份包浩斯發展年表和一張詳細描繪了包浩斯風格在波士頓地區漸次出現的地圖。哈佛大學與包浩斯學派的淵源頗深。1930年,哈佛的本科學生組織了美國首場包浩斯風格藝術研究展,這也是包浩斯風格尚處於活躍期時在美國的唯一一次展覽。
  • 哈佛大學的「斯芬克斯之謎」
    哈佛大學的「斯芬克斯之謎」 作者按:這是一篇16年前我從美國訪學結束回國後寫的一則小文。整理舊物時偶然間發現,如今讀起來別有一番滋味在心頭,覺得內容沒有過時。中美關係現正以自由落體狀態直線下落,只是還沒有跌到地面,我們要做好準備。
  • 比哈佛還難進,如何「搞定」傲嬌的史丹福大學?
    這所大學也走出了很多成功知名人士,包括27位圖靈獎獲得者,谷歌兩位創始人、雅虎兩位創始人,昇陽電腦、NVIDIA及思科的創始人等等。斯坦福比哈佛還難進?斯坦福有多難進?聽說比藤校還難?這可不是危言聳聽。
  • 超級學霸史愷昇:哈佛、史丹福大學爭著要,他從小的教育是什麼樣的
    這讓我想起一個超級學霸——史愷昇,哈佛、麻省理工和史丹福大學爭著要:有以他命名的行星:被美國媒體評為前十名優秀高中生,接受過歐巴馬接見:榮獲「美國西門子科學獎」第一名:遊泳遊進了區比賽,鋼琴彈得還能開個人演奏:爸爸史文杰也是一個學霸:1985年畢業於同濟大學物理系,赴美後獲得德州A&M大學經濟博士學位
  • 專訪哈佛大學宋怡明:世界歷史大框架下的海外華人
    宋怡明(Michael A.Szonyi):美國著名中國歷史研究專家,哈佛大學費正清中國研究中心(Fairbank Center for Chinese Studies)主任,哈佛大學東亞語言文明系中國歷史學教授。
  • 鄧小南、包弼德、薛鳳、魏希德、陳熙遠:數字人文與歷史研究
    本次研討會是「北京論壇雲端國際論壇系列」的首場活動,根據現場統計,至少有5000人在線參與了這次研討會。本次論壇邀請了北京大學歷史學系鄧小南教授、哈佛大學東亞語言與文明系包弼德(Peter K.Bol):「從軼事到數據:傳記數據的網絡和空間分布」哈佛大學包弼德教授是哈佛大學中國歷史地理信息系統項目(CHGIS)、中國歷代人物傳記資料庫(CBDB)項目的負責人。在本次的研討會中,他就「從軼事到數據:傳記數據的網絡和空間分布」這一主題展開了介紹。
  • 歷史動力學:如何用歷史大數據預測未來?(上)
    編者按:以史為鑑。日光之下並無新事。古人和歷史似乎在告訴我們總是在重複過去。但是在現代,嚴肅的歷史學家對周期論的態度一直都是不屑一顧的。不過有兩位學者打算用數學方法去尋找歷史中存在的模式。並且希望利用這一模型去預測未來。這個大數據版的以史為鑑能成功地預測未來嗎?時間會證明的。而且說不定就在這幾年的時間內。
  • 你知道哈佛大學在中國內地每年招多少人嗎?
    你知道哈佛大學在中國內地每年招多少人嗎?先看一組數據:據說,哈佛大學是沒有固定分數線的,不像中國大學錄取學生時那樣依照高考分數。美國的大學更看重學生的平時成績,但是硬性要求肯定是有的,參考最近幾年哈佛大學錄取學生的標準來看,被錄取的學生基本上SAT2300+,託福113+或雅思8+比較普遍,而且personal statement必須要非常出色。當然成績不是最主要的,然而,作為國際學生如果沒有一個幾乎完美的成績一定不能引起招生官注意。
  • 走進哈佛自然歷史博物館
    除了幾個富有特色的藝術博物館之外,哈佛最出名的要數其自然歷史博物館了。由於該館對本校師生優惠,不僅他們免費,還可以免費帶一位朋友。於是,在一個晴朗的日子裡,我和一位朋友就來到了位於牛津街上的自然歷史博物館參觀。
  • 這部帶著「哈佛光環」的中華帝國史,究竟什麼水平?
    對於有志收藏中國通史的讀者而言,這些年怕是要準備好荷包嘍~數量很多,那麼質量如何呢?評判書籍質量,向來是個容易得罪人的事情,特別是外國人寫的書。說太好,有「崇洋媚外」之嫌疑;說太差,又難免有「坐井觀天」之譏諷,最新出版的《哈佛中國史》尤其如此。
  • 哈佛大學:歷史比美國史早140年(組圖)
    哈佛大學的建立是由於當時的英國殖民者想在美國的土地上建一座大學,正因為哈佛大學的建立者當中有很多人都是劍橋大學的畢業生,哈佛大學所在的城市也就被命名為劍橋城。其實原來這所大學的名字叫做「劍橋學院」,哈佛大學現在的名字來源於1638年一位名叫約翰·哈佛的學院院長,這位院長去世時,將自己積蓄的一半和400本圖書(在1638年,一所建校只有兩年、第一屆只有學生9位的學校這可不是小數目)捐贈給這所大學。
  • 哈佛大學地理系的滅亡與地理學的重生
    這裡有一篇舊文,是一段非常有意思的關於GIS與哈佛的歷史,特別是地理信息系統(GIS)的思想史,與各位GIS同行分享一下。哈佛大學是世界級的高等學府,其一言一行對全世界都具有標杆作用。哈佛大學地理系創立於1904年,由地貌學大師William Davis創建,在美國地理學屆有著非常高的地位,但是很不幸,這個曾經輝煌的地理系在1948年轟然滅亡。
  • 哈佛的自然歷史博物館
    哈佛不僅圖書館多,博物館也不少。除了幾個富有特色的藝術博物館之外,哈佛最出名的要數其自然歷史博物館了。由於該館對本校師生優惠,不僅他們免費,還可以免費帶一位朋友,於是,在6月一個晴朗的日子裡,我和一位朋友就來到了位於牛津街上的自然歷史博物館參觀。
  • 回到歷史:2019年中國政治學回顧
    與此相反,中國人民大學國際關係學院教授楊光斌在《以中國為方法的政治學》中倡議,不僅要以中國本土的話語來解釋政治傳統,還要將它們升格為普遍性的政治學理論。例如中國在兩千年前就有了官僚制政府、大一統思想以及「一種文教、多種宗教」的特殊傳統,它們對中華文明兩千年的興衰有何影響?與現代西方政治學中的各式理論又有何異同?這都是中國政治學對世界的潛在貢獻。
  • 20年前,她考上哈佛大學被全國人記住,曾說要報效祖國,如今怎樣
    ——巴金哈佛大學作為世界頂級學府,吸引很有學習成績優異學霸,爭先恐後地想要進入這個學校學習,不過只有特別優秀的女生才能被這個學校錄取,20年前那麼火的哈佛女孩劉亦婷,曾發誓為國奉獻一生,大家一定很好奇如今她的現狀如何,我們接著往下看。
  • 歐美的中國書籍史研究有何新動向
    從社會文化史的角度梳理書籍的歷史脈絡,是近年來備受關注的一種研究趨勢。在這一方面,對歐洲書籍的社會文化史考察,已經提供了不少有益的參照;同時,對中國書籍的社會文化史書寫,在英文世界裡也相繼有新成果問世。筆者在此選取三部與中國書籍史有關的英文近著,略作引介,並附上筆者目之所及的其他相關著作題名,不盡之處,還望同好繼續補充。
  • 高分卻進不了哈佛耶魯,美國亞裔起訴常春藤大學「種族歧視」
    SFFA代表其成員起訴了哈佛大學,聲稱其中一些成員也有過和王類似的經歷。SFFA認為,哈佛在給新生分班時,會有意識地引入種族因素考量,每個種族的學生在班級中都有相對固定的比例。一般情況下,一個班裡會有大約一半白人,20%的亞裔,15%的非裔,以及20%的西班牙裔。為了達成這樣的比例,哈佛有意識地對亞裔學生的入學提出更高的要求。