我國世界史研究中外文資料庫的利用-光明日報-光明網

2020-12-11 光明數字報

    據筆者調查,國內主要圖書館購買的以及可免費利用的外文專業資料庫資源,已超過千種。這些資料庫就文獻類型而言,可分為圖書、期刊、學位論文與會議論文、報紙、檔案、統計資料、報告、書目與文摘、圖片、音視頻等。就收入內容而言,歷史學涉及史學理論、世界通史與斷代史、地區國別史(涉及70個左右的國家)、傳記、文物考古,其他學科如地理、哲學與宗教、政治與法律、軍事、經濟、文化、科學、教育、體育、語言與文字、文學、藝術、醫藥衛生等,也有很多資源可以參考。世界史研究需要利用資料庫尤其是外文資料庫,這是無須爭辯的問題。需要討論的是,如何對這些數量龐大的資料庫進行利用。本文從定名與定性、專題資料庫的建立、資料庫內容考辨三個角度,談一些粗淺的看法。

    所謂定名與定性,是指對資料庫的名稱、性質和收錄範圍有清晰的認識。

    一般而言,因資料庫開發者都會提供資料庫名稱,定名問題不會有太大的困難,但也有一些特殊情況。其一,資料庫開發者有時會改變資料庫的名稱,從而導致在不同的館藏地或不同的學者引用中對同一資料庫標引不同。如美國檔案類資料庫「美國解密檔案在線」(U.S. Declassified Documents Online),原名為「解密檔案參考系統」(Declassified Documents Reference System);期刊類全文資料庫「綜合學科學術文獻大全」(Academic Search Complete),原來的英文名為「Academic Search Premier」。在這種情況下,建議標引以最新名稱為準,同時了解其歷史名稱。其二,存在總庫、子庫的情況。如HeinOnline法律資料庫有60餘個子庫,美國國會圖書館的「數位化收藏」(Digital Collections)有300多個子庫。一些開發商或代理商,還會重組其數據資源,形成新的總庫。如Gale公司,它把旗下部分報紙期刊類的庫組成Gale NewsVault,又把以檔案為主的300餘個子庫組成「珍稀原始典藏檔案」(Archives Unbound,簡稱AU),還把這兩個庫和它的其他偏重原始檔案文獻的子庫組合起來,形成了Gale Scholar超大型資料庫。就個人利用而言,清晰的子庫名稱更重要;但由於一些館藏只標引了總庫,所以也需要了解總庫名稱。其三,館藏機構的標引方式,也會造成名稱的混亂。比如,有的館藏只列翻譯而無原文名稱,各館藏有時翻譯名稱不同,以及有的館藏根據購買情況重新擬定資料庫名稱。如國家圖書館購買了AU中亞洲的部分專輯,命名為「珍稀原始典藏檔案合集:亞洲」(Archives Unbound Asia)。

    確定性質指確定文獻的收錄類型。前文已提及,外文資料庫的文獻類型包括圖書、期刊、報紙、檔案等。不同類型的文獻,在史學研究中所起到的作用是不同的,或作為目錄檢索路徑,或作為前期學術史,或作為史料來源。在開發商或圖書館的資料庫介紹中,會說明文獻的類型或特徵。需要強調的是,上述文獻是基於現代的出版類型進行分類的,它很難完全體現人類過去所積累的文獻的所有特徵,所以只能是相對性的。比如,檔案在今天往往指代有密級的、生成之時尚不能為一般公眾查看的文獻,但對於古代史而言,甲骨、碑銘、紙草文書、木板文書等,不管其當時的利用範圍如何,都已是研究那個時代的珍貴「檔案」了。

    確定收錄範圍,指弄清資料庫收錄的內容特徵。在資料庫的介紹中,一般會對此作出說明,如「早期英文書籍在線」(Early English Books Online)的介紹,一般會說明其收錄的數量(12.5萬餘種、超過2250萬頁英文著作)、時段(1473—1700年之間)、類型(名家著作、皇家條例及布告、軍事、宗教和其他公共文件、年鑑)、學科範圍(歷史、語言、音樂、美術、物理學、婦女研究)等。但確定內容特徵有時也會有一定的困難,上文提及的總庫與子庫的情況是其中之一。有的資料庫有很多子庫,但圖書館一般只會選擇部分子庫購買,而標引時卻用總庫名稱,這樣就很難知道該庫在某一具體館中的子庫收錄情況。另一種情況是,很多圖書館會選擇資料庫中與本校教學科研密切的模塊來購買,從而導致即便沒有子庫的資料庫,在各館中收錄內容差異也較大。比如Sage期刊庫,有的館(如首都師範大學)購買了500多種現刊,有的館(如北京大學)則購買了800多種現刊。同名資料庫各館收藏不同,會讓同一檢索在不同的館藏出現差異甚至差別較大。此外,有的資料庫以模塊形式呈現,模塊下內容較多,而模塊名稱卻未必能完整展現其收錄內容。如ProQuest歷史庫的一個模塊「越南戰爭和美國外交政策(1960—1975年)」(Vietnam War and American Foreign Policy,1960—1975)是一個單一的資料庫,從其名稱來看,只能判斷其與越戰有關。但這個資料庫收錄內容廣泛,含有104個子輯,內容極其豐富,比如有成系列的美國國家安全委員會文件、國家安全委員會會議記錄,從甘迺迪到尼克森時期的國家安全文件等,實際上是戰後到20世紀70年代美國外交史研究的重要資源。像這類資料庫,不了解其子輯內容就沒法深入利用。

    定名與定性是我們利用外文資料庫的起步工作。接下來,就可以大體判斷某一資料庫與我們所從事研究的關係,從而確定是否要加以搜集和利用。類似於做專題文獻書目一樣,在從事一項專題性的學術研究時,也要圍繞該研究搜集在線資源,做一個專題資料庫的列表。需要注意的是,這些專題資料庫搜集時面不能過窄,它們不僅要包括與某一研究直接相關的數字資源,也要包括一些宏觀性質的及可能相關的其他資料庫。如研究兩次世界大戰期間英國的綏靖外交,首選當然是英國的外交檔案以及重要人物的文件集,如收錄了60餘冊《英國外交政策文件,1919—1939年》的「英國海外政策文件」(Documents on British Policy Overseas)資料庫、內維爾·張伯倫和奧斯丁·張伯倫的文件集(The Papers of Neville Chamberlain; The Papers of Sir Austen Chamberlain)、「邱吉爾檔案」(Churchill Archive),次選是這一時期的內閣文件(Cabinet Papers)和國會文件的系列資料庫(U.K.Parliamentary Papers, House of Commons Parliamentary Papers, Hansard等),最後是反映當時媒體動向的重要報刊,如「大英圖書館報紙」(British Library Newspapers)、《泰晤士報》《每日電訊報》《倫敦新聞畫報》《圖畫郵報》等。同時,通過「英國外交部機密印刷件:北美,1824—1961年」(Confidential Print: North America, 1824—1961)、「英國外交部:美國通信」(British Foreign Office: United States Correspondence)、「英國外交部檔案:日本,1919—1952年」(Foreign Office Files for Japan,1919—1952)、「英國外交部檔案:中國,1919—1980年」(Foreign Office Files for China,1919—1980)等英國檔案資料庫,以及美國、日本、德國、澳大利亞、加拿大等國家的外交檔案數字資源,可了解圍繞英國綏靖行動有關國家的互動。以上搜集偏重於兩次世界大戰期間與英國有關、相對原始的文獻,也不能忽略一般的通用資料庫,比如圖書資源(約50種)、期刊資源(約30種)、學位論文資源(十餘種)等。

    在搜集到相當的電子資源後,還要進行內容考辨的工作。這一考辨,可以從兩個角度入手。

    一是觀察資料庫資料來源和開發機構。一般而言,政府機構公布的本機構所掌握文獻的權威性,高於其他來源;知名開發商、學術機構開發的專業性資料庫,高於一般網絡資源。例如,我們要查美國人口數據,最優先利用的是美國人口普查局開發的「美國事實發現者」(American Fact Finder),它可以提供美國人口、住房、經濟和地理數據的來源;關於美國農業人口,則要參閱農業部的「國家農業統計數據」(National Agricultural Statistics Service),它提供了自1840年以來美國各州和地區的農業人口普查數據;還可以利用明尼蘇達大學的「美國國家歷史地理信息系統」(National Historical Geographic Information System),它提供了1790年至今的美國人口普查和其他全國性調查統計資料,包括帶有地理空間屬性信息的人口、農業、經濟等方面的數據。

    二是注重數據形式和原實體之間的關係。就人文學科的多數資料庫而言,其數據往往來自某種實物。利用這種資料庫時,除了傳統利用實物載體要注意的考辨等工作外,還要考察數據形式同原實體之間的關係。如紙質文獻在電子化的過程中,是完整電子化,還是部分電子化?電子化的文獻是如何排列的,這種排列同原始文獻的排列關係何在?等等。如ProQuest公司開發的「數位化國家安全檔案」(Digital National Security Archive),其文獻選取和組合模式是圍繞某一國家安全問題,抽取來自不同機構的檔案,並按時間先後組織在新的子輯中。雖然所抽取的檔案是完整掃描,但它並不會完整掃描原檔案所在卷宗或系列,研究人員只能通過不同檔案的時序排列建立起聯繫。利用這類資料庫時,有時還需使用相關的配套指南、大事年表、人名索引等工具。

    定名與定性、建立專題資料庫、內容考辨,是利用外文資料庫的基礎工作。做好這些工作,研究者可以更高效準確地找到自己所需要的電子資源。當然,它們並非利用外文資料庫注意事項的全部,如從知識考古學角度,可以討論資料庫開發的知識背景、開發動機、開發人員組成、文獻著錄方式等;從文獻挖掘角度,可以討論挖掘工具的選用、關鍵詞選取、算法等,這些都是我們在使用資料庫時需要考慮的內容。

    (作者:姚百慧,系首都師範大學歷史學院教授)

相關焦點

  • 龐大的外文資料庫如何運用於我國世界史研究?
    原標題:我國世界史研究中外文資料庫的利用據筆者調查,國內主要圖書館購買的以及可免費利用的外文專業資料庫資源,已超過千種。這些資料庫就文獻類型而言,可分為圖書、期刊、學位論文與會議論文、報紙、檔案、統計資料、報告、書目與文摘、圖片、音視頻等。
  • 「圖書推薦」《世界史研究外文資料庫指南》緒論
    《世界史研究外文資料庫指南》緒論來源:世界知識出版社微信平臺編輯:周悅01本書旨在對國內館藏或可資利用的世界史研究資料庫,做一嘗試性分類和簡介,它希望起到的作用包括三方面。其一,作為世界史研究初學者的入門嚮導。工欲善其事,必先利其器。
  • 光明日報推薦參評2020年中國新聞獎消息通訊類作品《創新服務能力...
    習近平總書記在今年6月16日致《光明日報》創刊70周年賀信中明確指示,《光明日報》要「堅守思想文化大報定位,堅持守正創新,構建全媒體傳播格局」,要繼續「團結、聯繫、引導、服務知識界」。《光明日報》數十年來與知識界有著深厚情感與密切聯繫,但在新媒體格局下,如何建設有效服務廣大知識界的新型平臺,是光明日報融媒體發展必須解決的問題。
  • 光仁洪與中國世界史研究
    他與同時代的吳於廑、周一良、齊思和、林志純、吳廷璆、蔣孟引、張芝聯、楊生茂諸先生一樣,在世界史教材編寫、學術組織建設以及學術研究方面進行了艱辛探索。  篳路藍縷創「新編」  我國世界史學科起步晚,底子薄,發展慢。新中國的成立為世界史研究打開了廣闊的發展前景。
  • 關於舉辦「尋找中國好校長」大型公益活動的啟事-光明日報-光明網
    為踐行社會主義核心價值觀,弘揚時代主旋律,順應教育深化改革發展趨勢,提升校長專業化水平,由光明日報社主辦,《教育家》雜誌社、光明網承辦,《留學》雜誌社、人民教師網協辦的「尋找中國好校長」大型系列公益活動正式啟動。
  • (4月14日)嘉園講壇第一講:如何有效利用外文文獻助力科學研究
    (4月14日)嘉園講壇第一講:如何有效利用外文文獻助力科學研究 來源:圖書館   時間:2020-04-14  瀏覽:
  • 民間文獻、資料庫與作為方法的總體史-光明日報-光明網
    2.民間文獻資料庫與社會理論及田野研究的關係    民間文獻的性質,決定了對民間文獻的研究以及以民間文獻為資料的研究,在方法和視野上必然是多學科、跨學科的綜合研究,並必然強調民間文獻與其他文獻以及文獻與田野的結合,在理論和概念上則必然更深刻地受到社會科學的影響。
  • 常用醫學外文資料庫的檢索功能及選擇策略
    時間:10月31日(周一)15:30-16:30地點:新民校區醫學圖書館三樓培訓室主講人:曹琦佳適應對象:醫學方向低年級本科生、高年級本科生、研究生、教師具體內容:醫學外文全文資料庫能反映本領域的最新研究進展,對於本學科領域的科研起著重要的導向作用。
  • 錢乘旦:世界史研究的時代關懷
    然而,相比於有著兩千多年積累的中國史研究而言,我國的世界史研究就顯得很年輕,它從20世紀初才算真正開始。改革開放給年輕的世界史學科提供了極好的發展機遇,也對世界史研究的時代關懷提出了更高的要求。   回應時代問題是我國世界史研究的優良傳統   儘管我國有著幾千年之久的歷史研究傳統,但我國的世界史研究卻不是從中國史學科中派生出來的一個分支,而是產生於西方的衝擊之下。
  • 光明日報 | 上海外國語大學:「話語能力」裡築家國情懷
    光明日報 | 上海外國語大學:「話語能力」裡築家國情懷 2020-08-21 15:28 來源:澎湃新聞·澎湃號·政務
  • 我校圖書館更新中外文文獻資料庫
    為了配合我校教學科研的快速發展,滿足廣大師生獲取不同學科、不同類型文獻信息的需求,現將我校圖書館近期引進的幾個中外文文獻資料庫,介紹給廣大讀者:①Ei Village——美國《工程索引》網絡版資料庫Compendex資料庫是目前全球最全面的工程檢索二次文獻資料庫,包含選自5,000多種工程類期刊、會議論文集和技術報告的超過
  • 光明日報社行政人員招聘公告-光明日報-光明網
    光明日報創刊於1949年6月16日,是中共中央主辦,以知識分子為主要讀者對象的思想文化大報。作為黨中央指導意識形態工作的重要陣地,作為黨和國家聯繫廣大知識分子的橋梁和紐帶,光明日報始終堅持與真理同行,與時代同步,立足知識界、面向全社會,在團結、聯繫、引導、服務知識界中發揮了重要作用。
  • 北京外國語大學圖書館中外文資料庫採購項目公開招標公告
    北京外國語大學圖書館中外文資料庫採購項目公開招標公告 公告信息: 採購項目名稱 北京外國語大學圖書館中外文資料庫採購項目 品目 貨物/通用設備/計算機設備及軟體/計算機軟體/基礎軟體/資料庫管理系統 採購單位 北京外國語大學
  • 國學大數據時代來了-光明日報-光明網
    該項工作利用Google Books中數位化質量比較高的超過500萬種圖書,時間跨度從公元1500年到公元2000年,規模總計5000億詞,其中英文3610億詞、法文450億詞、西班牙文450億詞、德文370億詞、中文130億詞、俄文350億詞,以及希伯來文20億詞(據估計,佔人類有史以來出版圖書總種數的4%),借鑑基因組學(Genomics)的思路,對這些圖書組成的「大數據」進行分析,如發現單詞或人名在歷史文獻中隨時間變化的頻率
  • 國內學術資料庫網站不完全統計
    http://cssci.nju.edu.cn/中國科學引文資料庫(Chinese Science Citation Database,簡稱CSCD)創建於1989年,收錄我國數學、物理、化學、天文學、地學、生物學、農林科學、醫藥衛生、工程技術、環境科學和管理科學等領域出版的中英文科技核心期刊和優秀期刊千餘種。
  • 科學利用清輯《全唐文》-光明日報-光明網
    【光明書話】    編者按    清輯《全唐文》規模宏大,資料豐富,但不注錄文出處,不列校勘記。日前,上海古籍出版社出版的《清編全唐文研究》一書針對上述問題,進行了深入研究,將唐文研究紮實推進了一大步。全書在資料輯集和考證論述上所下功夫極深,提供的新資料、新信息、新結論頗多。    斷代文學全集在古典文學研究中起著不可替代的支撐作用,學界對其有強烈需求。但這種書問題也最多,編纂難度極大。
  • 【光明日報】《中國科學院生物資源目錄》發布---中國科學院
    《2020年中國科學院生物資源研究報告》則系統梳理了國內外生物資源領域的政策規劃和發展態勢,分析了中國生物資源領域的發展基礎、建設與研究進展,對2019年至2020年中國戰略生物資源領域的研究及發展現狀進行了分析和總結。
  • 資訊 | 國內學術資料庫網站不完全統計
    包括學術期刊、學位論文、會議論文、外文文獻、專利、標準、科技成果、政策法規、機構、科技專家等子庫。集刊資料庫是依託中國集刊年會、中國集刊網,是中國首個學術集刊運營發布與知識服務智庫平臺,也是第一個以學術集刊資源為基礎的專業資料庫。主要以圖書、論文、圖片、圖表、資訊、視頻等類型來反映當前我國人文社會科學領域的最新成果。
  • 科研集訓專題 | 最新版國內學術資料庫匯總
    http://cssci.nju.edu.cn/中國科學引文資料庫(Chinese Science Citation Database,簡稱CSCD)創建於1989年,收錄我國數學、物理、化學、天文學、地學、生物學、農林科學、醫藥衛生、工程技術、環境科學和管理科學等領域出版的中英文科技核心期刊和優秀期刊千餘種。
  • 世界史研究方法芻議
    這一學科定位使我國世界史研究既面臨難度,又帶來前所未有的機遇。世界史研究首先要學習和借鑑國別史的研究方法。每個國家的國別史研究都有深厚的學術傳統和系統的訓練方法。自19世紀之後,各個國家都大體遵循現代科學歷史學的研究方法。這套方法的基本要素就是研究史料的方法。