我國世界史研究中外文資料庫的利用

2020-12-11 光明網新聞中心

  作者:姚百慧(首都師範大學歷史學院教授)

  據筆者調查,國內主要圖書館購買的以及可免費利用的外文專業資料庫資源,已超過千種。這些資料庫就文獻類型而言,可分為圖書、期刊、學位論文與會議論文、報紙、檔案、統計資料、報告、書目與文摘、圖片、音視頻等。就收入內容而言,歷史學涉及史學理論、世界通史與斷代史、地區國別史(涉及70個左右的國家)、傳記、文物考古,其他學科如地理、哲學與宗教、政治與法律、軍事、經濟、文化、科學、教育、體育、語言與文字、文學、藝術、醫藥衛生等,也有很多資源可以參考。世界史研究需要利用資料庫尤其是外文資料庫,這是無須爭辯的問題。需要討論的是,如何對這些數量龐大的資料庫進行利用。本文從定名與定性、專題資料庫的建立、資料庫內容考辨三個角度,談一些粗淺的看法。

  一

  所謂定名與定性,是指對資料庫的名稱、性質和收錄範圍有清晰的認識。

  一般而言,因資料庫開發者都會提供資料庫名稱,定名問題不會有太大的困難,但也有一些特殊情況。其一,資料庫開發者有時會改變資料庫的名稱,從而導致在不同的館藏地或不同的學者引用中對同一資料庫標引不同。如美國檔案類資料庫「美國解密檔案在線」(U.S. Declassified Documents Online),原名為「解密檔案參考系統」(Declassified Documents Reference System);期刊類全文資料庫「綜合學科學術文獻大全」(Academic Search Complete),原來的英文名為「Academic Search Premier」。在這種情況下,建議標引以最新名稱為準,同時了解其歷史名稱。其二,存在總庫、子庫的情況。如HeinOnline法律資料庫有60餘個子庫,美國國會圖書館的「數位化收藏」(Digital Collections)有300多個子庫。一些開發商或代理商,還會重組其數據資源,形成新的總庫。如Gale公司,它把旗下部分報紙期刊類的庫組成Gale NewsVault,又把以檔案為主的300餘個子庫組成「珍稀原始典藏檔案」(Archives Unbound,簡稱AU),還把這兩個庫和它的其他偏重原始檔案文獻的子庫組合起來,形成了Gale Scholar超大型資料庫。就個人利用而言,清晰的子庫名稱更重要;但由於一些館藏只標引了總庫,所以也需要了解總庫名稱。其三,館藏機構的標引方式,也會造成名稱的混亂。比如,有的館藏只列翻譯而無原文名稱,各館藏有時翻譯名稱不同,以及有的館藏根據購買情況重新擬定資料庫名稱。如國家圖書館購買了AU中亞洲的部分專輯,命名為「珍稀原始典藏檔案合集:亞洲」(Archives Unbound Asia)。

  確定性質指確定文獻的收錄類型。前文已提及,外文資料庫的文獻類型包括圖書、期刊、報紙、檔案等。不同類型的文獻,在史學研究中所起到的作用是不同的,或作為目錄檢索路徑,或作為前期學術史,或作為史料來源。在開發商或圖書館的資料庫介紹中,會說明文獻的類型或特徵。需要強調的是,上述文獻是基於現代的出版類型進行分類的,它很難完全體現人類過去所積累的文獻的所有特徵,所以只能是相對性的。比如,檔案在今天往往指代有密級的、生成之時尚不能為一般公眾查看的文獻,但對於古代史而言,甲骨、碑銘、紙草文書、木板文書等,不管其當時的利用範圍如何,都已是研究那個時代的珍貴「檔案」了。

  確定收錄範圍,指弄清資料庫收錄的內容特徵。在資料庫的介紹中,一般會對此作出說明,如「早期英文書籍在線」(Early English Books Online)的介紹,一般會說明其收錄的數量(12.5萬餘種、超過2250萬頁英文著作)、時段(1473—1700年之間)、類型(名家著作、皇家條例及布告、軍事、宗教和其他公共文件、年鑑)、學科範圍(歷史、語言、音樂、美術、物理學、婦女研究)等。但確定內容特徵有時也會有一定的困難,上文提及的總庫與子庫的情況是其中之一。有的資料庫有很多子庫,但圖書館一般只會選擇部分子庫購買,而標引時卻用總庫名稱,這樣就很難知道該庫在某一具體館中的子庫收錄情況。另一種情況是,很多圖書館會選擇資料庫中與本校教學科研密切的模塊來購買,從而導致即便沒有子庫的資料庫,在各館中收錄內容差異也較大。比如Sage期刊庫,有的館(如首都師範大學)購買了500多種現刊,有的館(如北京大學)則購買了800多種現刊。同名資料庫各館收藏不同,會讓同一檢索在不同的館藏出現差異甚至差別較大。此外,有的資料庫以模塊形式呈現,模塊下內容較多,而模塊名稱卻未必能完整展現其收錄內容。如ProQuest歷史庫的一個模塊「越南戰爭和美國外交政策(1960—1975年)」(Vietnam War and American Foreign Policy,1960—1975)是一個單一的資料庫,從其名稱來看,只能判斷其與越戰有關。但這個資料庫收錄內容廣泛,含有104個子輯,內容極其豐富,比如有成系列的美國國家安全委員會文件、國家安全委員會會議記錄,從甘迺迪到尼克森時期的國家安全文件等,實際上是戰後到20世紀70年代美國外交史研究的重要資源。像這類資料庫,不了解其子輯內容就沒法深入利用。

  二

  定名與定性是我們利用外文資料庫的起步工作。接下來,就可以大體判斷某一資料庫與我們所從事研究的關係,從而確定是否要加以搜集和利用。類似於做專題文獻書目一樣,在從事一項專題性的學術研究時,也要圍繞該研究搜集在線資源,做一個專題資料庫的列表。需要注意的是,這些專題資料庫搜集時面不能過窄,它們不僅要包括與某一研究直接相關的數字資源,也要包括一些宏觀性質的及可能相關的其他資料庫。如研究兩次世界大戰期間英國的綏靖外交,首選當然是英國的外交檔案以及重要人物的文件集,如收錄了60餘冊《英國外交政策文件,1919—1939年》的「英國海外政策文件」(Documents on British Policy Overseas)資料庫、內維爾·張伯倫和奧斯丁·張伯倫的文件集(The Papers of Neville Chamberlain; The Papers of Sir Austen Chamberlain)、「邱吉爾檔案」(Churchill Archive),次選是這一時期的內閣文件(Cabinet Papers)和國會文件的系列資料庫(U.K.Parliamentary Papers, House of Commons Parliamentary Papers, Hansard等),最後是反映當時媒體動向的重要報刊,如「大英圖書館報紙」(British Library Newspapers)、《泰晤士報》《每日電訊報》《倫敦新聞畫報》《圖畫郵報》等。同時,通過「英國外交部機密印刷件:北美,1824—1961年」(Confidential Print: North America, 1824—1961)、「英國外交部:美國通信」(British Foreign Office: United States Correspondence)、「英國外交部檔案:日本,1919—1952年」(Foreign Office Files for Japan,1919—1952)、「英國外交部檔案:中國,1919—1980年」(Foreign Office Files for China,1919—1980)等英國檔案資料庫,以及美國、日本、德國、澳大利亞、加拿大等國家的外交檔案數字資源,可了解圍繞英國綏靖行動有關國家的互動。以上搜集偏重於兩次世界大戰期間與英國有關、相對原始的文獻,也不能忽略一般的通用資料庫,比如圖書資源(約50種)、期刊資源(約30種)、學位論文資源(十餘種)等。

  三

  在搜集到相當的電子資源後,還要進行內容考辨的工作。這一考辨,可以從兩個角度入手。

  一是觀察資料庫資料來源和開發機構。一般而言,政府機構公布的本機構所掌握文獻的權威性,高於其他來源;知名開發商、學術機構開發的專業性資料庫,高於一般網絡資源。例如,我們要查美國人口數據,最優先利用的是美國人口普查局開發的「美國事實發現者」(American Fact Finder),它可以提供美國人口、住房、經濟和地理數據的來源;關於美國農業人口,則要參閱農業部的「國家農業統計數據」(National Agricultural Statistics Service),它提供了自1840年以來美國各州和地區的農業人口普查數據;還可以利用明尼蘇達大學的「美國國家歷史地理信息系統」(National Historical Geographic Information System),它提供了1790年至今的美國人口普查和其他全國性調查統計資料,包括帶有地理空間屬性信息的人口、農業、經濟等方面的數據。

  二是注重數據形式和原實體之間的關係。就人文學科的多數資料庫而言,其數據往往來自某種實物。利用這種資料庫時,除了傳統利用實物載體要注意的考辨等工作外,還要考察數據形式同原實體之間的關係。如紙質文獻在電子化的過程中,是完整電子化,還是部分電子化?電子化的文獻是如何排列的,這種排列同原始文獻的排列關係何在?等等。如ProQuest公司開發的「數位化國家安全檔案」(Digital National Security Archive),其文獻選取和組合模式是圍繞某一國家安全問題,抽取來自不同機構的檔案,並按時間先後組織在新的子輯中。雖然所抽取的檔案是完整掃描,但它並不會完整掃描原檔案所在卷宗或系列,研究人員只能通過不同檔案的時序排列建立起聯繫。利用這類資料庫時,有時還需使用相關的配套指南、大事年表、人名索引等工具。

  定名與定性、建立專題資料庫、內容考辨,是利用外文資料庫的基礎工作。做好這些工作,研究者可以更高效準確地找到自己所需要的電子資源。當然,它們並非利用外文資料庫注意事項的全部,如從知識考古學角度,可以討論資料庫開發的知識背景、開發動機、開發人員組成、文獻著錄方式等;從文獻挖掘角度,可以討論挖掘工具的選用、關鍵詞選取、算法等,這些都是我們在使用資料庫時需要考慮的內容。

  《光明日報》( 2020年07月20日 14版)

[ 責編:孫宗鶴 ]

相關焦點

  • 龐大的外文資料庫如何運用於我國世界史研究?
    原標題:我國世界史研究中外文資料庫的利用據筆者調查,國內主要圖書館購買的以及可免費利用的外文專業資料庫資源,已超過千種。這些資料庫就文獻類型而言,可分為圖書、期刊、學位論文與會議論文、報紙、檔案、統計資料、報告、書目與文摘、圖片、音視頻等。
  • 專家學者研討「大變局之際的世界史研究」
    來自復旦大學、華東師範大學、中國社會科學院、上海師範大學、上海大學、上海社會科學院的30多位世界史學者參加了此次研討會,並就大變局下我國世界史學者的責任擔當、世界史學科建設、研究主題、研究方法等方面的問題展開熱烈討論。
  • 學術乾貨丨研究僧的基本功——文獻資源檢索與利用
    作為一名有理想、有抱負的研究僧小夥伴們是否遇到過下面的問題呢?想要查的資料知網沒有怎麼辦?boss要求讀的英文期刊在哪裡?這麼多資料庫到底要選哪一個?主要包括以下一些資料庫:1、數位化期刊全文資料庫2、中國學位論文全文資料庫3、中國學術會議文獻資料庫4、中國法律法規全文庫5、外文文獻資料庫6、科技信息、商務信息系統7、專利全文資料庫維普資料庫是我國最大的數字期刊資料庫。
  • 全國人大代表陽衛國:建議取消我國境內新聞發布會外文翻譯
    「經過調查研究,並廣泛聽取社會各界意見,我們覺得此舉沒有必要性,建議在國內舉辦新聞發布會等重大外事活動中取消外文翻譯。」這一次,全國人大代表、株洲市委副書記、市長陽衛國帶來的這個建議讓人耳目一新。陽衛國介紹,近些年來,我國一些重要會議、重大活動的中外記者招待會、新聞發布會等都設有外文翻譯。
  • 中南民族大學2021年外文資料庫採購項目中標公告中標公告
    一、項目編號:ZWWH-20FZ-FW671(招標文件編號:ZWWH-20FZ-FW671)   二、項目名稱:中南民族大學2021年外文資料庫採購項目   三、中標(成交)信息   供應商名稱:中國圖書進出口(集團)有限公司   供應商地址:北京市朝陽區工人體育場東路16號   中標
  • 在LabVIEW中資料庫建立與管理功能實現方法研究
    在LabVIEW中資料庫建立與管理功能實現方法研究提出在LabVIEW中利用其ActiveX功能,調用微軟數據訪問控制項(Microsoft ADO)來實現數據訪問功能的方法,文中介紹了Microsoft ADO編程模型,並給出了在LabVIEW
  • 第四屆全國世界史中青年學者論壇在石家莊召開
    他指出,在世界百年未有之大變局中,我們可以對世界歷史上的許多問題產生新的認識,比如怎麼認識疫病和歷史發展的關係,怎麼認識歷史中的偶然性因素及其影響。當前正值歷史研究的重要機遇期,中國的世界史學者應該肩負起歷史重任,做出這個時代應該做出的成績和貢獻。世界史研究應該突出中國氣派和中國特色,同時加強與國外學界的交流。
  • 國內資料庫的檢索方法
    CNKI工程是以實現全社會知識資源傳播共享與增值利用為目標的信息化建設項目,由清華大學、清華同方發起,始建於1999年6月。二、維普資料庫及其檢索方法重慶維普資訊有限公司的前身為中國科技情報研究所重慶分所資料庫研究中心,是中國第一家進行中文期刊資料庫研究的機構。
  • 東亞區域史學術研討會暨首都師範大學東亞歷史研究中心成立儀式在京召開
    歷史學院作為首都師範大學的一份子,在對外學術交流中積累了較為豐富的經驗,東亞歷史研究中心的成立,相信會為構建人類命運共同體,做出自身應有的貢獻」。董增剛在致辭中表示:「首都師範大學歷史學院是由齊世榮、戚國淦等老一輩歷史學家辛勤創立的,如今歷史學院學科建制完整,師資力量雄厚,世界史、中國史、考古學在全國學科排名中名列前茅,並且在某些專業研究領域保持國內先進水平。
  • 《核酸研究》:高質量模式微生物基因組資料庫及分析平臺
    近日,《核酸研究(Nucleic AcidsResearch)》在線發表了國家微生物科學數據中心(中國科學院微生物研究所微生物資源與大數據中心、世界微生物數據中心)團隊關於全球模式微生物基因組資料庫gcType的文章。gcType是由我國牽頭的全球模式微生物基因組測序計劃的重要成果。
  • 對《歷史研究/中國史與世界史的融合》之淺談
    對《歷史研究/中國史與世界史的融合》之淺談倪寄如(退休工人)《歷史研究》2020年第4期刊出了陳懷宇的學術觀點,並對其《中國中古史研究:從中國走向世界》加了編者按——中國史與世界史的對話與融合,是歷史學永恆的命題,將中國史與世界史互寓其中,有助於對中國史有更深刻的詮釋,有助於對世界史有更全面的認識,有助於在對人類歷史的科學探索中,把握人類社會發展規律,解釋人類文明的真諦。中國史與世界史的互動、碰撞和交融,既是歷史學發展的應有之義,也是歷史學高質量發展的必由之路,同時也是本刊始終秉持的理念。
  • 臨沂大學2021年圖書館外文電子文獻資料庫採購項目(A7包)中標公告
    一、採購人:臨沂大學 地址:山東省臨沂市雙嶺路中段(臨沂大學) 聯繫方式:0539-7258756(臨沂大學) 採購代理機構:山東盛和招標代理有限公司 地址:山東省青島市市北區縣(區)敦化路138號西王大廈23A01室 聯繫方式:18663728356、18615261927   二、採購項目名稱:臨沂大學2021年圖書館外文電子文獻資料庫採購項目
  • 我國科學家構建油菜功能基因資料庫
    我國科學家構建油菜功能基因資料庫 2020-07-31 科技日報 劉志偉 童超波 劉勝毅 【字體:大 中 小】
  • 寫畢業論文,外文文獻從哪裡找?
    該平臺上的文獻資源非常的豐富,單外文文獻資源就多達6000餘萬,加上專利,合計就有1.5億餘萬。這些外文資源包含,外文期刊、會議、學位、OA、科技報告、軍事報告、專題報告、專利等,涵蓋全領域,且均可獲取原文,月更新幾十萬篇。
  • 蔡孟翰:宮崎市定史學:世界史中的中國史
    在《亞洲史論》裡,礪波護刪去第一章《東洋的樸素主義民族與文明主義社會》,以《世界史敘說》替代,原本第五章《菩薩蠻記》刪去第一部分西亞遊記,留下第二部分西亞史的展望,並以西亞史的展望為新的標題。礪波護刪去第六章《日出之國與日沒之處》,以《亞洲史論考·下卷》最後一章《東亞史上的日本》替代。 如此一來,誠如礪波護所說,「宮崎的亞洲史觀以及世界史觀更能以直接俐落的形式,能讓讀者看到」。
  • 【方志四川•論壇】王紹安 ‖ 地方志編纂應重視外文資料的運用
    馬克思主義認為:在研究問題的時候,首先要客觀地、充分地、全面地佔有材料,特別是第一手材料。只有在充分掌握材料的前提下,才能從中引出客觀的規律。因而在地方志編纂過程中,不但要掌握中文資料還要掌握外文資料,不但要學懂弄通做實習近平新時代中國特色社會主義思想,還要知道國外對我國改革開放新時代發生的重大事件、制定的方針政策所持的態度。
  • 使用外文翻譯方法降重有效果嗎?
    在網際網路上有各種各樣的降重方法,外文翻譯法只是其中的一種,那外文翻譯法能否有效地幫我們降低論文的重複率呢?事實上,在許多情況下,我們在撰寫畢業論文時,都需要用到外語,同時也需要對論文進行查重。現在大多數學校都使用知網論文檢測系統,那對於英語中翻譯成中文的論文內容,知網是否能檢測出重複內容呢?知網檢測系統有自己獨特的資料庫和算法,檢測後會標記出重複的內容。當相似度大於80%時,用紅色符號表示嚴重相似度,黃色語句略相似,綠色表示未檢測到類似語句合格。
  • ...人群;全國人大代表陽衛國:建議取消我國境內新聞發布會外文翻譯
    視頻中,一名警察膝蓋跪在一名黑人男子的脖子上,將其反扣在地。該男子動彈不得,不斷喊出「我無法呼吸」,然而警察一行四人置若罔聞,該男子最終窒息而死。目前,與事件有關的四位警察均已被解僱。另據環球網援引外媒報導,此事件引發了明尼蘇達州抗議示威活動。當地時間26日,數百名抗議者聚集在明尼阿波利斯市要求「伸張正義」並與警方爆發衝突,後者使用催淚彈和爆震彈驅散人群。
  • 王興 | 從「西洋史」到「世界史」:中國世界史學科的演變
    1920年陳衡哲被聘為北京大學教授, 講授西洋史, 她在北大開學演講中提到當時「中國的學界, 對著西洋歷史和研究歷史的方法, 有一種十分誠切的要求」。然而當時中國人學西洋史的情況並不樂觀, 他們「還沒有得著相當的研究法與教授法, 所以把西洋史這門學問, 弄得變成了一種乾燥無味的學問」, 因此加強在高校中對西洋史的學習和研究, 不僅是時人的共識, 也是中國史學繼續發展所必需。
  • 李隆國:構建國別史與世界形成史融合的中國新世界史
    這一學科定位使我國世界史研究既面臨難度,又帶來前所未有的機遇。世界史研究首先要學習和借鑑國別史的研究方法。每個國家的國別史研究都有深厚的學術傳統和系統的訓練方法。自19世紀之後,各個國家都大體遵循現代科學歷史學的研究方法。這套方法的基本要素就是研究史料的方法。