我國少數民族歷史悠久,許多少數民族在歷史上創製了古民族文字,並以民族文字形成了極其豐富的反映各民族社會歷史發展情況的文字歷史檔案。研究少數民族文字歷史檔案數位化建設的現狀與對策問題,可更好地發掘、傳播與利用這一優秀的民族歷史文化遺產。
一、少數民族文字歷史檔案數位化建設的現狀
少數民族文字歷史檔案是指建國前少數民族地方政權、土官、個人在其社會歷史發展過程中以本民族文字直接形成的反映少數民族政治、歷史、經濟、軍事、天文、曆法、醫藥、教育、文藝、哲學、倫理、宗教和民俗等方面情況,具有保存價值的各種不同形式的歷史記錄。少數民族文字歷史檔案數量豐富、種類繁多,其中較為典型的是滿文、藏文、維吾爾文、彝文、傣文、東巴文、白文、壯文、苗文、瑤文和水書等檔案材料,按其現存方式可劃分為古籍、文書、石刻(又包括碑刻、摩崖、石經牆、石經片和石經墩等類型)、金文、印章、竹簡、木刻、貝葉、骨文、皮書、布書、瓦書和陶文等。現今,少數民族文字歷史檔案的數位化建設處於起步階段,現狀如下:
1 .少數民族文字數位化技術多為高校、民族研究所、計算機中心等機構進行開發。以藏文數位化技術的研究為例。1986年由青海師範大學研究開發的TCDOS2.0版藏文系統通過了鑑定,這是第一個收入使用的藏文系統;中國藏學研究中心和航天部701所於1988年8月推出了藏文文字處理及雷射編輯排版印刷系統,後與濰坊華光合作開發出了華光書林藏文排版和雷射照排系統;中國計算機軟體與技術服務總公司、民族印刷廠、北京大學計算機研究所、中國民族語文翻譯中心聯合研製並推出了北大方正藏文書版系統,北大方正1997年推出了基於WIN31的藏文維思彩色印刷系統;西南民院計算機研究室開發了基於DOS平臺的SPDOS漢藏文版作業系統和藏文文字平臺。
2 .北方地區少數民族文字數位化技術的研究領先於南方地區。除藏文外,其他少數民族文字數位化技術開發情況如下:
(1)蒙古文。內蒙古計算中心開發出蒙文、漢文、英文作業系統,與山東濰坊合作研發出華光V型蒙文書刊、圖表、報紙雷射照版系統;內蒙古大學研製出MPS蒙漢混合字處理系統;內蒙古大學與北大合作開發出《北大方正電子出版系統》蒙文版。內蒙古社會科學院蒙文研究所的蘇·蘇雅拉圖研製出基於Windows95的蒙古文處理系統(可攜式計算機)。
(2)維、哈、柯文。主要有1989年新疆民語委主持開發的博格達維、哈、柯、漢、英、俄多文種排版系統;北大方正及濰坊華光已都研製有維、哈、柯文的排版系統;1997年6月新疆開發的《未來多文種系統VTDOS6.1》。
(3)朝鮮文。如方正朝鮮文書版系統和思維系統;華光推出的書林朝鮮文系統。
(4)錫伯文、滿文。有新疆民語委主持開發的計算機錫伯文、滿文文字處理和輕印刷系統;內蒙古大學等研製的滿文系統;遼寧省檔案館和東北大學計算機語言工程研究室共同開發的滿文作業系統。
(5)彝文。有北大方正和西南民院合作開發的彝文系統書版軟體;西南民院自行開發的VCDOS漢彝文雙語平臺和SPDOS漢彝文版漢字作業系統,後又推出了Win95彝文文字平臺;由雲南省民語委和雲大計算中心合作開發的雲南規範彝文排版系統。
(6)傣文。北大方正開發的傣文電子出版系統;濰坊華光開發的傣文電子排版系統。
(7)壯文。由北大方正研製的在英文基礎上稍加改造後實現的壯文書版系統。
(8)苗文。雲南省楚雄州光亞電子研究所研製的苗文排版系統。
3 .檔案系統少數民族文字歷史檔案的數位化管理工作尚未全面開展。現今少數民族地區許多檔案館(室)都收集珍藏有滿文、藏文、維吾爾文、彝文、傣文、東巴文、白文、壯文、苗文、瑤文和水書等少數民族文字歷史檔案,這些檔案大多處於手工管理階段,只有少數檔案部門開展了少數民族文字歷史檔案信息的數位化工作,檔案系統尚未開發出單一或多民族的數位化管理系統軟體;在現有檔案管理軟體中,也沒能開發出少數民族文字歷史檔案的管理功能,這就極大地限制了少數民族文字歷史檔案的利用效率與範圍。
二、少數民族文字歷史檔案數位化建設的方法
(一)引進與採用少數民族文字數位化的技術與科研成果
如許多高校、民族研究所、計算機中心等機構在少數民族文字處理技術方面開發出了藏文、蒙文、維文、朝鮮文、錫伯文、滿文、彝文、傣文、壯文、苗文等。在資料庫建立方面,蒙古文和藏文取得了顯著的成績。1987年完成中世紀蒙古語文資料庫;1993年在完成100萬詞綴(現代蒙古語文資料庫)的基礎上,又完成了《500萬詞級現代蒙古語文資料庫》;完成了《元朝秘史》拉丁標註、漢文標註和漢文旁註本的檢索統計系統,在《現代蒙古語詞頻統計》的基礎上又整理出《現代蒙古語頻率詞典》;研製了MHJ—1型蒙古語言分析軟體包;1990年推出蒙古文拉丁化輸入方法,開發了從新蒙古文到老蒙古文的轉寫軟體,完成了蒙古文詞根、詞幹和附加成分的自動切分與複合詞的自動識別系統;蒙文字幕機系統,蒙漢混排圖章計算機輔助設計系統,篆文刻繪系統,蒙語文節目微機管理系統,微機蒙文圖書目錄管理系統,蒙醫癲癇病專家系統等。
此外,廣西壯族自治區語委主持開發了壯語詞庫;西南民族學院開發出彝文(四川涼山規範彝文)字幕機系統;中國社會科學院民族研究所完成了1994年基金項目——中國少數民族語言文字多媒體資料庫。這些少數民族文字資料庫的建立,為少數民族文字歷史檔案的數位化提供便利條件。
(二)積極開展少數民族文字歷史檔案的數位化工作
1 .鍵盤輸入。鍵盤輸入是少數民族文字歷史檔案數位化的一種基本形式,目前已經開發出許多少數民族文字輸入法,各民族地區的檔案館(室)工作人員可根據所管理少數民族文字歷史檔案的情況選擇具體的少數民族文字輸入法,以作為少數民族文字歷史檔案數位化的基本工具。
2 .掃描儀。掃描儀的工作原理是把紙上的圖形、圖像或文字信息變成像素點陣,再用二進位數表示這些點陣,從而將圖形、文字變成數字,輸入計算機。由於掃描儀可以將整頁的少數民族文字、圖形或圖像直接輸入計算機,因而在少數民族文字歷史檔案信息的輸入方面具有廣闊的應用前景。