[訂閱]點擊文章標題下藍色的「漢語學習沙龍」,再點擊「關注」,以後更新資料會不斷自動推送到您的手機。[查看以前文章]再點擊「查看歷史消息」,即可看到以前發表的所有資料。
漢字總數到底一共有多少?
清朝編纂的《康熙字典》收字47,035字。它依據明朝《字彙》、《正字通》兩書加以增訂,其1716年面世以來,曾穩據收字最多的字典達兩百年。共和之後第四年,即1915 年,中華書局將宣統元年開始修訂的一部字典,冠名《中華大字典》出版,號稱收字達四萬八千餘,超過《康熙字典》約1,000 字。然而,其影響力始終沒有超過《康熙字典》。另外,該字典重複設立字頭的現象比較普遍,實際收字只有44,433字。對於《康熙字典》中收納的音義未詳字,或有音無義的約3,500字,《中華大字典》沒有收錄,因此實際上,與《康熙字典》去重後46,960字相較,《中華大字典》還要少收了近2,500字。近幾年來,對特大型字典的全文數位化完成之後,這些字典重複收字的情況才開始被認識清楚。因此,在1990年《漢語大字典》第一版出版前,《中華大字典》曾長期被誤認為是國內收字最多的字典。
《中華大字典》
真正超過《康熙字典》收字記錄的,是上個世紀六十年代日本人的《大漢和辭典》。1963年,漢學大家諸橋轍次歷時35年編纂的13冊《大漢和辭典》,一經大修館出版社全部刊出,即刻蜚聲國際。該字典初版收字五萬字,第二版收字五萬一千餘字,超過《康熙字典》三、四千字,成為古典漢語研究的新的權威。目前在東京大修館內設有《大漢和辭典》工作室,其修訂與再版工作,多年來不曾中斷,值得國人關注。
《大漢和辭典》
中國臺灣於《大漢和辭典》出齊後,曾經授予編纂者諸橋轍次一枚學術獎章。隨後,一是將《大漢和辭典》進行了盜印,二是組織力量編輯自己的特大型字典。幾年後的1968年,張其昀監修,林尹、高明主編的《中文大辭典》40冊倉促面世,收字49,905 字。然而,與日本的競爭,臺灣並不落下風,目前的漢字字典收字記錄即由臺灣保持。臺灣自1995年開始組織編輯《異體字字典(Dictionary of ChineseCharacter Variants)》,2000 年試用版網絡發布,目前最新的版本為2004年學術網絡11版(正式五版),收字106,230 字,計正字29,892,異體字76,338。遺憾的是,臺灣政府後力不足,該字典始終未出紙質版。
《中文大辭典》
在編撰大型字典的國際競爭中,大韓民國也不甘落後。1978年韓國啟動《漢韓大辭典》編纂工程,2008年16冊完刊,收字6萬。根據當時的相關新聞報導,該字典收字量和詞條數量都高居世界第一。報導同時指出,《韓漢大辭典》還補充了1萬多個韓國「固有漢字」。日本或韓國的優勢在於,其編纂的字典,可以專注收納其所在國專用的特殊字詞。
《漢韓大辭典》
中國國內的特大型字典編纂工作起步較晚。由徐仲舒主編,由湖北、四川兩省所組建的多個編寫組協調完成的13冊《漢語大字典》,於1990年面世。該字典收字數為54,678字。2010年4月,湖北辭書出版社又出版了《漢語大字典(第二版)》,收字增加到60,370 字。該字典收字多、釋義全,出版後即成為古典漢語研究新的權威。目前國內收字最多的字典是根據《漢語大字典》編纂資料整理的,冷玉龍等主編的《中華字海》(中華書局,1994),收字高達85,568 字。由於官方倡導簡化字,禁行正體字和異體字,並且出於正統性的考慮,不收日本國字、韓國固有漢字和越南字喃俗字,因此,國內官修字典收字受到一定的限制。
《漢語大字典》
《中華字海》
康熙字典(修訂版)
社會科學文獻出版社獨闢蹊徑,於2008年出版了《康熙字典(修訂版)》,該書由於採用超大漢字字符集建立巨型古典文獻資料庫——《瀚堂典藏》古籍資料庫,運用計算語言學原理和方法,通過計算機運算的方法,修訂、編纂字典,其效率大大提高。後來,王宏源增訂的《康熙字典(增訂版)》再次由社會科學文獻出版社出版發行。《康熙字典》(增訂版)全書一冊,2100頁,包括 Unicode Han A B C D 四個編碼區全部的字符,合計收字75,974 字,但未包括 Unicode 組織新增加的E 區5,762 字。由於《康熙字典》(增訂版)基於具有統一標準的 Unicode 字符進行運算編輯,每一個收錄的字,都可以存在並運行於電子設備中,該字典等同於一部《國際統一表意字符字典》(Unicode Han Dictionary)。同時,字典附帶有《瀚堂典藏》古籍資料庫試用帳號,讀者可利用檢索,窺其奧妙。
康熙字典(增訂版)16開本,精裝
據學者估計,東亞表意字符的總量大約有25萬字,目前可以辨識的近半數,其編碼工作在Unicode機構的管理之下有序進行中。Unicode作為國際標準制訂機構,廣泛接受東亞多個國家和地區提報的UnicodeHan字符。由於《康熙字典(增訂版)》是基於Unicode Han國際統一東亞編碼字符,採用計算語言學的原理,通過運算完成的特大型字典,並且對韓、日、越等中國周邊漢文化圈創造的字符,全盤收納。因此,隨著Unicode字符的不斷發布,該字典也將會不斷擴充,當可在不遠的將來重新坐上收字最多字典的寶座。
歷代工具書所收漢字數量
《說文解字》(公元100年) 9,353 (漢代)
《玉篇》(543年) 16,917
《廣韻》(1008年) 26,194
《集韻》(1037年) 53,525
《字彙》(1615年) 33,179 (明代)
《正字通》(1671年) 33,000 (明末清初)
《康熙字典》(1716年) 47,035 (清代)
《中華大字典》(1915年) 48,000 (清末民初)
《漢和大辭典》(1963年) 51,000 (日本)
《中文大辭典》(1968年) 49,905 (臺灣)
《異體字字典》(2004年) 106,230 (網絡版,臺灣)
《漢韓大辭典》(2008) 60,000 (韓國)
《漢語大字典》(第二版,2010年) 60,370
《康熙字典》(增訂版)(2015年) 75,974
《中華字海》(1994年) 85,568
估計「東亞表意字符」數量 25萬(除了中國漢字,還有韓、日、越自創的本土漢字,以及少數民族創造的一些表意文字)
《說文解字》
《玉篇》
《廣韻》
《集韻》
《字彙》
《正字通》
————————————
訂閱
點擊頂部標題下的藍色文字「漢語學習沙龍」後,再點擊「關注」,即為訂閱本微信內容,所有更新都會自動發送到您手機的微信中。
查閱以前的文章
點擊頂部標題下的藍色文字「漢語學習沙龍」,再點擊「查看歷史消息」,即可查看以前發表的所有文章或資料。
轉發、分享和收藏
點擊右上角,即可把文章或轉發給朋友,或分享到朋友圈,或收藏在您的手機裡。
本平臺微信號
「漢語學習沙龍」或者「hyxxsl」,輸入到「查找公眾號」即可找到。