醞釀多年的《通用規範漢字表》終於對外公示。
為什麼要制定字表?字表中的漢字是如何篩選出來的?怎樣規範地使用漢字?圍繞這些問題,本報記者對主要設在北京師範大學的《通用規範漢字表》後期研製工作組進行了獨家專訪,揭開字表中8300個通用規範漢字背後的「秘密」。
八年甄選8300個漢字
此次公示的《通用規範漢字表》,一共收錄了8300個漢字,共分為三級。
早在1988年,我國便出臺了《現代漢語通用字表》(收字7000個)和《現代漢語常用字表》(收字3500個);時隔21年之後,為何要重新制定《通用規範漢字表》?對此北京師範大學文學院王立軍教授表示,這主要是因為在信息化時代之下,人們的語言生活發生了巨大變化。
「任何規範都只適用於特定的時期,需要隨著時代的發展而進行改革。」王立軍教授解釋說,原有的規範在當時指導人們用字發揮了重要的作用,但是由於當時的技術局限性,規範中也有一些疏漏,比如個別進入常用字的字通行度不高。另外,不同部門先後發布的規範,內容上並不完全一致,需要重新進行整合和優化。
《通用規範漢字表》研製項目從2001年啟動,歷時8年才得以完成。專家學者們已經充分研究了我國自1955年以來編制的多個原有字表的規範原則,並基本清理了歷史遺留的用字規範問題。值得一提的是,此次發布的字表作為規範標準,是在《中華人民共和國通用語言文字法》發布後所制定的,它具有法律效應。
字表發布後並非一勞永逸。王立軍教授表示,研製工作組已經考慮到了今後對字表進行修訂的計劃。按照目前的設想,有關部門今後將對字表「三年一小修,十年一大修」,根據字表的實際使用情況和社會需求的變化,適時地對字表進行微調。
每個規範字都有來歷
能夠入選一、二級字表的漢字,是根據其使用頻率來確定的。專家們採用了9個信息龐大的「語料庫」的數據進行了統計。據北師大文學院講師卜師霞介紹,最為主要的兩個語料庫是「國家語委現代漢語平衡語料庫」和「北京語言大學現代新聞媒體動態流通語料庫」,收錄的漢字量分別為9100萬和3.5億。
「僅現代漢語平衡語料庫中,不重複的漢字就有8181個。」卜師霞老師介紹說,這個語料庫中涵蓋了從1919年至2002年的大量文字資料,除了報刊書籍、政府公文等印刷物和出版品外,就連並不起眼的產品說明書和廣告中的用字情況,也都一併囊括其中。
使用頻率最高的漢字究竟是哪個字?在對語料庫進行統計時,專家學者們也掌握到了這個並不為人所知的有趣細節。教育部語言文字應用所的王曉明老師經過統計後發現,貌不驚人的「的」字在漢字中使用頻率最高,在語料庫中出現的次數,竟然高達169萬多次。
「《通用規範漢字表》中收錄的每個字,都有明確的來歷。」北師大文學院講師凌麗君說,漢字中有大量的異體字存在,為了確保字表中收錄漢字的規範性,研製工作組的專家學者們對每個漢字的出處、正異對應關係都進行了檢索和考證,為此甚至查遍了包括《四庫全書》在內的典籍文獻。
罕見姓氏得以被正名
「氾」、「仝」、「谿」、「線」、「甯」,這些字曾被視為「泛」、「同」、「溪」、「線」、「寧」的異體字或繁體字;但是很少有人知道,它們其實原本也是姓氏。出於對家族傳統的尊重,在此次制定的《通用規範漢字表》中,這些漢字首次以姓氏用字的身份,被保留在三級字表中。
字表研製專家工作組組長、北師大文學院教授王寧以「線」字舉例說,一些「線」姓人士曾向專家們反映:「這個字中的部件『泉』,給人流動的感覺,換作『線』中的兩個『戈』,這層美好的意義就被破壞了。」而恢復這些罕見姓氏的本來面貌,將使得標誌血脈傳承的功能和文化內涵的姓氏用字得以保存。
一些漢字能夠收入字表,是基於人性化的考慮。比如「喆」原本被視為「哲」的異體字,但是研製工作組的專家學者們經過調查發現,全國有兩萬多人的名字中選用了這個字。專家們接受了民眾的意見,認為,「喆」字中兩個「吉」並排看起來很祥和,比『哲』字更適合取名,因而把它收入了三級字表,專門作姓名用字使用。
王寧教授說,此次制定字表的一個重要宗旨,就是「利國便民」。
還有一些異體字,出於對歷史的尊重而得以保留。例如,談到古代歷史時常常要用到的「盩厔」(今陝西西安「周至」縣)這兩個古字,活字印刷發明者畢昇的「昇」字,《璦琿條約》中的「琿」字,也都因其包含特定的歷史文化意義,而被收入三級字表。
據了解,此次公示的字表中共恢復了51個異體字,調整了6個繁體字。不過這些異體字和繁體字並不能任意使用。王寧教授解釋說,字表做了明確的規定,這些字只能限用於特定的地名或姓氏、人名用字;在一般意義上使用文字時,還不能隨便寫異體字和繁體字。
相關報導:
教育部:通用規範漢字表對中小學教學不會造成影響
教育部:為尊重人民實踐 51個異體字被收入規範漢字表
教育部官員:六個繁體字納入漢字表是現實需要
35個罕用字異體字等未被《通用規範漢字表》收錄
教育部:原則上不恢復繁體字 新字表廣泛徵集意見
專家稱《通用規範漢字表》是一個繼往開來的標準
高欣藝