2013-11-05 來源:語信司
範可育(華東師範大學):漢字的總數有多少?無人能準確回答,往往以工具書或字庫的收字量為依據。1994年9月28日《新民晚報》報導,由中華書局和中國友誼出版公司發行的《中華字海》收字86,000多個。1999年11月17日《文匯報》報導,北京國安資訊設備公司漢字字庫收錄有出處的漢字字形共計91,251個。國際編碼ISO-10646字符集收字將近80,000個。
費錦昌(教育部語言文字應用研究所):漢字字數眾多,但實際使用的字量有限。著名文字學家裘錫圭先生指出:「從商代到現代,一般使用的漢字的數量似乎並沒有顯著的變化,很可能一直在五六千左右徘徊。」當然,具體的字種,從商代到現代是有變化的,但用到的字數沒有大的變化,這是受到文字作為交際工具這一基本屬性的制約。這五六千字中,有的字常用,經常出現;有的字不常用,難得露面。它們在文本中的使用度和覆蓋率是不同的。常用字適應人們的共同需要,非常用字滿足人們的特殊需要。為了學習和使用的方便,人們總是要先學習經常用到的字。漢字的定量和分級可以說自古就有,歷史上著名的蒙學課本《三字經》《百家姓》《千字文》(俗稱「三百千」)就是從記錄日常記事、歷史敘述、姓氏人名等用字中篩選出來的。跟今天的字頻統計不同的只在於,現代靠計算機,古代靠語感、字感和經驗。上世紀二三十年代,著名教育家陳鶴琴曾用人工統計55萬多字的書報語料,得出不同漢字4261個。這是我國最早有意識地、從教育學的角度進行的漢字字頻統計工作。
顏逸明(華東師範大學):自從計算機介入漢字研究以後,漢字字頻統計工作開創了全新的局面,速度之快、精度之高是人工統計所無法比擬的。字頻統計的科學性還取決於三個條件:一是語料的字量,二是語料的年代跨度,三是語料在門類、領域上的覆蓋度和均衡度。
高家鶯(華東師範大學):《通用規範漢字表》根據漢字使用頻率、通用程度的不同和適用對象、使用要求的差異,對收錄的8105字進行合理分級。漢字分級是客觀存在的反映,並非字表研製者的主觀設計。分級的目的是為了增強字表的實用性,有效提高漢字學用的效率。
費錦昌:《現代漢語常用字表》(1988年)與《通用規範漢字表》(2013年)的一級字表收錄的都是常用字,字數都是3500個,二者的不同之處在於置換了103字,置換率近3%,就是每100個字中換了3個字。《現代漢語常用字表》中有103字未進入《通用規範漢字表》的一級字表,《通用規範漢字表》一級字表另外收錄了103個出現頻率更高的常用字。發生這種變化的原因是字頻統計工作在這二十多年中科學化程度更高了。據說,按字頻的高低排列,《通用規範漢字表》收錄到2700多字時,覆蓋率已經跟《現代漢語常用字表》3500字等同。為了尊重民眾的習慣,一級字表擴充編制,仍收3500字。也就是說,掌握了《通用規範漢字表》的3500個一級字比原先《現代漢語常用字表》的3500字使用的效率更高了。
高家鶯:過去語文教學中,有的教師往往著力教那些難字、僻字,而忽略了常用字的教學,導致學生在日常使用漢字時,讀錯字音、寫錯字形、弄錯字義的情況比比皆是。一屆屆畢業生走進社會,由於他們在校時沒有學好常用字,致使社會通用層面用字的整體水平下降。在歌舞比賽扎堆的背景下,中央電視臺獨具慧眼,舉辦了「中國漢字聽寫大會」,警醒民眾要保護漢字,弘揚漢字文化,在全社會獲得良好的反響。但在決賽階段,為了分出高下,舉辦者無奈地拋出大量生僻的書面語詞作為試題,比如「驊騮」「愣蔥」「捍蔽」「婉孌」等等,以致在比賽現場的復旦大學錢文忠教授連連驚呼:「這都是什麼孩子啊!這樣生僻的詞語也能寫出來!文曲星下凡啊!」我以為測試這些難字、僻詞,偏離了語文現代化方向,客觀上會對參賽者和電視機前的成千上萬學生起到不良的導向作用。現在不是已有參賽者在背字典、啃古文了嗎?希望下屆比賽時著重測試常用和通用詞語,可在試題中引進書寫元素和字用元素,用這種辦法來提高試題難易的區分度。
範可育:《通用規範漢字表》三級字表收錄的1605字提升了字表的「生澀度」,招來不少非議。以404個地名用字為例,字表把鄉鎮以上的地名用字全部收錄,還收了部分村級地名和部分自然實體名稱的用字,對於全國大多數人來說,這些字絕大多數是罕用字、生僻字,但這些生僻字對於當地人以及跟當地聯繫較多地區的百姓來說,它們又是常用字。比如「垟」(yáng,田地,多用於地名),我這個以語言文字學為專業的人平時也很少接觸到,但對於浙江溫州一帶,特別是翁垟、黃垟的百姓來說,「垟」是天天要碰面的常用字。正因為有這樣一個特性,《通用規範漢字表》把「垟」這類字收入三級字表,使它們獲得了「通用規範漢字」的身份證,這樣做既不會加重全國大多數民眾的負擔,又保證了這些特殊領域用字在電腦字庫中的位置。在現今科技發達的資訊時代,在電腦字庫裡增加若干個姓氏人名用字、地名用字、科技用字、普及文言文用字應該不是解決不了的難題。由於這些字進入了《通用規範漢字表》三級字表,將給戶籍、郵政、金融、科技和旅遊、辦理出國護照等用字帶來很大的便利。
顏逸明:使用三級字表中的字,要注意字表的註解。如「邨」原是《第一批異體字整理表》認定的「村」的異體字,已被淘汰。《通用規範漢字表》把它收入三級字表,並在註解中限定「可用于姓氏人名」,如「錢杏邨」(著名文學理論批評家)、「馬南邨」(鄧拓的筆名)等。為什麼註解不把「地名」也包括在內呢?我們理解,這是為了維護半個多世紀以來異體字整理工作的成果。把恢復的「邨」限制在姓氏人名,而鄉村、村莊的「cūn」仍應寫作「村」。可以說,三級字表裡恢復的異體字,許多是有限制地使用,跟一級字表、二級字表收錄的字相比,使用的條件是不同的。
(責任編輯:聶明磊)