科學定量 合理分級——學習《通用規範漢字表》四人談(二)

2020-12-13 中華人民共和國教育部

科學定量 合理分級——學習《通用規範漢字表》四人談(二)

2013-11-05 來源:語信司

  範可育(華東師範大學):漢字的總數有多少?無人能準確回答,往往以工具書或字庫的收字量為依據。1994年9月28日《新民晚報》報導,由中華書局和中國友誼出版公司發行的《中華字海》收字86,000多個。1999年11月17日《文匯報》報導,北京國安資訊設備公司漢字字庫收錄有出處的漢字字形共計91,251個。國際編碼ISO-10646字符集收字將近80,000個。

  費錦昌(教育部語言文字應用研究所):漢字字數眾多,但實際使用的字量有限。著名文字學家裘錫圭先生指出:「從商代到現代,一般使用的漢字的數量似乎並沒有顯著的變化,很可能一直在五六千左右徘徊。」當然,具體的字種,從商代到現代是有變化的,但用到的字數沒有大的變化,這是受到文字作為交際工具這一基本屬性的制約。這五六千字中,有的字常用,經常出現;有的字不常用,難得露面。它們在文本中的使用度和覆蓋率是不同的。常用字適應人們的共同需要,非常用字滿足人們的特殊需要。為了學習和使用的方便,人們總是要先學習經常用到的字。漢字的定量和分級可以說自古就有,歷史上著名的蒙學課本《三字經》《百家姓》《千字文》(俗稱「三百千」)就是從記錄日常記事、歷史敘述、姓氏人名等用字中篩選出來的。跟今天的字頻統計不同的只在於,現代靠計算機,古代靠語感、字感和經驗。上世紀二三十年代,著名教育家陳鶴琴曾用人工統計55萬多字的書報語料,得出不同漢字4261個。這是我國最早有意識地、從教育學的角度進行的漢字字頻統計工作。

  顏逸明(華東師範大學):自從計算機介入漢字研究以後,漢字字頻統計工作開創了全新的局面,速度之快、精度之高是人工統計所無法比擬的。字頻統計的科學性還取決於三個條件:一是語料的字量,二是語料的年代跨度,三是語料在門類、領域上的覆蓋度和均衡度。

  高家鶯(華東師範大學):《通用規範漢字表》根據漢字使用頻率、通用程度的不同和適用對象、使用要求的差異,對收錄的8105字進行合理分級。漢字分級是客觀存在的反映,並非字表研製者的主觀設計。分級的目的是為了增強字表的實用性,有效提高漢字學用的效率。

  費錦昌:《現代漢語常用字表》(1988年)與《通用規範漢字表》(2013年)的一級字表收錄的都是常用字,字數都是3500個,二者的不同之處在於置換了103字,置換率近3%,就是每100個字中換了3個字。《現代漢語常用字表》中有103字未進入《通用規範漢字表》的一級字表,《通用規範漢字表》一級字表另外收錄了103個出現頻率更高的常用字。發生這種變化的原因是字頻統計工作在這二十多年中科學化程度更高了。據說,按字頻的高低排列,《通用規範漢字表》收錄到2700多字時,覆蓋率已經跟《現代漢語常用字表》3500字等同。為了尊重民眾的習慣,一級字表擴充編制,仍收3500字。也就是說,掌握了《通用規範漢字表》的3500個一級字比原先《現代漢語常用字表》的3500字使用的效率更高了。

  高家鶯:過去語文教學中,有的教師往往著力教那些難字、僻字,而忽略了常用字的教學,導致學生在日常使用漢字時,讀錯字音、寫錯字形、弄錯字義的情況比比皆是。一屆屆畢業生走進社會,由於他們在校時沒有學好常用字,致使社會通用層面用字的整體水平下降。在歌舞比賽扎堆的背景下,中央電視臺獨具慧眼,舉辦了「中國漢字聽寫大會」,警醒民眾要保護漢字,弘揚漢字文化,在全社會獲得良好的反響。但在決賽階段,為了分出高下,舉辦者無奈地拋出大量生僻的書面語詞作為試題,比如「驊騮」「愣蔥」「捍蔽」「婉孌」等等,以致在比賽現場的復旦大學錢文忠教授連連驚呼:「這都是什麼孩子啊!這樣生僻的詞語也能寫出來!文曲星下凡啊!」我以為測試這些難字、僻詞,偏離了語文現代化方向,客觀上會對參賽者和電視機前的成千上萬學生起到不良的導向作用。現在不是已有參賽者在背字典、啃古文了嗎?希望下屆比賽時著重測試常用和通用詞語,可在試題中引進書寫元素和字用元素,用這種辦法來提高試題難易的區分度。

  範可育:《通用規範漢字表》三級字表收錄的1605字提升了字表的「生澀度」,招來不少非議。以404個地名用字為例,字表把鄉鎮以上的地名用字全部收錄,還收了部分村級地名和部分自然實體名稱的用字,對於全國大多數人來說,這些字絕大多數是罕用字、生僻字,但這些生僻字對於當地人以及跟當地聯繫較多地區的百姓來說,它們又是常用字。比如「垟」(yáng,田地,多用於地名),我這個以語言文字學為專業的人平時也很少接觸到,但對於浙江溫州一帶,特別是翁垟、黃垟的百姓來說,「垟」是天天要碰面的常用字。正因為有這樣一個特性,《通用規範漢字表》把「垟」這類字收入三級字表,使它們獲得了「通用規範漢字」的身份證,這樣做既不會加重全國大多數民眾的負擔,又保證了這些特殊領域用字在電腦字庫中的位置。在現今科技發達的資訊時代,在電腦字庫裡增加若干個姓氏人名用字、地名用字、科技用字、普及文言文用字應該不是解決不了的難題。由於這些字進入了《通用規範漢字表》三級字表,將給戶籍、郵政、金融、科技和旅遊、辦理出國護照等用字帶來很大的便利。

  顏逸明:使用三級字表中的字,要注意字表的註解。如「邨」原是《第一批異體字整理表》認定的「村」的異體字,已被淘汰。《通用規範漢字表》把它收入三級字表,並在註解中限定「可用于姓氏人名」,如「錢杏邨」(著名文學理論批評家)、「馬南邨」(鄧拓的筆名)等。為什麼註解不把「地名」也包括在內呢?我們理解,這是為了維護半個多世紀以來異體字整理工作的成果。把恢復的「邨」限制在姓氏人名,而鄉村、村莊的「cūn」仍應寫作「村」。可以說,三級字表裡恢復的異體字,許多是有限制地使用,跟一級字表、二級字表收錄的字相比,使用的條件是不同的。

(責任編輯:聶明磊)

相關焦點

  • 《通用規範漢字表》公布 常用字3500個
    (5)遵循規律,注重漢字規範的科學性。堅持實事求是的科學精神,遵循漢字發展和應用的客觀規律,運用語料庫技術等現代化手段,充分論證、科學定量、合理分級,吸收社會相關研究成果與實踐經驗,提高漢字規範的科學性。  (6)充分考慮港澳臺地區和海外華人漢字應用的實際情況,兼顧漢字應用的國際需求,儘量避免擴大差異。  4.《通用規範漢字表》主要有哪些特點?
  • 教育部發布會就《通用規範漢字表》答記者問
    海外華人社區和國際組織在學習和使用漢字時,多數採用我國大陸的語言文字規範來學習和使用簡化字,為方便漢語的國際教育和國際應用,十分需要建立切合時代發展的漢字規範。    2.《通用規範漢字表》主要包括哪些內容?    《通用規範漢字表》包括主表和附表兩部分。
  • 貫徹實施《通用規範漢字表》提升語言文字應用規範化標準化水平
    二、《通用規範漢字表》是新中國成立以來漢字規範的總結、繼承和提升,是信息化時代漢字規範的新起點和新發展     《通用規範漢字表》是在整合優化50多年來漢字規範成果的基礎上制定的。五是遵循規律,注重漢字規範的科學性。堅持實事求是的科學精神,遵循漢字發展和應用的客觀規律,運用語料庫技術等現代化手段,充分論證、科學定量、合理分級,吸收社會相關研究成果與實踐經驗,提高漢字規範的科學性。六是充分考慮港澳臺地區和海外華人漢字應用的實際情況,兼顧漢字應用的國際需求,儘量避免擴大差異。
  • 一部解讀《通用規範漢字表》的字典
    教育部、國家語言文字工作委員會歷時十餘年組織研製了《通用規範漢字表》,2013年6月由國務院正式發布。《通用規範漢字表》是繼1986年國務院批准重新發布《簡化字總表》後的又一重大漢字規範,是最新、最權威的規範漢字依據。
  • 《通用規範漢字字典》《〈通用規範漢字表〉解讀》出版
    >   中新網北京8月28日電 (記者 應妮)繼教育部27日召開新聞發布會詳細介紹《通用規範漢字表》,商務印書館28日在京宣布出版由教育部語言文字信息管理司策劃並委託編寫的《通用規範漢字字典》和《〈通用規範漢字表〉解讀》,指導規範漢字的使用。
  • 談資訊時代的漢字規範
    新的漢字規範具有鮮明的時代特點  這次《通用規範漢字表》的研製,是在50-80年代已有規範的基礎上制定的,它記錄現代漢語的通用漢字的規範字集。在字量、字級方面有兩個重要的變化:《通用規範漢字表》一、二級字表是一般通用領域的漢字,兩級相加6500字,比過去7000通用字少了500字。
  • 《通用規範漢字表》定義「規範漢字」-光明日報-光明網
    「這次《通用規範漢字表》的發布,使『規範漢字』這一法律概念落到實處,明確告知表內列舉的8105個漢字就是國家規定的通用規範漢字。」27日,教育部召開新聞發布會介紹《通用規範漢字表》相關情況。
  • 國務院最新發布《通用規範漢字表》
    本報訊(記者陳菁霞)日前,作為當前最權威、最重要的一部漢字規範———《通用規範漢字表》由國務院正式發布。記者從商務印書館獲悉,為配合《通用規範漢字表》的實施,商務印書館日前出版了由教育部語言文字信息管理司策劃並委託編寫的《通用規範漢字字典》和《解讀》,以解讀《字表》,指導規範漢字的使用。
  • 教育部介紹《通用規範漢字表》徵求意見有關情況
    我今天主要發布兩個方面的內容:第一,關於《通用規範漢字表》的一些情況;第二關於《通用規範漢字表》公開向社會徵求意見的一些情況。下面介紹第一個方面的內容。    三級字表收字1 800個,是一些專門領域(姓氏人名、地名、科學技術術語、中小學語文教材文言文)使用的未進入一、二級字表的較通用的字,主要滿足與大眾生活和文化普及密切相關的專門領域的用字需要。    二、《通用規範漢字表》的研製情況    漢字是中華民族的驕傲。它歷史悠久,使用人口眾多,使用狀況也相當複雜;漢字之學源遠流長,淵深如海。
  • 《通用規範漢字表》公布 未恢復一個繁體字
    歷時10餘年、先後修改90餘稿的《通用規範漢字表》日前公布,8105個漢字領到「身份證」。其中,45個異體字加入到了規範字行列,有了「合法地位」,「喆」字正在其中。對於常用字減少的原因,《通用規範漢字表》研製組組長王寧介紹說,一是現在選字方法更為科學,對哪些字使用頻率高統計更準確;二是現在用字更規範、更集中,6500個常用字比原來的7000個字覆蓋率要高。44個漢字字形暫不調整2009年,《通用規範漢字表》(徵求意見稿)公布,曾因對44個漢字字形微調,引發輿論熱議。
  • 2013新版《通用規範漢字表》收錄了多少個漢字?
    《通用規範漢字表》公布,原有相關字錶停止使用  綜合新華社北京8月27日電 記者27日從教育部獲悉,《通用規範漢字表》日前公布,收錄其中的8105個漢字成為中國擁有首批「身份證」的方塊字。  「此次公布的《通用規範漢字表》是信息化時代漢字規範的新起點新發展。」教育部語言文字信息管理司司長張浩明27日在此間舉行的新聞發布會上說,新中國成立以來,我國相繼發布了多項漢字規範,然而近年來,這些標準已經不能滿足現實生活的需要。
  • 《通用規範漢字表》正式發布 繁體字未予恢復
    《通用規範漢字表》將其在特定用法上調整為規範字,規定該字可用于姓氏人名,讀zha(一聲),如「哪吒」。讀zha(四聲)時,仍用「吒」。「蹚」意為蹚水、蹚地,讀tang(一聲),不再作為「趟」(tang四聲)的異體字。《第一批異體字整理表》中為「哲」的異體字。《通用規範漢字表》規定該字可用于姓氏人名。  昨天,教育部召開新聞發布會,《通用規範漢字表》經國務院正式發布。
  • 《通用規範漢字表》正式發布 繁體字未能被恢復【3】
    原標題:《通用規範漢字表》正式發布 喆堃等45個異體字轉正 45個異體字「轉正」 在此次公布的《通用規範漢字表》中,新收錄了226個簡化字。這226個新增的簡化字中,166個曾被《現代漢語詞典》和《新華字典》收錄,51個見於其他多種辭書,9個出自頻度較高的姓氏人名以及現代科技用字。
  • 通用規範漢字表未恢復繁體字 未收錄「囧」字
    歷時10餘年、先後修改90餘稿的《通用規範漢字表》日前公布,8105個漢字領到「身份證」。其中,45個異體字加入到了規範字行列,有了「合法地位」,「喆」字正在其中。對於常用字減少的原因,《通用規範漢字表》研製組組長王寧介紹說,一是現在選字方法更為科學,對哪些字使用頻率高統計更準確;二是現在用字更規範、更集中,6500個常用字比原來的7000個字覆蓋率要高。  44個漢字字形暫不調整  2009年,《通用規範漢字表》(徵求意見稿)公布,曾因對44個漢字字形微調,引發輿論熱議。
  • 「囧」「槑」等流行字未入選《通用規範漢字表》
    《通用規範漢字表》是對50餘年來漢字規範整合優化後的最新成果,無論是對老百姓的日常生活,還是對提升國家通用語言文字的規範化、標準化水平,促進國家經濟社會和文化教育事業發展,都具有重要意義。  「喆」、「堃」等姓名高頻字「轉正」  《通用規範漢字表》收字8105個,分為三級。
  • 人名地名異體字被收入《通用規範漢字表》
    《通用規範漢字表》(徵求意見稿)及有關材料將登載在《中國教育報》和中國語言文字網上。各界人士可通過電子郵件、信函和傳真等方式提出意見和建議。  據新華社電 (吳晶、董豆豆)由教育部、國家語言文字工作委員會歷時8年組織研製的《通用規範漢字表》自8月12日至31日向社會公開徵求意見。
  • <通用規範漢字表>常用字減少500個 未恢復繁體字
    中新社北京8月27日電(記者 馬海燕)新發布的《通用規範漢字表》常用字6500個,比原來的通用字表7000個減少了500個。對於近年來議論頗多的繁體字,並未恢復。  中國教育部27日在北京專門召開發布會,介紹新《通用規範漢字表》有關情況。
  • 《通用規範漢字表》沒有恢復一個繁體字
    早報訊 教育部昨天召開新聞發布會,介紹《通用規範漢字表》(下稱字表)情況,本次字表中沒有恢復一個繁體字成為一大特點。繁體字一個都沒有收錄此次字表收錄8105個漢字,分為三級,一級為常用字級,3500字;二級3000個;三級字表收字1605個。在昨天的發布會上,知名語言文字專家、字表研製組組長王寧介紹了字表研製中對繁體字的處理。王寧指出,維護漢字的基本穩定是《通用規範漢字表》制定的重要原則。自古如此,從漢字發展的歷史看,簡化一直是主要趨勢。
  • 《通用規範漢字表》公布 45個異體字改為規範字
    記者27日從教育部獲悉,研製了10年的《通用規範漢字表》日前公布,收錄其中的8105個漢字成為中國擁有首批「身份證」的方塊字。  專家介紹,許多大家喜愛的人名用字都在新的《通用規範漢字表》中「轉正」,例如「喆」、「堃」、「淼」等。以往一些人辦理登機牌時需要用「?」來代替打不出的漢字,如今有了「合法」身份,到銀行辦卡打不出名字的情況有望減少。
  • 解讀《通用規範漢字表》字表分3級 收字8300
    新華網北京8月12日電(吳晶、董豆豆)歷時8年研製的《通用規範漢字表》12日起面向社會公開徵求意見。字表發布後,社會各領域的現代通用漢字,原則上應使用表內字。對於每天都要說話、寫字的現代人來說,這套規範解決了哪些問題?對日常生活和學習有何意義?教育部有關負責人和專家對此進行了解讀。