關於《通用規範漢字表》公開徵求意見的公告
為了全面貫徹《中華人民共和國國家通用語言文字法》,促進國家通用語言文字的規範化、標準化,適應資訊時代語言生活和社會發展的需要,教育部、國家語言文字工作委員會歷時8年組織研製了《通用規範漢字表》。
《通用規範漢字表》是《國家通用語言文字法》的配套規範,是國家文字政策的體現,關係到國家文化、教育、科技的發展及信息化建設,關係到大眾的日常生活。為確保字表的科學性和可行性,經國務院批准,決定自2009年8月12日起至2009年8月31日面向社會公開徵求意見。
《通用規範漢字表(徵求意見稿)》及有關材料登載在《中國教育報》(2009年8月13日)和中國語言文字網(網址:http://www.china-language.gov.cn)。
歡迎各界人士通過電子郵件、信函和傳真等方式提出意見和建議。電子郵箱:gfhzb@moe.edu.cn;通訊地址:北京市東城區朝陽門內南小街51號《通用規範漢字表》意見收集組,郵政編碼:100010;傳真:010-65286219。
特此公告。
教育部國家語言文字工作委員會
2009年8月12日
附件1:《通用規範漢字表(徵求意見稿)》
附件2:
《通用規範漢字表(徵求意見稿)》背景知識詞條
撰者按:這裡所做的詞語解釋,不是嚴格意義上的學術定義,而是為了便於非文字學專業的人更好的理解字表。所列舉的詞語有的未必只限於表述漢字,其他文字也應涵括,但這裡皆把它當作漢字的專有術語來解釋。
1.字集:按照一定原則選出的一定數量漢字的集合。比如1988年1月,國家語委和國家教委聯合發布的《現代漢語常用字表》就是一個一般社會領域最常用漢字的字集。
2.字量:文字的數量,一般指某一特定範圍使用到的漢字的數量。比如1988年3月,國家語委和新聞出版署聯合發布的《現代漢語通用字表》的字量是7000個。《通用規範漢字表(徵求意見稿)》的總字量為8300個。
3.字形:漢字的外形,即單個漢字在空間展現出來的形貌。比如「王」由三橫一豎組成。
4.字級:在一個一定數量的漢字集合內部,根據使用頻率和流通程度等屬性確定的字的級別。比如,1988年1月,國家語委和國家教委聯合發布的《現代漢語常用字表》收字3500個,其中又分為兩個字級:前面2500個是常用字,後面1000個是次常用字。《通用規範漢字表(徵求意見稿)》分為一級字、二級字、三級字3個字級。
5.字用:漢字在書面作品中使用的情況。確定字用依據的是漢字具體的使用職能。記錄同一個詞的不同字形可算同一個字(比如說「淚」和「涙」是同一個字);記錄不同詞的相同字形則可算不同的字(比如「體」,古代讀bèn,表示愚笨;現代讀tǐ,表示身體,二者雖然形體相同但可算兩個字)。
6.字樣:《通用規範漢字表(徵求意見稿)》的相關文件中所使用的「字樣」是指漢字的外部樣態。凡是漢字中的線條、圖素、筆畫在數量、交接方式、位相或體式等方面具有差異,也就是不能同比例重合的字,都屬於不同的字樣。比如說「淚」和「涙」是兩個字樣,因為它們的外在形態不同,但字用沒有區別,因為它們的職能相同,都是記錄漢語中「眼淚」這個詞。再比如,「戶-戶-戶-戶-戶」五個形體也是5個不同的字樣,只是其間的差別主要由於字體風格形成。總之,「字樣」描述的是每個字的外形。
7.字頻:漢字的出現頻率,即某個漢字在一定語料中使用(出現)的次數與樣本總字數的比率。比如在一個一萬字的文本中, 「的」字一共出現過415次,那麼「的」字在該文本中的字頻便是4.15%(415÷10000×100%=4.15%)。
8.字序:漢字在辭書和各種索引中的排列順序。漢字的字序主要有音序和形序。比如「天、地、人」三字,按形序(筆畫序)排列應該是「人(2畫)、天(4畫)、地(6畫)」,按音序排列應該是「地(di)、人(ren)、天(tian)」。幾個字筆畫相同時,則依照筆順的先後順序排列(筆順的先後順序是橫1、豎2、撇3、點4、折5),如「文、王、隊、日、午」五個字全是四畫,起筆分別為點、橫、折、豎、撇,依照筆順則應排列為「王、日、午、文、隊」。
9.類推簡化:某個字形簡化了,當這個字作為其他字的構件時如果也可以跟著簡化,就形成類推簡化。《簡化字總表》規定其第二表中的132個簡化字和12個簡化偏旁,可以類推簡化。比如「嚴、龍」簡作「嚴、龍」,「儼、壟」可以類推簡化作「儼、壟」;「車」簡作「車」,則以「車」為偏旁的「軌、軍、庫、載」可以類推簡化為「軌、軍、庫、載」。
10.有限類推:類推簡化限定在一定範圍內。《通用規範漢字表(徵求意見稿)》實行的就是有限類推,即凡收進字表的字如其字形是繁體,都依據《簡化字總表》規定的原則而類推簡化。而字表以外的字,不管其形體是否含有已經簡化了的繁體字形,都不再類推簡化。比如「驦、驌、鸘、鷫」四字收進了字表,依據類推簡化原則,將們分別簡化為「驦、驌、鸘、鷫」。與其相對的說法是「無限類推」,也就是某個字不管其現在是否使用,只要其形體含有已經簡化了的繁體字形,都類推簡化。比如「驡」現在基本不用,但因為「龍」簡化作「龍」、「馬」簡作「馬」,於是把「驡」類推簡作「龍+馬」。無限類推學術界不贊成,主管部門也已明確否定。
11.異體字:「異體字」是與「正體字」相對的概念。音義和使用功能相同而字形不同於正體字的漢字。例如,「峰-峰」、「凳-櫈」、「朵-朶」、「淚-涙」等字組中,後者皆為前者的異體字。嚴格意義上的異體字,其職能不由正體字承擔,是漢字的冗餘,給記憶帶來負擔,所以有必要限制其使用。
12.宋體字形:宋代刻版印書通行的字體。結構方正勻稱,橫細直粗,便於刻版,閱讀醒目,是16世紀以來漢字的主要印刷體。當前出版物上的常用字體,除宋體外(如:小),還有仿宋體(小)、楷體(小)、黑體(小)等。
13.《第一批異體字整理表》:1955年12月22日,文化部和中國文字改革委員會聯合發布的新中國第一個漢字規範,1956年2月1日起在全國實施。該表內列810組字,每組最少2個字,最多6個字,共1865字。根據從簡從俗的原則,從中選出810個作為正體,淘汰了1055個異體字。比如「櫓—艪艣樐」為一組具有正字與異體字關係的字,該表將「櫓」定為正字,「艪艣樐」是淘汰的異體字。該表發布後,不僅精簡了漢字的字數,而且有效地遏制了漢字使用中的字體混亂現象。
14.《印刷通用漢字字形表》:1955年,中國文字改革委員會提出進行漢字字模標準化工作,以統一印刷字體和手寫正楷體的筆畫結構,精簡偏旁部件的種類,確定漢字的標準字形,並把它作為書寫的規範和設計印刷、打字字模的標準,以利學習和使用。1956年9月,標準字形研究組編成了《標準字形方案(草案)》,1957年對該草案進行修改並更名為《漢字字形整理方案(草案)》,1959年初步定稿;1960年5月,在前表的基礎上又編成《通用漢字字形表草案》;1962年3月,文化部決定把整理字形的工作確定在印刷通用漢字的範圍內,並改名為《印刷通用漢字字形表》。
整理字形的原則是:①宋體楷化;②字形結構和筆勢儘量服從橫寫的需要;③折筆儘量改為直筆;④連結個別筆畫結構;⑤精簡偏旁的數量;⑥按讀音分化原有部件。1964年5月,字形整理組擬出《印刷通用漢字字形表》,1965年發布實施。收印刷通用漢字6196個,並給每個漢字規定了筆畫數、結構和筆順。經過對字形的調整和美化,進一步取得了宋體字筆形的一致,使字形更趨於規律性、系統性。
15.《簡化字總表》:1956年1月,國務院公布《漢字簡化方案》;1964年3月,中國文字改革委員會、文化部、教育部聯合發布《關於簡化字的聯合通知》,《總表》分成三個表。第一表所收的是352個不作偏旁用的簡化字。這些字的繁體一般都不用作別的字的偏旁。個別能作別的字的偏旁,也不依簡化字簡化。如「習」簡化作「習」,但「褶」不簡化作「衤+習」。第二表所收的是132個可作偏旁用的簡化字和14個簡化偏旁。第三表所收的是應用第二表的簡化字和簡化偏旁作為偏旁得出來的簡化字。1986年10月,國家語委經國務院批准重新發布了《簡化字總表》,並作了個別調整。調整後的《總表》,實收簡化字2235個。
16.《現代漢語常用字表》:1988年1月26日,國家語委、國家教委聯合發布,目的是為了適應語文教學及其他方面的需要。字表分常用字(2500字)和次常用字(1000字)兩個部分。選字原則是:①根據漢字的使用頻率,選取使用頻率高的字;②在使用頻率相同的情況下,選取學科分布廣、使用度高的字;③根據漢字的構字能力和構詞能力,選取構字能力和構詞能力強的字;④根據漢字的實際使用(語義功能)情況斟酌取捨。其後,國家教委頒布的基礎教育教學大綱規定基礎教育階段的識字量為3500字,完全等同於本字表。
17.《現代漢語通用字表》:國家語委、新聞出版署1988年3月25日發布。共收7000字,包括《現代漢語常用字表》的3500字。本表的制訂,主要依據1965年頒布的《印刷通用漢字字形表》。根據實際需要,刪去《印刷通用漢字字形表》中的50字,增收854字。同時,本表依據《印刷通用漢字字形表》確定的字形標準,規定了漢字的字形結構、筆畫數和筆順。其後,印刷通用漢字字形即以此表為準。
18.語料庫:應用計算機技術存儲語言材料的總匯。語料範圍可以是綜合的,也可以是專項的,如國家語委「現代漢語平衡語料庫」(收1919-2002年的語料9100萬漢字)。語料庫的容量大小和編制體例可根據需要設計,內容也可以及時更新補充。
19.《GB13000.1字符集漢字字序(筆畫序)規範》:GB13000.1字符集是指國家標準漢字編碼字符集,共20902個漢字。《GB13000.1字符集漢字字序(筆畫序)規範》由國家語委1999年10月1日發布、2000年1月1日實施,編號為GF3003-1999。它是按筆畫排序的漢字字序規範,主要用於漢字的信息處理、排序檢索、辭書編纂等方面。
20.歷史通用字形:即在歷史上已經通行的漢字。一般指《康熙字典》之後、特別是《中華大字典》(1915年)之後的字形。使用歷史通用字形的原則:字形要有歷史上使用過的依據;有多個字形可以採用時,要儘量選取通行度高、易於識別的字形。這個概念主要針對這種情況:如果文章中需要使用非常生僻的字,要使用歷史上已經通行的字形,不要生造新字或亂改字形(包括類推簡化),以免增加漢字的繁複程度。比如「壣」「蘹」未收入字表,如果寫作時確需使用,則不能將其簡化為「土+聯」「艹+懷」,也不能寫成其他新造形體,而要使用古書中所使用的原字形。