【大家談·語言文字規範那些事兒】
編者按
生活中無處不在的數字,似乎可以「隨意」使用。然而,對於漢字數字和阿拉伯數字這兩種不同的數字表達形式,他們的表達功能、使用場合有何不同,在正式的中文出版物中,應該如何使用數字等問題,恐怕仍不被大多數人所熟知。本刊特邀《出版物上數字用法》課題組首席專家詹衛東教授及其團隊,解讀標準背後的規律和「故事」。
在現代社會生活中,需要用到數字的場合可謂比比皆是。身份證號、學號、銀行帳號、電話號碼、郵政編碼、書號……數字的具體應用恐怕多到無法列出一個完整的清單,但概括起來,數字的主要功能可以歸納為兩個:計量和編號。
與其表達功能相對應,數字在中文文本中主要有兩種表達形式:一種是中文固有的書寫形式,即漢字數字形式,基本符號有「零、一、二、三、四、五、六、七、八、九、十、百、千、萬、億」等;另一種是自19世紀末20世紀初開始,伴隨西學東漸和中國現代化進程,逐步在中文中推行開的阿拉伯數字形式,基本符號有「0、1、2、3、4、5、6、7、8、9」等。在實際使用中,阿拉伯數字還可以根據需要,使用小數點「.」、多位數分節符「,」、以及短線「-」和分隔符「∶」等輔助符號。用漢字書寫的數字則不含其他輔助符號。
可見,數字的上述兩種表達形式跟數字的主要表達功能之間是有大致對應關係的,即在強調精確計量和編號功能的場合,傾向於使用阿拉伯數字,而作為一般語詞使用以及表達概數的場合,則傾向於使用漢字數字形式。
不過,這種分工並不是絕對的。一方面,漢字數字也有計量和編號的功能。在阿拉伯數字進入中國之前,中國人正是用自己的漢字數字書寫形式來計數的,包括做計算和用數字來編號、排序。另一方面,阿拉伯數字在使用過程中,其表達功能也逐漸拓寬,從最開始的主要用於精確計量發展到各種編號功能,進而發展到跟漢字成分結合在一起來表達概數。這樣,就造成了在一些場合二者可以換用的情形。也正是因為這個原因,才需要對兩種數字書寫形式進行適當的規範,儘可能將不同的表達形式跟不同的表達功能對應起來,實現漢字數字跟阿拉伯數字相對分工明確,各司其職的目標,從整體上提升中文文本傳遞信息的效率。
形式是為內容服務的,數字形式也不例外。在書面上選擇數字書寫形式時,總原則是根據數字的表達功能(或者說表達目的)來選擇其書寫形式。但正如上文指出的,數字的形式和功能之間儘管有大體的對應關係,但仍然存在交叉和可以換用的情況。因而,在具體落實根據表達功能來選擇表達形式這一總原則的時候,要遵循四個更具體的原則。
1. 編碼效率原則
數字的主要功能是計量和編號。對於這兩個功能來說,都要求信息傳遞的效率高。因而在用數字計量和編號的時候,需要用到的數字越多,就越應該使用阿拉伯數字書寫形式。因為在表達同樣的數值時,阿拉伯數字總是比漢字數字形式的編碼簡短。此外,從視覺效果上,因為編碼簡短,阿拉伯數字給人的整體感覺是結構緊湊。加之筆畫線條簡潔,不同於一般的漢字符號,文本中的阿拉伯數字總是能收到醒目之效,這也會節省辨識的時間,提高解讀的效率。
2. 尊重傳統原則
漢字數字是中文書寫系統中固有的符號,在中文文本中,其歷史比阿拉伯數字要悠久得多。因而有許多表達場合,習慣上要使用漢字數字。特別是在不強調計量的時候,更是如此。使用漢字數字形式,可以讓文本整體更好地保持中文文字系統的統一美感。在不影響信息傳遞效率的前提下,使用漢字數字書寫形式,是對漢民族悠久歷史文化的尊重和傳承。
3. 表意清晰原則
前兩個原則是在宏觀層面針對全體數字而言的。編碼效率原則鼓勵多使用阿拉伯數字形式。尊重傳統原則鼓勵多使用漢字數字形式。這裡談的表意清晰原則則是在微觀層面,針對具體的數字形式而言的,一個數字形式在具體語境中出現的時候,總是要傳遞一定的表意信息。如果不同的數字形式在表意時清晰度有差別,則應該根據語境中實際表意的需要,選擇表意更清晰、更準確的形式。
為了更好地說明這個原則,不妨看一個對比例子:「他在等晚1點的航班。」和「他在等晚一點的航班。」前一句用阿拉伯數字形式「1」,後一句用漢字數字形式「一」。很顯然,前一句意思更清晰,後一句則有歧解的可能性。「1點」只能理解為「1點鐘」的意思,指一個確定的時點。「一點」則既可以指「1點鐘」這個確定的時點,也可以指「一小段時間」這個模糊時間長度量。如果要表達「晚上1點鐘」這個確定時點的意思,從編碼效率高和表意清晰兩個原則的要求來說,就應該選擇用阿拉伯數字形式。如果選擇用漢字數字形式,那麼,為了提高表意的清晰度,就要增加字符,也就是加長編碼(損失編碼效率),來換取表意的清晰,比如上面兩句可以分別寫成:「他在等晚上一點的航班」和「他在等更晚一點的航班」。這樣的表達形式,就完全滿足「表意清晰原則」的要求了。
4. 系統一致原則
系統一致原則,也可稱為「同類別同形式」原則。這個原則主要是針對阿拉伯數字和漢字數字兩種形式均可使用的情況,是兼顧宏觀層面和微觀層面提出的。無論是從中文文本整體的美觀來說,還是從文本中每個具體表達形式的效率以及準確性來說,保持一個文本內部數字使用的一致性這個原則都是一個正向的推動力。反之,內部形式上的不一致,則不僅會增加閱讀的負擔,甚至還有可能造成表達不準確、不清楚的問題。
比如在提到年份的時候,行文中應該使用完整的數字表達形式,如「1978年」或「一九七八年」,都指向的是公元紀年中的同一個年份。在同一篇文章中,應該根據表達的需要,選擇其中一種形式,而不應該兩種形式隨意換用。再比如在表達具體的日期時,更不應該出現漢字數字形式和阿拉伯數字形式混用的情況,比如「一九七八年10月1日」,就是違反系統一致性原則的情形。遵循系統一致性原則的寫法應該是「一九七八年十月一日」或「1978年10月1日」。
概括而言,上述四個原則實際上回答了在有競爭的情況下,如何選擇優先的書寫形式的問題。四條原則的含義分別可簡要表述為:編碼短的書寫形式優先,歷史悠久的書寫形式優先,無歧義的書寫形式優先,無矛盾的書寫形式優先。
顯然,上述四個原則各有自己的傾向:編碼效率原則會突出阿拉伯數字的功用,尊重傳統原則會突出漢字數字的功用,表達清晰原則會對前兩條規則進行約束,無論是阿拉伯數字,還是漢字數字,其具體的使用形式,都應該追求清晰、準確的表達效果。系統一致原則將更多的選擇主動權交給文本的作者,即由作者來決定文本中哪些數字是同類的表達功能,那麼這些數字就應該選用相同的表達形式,不能隨意換用不同的表達形式。
在具體實踐中,可能出現不同原則之間的衝突。如果發生這種情況,應該有更基本的「元規則」來決定如何處理衝突。這個元規則就是:應該選用適用原則多的那種數字形式,而不應該選用明顯違反某個原則的那種數字形式。此外,上述原則也可以幫助我們更好的理解,兩種數字表達形式有時候並不是非此即彼的關係,也可能是任選其一都合乎規範的要求。
(作者:詹衛東,系北京大學中文系教授)