小編按:據教育部官方微博「微言教育」11月19日發布的消息稱:
《漢字簡繁文本智能轉換系統》發布 準確率達99.99%
據悉,該系統由廈門大學 、教育部語言文字應用研究所、北京師範大學聯合承擔,
能進行面向中國臺灣用字和古籍用字兩種簡繁轉換,還可進行網站頁面整體轉換。
⇧如果覺得文章不錯,記得分享給朋友們哦~
本文內容選自第1408號《語言文字周報》
或能為漢字繁簡轉換問題,提供一些有益的思考
全文如下:
最近我讀到了文化藝術出版社2010年10月出版的《〈說文解字敘〉王友誼篆書寫本》,這本書內包括《說文解字敘》、《許衝上〈說文解字〉表》和《漢安帝詔》三篇文章的楷書繁體和篆書兩種文本。篆書的書法很顯功力,給讀者以愉悅的享受,但美中不足的是無論楷書還是篆書都有一些錯字,據我的統計共有18處之多。例如(為便於印製,把篆書也楷化了):
「萬國鹹寜,神人以和」誤為「萬國鹹寜,神人以和」(楷書);
「萬物鹹覩,靡不兼載」誤為「萬物鹹覩,靡不兼載」(楷書);
「許沖」誤為「許衝」(篆書);
「人持十為鬥」誤為「人持十為鬥」(楷書、篆書);
「徵禮等百餘人,令説文字未央廷中」誤為「徵禮等百餘人,令説文字未央廷中」(楷書、篆書);
「召陵萬歲裡」誤為「召陵萬歲裡」(楷書、篆書)。
這些錯字是怎麼造成的,我們並不清楚。
該書的《後記》裡說,書法家在進行篆書創作前,請電腦公司將這三篇文章裡的字用電腦先做成篆書小樣,供書法家參考。從錯字本身來分析,這幾個字都錯在簡繁體轉換上。
例如,「鬥」本來是升鬥的鬥,讀dǒu,漢字簡化時用它來代替鬥爭的「鬥」,讀dòu。在由簡體轉換為繁體時,不是所有的「鬥」字都要轉換為「鬥」,而要加以區分:讀dòu時轉換為「鬥」;讀dǒu時仍舊要用「鬥」,不能轉換為「鬥」。《說文敘》裡的「人持十為鬥」說的是在許慎生活的漢代,有的人胡亂解說文字,把升鬥的「鬥」解釋為「人」拿著「十」。這裡的「鬥」不能轉換為「鬥」。
又如,在繁體字裡,徵討的「徵」和徵召的「徵」寫法不同,而且這兩個字的上古音和中古音也不相同,只是到了近代才變為同音,都讀zhēnɡ。漢字簡化時,用徵討的「徵」代替徵召的「徵」。在由簡體轉換為繁體時,在表示徵討義時仍用「徵」,在表示徵召義時「徵」要改為「徵」。《說文敘》裡的「徵禮等百餘人」是皇帝徵召爰禮等一百多人,在繁體字裡要用「徵禮等百餘人」,不能改為「徵禮等百餘人」。
在《簡化字總表》裡,多數字是一個簡體對應一個繁體,例如「書」對應「書」,「龍」對應「龍」。對這樣的字進行簡繁或繁簡轉換時不容易出錯。可是《簡化字總表》裡也有幾十組字是一簡對多繁,例如「鬱」對應「鬱」和「鬱」,「澱」對應「澱」和「澱」。對這樣的字,進行轉換時要特別留意,必須明確要轉換為對應的哪個繁體。
目前進行簡繁體轉換有人工轉換和機器轉換兩種方式。人工轉換時,從事轉換工作的人必須熟悉簡繁兩種字體間的對應關係,特別要熟悉其中的一簡對多繁。如果讓不具備這種能力的人從事轉換工作,就要出錯。
同樣用電腦進行轉換時,使用的軟體必須具備區分一簡對多繁的能力。如果不具備這種功能,轉換時就會出錯。就筆者的有限見聞說,目前上市的轉換軟體,多數只能用來進行一對一的轉換,而不能完全正確地進行一對多的轉換。軟體的智能化程度還不夠。使用不具備一對多轉換能力的軟體進行轉換,結果就會出錯。
這樣說來,我們就不能用電腦進行漢字簡繁體轉換了嗎?也不盡然,可以用電腦進行轉換,但是轉換之後一定要用人工幹預,把轉換錯了的改正過來。如果不做人工幹預,當然就會出問題。
本文開頭說的《〈說文解字敘〉王友誼篆書寫本》裡的錯,就是在用電腦進行轉換時,沒有進行人工幹預,所以我說「漢字簡繁體轉換不能單靠電腦」。當然以後如果研製出了智能化程度更高的軟體,具備了完全的簡繁轉換能力,人工幹預就可以省去了。我們期待著早一點能用上這樣的軟體。
點擊「閱讀原文」,可以在線使用繁簡文本智能轉換系統。在語言文字周報微信頁面,回復關鍵字「繁簡字」,收取微信內容:簡繁轉換易錯字43例。
網頁地址:http://jf.cloudtranslation.cc/;
該轉換系統還有「專門詞彙轉換」功能,專門詞彙門類涉及:計算機、物理、生物、電子電機工程、化學、工程學。
花絮:
甲骨文實現圖文編輯
在電腦上輸入一個漢字是很容易的事情,可是,你能夠在電腦上輸入一個甲骨文字嗎?
如今,《甲骨文圖文編輯系統》能幫你實現在一個編輯平臺中無障礙輸入所有的甲骨文字、進行甲骨文拓片的視頻輸入和甲骨文字形的動態編輯等功能。
據了解,由安陽師範學院教師慄青生組織開發的《甲骨文圖文編輯系統》,近期通過河南省科技廳組織的科技成果鑑定。來自中國科學院、廈門大學、北京語言大學、鄭州大學等5所高等院校和研究所的7位專家組成的項目鑑定委員會在聽取項目組的匯報、審查相關資料、觀看演示、質疑與討論後,對成果表示了認同。
《甲骨文圖文編輯系統》是一個集通用文字編輯和甲骨文字編輯於一體的圖文編排系統,具有甲骨文字輸入、甲骨文拓片視頻輸入、甲骨文字形編輯等功能,實現了所見即所得的圖文混排和印刷效果,為甲骨文編輯印刷研究提供了技術手段。該系統提供了一種描述甲骨文字形的方法,並在此基礎上實現了一碼多字的動態編碼;該系統設計合理,技術先進,在甲骨文字形描述方面有創新,達到國內同類研究領先水平。通過用戶使用表明,系統運行穩定,操作簡便,提高了甲骨文編輯出版的工作效率,具有廣闊的推廣和應用前景。(選自《教育時報》)