1~9代表橫豎撇捺,兩三個數字就代表了一個漢字。歷經10年研究,成都民間專家鍾林破解漢字神秘「基因」——把上萬個漢字濃縮於1~9的9個數字中,從而讓漢字在數位化浪潮中獲得了全新的生機和無限的應用空間。記者獲悉,對於此項已獲多項發明專利、以「漢字數碼」命名的重大科研成果,四川代表團代表將在十一屆全國人大一次會議上提交一份議案,建議制定《漢字數位化方案》,以解決我國信息技術的核心問題。
用數字寫手機簡訊
鍾林,50歲,成都人。記者日前來到他的辦公室採訪時,他正在給朋友發簡訊。記者看見,他的手機已經很舊了,按鍵上的保護膜脫落了不少,但他笑著說:「這部手機可是目前世界上獨一無二的,因為它的晶片裡嵌著『漢字數碼』。」
「簡單地說,漢字數碼就是用數字表示漢字的規則和方法,我們用的是1~9這9個數字。」鍾林用他的手機演示說,比如「中」字就是「92」,「國」字就是「95」。而「中國」這個詞組則可以簡化成「929」;最後按一個「0」就會顯示在屏幕上。「0的功能相當於電腦鍵盤上的確認鍵或回車鍵。」
用幾個數字就能表示上萬個漢字?記者頗感新鮮,但在這間辦公室裝上「漢字數碼」軟體的電腦上,卻看到工作人員打字都用一隻手,只按數字鍵就可以了。「漢字數碼可以『解放』出一隻手,你完全可以邊打字邊喝咖啡。」鍾林詼諧地說。
讓電腦聽懂中國話
「漢字數碼是一種可以讓計算機聽懂的語言。」鍾林解釋說,從某方面來說,電腦還不如貓狗,根本不可能「聽懂」數以千計的漢字和數以萬計的同音詞,但「聽懂」1~9這9個數字完全可能。如果我們通過漢字數碼將漢語語音轉換為數字語音,計算機就能「聽懂」中文啦!比如,我們說出「929」這3個數字,電腦「聽到」後就能直接顯示「中國」兩個字來。
「漢字數碼能用平均2.05個數字表示出一個漢字,處理速度比英文快一倍,而儲存空間僅相當於其他形式文字儲存的50%。」鍾林介紹說,根據科學測算,一個漢字承載的信息量相當於3.6個英文字母,如果用漢字數碼錶達中文,1個數字就相當於1.8個英文字母,存儲和傳遞中文既節約了大量時間,又能使儲存空間變得更小。「今後還可能擺脫滑鼠、鍵盤的限制,讓中文走進計算機中央處理器,成為真正的『中文芯』」。
中科院盯上漢字數碼
據了解,漢字數碼已引起中國科學院的高度關注。2007年12月26日,中科院虛擬經濟與數據科學研究中心和鍾林所在公司籤署一項合作協議,將該公司納入其直接孵化的高科技企業。雙方約定,在漢字數碼系列專利技術及相關技術的進一步研發、產業化方面進行合作。今年3月中旬,中國科學院還將組織專家對漢字數碼進行專門鑑定。
此前,商務印書館有關專家表示,漢字數碼是一項「具有劃時代意義的偉大發明」,待時機成熟時將出版數碼版的《新華字典》。
省社科院副院長李明泉研究員評價說,「漢字數碼改變了中國漢字文化一貫的感性思維方式,這使漢字更容易理解,漢字文化更容易傳播。漢字數碼比很多中文處理方式簡捷,可以讓人很快地掌握,是一種快捷易學的中文處理工具」。
據了解,鍾林已就漢字數碼向國家知識產權局提出了6項發明專利申請,其中3項已獲得發明專利授權。截至目前,漢字數碼已發展出漢字輸入、漢字檢索、漢字儲存、漢語分詞、信息加密、信息點播、文本挖掘、機器翻譯、作業系統、語音識別、人工智慧等一系列關鍵性信息技術,在科技、經濟、社會、文化等各個領域均具有廣泛的應用價值。本報記者向朝陽
小百科
漢字數碼
漢字數碼就是用數字表示構成漢字的「橫、豎、撇、捺」,並按筆畫順序分成一畫筆形、兩畫筆形和三畫筆形。一畫筆形的「橫、豎、撇、捺」分別對應編為1、2、3、4;兩畫筆形的「橫、豎、撇、捺」分別對應編為5、6、7、8;三畫筆形如「口」和「方框」,編為9。只要按照一定規則,分清漢字筆畫、筆形,經過短期熟悉就能熟練運用。