漢字變身數字 成都民間專家讓電腦聽懂中國話

2020-12-01 四川新聞網

  1~9代表橫豎撇捺,兩三個數字就代表了一個漢字。歷經10年研究,成都民間專家鍾林破解漢字神秘「基因」——把上萬個漢字濃縮於1~9的9個數字中,從而讓漢字在數位化浪潮中獲得了全新的生機和無限的應用空間。記者獲悉,對於此項已獲多項發明專利、以「漢字數碼」命名的重大科研成果,四川代表團代表將在十一屆全國人大一次會議上提交一份議案,建議制定《漢字數位化方案》,以解決我國信息技術的核心問題。

  用數字寫手機簡訊

  鍾林,50歲,成都人。記者日前來到他的辦公室採訪時,他正在給朋友發簡訊。記者看見,他的手機已經很舊了,按鍵上的保護膜脫落了不少,但他笑著說:「這部手機可是目前世界上獨一無二的,因為它的晶片裡嵌著『漢字數碼』。」

  「簡單地說,漢字數碼就是用數字表示漢字的規則和方法,我們用的是1~9這9個數字。」鍾林用他的手機演示說,比如「中」字就是「92」,「國」字就是「95」。而「中國」這個詞組則可以簡化成「929」;最後按一個「0」就會顯示在屏幕上。「0的功能相當於電腦鍵盤上的確認鍵或回車鍵。」

  用幾個數字就能表示上萬個漢字?記者頗感新鮮,但在這間辦公室裝上「漢字數碼」軟體的電腦上,卻看到工作人員打字都用一隻手,只按數字鍵就可以了。「漢字數碼可以『解放』出一隻手,你完全可以邊打字邊喝咖啡。」鍾林詼諧地說。

  讓電腦聽懂中國話

  「漢字數碼是一種可以讓計算機聽懂的語言。」鍾林解釋說,從某方面來說,電腦還不如貓狗,根本不可能「聽懂」數以千計的漢字和數以萬計的同音詞,但「聽懂」1~9這9個數字完全可能。如果我們通過漢字數碼將漢語語音轉換為數字語音,計算機就能「聽懂」中文啦!比如,我們說出「929」這3個數字,電腦「聽到」後就能直接顯示「中國」兩個字來。

  「漢字數碼能用平均2.05個數字表示出一個漢字,處理速度比英文快一倍,而儲存空間僅相當於其他形式文字儲存的50%。」鍾林介紹說,根據科學測算,一個漢字承載的信息量相當於3.6個英文字母,如果用漢字數碼錶達中文,1個數字就相當於1.8個英文字母,存儲和傳遞中文既節約了大量時間,又能使儲存空間變得更小。「今後還可能擺脫滑鼠、鍵盤的限制,讓中文走進計算機中央處理器,成為真正的『中文芯』」。

  中科院盯上漢字數碼

  據了解,漢字數碼已引起中國科學院的高度關注。2007年12月26日,中科院虛擬經濟與數據科學研究中心和鍾林所在公司籤署一項合作協議,將該公司納入其直接孵化的高科技企業。雙方約定,在漢字數碼系列專利技術及相關技術的進一步研發、產業化方面進行合作。今年3月中旬,中國科學院還將組織專家對漢字數碼進行專門鑑定。

  此前,商務印書館有關專家表示,漢字數碼是一項「具有劃時代意義的偉大發明」,待時機成熟時將出版數碼版的《新華字典》。

  省社科院副院長李明泉研究員評價說,「漢字數碼改變了中國漢字文化一貫的感性思維方式,這使漢字更容易理解,漢字文化更容易傳播。漢字數碼比很多中文處理方式簡捷,可以讓人很快地掌握,是一種快捷易學的中文處理工具」。

  據了解,鍾林已就漢字數碼向國家知識產權局提出了6項發明專利申請,其中3項已獲得發明專利授權。截至目前,漢字數碼已發展出漢字輸入、漢字檢索、漢字儲存、漢語分詞、信息加密、信息點播、文本挖掘、機器翻譯、作業系統、語音識別、人工智慧等一系列關鍵性信息技術,在科技、經濟、社會、文化等各個領域均具有廣泛的應用價值。本報記者向朝陽

  小百科

  漢字數碼

  漢字數碼就是用數字表示構成漢字的「橫、豎、撇、捺」,並按筆畫順序分成一畫筆形、兩畫筆形和三畫筆形。一畫筆形的「橫、豎、撇、捺」分別對應編為1、2、3、4;兩畫筆形的「橫、豎、撇、捺」分別對應編為5、6、7、8;三畫筆形如「口」和「方框」,編為9。只要按照一定規則,分清漢字筆畫、筆形,經過短期熟悉就能熟練運用。

相關焦點

  • 漢字數位化是建設數字中國的基礎設施之一
    數字字母可以按照電腦漢字的組字方式,連結成一個十六進位的數字,這個數很容易轉換為二進位數,用於計算機運算,並且還具有可逆性。如單字「吧」的電腦漢字是bab,數字漢字是040104;「拔」是bac,040105;「芭」是bae,040107。
  • 那些店名帶數字的成都美食
    那些店名帶數字的成都美食 2017-09-10 12:32 來源:澎湃新聞·澎湃號·政務
  • 新生兒起名用規範漢字 您贊成嗎?
    2004年1月1日起施行的居民身份證法第4條規定:居民身份證使用規範漢字和符合國家標準的數字符號填寫。這裡的「規範漢字」顯然並非指直到現在也沒正式公布的《規範漢字表》,只要是字典裡有的漢字(非生編硬造)就可以認為是規範漢字。《民法通則》第99條規定:公民享有姓名權,有權決定、使用和依照規定改變自己的姓名,禁止他人幹涉、盜用、冒用。
  • 62畫zei字是「漢字之最」?專家稱只是文字遊戲
    62畫zei字是「漢字之最」?專家稱只是文字遊戲 本報記者 楊偉廣 攝  記者 楊偉廣  近日,邯鄲市的程老先生針對一些媒體報導的中國筆畫最多的字念「biang」(共56畫,讀二聲),提出自己的異議,他說有一個「zei」(讀二聲)字,共62畫,這才是「漢字之最」。但是,有專家學者表示,「zei」字只能算是一個由幾個字拼到一起的民間自造字,不屬於漢字。
  • 漢字視力表走紅 專家提醒久看易疲勞
    最近,市民小顏用網上的「漢字視力表」檢測視力後,眼睛感覺十分疲勞。除了「漢字視力表」,最近網上還流行著花朵、小鴨子、肉骨頭等圖案的另類視力表,甚至還有美女圖案的「男士專用視力表」。對此,眼科專家表示,另類視力檢查表純屬網友娛樂,並無科學依據,檢測視力還需到專業機構。  記者在網上看到,漢字視力表共八關,要求在大量的漢字中找出一個不一樣的字,每完成一關,有相應的評級。
  • 「漢字叔叔」和美國心胸血管外科專家,緣何都對南京一往情深?
    他於26年前開始研發的「漢字字源」網站,如今成為世界上最大的公開漢字字源資料庫之一,收錄近10萬個古代中文字形,6552 個最常用的現代中文字字源,31876 個甲骨 文,24223 個金文,以及49705個篆書……在中國遊歷多年後,2019年底,「漢字叔叔」終於定居南京,並成為南京視網麼信息科技有限公司特聘專家,70歲的他正和一個創業團隊,聯袂攻關如何用生動活潑的音視頻形象講述漢字演變故事
  • 漢字筆順 你寫對了嗎:專家詳解漢字筆順規則意義何在
    然而,多位我國語言文字的權威專家接受記者專訪後,觀點都驚人的一致:規範漢字的筆順非常有意義,且筆順規則不能「從俗」。探求漢字筆順規則沿革我國1965年已明確漢字筆順規則「漢字的筆順傳統上有兩種。」關於這個問題,教育部語言文字信息管理司向記者推薦了一位權威專家:國家語委原副主任、研究員、國家有突出貢獻專家、原國家督學傅永和。傅老告訴記者,1965年,由國家文化部、中國文字改革委員會聯合發布了《印刷通用漢字字形表》,收錄6196字,這就是我國首次確定的漢字筆順規範。「當時規範的制定依據已無從考證,但從那時起至今,這個筆順規範的字量不斷擴充,其根本規則一直未變。」傅老說。
  • IBM耗資千萬研究得出結論「漢字不適用於電腦」,卻被中國人打臉
    電腦的出現和普及讓人類社會進入電子時代,但在早期,電腦的功能很弱,漢字的輸入成了一大難題。有些歪果仁甚至還把中國人輸入漢字的場景想像成這樣——在計算機編程時,1個漢字就要佔用2個字符,這樣寫的程序顯得臃腫,並且影響編輯。
  • "漢字聽寫" 土木之爭:生僻字需有度
    自11月7日《咬文嚼字》狠「咬」《漢字聽寫大會》有錯別字後,由於《漢字聽寫大會》節目組當晚發來解釋意見辯稱「樅有兩讀,選擇該字來記錄,語言上也是合適的,所以民間自然選擇使雞樅成為現代通行的寫法。根據正字和正音工作中酌古難今的原則,判選手書寫正確是合適的」。
  • 國外一小夥因痴迷中文,在手臂上紋漢字,不過內容有些尷尬
    各個國家的語言都是有著自己的文化底蘊,尤其是中國的文化,真的是博大精深,源遠流長,也深受很多國外人的喜歡,甚至現在全世界都在說中國話
  • 國外一小夥因痴迷中文,在手臂上紋漢字,不過內容著實有些尷尬
    各個國家的語言都是有著自己的文化底蘊,尤其是中國的文化,真的是博大精深,源遠流長,也深受很多國外人的喜歡,甚至現在全世界都在說中國話。對於國外人來講,中國的漢字就是一種藝術,而且經常還成為刺青的題材,而且還有很多的外國人將漢字印在衣服上,這樣即使一種時尚,又是一種熱愛漢語的表現,一舉兩得。
  • 中國最生僻的5個漢字,僅僅只有一筆,專家:能認識一個就不錯了
    然而,「晦澀難懂」並不代表「博大精深」,陌生、深奧的知識難以生出自豪感,我們只有將這種漢字文化加以普及,讓更多的人了解,才可以充分發揚傳統文化,而不是只知讀音,不明真意。「丶」字可以稱得上是最常見的一個「一筆」漢字了,很多人都以為這個字讀「點」,但實際上,它念「zhǔ」。「丶」字有四個意思,第一,古人斷句所用的符號;第二,同「主」;第三。同「注」;第四,還是一個罕見的姓氏。
  • 專家解釋漢字順序不影響閱讀:人腦自動排序
    「研表究明,漢字序順並不定一影閱響讀。比如當你看完這句話後,才發這現裡的字全是都亂的。」這兩天,一道有趣的測試題勾起了眾多網友的求知慾。為什麼漢字順序錯了,人也能讀懂?5日,記者採訪專家了解到,人眼一次能看六個漢字,把六個錯亂的字理解對了,其實是種心理問題。利用好這點可加快人的閱讀速度,但在看合同、藥方等重要文字材料時,可千萬要克制,以免釀成大錯!
  • 起名專家易博士 談走出起名用字五行的誤區
    很多運用電腦起名的公司和個人為了高效,常常是不負責任的運用這個簡單而且不正確的方法來給起名用字定五行;而且導致一個很不好的後果,很多顧客信以為真,對起名用字的真實性判斷出現誤區。
  • 展望成都大運會,專家們這樣說!
    成都大運會已正式進入「周年期」,第31屆世界大學生夏季運動會專家諮詢委員會日前正式成立。8月17日至20日,成都大運會專家諮詢委員會部分專家來到成都,參加座談會、考察體育場館和天府綠道、出席大運會倒計時一周年活動、與執委會各工作部展開工作交流……在蓉的幾天裡,專家們日程安排得十分緊湊,對於一年後即將舉行的成都大運會,他們給出了自己專業的建議與鼓勵。
  • 王永民發明五筆字型,漢字輸入實現「登頂一跳」
    漢字與科技融合,終於讓中國人邁步跨過那道資訊時代的數字鴻溝。科技之星王永民北京王碼創新網絡技術有限公司董事長發明「王碼五筆字型」漢字輸入法,首創「漢字字根周期表」,有效解決了進入資訊時代的漢字輸入難題。1998年發明「98規範王碼」。
  • 漢字轉成拼音的方法
    將上訪文本框的內容填寫上自已想要的漢字,可以是一個字、一個詞語也可以是一句話甚至於一段話他都是可以幫你翻譯出來相應的漢字拼音的,填寫完畢後點擊中間的[轉換]按鈕,然後漢字轉拼音軟體會在下方的文本框顯示出來相應的結果,如圖:軟體提供了很多便捷、宜人的功能設置,比如你想要比較快速的去知道某個漢字是讀第幾聲的,那你可以勾選下方的:包括聲調[數字],其結果上拼音的旁邊就會出現1-
  • 成都某高校老師發明「新式體罰」:遲到罰寫biang字千遍
    央廣網成都10月28日消息 據中國之聲《新聞晚高峰》報導,王斯俊是電子科技大學成都學院的一位大二輔導員,他非常重視學生的課堂出勤率和準點率「biang」字是一個合字,有多種寫法,都無法輸入電腦,是陝西關中漢族傳統風味麵食,又名褲帶面,陝西民間自創的「biang」字,因為biangbiang面而走紅,這個50多畫的字,被譽為漢字中筆畫最多的字。試想如果把這個字抄上1000遍,會是一種什麼樣的體驗呢?  學生程同學說,自己以前也曾遲到過,但這次遲到卻讓她的記憶格外深刻。「因為這個字筆畫特別多,結構又複雜,抄起來特別累。
  • 網站評選"最難漢字"21個字候選 專家也不識(圖)
    據香港明報報導,有網民在網上搞「最難漢字」評選活動,選出21個一般人不認識的生字候選,個個令人摸不著頭腦。    發起評選的英文網站「Hardest Chinese Ever」選了21個字供網友投票,其中解「驅魔」的字,暫時得票最多。
  • 成都漫畫家為戰「疫」加油 讓戴口罩的大熊貓變身防疫宣傳員
    大成都 > 人物 > 正文 成都漫畫家為戰「疫」加油 讓戴口罩的大熊貓變身防疫宣傳員 來源:四川日報    時間:2020