一、先弄清幾個概念
1.1 什麼是漢字輸入法
輸入,《現代漢語詞典》的解釋就是,科學技術上指能量、信號等進入某種機構或裝置。漢語的中文信息就是要「用計算機對漢語的音、形、義進行處理。①」漢字輸入法,通俗一點說,就是通過電腦打出漢字的一種方法。
1.2 什麼是漢字
記錄漢語的文字叫漢字,因漢字大多是一個字佔一個方形的面積,所以又叫方塊字。漢字的筆畫形態很多種,但國家語言委員會規定的漢字基本筆畫只有五種:橫(一)、豎(丨)、撇(ノ)、點(丶)、折(S)。
1.3 什麼是拼音
把兩個或兩個以上的音素結合起來成為一個複合的音,如「b」和「iao」拼成「biao」(標)。現在通行的漢語拼音方案是採用英語字母作音素的,但讀音和英語完全不同。漢語拼音是採用北京的標準音作為漢字普通話的。跟北京標準音有區別的其它地方的語音系統叫方言。漢語拼音中的知識性名詞很多,如齒唇音(f)、輔音(b、t、s、m、l)、複輔音(z、zh等)、捲舌元音(e、r等)、複合元音(ai、ei等)等等,請參閱《現代漢語詞典》等工具書。
1.4 什麼是拼音文字
用符號(字母)來表示語音的文字叫拼音文字,現代世界多國所用的文字多數是拼音文字,如英文、俄文及我國的藏文、蒙文,而漢語則不是拼音文字,而是圖形文字。
二、並不神秘的漢字輸入法電腦是老外發明的,鍵盤是為打ABC而設計的,用電腦打中文,曾經是一個大難題,曾經被老外看作中國實現信息化的一頭攔路虎。自從電腦傳入中國來,多少人在日以繼夜地研究漢字輸入的方法?隨著電腦的普及,隨著時間的推移,一種種輸入法出現了,據說漢字輸入法申請專利的就有500多種。現在,經常還有各種輸入法誕生,僅2000年8月2日的《深圳特區報》就在同一天報導了兩種新的輸入法,其中湖北省的80歲的老紅軍汪洋還發明了九種輸入法。
利用信息處理技術,將一個「字」編進幾個英文或數字代碼(一般是4個),這樣你敲打這幾個代碼時,就可以打出該字來。漢字繁多複雜,有象形、有表意、有會音,條條道路通羅馬,有一種代碼延生,就會有100種1000種甚至10000種誕生。反正編碼原理簡單,你隨便可以將「ABCD」或「DCBA」編成兩個代碼表示什麼,然後輸出來。英文字母有26個,之間的排列組合有多少,要靠計算機才能算得出。所以,當報紙又一次次報導一種新的輸入法發明時,其實已不是什麼新聞。 有更多的各樣的輸入法發明,一點也不新鮮,一點也不神秘,不要以為敲出幾個鍵能打出什麼字來,就大驚小怪,以為什麼大發明,這是因為電腦帶來的神秘感,當越多的人了解了電腦以後,這類新聞就會消失了。
三、關鍵是漢字輸入法的科學性發明一種漢字輸入法其實不難,但要發明一種社會一致認可的輸入法就確實很難了。這條路上有多少人在探索和追求,「引無數英雄競拆腰」。國家電子部有專門的中文信息處理開放實驗室,民間有漢字編碼協會,老外有微軟專門設立了中國研究開發中心中文技術部,摩託羅拉手機也搞了個摩託羅拉按鍵輸入法。 考量一個輸入法好壞的標準,只有8個字:易學、好記、快打、規範。四者必須統一。易學難輸(如拼音)不實用,難學易輸(如五筆)難普及。
漢字輸入法是一種工具,工具不需要多,實用就行了,就象吃飯,中國人只用筷子,西方人只用刀叉,僅此一種。工具太多,往往無所適從,例如:學習打字選擇哪種輸入呢?學校推廣輸入法,那一種符合語文教學規範呢?
由於輸入法太多,已經給中國人帶來了新的麻煩。沒有漢字輸入法,計算機難在中國普及,沒有統一的輸入法,也影響了計算機在中國的普及,影響了中國人的工作和生活。國家為什麼不統一一個漢字輸入法呢?實在也為難,選擇什麼輸入法好呢?目前面市的各種筆和碼,總是有較大的缺憾,總是不完美,如其匆促選定,那也坑害百姓,還是慢慢等待吧!
市場在呼喚,漢字在呼喚,祖國和人民也在呼喚!
四、縱論各類輸入法漢字輸入法有幾百種之多,條條道路通北京,哪條才是最快捷方便的路呢?
目前,幾百種漢字輸入法,按輸入工具而分,可分為鍵盤輸入法(英文字母和數字鍵盤)和非鍵盤(滑鼠、語音、手寫)輸入法。
4.1 非鍵盤輸入法
無論多好的鍵盤輸入法,都需要使用者經過一段時間的練習才可能達致基本要求速度,至少用戶的指法必須很熟練才行,對於並不專業電腦使用者來說,多少會有些困難,所以,現在有許多人想另闢蹊徑,不通過鍵盤而通過其它途徑,省卻了這個練習的過程,讓所有的人都能輕易地輸入漢字。我們把這些輸入法統稱為非鍵盤輸入法,它們的特點就是使用簡單,但都需要特殊設備,這裡只做簡單介紹和對比。
非鍵盤輸入方式無非是手寫、聽、聽寫、讀聽寫等方式,但由於組合不同,品牌不同形成林林總總的產品,分為下面幾類:手寫筆、語音識別、手寫加語音識別加OCR掃描閱讀器。
手寫輸入法
手寫輸入法是一種筆式環境下的手寫中文識別輸入法,符合中國人用筆寫字的習慣,只要在手板上按平常的習慣寫字,電腦就能將其識別顯示出來。
手寫輸入法需要配套的硬體手寫板,在配套的手寫板上用筆(可以是任何類型的硬筆)來書寫錄入漢字,不僅方便、快捷而且錯字率也比較低,用滑鼠在指定區域內也可以寫出字來,只是滑鼠操作要求非常熟練。
手寫筆種類最多,有漢王筆、紫光筆、慧筆、文通筆、蒙括筆、如意筆、中國超級筆、金銀筆、首寫筆、隨手筆、海文筆等。
手寫輸入法的缺點:一是要專門增加手寫板和筆。二是漢字筆畫多,手寫速度慢,易疲勞。三是漢字結構使手寫筆容易出錯,如寫一個「好」字,會變成「女 子」兩個字,而「贏」是由5個字組成的,識別起來更難。
語音輸入法
語音輸入法,顧名思義,是將聲音通過話筒轉換成文字的一種輸入方法,語音識別以IBM推出的Via Vocie為代表,國內則推出Duttv++語音識別系統,天信語音識別系統,世音通語音識別系統等。
以IBM語音輸入法為例,雖然使用起來很方便,但錯字率仍然比較高,特別是一些未經訓練的專業名詞以及生僻字。
語音輸入法在硬體方面的要求你的電腦必須配備能進行正常錄音的音效卡,然後調試好了麥克風,你就可以對著麥克風用普通話語音進行錄入,如果你的普通話口音不準,你只要用它的語音訓練程序,進行一段時間的訓練,讓它熟悉你的語音,也同樣可以通過講話來實現文字輸入。
語音輸入法的缺點:一是漢語的同音字多,電腦難識別;二是漢語方言多,語音不準難識別;三是不認識的字打不出來;四是修改起來很麻煩,還是要用鍵盤;五是工作環境不允許用語音輸入。
ORC技術
ORC,叫做光學字符識別技術,它要求首先把要輸入的文字通過掃描儀轉化為圖形才能識別,所以,掃描儀是必須的,而且原稿的印刷質量越高,識別的準確率就越高,一般最好是印刷體的文字,比如圖書、雜誌等,如果原稿的紙張較薄,那麼有可能在掃描時紙張背面的圖形、文字也透視過來,幹擾最後的識別效果。
ORC軟體種類比較多,常用的比如清華ORC、在系統對圖形進行識別後,系統會把不能肯定的字符標記出來,讓用戶自行修改。 ORC解決的是手寫或印刷的重新輸入的問題,它必須得配備一臺掃描儀,而一般市面上的掃描儀基本都附帶了ORC軟體。 ORC技術是特定的處境中使用的,例如印刷體掃描才實用。
混合輸入法
手寫加語音識別的輸入法有漢王聽寫、蒙括聽寫王系統等,慧筆、紫光筆等也添加了這種功能。
語音手寫識別後加ORC的輸入法有漢王「讀寫聽」,清華「錄入之星」中的B型(漢瑞得有線筆+ViaVoice+清華TH-ORC5.98)和C型(漢瑞得有線筆+ViaVoice+清華TH-ORC5.98)等。
微軟拼音輸入法2.0,除了可以用鍵盤輸入外,也支持滑鼠手寫輸入,使用起來也算靈活。 用滑鼠點擊字根或偏旁輸出漢字的滑鼠輸入法也有更大的缺點:一是拖動滑鼠點擊較累;二是滑鼠點擊容易出錯,修改也麻煩。
不管何種非鍵盤輸入法,都有較大的局限和缺憾。只能在特定的場合(如掌上電腦)使用,根本不可能威脅和取代鍵盤輸入法。
4.2 鍵盤輸入
鍵盤輸入法,就是利用鍵盤,根據一定的編碼規則來輸入漢字的一種方法。
英文字母有26個,它們對應著鍵盤上的26個字母,所以,對於英文而言是不存在什麼輸入法的,漢字的字數有幾萬個,它們和鍵盤是沒有任何對應關係的,但為了向電腦中輸入漢字,我們必須把漢字拆成更小的部件,並將這些部件與鍵盤上的鍵產生聯繫,才能使我們通過鍵盤按照某種規律輸入,這就是漢字編碼。
目前,漢字的編碼方案有數百種,其中在電腦上已經運行的就有幾十種,作為一種圖形文字,漢字是由字的音、形、義來共同表達的,漢字輸入的編碼方法,基本上都是採用將音、形、義與特定的鍵相聯繫,再根據不同漢字進行組合來完成漢字的輸入的。
目前的鍵盤輸入法種類繁多,而且新的輸入法不斷湧現,各種輸入法各有各的特點,各有各的優勢,隨著各種輸入法版本的更新,其功能越來越強,目前的中文輸入法有以下幾類:
對應碼(流水碼)
這種輸入法以各種編碼表作為輸入根據,因為每個漢字只有一個編碼,所以重碼率幾乎為零,效率高,可以高速盲打,但缺點是需要記憶量極大,而且沒有什麼規律可言。
常見的流水碼有區位碼、電報碼、內碼等,一個編碼對應一個漢字。
這種方法適用於某些專業人員,比如:電報員、通訊員等,但在電腦輸入漢字時,這類輸入法已基本淘汰,只是作為一種輔助輸入法,主要用於輸入一些特殊符號。
音碼(拼音輸入法)
這類輸入法,是按照漢字的拼音來進行輸入漢字的,不需要特殊記憶,符合人的思維習慣,只要會拼音就可以輸入漢字。
例如:全拼雙音,雙拼雙音,新全拼,新雙拼,智能ABC,洪恩拼音,考拉,拼音王,拼音之星,微軟拼音等。臺灣的注音、忘形、自然、漢音、羅馬拼音等;香港的漢語拼音、粵語拼音等。
這種輸入法不適用於專業打字員,而比較適用於普通的電腦操作者,尤其是隨著一批智能產品和優秀軟體的問世,中文輸入跨進了「以詞輸入為指導」的境界,重碼選擇也不再成為音碼的主要障礙,新的拼音輸入法在模糊音處理,自動造詞,兼容性等方面都有很大的提高,微軟拼音輸入,黑馬智能輸入等輸入法還支持整句輸入,使拼音輸入速度有所提高。
微軟中國研究開發中心漢字輸入法的專家們也把漢語拼音輸入當作主課研究,他們致力詞組拼音輸入研究後認為:「據我們統計,漢語單字同音現象是非常嚴重的。以6763個漢字為例,沒有同音字的漢字只有16個,其它漢字都有同音字,其中最多的有116個同音字,而漢語詞的同音現象則有較大的改善,以52505個詞語為例,其中35942個詞語沒有同音字詞。②」他們得出結論:「漢語分詞系統作為中文信息處理系統的基石。有著極其廣泛的前景。③」事實是不是如此呢?
各種拼音輸入法,大概佔了專業市場2-3%的份額吧!而非專業人士,則大部分是在用拼輸入法在那是慢慢地敲,拼音易學無需培訓,致命的缺點是:難用難打。問題有五:
A:中國漢字同音字多。幾萬個漢字只有416種讀音,平均每種讀音幾十個同音字。同音字之多,在生活中常常產生歧義。例如:在《新華字典》中,有135個一至四聲的同音字:「yi」以、已、遺、移、宜、怡、矣、一、乙、億、藝、議、亦、衣、異、軼、役、憶、蟻、譯、易、疫、益、意、翼在《中華字典》中,有85個一至四聲的同音字「qi」:七、妻、戚、悽、乞、企、旗 、騎、啟、起、汽、泣、器┅。因為單字同音多,有人想到了用雙拼組詞的辦法來解決這一問題。什麼雙拼輸入法等,一是組詞的能力要提高;二是詞庫太多無法收全;三是增加麻煩。例如:要打個「李」字(《新華字典》裡也有85個同音字),你要打個桃李,然後再去掉桃留下李;四是詞組同音詞也多,例如:在《現代漢語詞典》中,讀「shi shi」的詞條有21個:時世、時時、史詩、史實、事實、適時、失實、失事、失勢、誓師、視事、實施………
B:中國漢字近音字多,中國人分布廣,方言多,對普通話不標準的人更難適應。例如:廣東人王黃不分,普通話中有無翹舌音,鼻音很多人根本難分清,如:音節「in」和「ing」「en」和「eng」「an」和「ang」「zcs」和「zhchsh」較難區別。
C:中國漢字字庫多,幾乎沒有人可以識全部漢字,碰到不認識的字毫無辦法。中國漢字,《中華大字典》收集的有56000個。字種之多在世界名國文字中佔首位,屬大字符集語種。根據我國1981年公布的《通用漢字字符集(基本集)及其交換碼標準》GB2312-80方案,把高頻字,常用字和次常用字歸結為漢字基本字符集(共6763個漢字),再按出現的頻度分為一級漢字3755個和二級漢字3008個。但也很少有人全部認識這6763個字,拼音輸入少不了各種字典。
D、用拼音輸入法打字,當你看到漢字,你的腦海就得把它翻譯處理成英語那樣的完整符號,在鍵盤上敲打再變成漢字,費勁!
E、也需記憶和學習。例如:在簡拼輸入法中,漢字「zhuang」,長達6位,將「zh」簡化為「a」,將「ang」簡化為「h」,得到簡拼碼為「auh」,僅三位碼長。在簡拼和雙拼輸入法中,簡化碼錶更難記憶,如下圖:
簡拼輸入法簡化表
Q | W | E | R | T | Y | U | I | O | P | ||||||||||
A | S | D | F | G | H | J | K | L | |||||||||||
Z | X | C | V | B | N | M | , |
雙拼輸入法簡表
Q | W | E | R | T | Y | U | I | O | P | ||||||||||
A | S | D | F | G | H | J | K | L | |||||||||||
Z | X | C | V | B | N | M | , |
因此,很多人無正常使用拼音打字,主要是一些看到五筆字根望而懶背又想打字的人,一些普通話比較標準的人,一些非專業人士在那裡慢慢地慢慢地用拼音打字!這種打字就等於拖著長腔說話:「打……字……」
所以,航空工業出版社出版的《五筆速成》(編著者鍾劍,齊良培)一書中說:「儘管人們對拼音輸入法進行了如此之多的改進,但並沒有從根本上解決漢字的重碼問題。由此可以得出這樣的結論,僅僅靠拼音解決漢字輸入法的重碼問已走到了盡頭。」④ 英雄所見略同,我們贊同這一結論。
形碼
形碼是漢字的字形(筆畫、字根、部首、偏旁)來進行編碼的。漢字是由許多相對獨立的基本部分組成,例如:「好」字是由「女」和「子」組成,「助」字是由「且」和「力」組成,這裡的「女」「子」「且」「力」在漢字編碼中稱為字根或字元,形碼是一種將字根或筆畫規定為基本的輸入編碼,再由這些編碼組合成漢字的輸入方法。
最常用的形碼有五筆字型、表形碼、碼根碼等;臺灣的倉頡、大易、行列、嘸蝦米、華象直覺等;香港的縱橫、快碼等。形碼的最大的優點是重碼少,不受方言幹擾,只要經過一段時間的訓練,輸入中文字的效率會有大大的提高,因而這類輸入法也是目前最受歡迎的一類,現在社會上,大多數打字員都是用形碼進行漢字輸入,而且對普通發音不準的南方用戶很有好處,因為形碼中是不涉及拼音的,但形碼的缺點就是需要記憶的東西較多,長時間不用會忘掉。
五筆字型是形碼的典型代表。它雖難學難記,但專業人士太多用五筆進行漢字輸入。全國的打字培訓班95%是為學習五筆字型而開的。而介紹學習打字的書籍也是大部分為五筆所編,可見學會五筆有多難了。下面是一些五筆培訓教材對「五筆難」的評價:
A、《跟我學五筆字型》:「雖然五筆字型擁有廣大的學習和應用人員,但與我們計算機應用人員相比,只佔少數,有人統計,在100個計算機應用人員中,使用五筆字型的大約只有5人,為什麼除了專業打字人員外,用五筆字型的人很少呢?究其原因,那是因為學五筆字型難,記憶更難,生背硬記,枯燥乏味,缺乏較好的學習方法。⑤」
B、《五筆字型學用查》:「客觀地講,五筆字型漢字輸入法雖然較拼音輸入法難學一些,但用戶需要記憶的內容不少,如字根鍵盤布局,漢字拆分規則等。⑥」
C、《巧學巧用五筆字型》:「不少人認為五筆字型輸入方案難學。」「五筆字型和表形碼等一類的形編碼輸入方案……卻又有許多還需要記憶的規則,比較難學。⑦」
D、《五筆字型學習捷徑》:五筆字型「要熟練掌握,除透徹了解漢字結構外,還要經過大量上機訓練。⑧」
E、《電腦打字實用教材》:學習五筆「第一類人正值年少,記憶力好,反應靈敏。這些人,經過一期培訓(半月或一月)相當多數的人可以達到每分鐘30字的水平。⑨」
僅看看這些書名,就知道學五筆有多難,僅我們所見,大學府清華大學出版社就出了三本關於學習五筆的書籍。每本發行量達20萬冊,應當說靠五筆狠賺了一筆。
象形碼
象形碼可歸類為形碼,它是將漢字的字根(部首、筆劃)按英文字母的形似來編碼。如廣州的中文特快、湖北的三維天然碼。三維天然碼這樣象形:「工」象「I」「屍」象「P」。而「K、E」則可以正反上下四方轉向。如「E」的四個方向是正「E」的「印」,反「E」的「彐」,上「E」的「出」,下「E」的「巾」等。找出幾個相似的外形可以,上萬個漢字怎麼象形呢?難道26個字母會是萬變的孫悟空?只好牽強附會了。應該說,比五筆好記,但相差不遠,只不過是50步笑100步罷了。
筆畫碼(數字筆畫碼)
筆畫碼是以漢字的五個筆畫(有的增加至10個)為編碼的漢字輸入法。如用大鍵盤的二筆、六元金碼,101和用小鍵盤的五筆數碼等。
將漢字的五個基本筆畫橫豎撇點折分別定位為12345,這是國家技術管理局規定的。在此基礎上,如何編碼,就看各位如何發揮了。如何從頭打到尾,則碼太長,如打個鮮字,打完「35251222」8碼才打出個魚字,鮮字還沒見影呢,所以五筆數碼數字拆分,前4後2,取6位碼。這種編碼方法,經國家技術監督局評審的便有3個,各有千秋,很難說好。
二筆和六元金碼是同一人發明的,後者是前者的克隆,如果將位置順序變化一下又是一種輸入法,那麼,僅僅這種方法便可變出幾十種輸入法來。二筆和六元金碼將漢字五個筆畫排列成25個雙筆畫加上五個單筆畫,計有3個字母鍵(佔用了幾個功能鍵),要記憶的元素達60個之多,轉換的環節較多,不符合人的思維習慣。可以克隆的,不是唯一的,便是不科學的。
音形碼
音形碼吸取了音碼和形碼的優點,將二者混合使用。常見的音形碼有鄭碼、錢碼、丁碼等。
自然碼是目前比較常用的一種混合碼,這種輸入法以音碼為主,以形碼作為可選輔助編碼,而且其形碼採用「切音」法,解決了不認識的漢字輸入問題。自然碼6.0增強版,保持了原有的功能,新增加的多環境、多內碼、多方案、多詞庫等功能提高了輸入速度和輸入性能。
這種輸入法的特點是速度較快,又不需要專門培訓。適合於對打字速度有些要求的非專業打字人員使用,如記者、作家等,相對於音碼和形碼,音形碼使用的人還比較少。
南京的易碼、廣州的一碼輸入法也是音形碼,兩者較為相似。一碼單字的碼長為三位。第一位碼為該字讀音的首字母,不認識的字也難處理。而要強記的偏旁歸鍵也有近100個,極不規範。如:「丶、冫、氵……」打「A」;「亠、宀」打「O」;「R」打「人」;「」打「皿」,等等。
混合輸入法
為了提高輸入效率,某些漢字系統結合了一些智能化的功能,同時採用音、形、義多種途徑輸入。還有很多智能輸入法把拼音輸入法和某種形碼輸入法結合起來,使一種輸入法中包含多種輸入法。
以萬能五筆為例,它包含五筆、拼音、中譯英、英譯中等多種輸入法,全部輸入法只在一個輸入法窗口裡,不需要你切換來切換去的,你如果會拼音,就打拼音;會英語就打英語;如果不會拼音不會英語,還可以打筆畫;還有拼音+筆畫,為用戶考慮得周到。但是,有一種好的工具可以使用就行了,一個人會使用一種工具就行了,一個人是很難學會十八般武藝的,吃飯時又用筷子又用刀叉,是不是太複雜了?英譯中事實上就是一個翻譯軟體的功能(如快譯通),沒什麼了不起。
除此之外,一般輸入法都有一些輔助輸入功能,比如:聯想功能、模糊音設置、自動造詞、高頻先見、自動忘卻、多重南方音,疊字疊詞、智能標點等。隨著網絡的發展,很多輸入法既可以輸入簡體字,又可以輸入繁體字,適應性更強了,新的輸入法還提供擴充GBK漢字庫和GBK難字查詢功能,便於難檢字的輸入。
此外,還有以字義為基礎的輸入法,如英漢輸入法,此類型輸入法主要針對使用外語的人士,只要輸入相應字義的單詞,即可輸入該字,但速度比較慢,而且對使用英文程度有一定的要求。
五、打字通,漢字輸入法最後最好的全面解決方案
5.1 什麼是打字通漢字輸入法?
打字通,將一個「字」拆成幾個「字根」(單字、偏旁、筆畫),字根讀音的第一個字母(聲母),就是打字通漢字輸入法的代碼。即「拆字打聲母」 ,如:月為Y、共為G、山為S。冀=北+田+共=BTG。如:
字 | 拆 法 | 代 碼 | 字 | 拆 法 | 代 碼 |
章 | 立日十丶 | LRSD | 臨 | 丨丨丿一 | SSPH |
股 | 月幾又丿 | YJYP | 方 | 丶萬丶 | DWDF |
慧 | 豐豐彐心 | FFXX | 贏 | 亡口月凡 | WOYF |
註:不夠四碼的字要補書寫的第一個單筆畫和該字讀音的首字母
5.2打字通的特點是什麼?
A、易學:1分鐘學會,2小時熟練,3天成高手!只要你了解一個字的編碼原理,便可以基本掌握打字通了。被譽為「比拼音還易學」。
B、好記:不用分部首,不用背字根,不用記鍵盤,不用報戶口,不用辨字型,不用拼全音。字根讀音的第一個字母即代碼,此乃小學已掌握的知識。
C、快速:專業及業餘人士皆適用,經測試,詞組輸入每分鐘可達300字以上,比拼音快10倍,速度趕超五筆。
D、規範:和中小學語文教學接軌,符合中小學語文教學規範,有助於學好漢字,糾正錯別字,幫助記憶漢字,尤其適合中小學生學習使用。
5.3為什麼說打字通可以取代五筆?
毛主席教導我們,有比較才有鑑別。俗話說:不怕不識貨,就怕貨比貨。打字通說:就怕不識碼,不怕碼比碼。敢挑戰千筆萬碼,打字通打遍天下!
五筆會被取代嗎?
會,當然會!一個既難學又難記的輸入法,一個極不規範的輸入法,肯定會被一種易學、好記、快打、規範的輸入法所取代。這幾年,千筆萬碼在實踐著這一夢想,自1983年王永民先生發明五筆以來,己有幾百種輸入法問世,包括各種筆和碼,並向五筆發出挑戰,可惜總是無功而返。這些輸入法總是有缺憾,綜合指標均未超過五筆,打得快的不好學,是指五筆;好學的打不快,是指拼音等各種輸入法。為什麼橫掃大陸市場的五筆走不到港澳臺呢?同樣,為什麼港澳臺正風行的蒼頡走不進大陸龐大的市場呢?難道繁簡字的鴻溝就那麼大嗎?
不是的,是因為大陸五筆也好,港臺蒼頡也好,其編碼原理不科學,只有科學才是無界限的。所以,要取代五筆,走向中文世界,只有一種符合「易學、好記、快打、規範」原理的打字通才可以完成這一使命。五筆問世已經20年,真正學會的有幾人,佔總人口的百分之幾?工具(如筷子)是具有高度龔斷性的,有人說,學五筆比學開汽車還要難,這說明五筆這個工具存在嚴重的缺陷。
形象一點比喻,五筆是技術落後的手動棍波解放牌汽車,而打字通則是易學先進的自動波小車了。
為什麼說打字通可以取代五筆?
A、規律性
打字通的編碼原理一學就會,正所謂一個「字」學會打字通,而五筆說上一小時你都無法將其編碼原理講清楚。
B、科學性
打字通是以《新華字典》、《中華字典》、《現代漢語詞典》所收錄的單字、偏旁、筆畫及常用字為字根的取碼範圍,字根的讀音的首位字母即是代碼,其科學性不容置疑。
打字通和五筆一樣,字根比較均勻地分布在26個(五筆是25個)英文字母鍵盤上,解決了漢語拼音音節少(416)的問題,從數學的排列組合角度來分析,拆分字根來編碼也是比較科學的。
C、唯一性
打字通按字的構成字根的讀音的首位字母為代碼,不可更改,具有唯一性,更具有不可代替性。而五筆的字根沒有規律地隨意地放在25位字母鍵盤上,等於是用手抓起一把字根撒在鍵盤上,那麼也就可以任意組合。用五筆的字根編出種種不同的代碼來。例如,同是拆成「立、日、心」的「意」字,五筆的代碼是:「UJN」,跟字根沒任何聯繫,而打字通的代碼是:「LRX」是三個字根的聲母,不可更改,除非「意」字改結構,或者「立、日、心」改讀音,才要改「意」字編碼。唯一性,這是除打字通之外所有漢字輸入法都做不到的。
五筆和打字通字根相同而代碼不同的有:
字根 | 打字通 | 五筆字型 | 字根 | 打字通 | 五筆字型 |
巴 | B | C | 又 | Y | C |
D、廣泛性
大量發行中小學生廣泛使用的《現代漢語詞典》、《新華字典》、《中華字典》是打字通的堅實基礎,這些辭書正是中小學語文教學不可少的工具書,有誰不會翻查字典呢?會查字典就會用打字通打字。可以說全國的中小學語文教學打下的基礎,就是學習打字通打字的基礎,也就是利用你已有的語文知識,就能學會打字,減少學習記憶的時間和腦力。
E、技術性
摩託車的技術指標決定了它比自行車要跑得快,這指標是實打實的。打字通優秀的技術指標是看得見的。
技術指標一是易學:
打字通規則簡單易學,一個「字」學會電腦打字,一個字有兩種意思,一是時間一個「字」(粵語,指五分鐘),二是告訴你一個「字」的編碼原理,你就幾乎掌握了打字通,無記憶鍵盤負擔,一學就會,入門快上手易。
而五筆規則複雜,要報戶口,要區分字的上下左右雜合型,識別碼難懂。
技術指標二是好記:
這是打字通的最大優勢,不用死記,永不忘記。
①、打字通不用背字根表,不用記憶字根的鍵位
因為字根讀音的第一個字母就是它的代碼,而要分辨是否五筆字根則要逐個代碼去查找。例如:打字通打「Q」鍵的有:「七、千、齊、去、區、丘、求、曲、乞、犭」,它的讀音的首個字母「Q」就是代碼;五筆字根字打「Q」的有:金、釒、兒、勹、夕、匚等12個,除了死記還有什麼辦法呢?
②、漢字五個筆畫的代碼
筆畫 | 橫 | 豎 | 撇 | 點/捺 | 折 |
五筆字型 | G | H | T | Y | N |
打字通 | H | S | P | D | Z |
可以看見,五筆筆畫和代碼之間沒有任何聯繫,全靠死記硬背。既然是隨意放在鍵盤上,那麼,這5個筆畫之間也可以互相換位,也可以放到其餘鍵盤上。打字通筆畫和代碼之間相互聯繫,筆畫代碼就是該筆畫讀音的第一個字母,一看就懂,容易記憶。但打字通的筆畫代碼不可換位,也不可放在其它鍵盤上。除非將點改為捺,則可放在「N」鍵。
③、打字通的一級簡碼比五筆好記
代碼 | Q | W | E | R | T | Y | U | I | O | P | A | S | D |
五筆 | 我 | 人 | 有 | 的 | 和 | 主 | 產 | 不 | 為 | 這 | 工 | 要 | 在 |
打字通 | 區 去 | 我 | 而 | 日 | 他 | 月 | 於 | 義 | 口 | 平 | 啊 | 是 | 的 |
代碼 | F | G | H | J | K | L | Z | X | C | V | B | N | M |
五筆 | 地 | 一 | 上 | 是 | 中 | 國 | / | 經 | 以 | 發 | 了 | 民 | 同 |
打字通 | 發 | 個 | 和 | 就級 | 可 | 了 | 在 | 學 | 產 | 網 | 不 | 年 | 民 |
五筆的25個一級簡碼與代碼之間同樣沒有一點聯繫。而打字通的130個一級簡碼與代碼之間相互聯繫。除「V」鍵以外,其餘皆是該字的讀音的首位字母(零聲母「U」「I」取韻母),打字通每個字母有三個常用字作固定的一級簡碼,大大擔高了打字的速度。
④、五筆成字字根的編碼方法
本鍵碼(要報戶口「25個鍵位」,要記牢其鍵位)+首筆碼+次筆碼+末筆碼。非成字字根和代碼之間沒有聯繫(要死記硬背)。打字通的成字字根打法和其它字一樣,沒有特殊的規則。
⑤、打字通和五筆的識別碼
打字通和五筆一樣,不足四筆的加識別碼。但五筆要區分字型,有15個識別碼:
橫 | 豎 | 撇 | 捺 | 折 | 舉 例 | |
左右型 | G | H | T | Y | N | 胡 結 湘 樹 持 |
上下型 | F | J | R | U | B | 要 夏 會 晶 霜 |
雜合型 | D | K | E | I | V | 同 區 還 我 才 |
打字通不用區分部首與非部首,取碼規則為該字的1、2、3末四碼,不足四碼補書寫順序第一個單筆畫,不用區分字型,識別碼只有五個:
⑥、五筆――打字通比較
類 別 | 字或詞 | 拆 法 | 五 筆 | 打字通 |
單字 | 新 | 立木斤丶 | U S R H | L M J D |
雙字 | 對外 | 又寸夕卜 | C F Q H | Y C X B |
三字 | 計算機 | 訁q木幾 | Y T S M | Y Z M J |
四字 | 將錯就錯 | 丬釒京釒 | U Q Y Q | J J J J |
多字 | 中央電視臺 | 口冂曰厶 | K M J C | O K R V |
說明:同樣的字詞,同樣的拆法,代碼卻不一樣,五筆要死記,打字通則可輕鬆記憶,這就是打字通的成功之處。
技術指標三是規範:
打字通的代碼字根取材於《新華字典》、《中華字典》和《現代漢語詞典》,字根讀音完全按照漢語拼音方案。非成字字根按同樣標準,並按習慣取其讀音的主要意義的一個字的首位字母取碼,如寶蓋頭,取「寶」字讀音的首位字母「B」。而五筆自造成字字根和非成字字根佔了一半多,很多字根連老師都不懂,和中小學語文教學內容脫節,雖然佔了專業人士打字市場的大部分,但中小學一直不敢推廣。
打字通除部首規範外,拆字也絕大部分合乎規範,由大拆到小,是字根打字根,非字根打筆畫,筆畫中提屬橫,捺屬點,豎左鉤屬豎,其它全屬折筆,這些規則完全按照國家文字委員會的標準,沒有自造筆畫。
需要說明的是國家語言文字委員會指漢字五個單筆畫為:橫、豎、撇、點折,五筆卻叫橫、豎、撇、捺、折,這也應是五筆的一個不規範吧!
技術指標四是快速:
大家知道,摩託車快過自行車,因為摩託車的各項技術指標超過了自行車。
那麼,打字通和五筆字根輸入法速度誰快誰慢呢?個人因素(電腦認識水平,操作熟練水平等)除外,就要看兩者一、二、三級簡碼、詞庫及重碼率的多少等五項內容了。這是決定速度快慢的技術因素。
1、一級簡碼五筆僅有25個,打字通則有130個,大寫數字是常用的,打字通打AA就可獨創性直接輸出,優於五筆字根。
2、二級簡碼五筆理論上有25*25=625個,實際只有589個,打字通理論上有26*26=676個,實際只有615個,打字通多了26個。
3、三級簡碼五筆僅有1200多個,而打字通則有5000多個,國家規定的常用漢字有6763個(打字通則有7000多個),五筆和打字通最大碼長都是4碼,但打字通大部分都是三鍵輸出,大大優秀於五筆字根。 所謂二、三級簡碼,是指排在提示行第一位,打字通有一、二、三筆輸入法,只要輸入的第一個代碼正確,都可以顯示出10個字。
4、還有詞庫,五筆僅有17000多個,而打字通則有27000多個,又是大大超過了五筆,說實話,所謂打得快的,達200多字者都是打詞組,打字通詞庫容量多,可以在線造詞,最長可選入39字,造入任何人名、地名、單位名稱及專有名詞,適合專業打字員快速使用。
5、最後一個技術因素是重碼率,打字通跟五筆差不多,重碼率高要選字(如拼音、101等)自然打得慢了,你可以任意檢測打字通的重碼率,確實很低,打字通一個字有幾種打法也有重碼,因為保留一種字有多種拆法,如果刪去多種打法,則可大大降低重碼率,所以打字通有多種版本(校園版和專業版)問世,專業打字人員建議使用專業版。還有一種辦法降低重碼率,就是將重碼率較高的字再拆小,按一類表的成字字根的打法拆,則可大大減少重碼率。
不論是一、二、三級簡碼,還是詞庫、重碼率,樣樣技術指標,打字通都超過五筆,打字通的輸入速度肯定快過五筆。
這裡不妨按易學、好記、規範、快速四項指標,分別給五筆和打字通打分:
易學 | 好記 | 規範 | 快速 | 總分 | 平均 | |
五筆 | 0 | 0 | 50 | 100 | 150 | 37.5 |
打字通 | 95 | 95 | 100 | 100 | 390 | 97.5 |
評分標準:
1、五筆是公認最難學、最難記的漢字輸入法,所以,易學、好記此兩項為0分;而打字通是公認比拼音還易學、記憶量比拼音還要少,所以,易學、好記此兩項應得高分。
2、五筆的拆字方法很多不規範,連大學中文系的人都說看不懂,像天書,如「被」字拆成四個字根,你知道怎麼拆嗎?因為五筆的不規範,所以語文老師不敢教。規範一項五筆肯定不及格。
3、五筆是公認最快速的,所以得100分。而打字通的輸入速度被認為「速度趕超五筆」,所以也得100分。
打字通全面超過五筆字型,就象《新華字典》的部首檢字法取代了過去的四角號碼查字法一樣,打字通取代五筆已是勢不可擋了。
5.4為什麼說打字通比拼音還易學、還好用、速度快10倍?
打字通只用字根的讀音的第一個字母(聲母)作編碼,不用韻母,更不用區分韻母的前後鼻音、捲舌音、兒化音等等。讀音不準,不認識的字都可以打出來,打字通不是比拼音輸入法還簡單易學嗎?
「靡」字的讀音是什麼?你不認識這個字,拼音輸入法怎麼打?而打字通只要知道構成靡字的常用漢字「廣、木、非、林、麻」即可將此字用三種方法打出。且不看「廣、木、非、麻」等字的全部讀音是什麼,而只知道首位字母是什麼即可。望字猜音,「靡」(mi)會讀作(fei),那就相差甚遠了。
中國文字不是注音文字,望字不能讀音,此字的讀音全靠兒時的學習和平時的積累,任何報刊也沒有將字的讀音標出,任何人都無法將字認全,而只要掌握了300多個字根的讀音的首字母,就可打出字庫裡的漢字,不是比拼音還好用嗎?
前面所述,漢語同音、近音字多,拼音輸入法的最大問題就是重碼率較多,例如靡(mi)字,漢語拼音裡面有29個,而要找到「靡」字,第一排10個找不到,必須翻頁,而拆成三種代碼「GMMF、GLFD、MFDM」則分別三碼和四碼皆可直接上屏。再比如張(zhang),打完全碼有6碼,碼太長,且同音字有24個,近音字(ZAN、ZANG、ZHAN、ZHANG、ZHUAN、ZHUANG)更複雜,而按照打字通的打法:「GCZ」三碼即上屏。重碼率少,速度自然快,據測算,比拼音輸入快10倍。下面是一些字的比較(如下表):
字 | 拼 音 | 重 碼 | 打字通 | 代 碼 | 重 碼 |
媒 | Mei | 29 | 女甘木く | NGMZ | 0 |
潛 | Qian | 34 | 氵夫夫日 | DFFR | 0 |
戴 | Dai | 26 | 土田共丶 | TTGD | 0 |
密 | Mi | 33 | 宀必山丶 | BBSD | 0 |
贊 | Zan | 12 | 先先貝ノ | XXBP | 0 |
美 | Me | 29 | R王大丶 | BWDD | 4 |
娛 | Yu | 117 | 女口天く | NOTZ | 0 |
警 | Jing | 44 | 艹句攵言 | CJWY | 0 |
冀 | Ji | 123 | 北田共丨 | BTGS | 0 |
慧 | Hui | 51 | 豐豐彐心 | FFXX | 0 |
暗 | Ai | 24 | 日立日丨 | RLRS | 0 |
整 | Zheng | 26 | 束攵正一 | SWZH | 0 |
泰 | Tai | 19 | 三人水一 | SRSH | 0 |
隆 | Long | 23 | 阝攵一生 | EWHS | 0 |
峰 | Feng | 27 | 山攵豐丨 | SWFS | 0 |
傅 | Fu | 98 | 亻甫寸ノ | RFCP | 0 |
搬 | Ban | 24 | 扌舟幾又 | SZJY | 0 |
意 | Yi | 135 | 立日心丶 | LRXD | 0 |
由上表可見,如果構成該字的讀音不變(不可能)結構不變(繁改簡),那麼該字的代碼就不可能變,這是打字通的科學性、規律性和唯一性。也是和五筆、二筆等輸入法的根本區別和先進所在,打字通的編碼思想和編碼方案,無不閃耀著智慧的光芒,一個可以戰勝千筆萬碼一統漢字輸入方法的電腦入門工具誕生了,我們為此感到歡欣鼓舞!
5.5 打字通漢字輸入法與手寫筆、語音輸入比較表
比較項目 | 打字通鍵盤輸入 | 手寫筆 | 語音輸入 |
入門時間 | 1分鐘 | 10分鐘 | 10分鐘 |
正確輸入 | 300字/分鐘 | 30字/分鐘 | 100字/分鐘 |
正確率 | 100% | 95%(需書寫規範) | 90%(需標準語音) |
實用程度 | 安裝攜帶方便,適合286以上電腦. | 不需安裝攜帶,只適用於486以上電腦,需配手寫板、筆等工具. | 不易安裝攜帶,要求486以上多媒體電腦,需配麥克風音效卡等專用工具. |
價格 | 299元 | 600元 | 800元 |
本文結論:打字通取代五筆和拼音輸入法
綜上所述,漢語非鍵盤輸入法(手寫、語音、滑鼠及ORC技術)威脅不了更取代不了鍵盤輸入法,鍵盤輸入法專業人員使用最多的是五筆字型,而業餘人員使用最多的是拼音。可以說,因為五筆的難學,才會有更多的人去嘗試非鍵盤輸入法,也才有拼音輸入法的市場。而當一種既可取代五筆又可替代拼音的打字通輸入法問世之際,用空前絕後來形容就不過分了。我們認為,將一個字拆成幾個字根(部首、筆畫、偏旁)再打其讀音的首個字母,較好地解決了拼音的重碼率較高和五筆形碼難學難記字難拆的問題,變三難(難學、難記、難打)為三易(易學、易記、易打),解決了漢字電腦輸入的瓶頸問題。打字通問世,打字難變易。打字通的編碼方法和方案,正是漢字輸入法的最後最好的全面解決方案。用電腦打漢字,必須用打字通,有電腦的存在、有漢字的存在,就有打字通漢字輸入法的存在。打字通的價值是無法用金錢來估量的,打字通對社會的貢獻也是無法用金錢來估量的。打字通願和大家一同探討和完善,為中國人輕輕鬆鬆學會電腦打字,為中國的現代化建設而努力!
參考文獻
①《漢語信息處理詞彙01部分;基本術語(GB12200.1-90)》中國校準出版社,1991。
②《微軟中國研究開發中心通訊》2000年第三期。《漢語分詞在中文軟體中的廣泛應用》,作者李東、張湘輝。
③同上
④《中文錄入五筆字型速成》,航空工業出版社,1999,編著者鍾劍,齊良培。
⑤《跟我就五筆字型》,上海科學技術電腦社,2000,編著者潘承榮、李愛華。
⑥《五筆字型學用查》,航空工業出版社,1999,主編崔亞量、甘露。
⑦《巧學巧用五筆字型》,清華大學出版社,1999,鍾道隆著。
⑧《五筆字型學習捷徑》,清華大學出版社,1994,編者莊躍輝、餘壽林、舒妙飛。
⑨《電腦打字實用教材》,清華大學出版社1993,編著者康東日。