輸入法這事上,英文已經輸給了漢字

2020-12-12 觀察者網

【觀察者網翻譯/青年觀察者張成】

一個秋日的早晨,史丹福大學的穆蘭尼向我抱怨現行的QWERTY電腦鍵盤布局。他並不是一名技術人員,也不是德沃拉克鍵盤(一種將常用字母都歸在一起,以期提高打字速度鍵盤布局,1936年由美國人奧古斯特·德沃拉克設計——觀察者網注)的忠實粉絲,他研究的是中國現代史。我們正在一起策劃一個關於中國打字機和鍵盤的展覽,在策展的過程中穆蘭尼得出結論:在西方人執迷於QWERTY鍵盤布局時,中國在科技上早已把西方甩在了身後。

他的觀點至今仍非主流。由於漢字有將近7.5萬個,遠比字母體系複雜得多,因此歷史上人們一直認為中文與現代科技是不相容的。如何用打字機打出漢字,用漢字發電報,甚至如何用漢字與現代世界溝通?如果你是一個劍橋畢業的、熟悉並熱愛希臘文的西方古典主義者,也許會得出結論——漢字是古老迂腐的,再由衷讚嘆一句「字母表萬歲!」

但是,穆蘭尼卻認為,計算機的發明可能會將龐大漢字字符庫的劣勢轉變為優勢。

穆蘭尼近期與人合作出版了兩本有關計算機和中文打字機的書。他跟我聊了聊研究的收穫。他的發現讓我十分激動,因為這不僅關乎中國,更關乎人與計算機的關係。計算機不只是硬體,它更是溝通人與軟體的媒介。他說:「使用QWERTY鍵盤是與電腦溝通最早、最原始的方式。你按下A,屏幕上就跳出字母A,實際上這一操作並未充分利用電腦處理器和內存的性能,可以說是大材小用了」。然而在中文電腦上使用QWERTY鍵盤鍵入字母A,電腦就會給出與這個A關聯的所有漢字。在電腦上輸入中文要求計算機各層軟體協調工作,用戶在使用電腦的過程中很容易就可以發現這一點。

換句話說,輸入中文的本質是給電腦一串指令,電腦給出你要輸入的漢字。穆蘭尼認為會打字的中國人都是「懂代碼的人」。現在有各種各樣的中文輸入法,但是西方世界卻仍然只能一個字母一個字母地打出想要的內容,無法靠升級軟體帶來任何輸入法的進化。「很多人一個半世紀以來都堅信字母體系是最科學的文字體系,你很難改變他們的想法」,穆蘭尼說。

穆蘭尼表示,歷史上中文打字方式非常落後,但正是這段歷史激勵著中國人在計算機軟體大發展時代充分利用軟體優勢,最終使得現在輸入中文的效率超過了輸入英文。

1871年電報進入中國的時候,最早使用電報的那一批人不得不在語言面前向西方科技低頭。一位荷蘭的天文學家和法國的海關官員提出了解決方案,即給每個漢字一個四位數的電碼,再將電碼編成摩爾斯電碼的點劃線。這的確是有用的,但是卻使得中文傳輸處在弱勢地位。摩爾斯電碼用五位點劃線表示數字,而只用一至三位點劃線表示字母。這使得發送中文電報既昂貴又沒有效率。據一些人說,前總理周恩來出訪時,發送電報是最大的一筆開銷。

中文打字機也十分笨重,2000多個常用漢字擠在厚重的底盤上。打字員通常需要在鍵盤上找到對應的漢字,重重地將推桿敲在紙上。如果你要打的不是常用漢字,那麼就得在備用底盤上,大海撈針般地從幾千個漢字中找出你要的那一個。

與此同時,也有許多人在不斷嘗試尋找發送電報更簡便的方法,試圖發明更適合中文輸入的打字機。為此,他們必須找到漢字新的索引方式,把漢字分解成一個個小部分。比如四角號碼檢字法就以漢字四個角上的形狀對漢字分類。十種不同角的形態被冠以0到9十個數字,以順時針鍵入四個角的形狀所對應的代碼,就能打出相應漢字。如果你不會寫漢字,你也許不會覺得這個發明多麼精妙。但事實上,這是對於漢字徹頭徹尾的一次再思考。

打個比方,這就像是你不再一個一個字母地輸入英文單詞,而是根據上伸(如d,b,l,h)或下探(如p,y,g,j)的字母個數來表示單詞。以抽象代碼的方式進行檢索,這一想法某種意義上來說是中國人的創新。

穆蘭尼說,隨著計算機的普及,中文輸入法的種類愈發多樣,在上世紀七八十年代甚至掀起了輸入法戰爭。不同的輸入法對思考漢字提出了不同的要求:也許是按照四個角來思考,也許是三個角,也許只是部首,或者是筆畫順序。還有一些人則嘗試了拼音輸入法,在QWERTY鍵盤上通過對軟體的應用將字母轉化成文字。隨著技術的不斷突破,這些輸入法現在都可以為你預測將要輸入的漢字。比如,你如果要輸入一段話,只需要輸入每一個字對應拼音的第一個字母。換句話說,系統聯想出你接下來要輸入什麼。以軟體輔助的中文輸入法將會勝出,事實上我覺得它已經贏了。西方人有必要知道,我們目前「敲擊什麼就輸入什麼」的鍵盤具有很大局限性。不過即便如此,估計美國人也只能理解到這一程度。

總部設在西雅圖的Tegic公司最初發明T9輸入法時,創造了手機上新的字母排列方式。通常人們以數字2代表a,b,c,以數字3代表d,e,f,以數字4代表g,h,i,以此類推。T9輸入法的用戶可能並不陌生,如果要打「hone」一詞,輸入「4663」後,要先划過「good」,「home」和「hoof」後才能找到「hone」。但是Tegic最早開發了以數字代表字母的新方式,既不按照QWERTY的順序,也不按照字母順序,只為優化輸入法避免重複。

但是這一輸入法未獲成功。Tegic公司的聯合創始人瓦倫丁回憶道:「你不能在手機上改變字母的排列順序。因為現行的字母排列方式已被廣泛接受,我們不得不採用這種低效的輸入法」。

在中國讓用戶接受新的事物就沒那麼難,因為中國用戶的使用習慣尚未固化。中國T9輸入法是基於漢字筆畫開發的,每一個數字代表不同的筆畫。瓦倫丁表示,由於中文T9筆畫輸入法帶有聯想功能,因此用戶平均只需要輸入1.4個筆畫就可以打出一個字,而一個漢字通常由9筆組成。這是輸入效率上的一大飛躍(順便提一句,瓦倫丁在越戰時期是一名中文翻譯,他聽錄下中文的四字電碼,並將其譯成漢字,因此他對落後的中文輸入法深有體會)。

克裡斯蒂娜是一名獨立設計研究員,也是一位民族志學者。她說:「在中國,過去十年裡手機的普及意味著許多新用戶第一次開始學習在行動裝置上輸入漢字。他們此前對QWERTY鍵盤沒有什麼經驗,因此他們更容易接受新的輸入法」。新的輸入法家族包括T9筆畫輸入法,QWERTY鍵盤上的拼音輸入法以及觸控螢幕手寫輸入法等等。

「如果你找50個人,讓他們輸入一樣的東西」,穆爾尼說,「然後你自己觀察他們在鍵盤上的操作,你也許會發現50種不同的操作方式」。新的輸入法不斷湧現,其中一些新的英語輸入法效率更高,比如ShapeWriter和Swype輸入法,使得用戶能夠一次動作划過所有字母打出單詞。但是似乎它們並未獲得用戶的認可。舊的QWERTY輸入法足夠用,誰會僅僅為了在手機上打字快一點而完全從頭開始學習一種新的輸入法呢?

穆爾尼的說法也許有些刺耳,「在使用字母的國家,有一種過於自滿的氛圍。我個人認為,這不是對字母的主觀崇拜,而是因為人的懶惰,不想學習效率更高的編碼輸入方式」。穆爾尼這是在挑戰QWERTY的「權威」,挑戰西方科技的根本協議標準。

人們之所以覺得他的話刺耳,是因為已經很久沒有人挑戰西方權威了。電報和打字機的發明與字母的思維方式息息相關,之後的計算機和網絡協議亦是如此。中文使用者用了一個世紀的時間讓他們的語言適應科技的發展,直到計算機的發展使得中文重新獲得地位。這使得中文世界與科技的關係變得比英文世界還要密切和深入。

(青年觀察者張成譯自《大西洋月刊》,觀察者網馬力校)

本文系觀察者網獨家稿件,文章內容純屬作者個人觀點,不代表平臺觀點,未經授權,不得轉載,否則將追究法律責任。關注觀察者網微信guanchacn,每日閱讀趣味文章。

相關焦點

  • 以前很火的五筆輸入法,為何會輸給拼音?
    不過在用戶量上,百度輸入法擁有5.36億用戶,超過搜狗的5.35億以及訊飛的1.07億扳回一城。輸入法的作用在於提供一種技術,可以讓用戶用於搜索和查詢,只不過不管輸入法怎麼變,大部分人使用的類別基本就兩類。以國內的用戶為例,在使用輸入法時,通常會選擇五筆輸入法和拼音輸入法,而這兩種輸入方式,伴隨著80後和90後的成長至今已經超過20個年頭。
  • 風靡一時的五筆輸入法,為什麼會輸給拼音輸入法?主要原因有3點
    比如查找資料或者在社交軟體上聊天,這些都需要輸入文字。在電腦剛流行起來的時候,很多人不會使用電腦,為了更方便輸入文字,會專門學習一種輸入法,那就是五筆輸入法。利用五筆輸入法能夠快速的輸入文字,但是對輸入的人有一定的要求,需要系統的學習五筆字根表,掌握漢字每一個部首和鍵盤對應的部位才能夠進行輸入,這是在當時做文員工作的人必須要學的。
  • 曾經很火的五筆,現今卻輸給了拼音輸入法,究竟是什麼原因?
    然而,有一個手機和電腦上都存在東西沒有發生太大的變換,那就是我們每天都在使用的輸入法。大家都知道,輸入法有好幾種,在常見的輸入法中五筆輸入法最快,但是目前使用最多的還是拼音輸入法。說到五筆輸入法,相信大家並不陌生,是王永民在1983年發明的一種漢字輸入法。
  • 五筆字型:劃時代的漢字輸入法
    1 1983年五筆字型問世上世紀七八十年代,我國電腦普及遭遇瓶頸,漢字輸入法的缺失是一個重要原因。有人說,如果不廢除漢字而代之以拼音,電腦就不能在中華大地普遍應用,中國就不能步入現代文明。究其原因,用鍵盤敲26個英文字母很容易,但漢字有成千上萬個,而且筆劃那麼多,字形那麼複雜,如何通過小小的鍵盤來呈現,著實是個難題。
  • 為何風靡一時的五筆輸入法,會輸給拼音輸入法?
    誠然,個人電腦已經沒落了,現在是智慧型手機的時代,但是有一個主題卻從來沒有變過——人機互動,而打字就是最基本的人機互動。這就不得不提到輸入法了,想要通過打字實現人機互動就必須要輸入法,尤其是在電腦廣泛應用的幾天,不會打字,寸步難行。現在最火的輸入法是什麼?
  • 為什麼以前很火的五筆,最後還是輸給了拼音輸入法,其實原因很簡單
    手機和電腦已經成為了我們生活中離不開的電子設備,這些年手機和電腦都發生了翻天覆地的變化,唯獨一個東西沒有發生太大的改變,這就是我們每天都在使用的輸入法。你現在在使用什麼輸入法呢?Windows98於是國內的專家都開始研究如何在電腦鍵盤上快速又高效的輸入漢字。
  • 漢字雙筆碼輸入法通過國家鑑定
    27日,以漢字書寫筆畫為基礎的輸入方法——漢字雙筆碼輸入法通過國家鑑定。  在信息產業部委託福建省信息產業廳召開的技術鑑定會上,以倪光南院士為首的鑑定委員會認為,這種輸入法軟體「具有自主智慧財產權,在小鍵盤編碼設計和多信息輔助功能方面達到國內外領先水平,對促進中文信息產業發展具有重要意義。」
  • 幾種手機漢字輸入法的測評
    提供GBK國家標準擴充漢字21003個,儘管很多難字但只要見其形,即可輕鬆編碼輸入,解決了拼音輸入不明讀音、讀音不準及重碼太多等困難。用拼音類的輸入法絕大多數人花了很長時間也無法完成輸入,而用金數碼筆畫輸入法卻輕而易舉,其編碼是[乪]690 [囧] 26361 [偘]32999。這與輸入普通的字並無差別。此外,遇到個別編碼不準的情況,還有容錯碼及模糊輸入可以輕鬆解決。
  • 從差點廢除漢字到輸入法速度與顏值齊飛,中文輸入法的華麗逆襲
    但是隨著電腦和鍵盤的誕生,中文輸入法曾經面臨這巨大的挑戰,因為鍵盤這東西是按照英文字母弄的,當時很難把英文字母轉換成漢字,當時很多人都斷言,在計算機時代漢字將被淘汰,為此還曾經有人提出要把漢字變成拼音字母問題,就像當年的民國時代,有人提議廢除漢字一樣,出發點都是為了這個國家民族的未來。
  • 為什麼曾經很火的五筆,最後還是輸給了拼音輸入法?其原因很簡單
    相信大部人現在都是使用的拼音輸入法,可是很少有人知道在數十年前風靡全國的輸入法還是五筆輸入法,只不過現在已經逐漸消失在了大眾的眼中。世界上第一臺計算機埃尼阿克在1946年的美國加州誕生,那個時候的我們都還不知道電子管是什麼。直到上個世紀七十年代,國內才開始引進了第一臺計算機。
  • 為何以前很火的五筆輸入法,終究輸給了拼音法,兩點真實原因!
    既然在網絡上文字交流,那麼打字的技能必不可少!相信很多朋友每天都會在各種通訊產品裡面打字進行工作交流或者社交交流,打字已經變成我們現代人的必須要具備的一項網絡技能了,學不會這個技能就意味著你不能和朋友正常地聊天甚至會影響到你的工作。當然我們也可以選擇不同的方法來打字,這裡就要涉及到輸入法了,那麼你平時在生活中使用的是哪種輸入法呢?
  • 專訪「縱橫碼漢字輸入法」發明人周忠繼:我只做了自己覺得對的事
    中新社香港5月7日電 題:專訪「縱橫碼漢字輸入法」發明人周忠繼:我只做了自己覺得對的事  作者 韓星童  「應該怎樣輸入『香港特別行政區』這幾個字?」  「縱橫碼漢字輸入法」發明人、94歲高齡的周忠繼不用多想,伸出手指在鍵盤上連摁六個數字「093020」,電腦屏幕立刻跳出這七個漢字。
  • 漢字拼音化 拼音輸入法銷蝕漢字能力
    而在與輸入法相關的錯誤中,因「同音輸入」造成的錯誤,如「突破」誤為「圖破」、「重點」誤為「終點」等,共有1703處,佔90%;因「字形相近」造成的錯誤,如「緊」誤為「紫」、「租賃」誤為「租憑」等,共有193處,佔10%。鑑於這一統計的時間跨度長、範圍廣,且具有連續性,可以認為,其結果基本反映了拼音輸入法和字形輸入法造成我國出版物文字錯誤的比例。
  • 當初風靡一時的五筆輸入法,為何會被拼音輸入法打敗?有兩點原因
    在這些評論區使用鍵盤輸入漢字,最常用的輸入法就是拼音輸入法了。拼音輸入法不僅能通過首字母快速完成漢字的輸入,也能通過智能糾錯,更改打錯的拼音,最終完成輸入。如今拼音輸入法已經在全國各地普及,成為當代人必須要掌握的一項生活技能,否則就無法正常在網上和人交流。但其實拼音輸入法普及之前,最風靡的還是五筆輸入法。
  • 香港故事|「縱橫碼漢字輸入法」發明人周忠繼:我只做了自己覺得對的事
    「縱橫碼漢字輸入法」發明人、94歲高齡的周忠繼不用多想,伸出手指在鍵盤上連摁六個數字「093020」,電腦屏幕立刻跳出這七個漢字。「縱橫碼漢字輸入法」發明人周忠繼。出生於江蘇蘇州的周忠繼,上世紀五十年代與兄長移居香港,從事紡織工業、金融地產等商業貿易,躋身於實業家之列。
  • 劉學中和他的新型漢字輸入法
    本報記者 秦名芳 通訊員 劉超 文/圖  會使用電腦的人都知道,五筆字型和鄭碼輸入法打字較快,但每個鍵位的字根較多,排列規律性又不強,學習難度較大;筆畫和拼音輸入法雖然容易學,但編碼效率較低,打字速度上不去;隨著對外交流的擴大,國外電腦用戶輸入中文也存在一些障礙。
  • 倪光南:搜狗輸入法是漢字信息處理的重大進步
    報告指出,以搜狗為代表的輸入法已成為中國網際網路的基礎性服務,產業生態鏈初步形成。  在慶典活動上,中國工程院院士、聯想漢卡發行人倪光南做了主題演講,他說,搜狗輸入法利用網際網路平臺,通過搜索、雲計算等技術,提高了輸入速度和準確度,這是漢字信息處理的重大進步。他說,希望好的輸入法能為全國13億人服務,為世界上所有使用漢字的人服務。
  • 雲南退休教師自創漢字輸入法獲國家發明專利
    中新網昆明11月29日電(王豔龍)雲南農業大學退休教師吳敬祖憑藉著自己的興趣愛好,20年堅持研究計算機語言文字輸入法,自創了簡單、易學的漢字輸入法。該輸入法可以精準打出所需文字,且能實現中英文互譯,獲得了國家知識產權局的專利認可。  29日,記者赴雲南農業大學拜訪了吳敬祖,這位精神矍鑠的64歲老人正在研究如何將自創的輸入法「移植」到手機上。  「我覺得漢字輸入法不應該那麼複雜,應該簡單、精準,不要一輸入就出來一大堆,讓你不知道在哪裡找到它。」
  • 漢字曾被指不科學差點被廢掉:一項獨特優勢證明漢字比英文更先進
    說到漢字危機,就不得不提到曾在這片土地斷斷續續上演過的「漢字拉丁化改革」,由於近代中國式微,一些人將落後的原因歸咎於傳統糟粕太多,很不幸,漢字也淪為了他們的打擊對象,被指為一種過於繁複且不科學的文字。可即使到了80年代,廢除漢字改用拉丁拼音的聲音卻仍然存在,由於漢字不是字母文字,輸入計算機十分麻煩且效率低下,關鍵在於需要字庫支持,不像英文,26個字母排列組合便可構成詞句,漢字總數可是高達將近十萬個,即使是常用漢字也有三千多個。
  • 輸入法「黑科技」五筆輸入,為什麼「消失」了,輸給了拼音大數據
    輸入法「黑科技」五筆輸入,為什麼「消失」了,輸給了拼音大數據輸入法作為當前觸控屏幕最主要的輸入手段,不管是在過去還是在現在都是不可代替的,即使語音輸入在未來發展的相當成熟在很多場景中仍然需要我們進行手動輸入的操作,畢竟一天的語音下來沒有誰的嗓子能夠承受的了