編者:感覺微軟的拼音輸入法不像是中國人開發的,難用、體積龐大,儘管最近經常有新版本推出,但使用拼音輸入的用戶還是難以接受。
1984年8月5日, 法新社發出報導:新華社派了22名記者,4名攝影記者和4名技術人員在洛杉磯奧運會採訪和工作。在全世界報導奧運會的7000名記者中,只有中國人用手寫他們的報導。
1995年,美國微軟公司與中國國家語言文字工作委員會9月20日在北京籤署合作備忘錄,微軟將支持國家語言文字工作委員會(國家語委),研究和開發中國 語言文字相關項目, 以促進中文在電腦領域的普及和推廣。同年微軟發布的具有劃時代意義的Windows95,宣布正式支持中文輸入法。古老的中國文字開始與最先進的信息系統 結緣。
2008年,奧運會112年來首次來到了中國,一條條實時中文奧運報導直達全球華人。當中國的記者們用指尖而非筆尖傳遞著光榮與夢想時, 微軟中文輸入法的研發團隊的工程師們已經開始為新版本的拼音輸入法而衝刺。
十五年的承諾
1995年,李東加入微軟在中國成立的第一支研發團隊。她接手的第一個項目,就是微軟中文輸入法。 「可能誰也想不到,並不引人注目的中文輸入法,成為了微軟在中國投資的第一個研發項目。」已經成為輸入法項目負責人的李東笑說,「當時我們團隊有6個人, 今天已經發展到57人的規模」。這個團隊正在為亞太地區的多個市場開發各語種的輸入法。
1996年,比爾·蓋茨來到中國,在釣魚臺國賓館,他向各部委的領導演示了第一個版本的微軟中文拼音輸入法, 展示了微軟在中國第一個研發項目投資的成功,也帶來了未來在中國長久發展的默默承諾。
要讓古老的中國文字與基於二進位代碼開發的現代軟體結合,殊非易事。語料的採集、語句語義的分析、用戶習慣的調研等等,都是一項項的空白。與學術界的合 作,成為研發的突破口。1995年,微軟與哈爾濱工業大學開始合作,雙方成立聯合語言語音實驗室,主要從事中文語言處理研究。 2006年7月,微軟與哈工大又合作成立了哈工大教育部微軟語言語音重點實驗室深圳分室,與本部的實驗室在統一的運作模式下南北呼應,互相支持和協作。
「我們當時找到了國內在自然語言處理領域權威地位的哈工大,與李生和王曉龍等著名教授合作,開發了微軟拼音輸入法。微軟拼音輸入法的特點,是語句級智能, 這與當時的詞語級智能相比,是個極大的科技進步。」李東介紹說,「換句話說,就是進行整句輸入,系統會自動分析自動校正相應的漢字,整句的拼音輸入完了, 相應的漢字整句也生成了,正確率相當高。」 經過若干版本的演進,微軟拼音輸入法風靡一時。
「從1995年開始,微軟就不斷投資,長期和國家語委合作開發語料庫,並且參與到國家語委的標準化研究中。」李東說,「此外,為了提高微軟拼音輸入法的詞 庫質量,我們還長期與國家名詞審定委員會權威專家合作目前形成了58個高質量的專業詞庫。比如很難的醫學語句,一次性輸入成功率非常高,在許多專業領域, 微軟拼音輸入法都成為學者們工作中的必需工具。」
還讓李東引以為豪的是,1999年香港回歸前後,她主持開發了繁體漢字的拼音輸入功能,並且獲得了專利。從此,微軟Office的用戶,就能毫不費力的進 行繁體或簡體的漢字輸入和相互轉換,推動了大陸與香港地區的文化融合。而微軟拼音輸入法臺灣版本的成功開發,同樣支持簡體或繁體的漢字輸入轉換,也促進了 兩岸的文化交流與合作。
寧靜致遠
中文信息處理技術進步的程度如何,決定著中華文化(包括傳統的和現實的)繼承、發展和弘揚的速度、範圍和質量。對文化的傳承,絕非一朝一夕之功。
相比於當時市場中的各類中文輸入法來說,微軟拼音輸入法的市場宣傳推廣幾乎可以忽略不計。然而,微軟的投入卻一直未減。其中投資方向之一,就是投入到了對 中國少數民族文字的支持上。微軟認為,少數民族文字也是中華民族文化的重要組成部分,而其數位化也將推動少數民族文化在新時代的保留與發展。微軟的 Office辦公軟體,還進一步考慮到了少數民族文字(蒙文、藏文、傣文等)的排版需求——豎排且從右到左書寫的方式。
「從2006年網際網路的興起以後,可能大家感覺到微軟拼音輸入法的進步有些滯後了。」李東坦言。 「其中原因之一,是我們的開發周期長,因為要配合每一代的Windows和Office系統,必須得經過全球36種語言的嚴格測試,不同應用系統的兼容性 測試、安全性可靠性的全面測試、國家標準認證測試, 才會上市。」此外,微軟還花了大量時間,與高校、國家語委、行業語言專家等開展基礎性研究工作。」我們現在已經基於網際網路平臺,加大了產品的更新力度。」
除了與國家標準規範部門合作外,微軟還非常重視用戶體驗。每年,微軟拼音輸入法的消費者調研都要進行幾輪,調研方式包括邀請用戶到微軟實驗室進行實際測 試,以及對重點城市的消費都進行問卷調查。除此之外,微軟還邀請用戶把錯誤報告發送給微軟,以便在下一個版本的開發中改進。十五年來的默默耕耘和積累,讓 微軟拼音輸入法在Office2010版本中再放光彩。
積跬步而致千裡
經過2年多夜以繼日的開發,微軟拼音輸入法2010版有了許多新的提升,比如更加準確的智能,而且整句輸入準確率更高。輸入法的詞彙庫也大量擴充,特別補 充了當下流行網絡詞彙庫並且支持詞庫自動更新, 使用戶可以保持與網絡文化的與時俱進。除了網絡詞彙外,微軟拼音輸入法一直在行業專業詞彙領域保持領先,通過與各行業專家的長期合作,收錄了最為全面的行 業專業詞彙庫。最新的開放詞典平臺,使各行業用戶可以創建並分享不同的專業詞庫。 此外,微軟拼音輸入法2010的性能有了大幅提升,啟動更迅速、反映更靈敏。
為了及時吸納用戶的需求和反饋,微軟拼音輸入法提供了完整的價值創新鏈條:對於新詞、錯詞,用戶可隨時反饋給微軟,輸入法能夠定期自動更新。為了更準確把 握用戶需求、了解用戶習慣,微軟亞太研發集團的同事們努力鑽研網友的聊天習慣,甚至跑到網吧去了解網吧用戶使用輸入法的習慣等等。
在這個信息科技時代,中文輸入法的意義已遠遠不僅限於文字輸入。隨著中國國力的增強和國際交流的增加,越來越多的外國人開始學習漢語。在此情況下,中文信 息處理將促進對外漢語教學。而對內也有助於鞏固和提高基礎中文教育,曾幾何時,國人開始提筆忘字,需要靠拼音輸入法找回模糊的記憶?
「十五年來,正因為有微軟對中國市場的長遠承諾, 我們才推動了拼音輸入法的不斷升級。也正因為這種努力,帶動了國內這個領域軟體的蓬勃發展。回頭來看,這對中文信息處理的演進做出了歷史性的貢獻,有幸能 成為這個團隊中的一員,我很自豪。「 李東說,」「未來,我們會繼續做出更大的努力,奉獻給大家更精彩的輸入法, 提供給用戶更完美的計算機交互體驗」。