輸入法的本質是人類與機器的交互方式,當我們認知到這一點時,其實交互的方式已經衍生出了無數的版本。
比如,PC時代的我們使用輸入法時需要通過鍵盤和滑鼠與機器進行交互;移動網際網路時代的到來,觸控螢幕又開始代替鍵鼠,承載著輸入法與機器的交互;而這個時代,語音乃至更豐富多樣化的方式幫助我們用輸入法與機器進行交互。
百度輸入法稱之為「全感官」交互體驗,它是以語音輸入技術為基礎,同時結合新一代年輕人的表達方式進行持續更新,包括中英自由說、方言自由說、離線語音、AI鬥圖、凌空手寫、AR表情等新技能。
當然,語音輸入的方式其實不僅僅是百度輸入法一家之言,也不是第三方輸入法的獨有,在這個時代,不管是原生的還是第三方輸入法其實都在這方面通過人工智慧的方式發力語音輸入的體驗,以提升輸入的舒適性、智能化以及效率化。
這裡面,尤以第三方輸入法的建樹更多,除了前面提及的百度輸入法之外,以訊飛輸入法為例,它在2019年當前已經實現的是高速語音輸入、中英文免切換輸入、方言輸入以及行書、草書、生僻字的識別等等;而搜狗輸入法則深耕以語言為核心的AI技能,推出了包括中日韓語音隨心譯、模仿明星/動漫人物的語音變聲功能等全新的玩法,同時也完善了盲打鍵盤、表情包等功能,提升的不僅僅全場景語音輸入的體驗,還提升了趣味性。
但事實上,紮根在各種輸入方式中的現代化AI技術還有更多可挖掘的部分,以百度輸入法為例,其這兩年進化的主要體現是「流式多級的截斷Attention模型」(注意力模型),這也是國際上首次超越了整句的注意力模型。
如何解釋這個問題呢?百度官方是這麼詮釋這個先進的模型的:過去傳統的Attention模型都是基於整句的,整句Attention技術是在語音都上傳到伺服器後,才能開始聲學打分計算和解碼,會引入較大的用戶等待時間,沒法做到在線語音交互的大規模實時服務,達不到上線標準。
有了這項模型的支持,百度輸入法最直接提升的是這三點:
提供更準確的智能語音服務,且正式實現離線語音輸入;AI真正深度理解你的語音指令的含義--這也是當前萬物互聯的一個主流的趨勢;能夠實現更複雜的、具有邏輯層級的任務。
這個部分如何通俗易懂地向大家詮釋呢?或許,百度輸入法新增加AI助聊功能能夠幫我們解讀一番。百度官方對AI助聊的解釋不多,但我們從字面上的意思或許可以這樣理解:它是基於AI技術的層面,提升我們的場景化下的聊天體驗。
以AI助聊的『智能預測』為例,它有點類似於我們在搜尋引擎的模糊搜索一樣,只要你輸入詞語就能夠進行「聯想」,將你接下來要表達的意思補全完整,提升你的輸入效率。而且,句子並不完全是偏正式語言風格的,也有常態化的、文案風格的,不一而足。假如你正在聊天APP或者社交媒體中進行聊天,那麼它提升的是聊天的高效率;而如果你發表感知或者評論,它可能又變成了你的「文案助手」,將一些你一時想不到的或者是風格更優美的文案提供給你,提升的是你的場景化輸入體驗。
相比『智能預測』的多場景適應性,『智能幫寫』其實也是智能預測的一類,只不過它在一些情緒的表達上補全『智能預測』的空白,從而進一步提升用戶的使用體驗。比如,嘴笨的人或者性格比較直的同學,想要在聊天時表達或委婉、或暖心的意思,你只要輸入一個有關心情的詞語,它就可以給你提供或正能量的、或暖心的能夠表達你意思的句式出來,就像一個輸入端的人工智慧管家,幫你表達出更準確、更符合交流的句子。
如果你在輸入時不小心打錯了一兩個字,百度輸入法AI助聊的『智能糾錯』也可以隨時幫你改成正確的字,避免讓你表達錯了意思或者毀了一個好的文案,在實際的體驗中,它可以做到聯繫上下文之後的精準「糾錯」,而不是我們過去那種麻煩的、準確性不高的糾錯體驗。
總結:
這就是百度輸入法在AI技術上的又一次「深耕」的結果,也是繼AI語音輸入、AI滑行輸入之後的有一大創舉,看起來提升的格局並不大,但它更場景化、更接地氣,解決的就是當下我們日常生活中比較常態化的使用場景。
AI助聊最關鍵的是AI,而最接地氣的就是『助聊』,和老婆/女友或者長輩上司的聊天,與校友/網友/同事的群體聊天,都可以藉助AI助聊這個功能大幅提升你的聊天體驗和輸入的效率,這樣的百度輸入法你確定不試試嗎?