不久前,百度輸入法在北京舉辦了主題為「AI輸入,開啟全感官輸入時代」的發布會。會上,百度副總裁AI技術平臺體系(AIG)總負責人王海峰出席並為大會致辭。隨著AI技術進步,進一步滲入到輸入法中,百度AI輸入開啟了全感官輸入時代的序幕。
百度AI輸入
百度副總裁AI技術平臺體系(AIG)總負責人王海峰在大會致辭中指出「隨著AI的到來,全感官輸入時代的序幕已經拉開。」
輸入法本質上是一種人與機器交流的媒介,也是用戶高頻使用的重要工具。縱觀歷史,隨著技術的發展,人與機器交流的媒介和形式也在不斷變化升級。隨著語音、手寫等輸入方式的出現,輸入法也幾經變化,而真正為輸入法帶來質的突破的,是AI技術。
百度從誕生之日起就已經和AI息息相關,而百度輸入法是百度AI的重要產品,也是百度AI技術率先落地應用的產品之一,王海峰在大會中用「AI技術應用的橋頭堡」形容百度輸入法的價值所在。基於百度領先的AI語音技術,百度輸入法實現了又準又快的語音輸入,並支持多語種、場景化、長語音、輕聲識別等功能創新,這些功能應用在實際場景中,將實實在在改變用戶生活。
全感官輸入時代的序幕已經拉開,未來將會有更多AI能力應用到輸入法中。
一項技術突破,兩大全新功能
此外,作為此次發布會的亮點之一,百度語音技術部總監高亮,在大會上發布了百度語音技術的最新突破——Deep Peak 2模型。該技術全稱為「基於 LSTM 和 CTC 的上下文無關音素組合建模」,該模型突破了沿用十幾年的傳統模型,能夠更充分地發揮神經網絡模型的參數優勢,大幅提升中英文、多種口音、多種風格(如朗讀、聊天、輕聲)混合輸入的識別準確率,聊天場景下的相對正確率較行業領先水平提升20%,讓機器更輕鬆適應用戶的自然對話。
同時,百度輸入法負責人蔡玉婷在大會中宣布了百度輸入法v8.0版本的正式上線,該版本在此前已有的AI功能上增加了「語音速記」和「AR表情」兩大全新AI功能。
其中,「語音速記」在輸入法領域獨家首發了「聲紋識別」技術,該技術針對2-3人小型會議場景,可根據聲紋自動區別發言人,實現智能化的語音識別。而「AR表情」功能基於百度領先的人臉識別技術和 AR 技術,用戶不僅可根據相機或相冊進行人臉識別、製作表情包,還支持用戶通過自己的表情控制虛擬人物形象。製作出來的AR表情,可以直接通過輸入法搜索、語音輸入和鍵盤輸入時展示出來。
百度輸入法 更懂你的表達
當AI技術深入落地輸入法,其所加持的各種功能讓它已不再僅僅是「輸入工具」。
當記者面對人物採訪時,百度輸入法語音速記功能高效、精準的記錄,可幫助記者進行實時記錄,從而提升了記者的工作效率,彌補了傳統手記在速度上的滯後。也避免了事後需要聽打來整理錄音的不便。
此外,遊戲主播在直播過程中,也可利用百度輸入遊戲鍵盤開黑。不僅有極簡語音功能可令其節省打字時間,更有諸如便捷短語、和諧轉換等功能可為主播門進行定製化服務,豐富其遊戲體驗感 。
而對於外國人來說,用百度輸入法還有內置翻譯功能。在線交流中,遇見不懂詞彙可直接用輸入法來實時翻譯,避免的不同APP間跳轉的繁瑣,消除了交流障礙,方便其日常溝通和學習。
科技發展,AI時代近在眼前。百度在不斷發展AI技術的同時,更注重讓技術落地於實踐、服務於生活。百度輸入法未來進一步革新人機互動模式,完全開啟全感官輸入時代的日子指日可待。