百度推出AI輸入法8.0 一分鐘能識別426字語音

2020-12-13 智東西

智東西文 | CJ

智東西1月17日消息，百度輸入法推出8.0版本，該版本的更新內容包括一個核心技術突破「Deep Peak 2」模型和兩個全新AI功能，包括「語音速記」和「AI表情」。

發布會開始，百度副總裁王海峰演講稱，百度在做輸入法的最初時期就運用了深度學習的算法，未來百度也將在AI技術上做出更大突破，讓AI在更多的領域提升人機互動的體驗。

一、語音識別技術突破

據百度語音技術總監高亮說,新版本的百度輸入法使用了最新技術突破「Deep Peak 2」模型，該技術全稱為「基於LSTM（Long Short-Term Memory，長短期記憶網絡）和CTC（ Connectionist temporal classification，聯結主義時間分類器）的上下文無關音素組合建模」。

該技術與傳統的語音技術「上下文相關建模」的不同點在於，在「上下文相關建模」中，同一個音素，由於左右兩邊相連的音素不同，就會被定義成不同的建模單元，而在Deep Peak 2模型中，同一個音素，無論其左右兩邊的音素是否相同，都會被定義為唯一的建模單元。

得益於該項技術突破，建模單元減少10倍，同時路徑解碼部分的消耗降低10倍，解碼速度也提升10倍。

除此之外，因為該技術突破可以讓口語和正式語言結合用於深度學習訓練，使得新的語音識別模型可以識別多種語音內容，包括中英文混說、各種重口音混說的情況，現場全程使用的「實時語音識別上屏技術」也應用了最新的Deep Peak 2模型。

同時，主持人華少現場在一分鐘內進行了「426字」的快速語音播報，百度輸入法的語音識別幾乎和華少同時完成，識別內容也與華少現場所說的相差無幾。

二、兩大全新AI功能

百度輸入法負責人蔡玉婷稱，這次百度輸入法8.0版本在此前已有的AI功能上增加了「語音速記」和「AR表情」兩大全新AI功能。其中，「語音速記」功能中應用了「聲紋識別」技術，該技術針對2-3人的小型會議場景，可根據聲紋區分不同發言人的語音信息。

由於超過六成的百度輸入法用戶都會使用表情輸入，因此此次百度輸入法也推出了新的「AR表情」功能，該功能運用了人臉識別技術和AR技術，用戶可以通過相機或相冊進行人臉識別、製作表情包，還可以用自己的表情控制虛擬人物的形象。用戶製作出來的AR表情，可以直接通過輸入法搜索、語音輸入和鍵盤輸入時展示出來。

百度輸入法的工作人員也現場演示了該功能的玩法。

這次百度輸入法8.0的發布是對百度輸入法的進一步優化，通過AI技術突破強化了語音識別功能，AR技術的加入也呈現了輸入法的不同表達形式，增加了輸入內容的個性和娛樂性。

相關焦點

百度輸入法8.0版本正式發布:主打AI語音速記/AR表情!

驅動中國2018年1月17日消息今天下午百度在北京達美會議中心正式推出了主打「百度AI輸入」的百度手機輸入法8.0版本，此次大版本更新重磅推出了語音速記和AR表情兩大功能。並首次在手機輸入法中展示了百度在AI語音識別、計算機視覺領域的硬功夫。
1分鐘可以輸入400字?百度輸入法語音輸入再升級

據我觀察，50歲以上的中老年人，手機輸入法用的基本上是手寫輸入法。效率非常慢，一分鐘頂多也就才寫十幾個字。 1分鐘，400字五筆輸入法的極限速度是1分鐘150字，拼音輸入法則在1分鐘80字左右，這基本就是鍵盤輸入的極限了，手機上會更慢。近段時間，百度再次完成蛻變，語音識別技術全面升級，重點加強了方言識別能力，打字效率幾乎高達1分鐘400字。
百度發布國內首款AI輸入法語音技術實現世界級突破

【環球網科技記者林迪】1月16日，國內首款真正意義上的AI輸入法——百度輸入法AI探索版正式亮相百度輸入法「AI·新輸入全感官輸入2.0」發布會。據悉，這是一款默認輸入方式為全語音輸入，並調動表情、肢體等進行全感官輸入的全新輸入產品。
訊飛輸入法9.0發布,語音輸入免切換高識別賦能AI

5月21日，科大訊飛召開新品發布會，發布了訊飛輸入法9.0。該輸入法採用自主研發的新一代語音識別模型，充分考慮使用場景和用戶體驗，將新技術最快、最好地運用到產品和服務中，基於A.I.升級驅動語音輸入再次進化，實現中英、普通話與方言以及離線與在線語音免切換輸入，與傳統拼音輸入相比打字效率提升300%，開啟語音輸入免切換時代。
輸入法AI時代來臨,百度輸入法多重AI科技賦能,讓輸入更高效便利

據調查數據顯示，九成用戶對AI功能表示肯定，能帶來交互效率升級，百度不斷創造全新輸入功能滿足用戶需求，讓交流更簡單高效，包括首發離線中英自由說，飄逸順滑的AI滑行，手寫自由寫，以及最新推出的AI助聊功能，成為更懂用戶表達的輸入法產品。
第三方語音輸入法怎麼選?百度輸入法、搜狗、訊飛差距竟如此明顯...

另外，隨著雲計算和AI人工智慧的發展，各家輸入法都推出了語音識別功能，該功能的推出將手機的輸入效率抬升到了一個全新的層次。相比傳統的拼音、手寫、筆畫等繁瑣的輸入方式，語音輸入操作更加簡單，輸入效率也大幅度的提高。
全感官輸入2.0時代百度輸入法AI探索版正式亮相

1月16日，在百度輸入法「AI·新輸入全感官輸入2.0」發布會上，國內首款真正意義上的AI輸入法——百度輸入法AI探索版正式亮相，這是一款默認輸入方式為全語音輸入，並調動表情、肢體等進行全感官輸入的全新輸入產品。
AI技術發威,百度輸入法日均語音輸入請求量超越搜狗

看到輸入法日均語音請求3.35億次這個數據，我還是感覺到有些意外的。第一個是輸入法只是百度眾多應用的一款，不是百度App這樣的旗艦應用，會在發布財報時被李彥宏重點提及，讓人意外。7月，賽諾（SINO-MR）對外發布的《2018上半年中國手機輸入法分析報告》顯示，在手機輸入上，語音輸入正在越來越重要，拼音和手寫輸入法則有下滑趨勢，「得益於1分鐘輸入400字，提升用戶對語音輸入效率的感知，語音輸入佔比從去年下半年的38%提升至今年上半年的41%，使用佔比穩步提升。」
語音輸入AI黑科技圈粉老中青少,百度輸入法開啟感官輸入新時代!

尤其是去年，百度手機輸入法推出V9.0版本，主打皮膚新玩法。不管是愛豆美圖還是只是學習，都讓你在使用手機輸入的時候賞心悅目。今年推出的語音黑科技，更是在進一步，憑藉百度在語音和AI的深厚積蓄引領5G時代全感官輸入新體驗。
一分鐘輸入500個字,百度輸入法V9.0強勢來襲

手機輸入法已經成為我們日常不可或缺的APP，而目前國內比較出名的輸入有百度輸入法、搜狗輸入法以及訊飛輸入法等。其中搜狗輸入法以詞彙量多而出名，訊飛輸入法以語音識別準確而出名，而在V9.0版本之前的百度輸入法和其他兩個相比顯得不那麼出眾，但是自從更新到V9.0的YAN鍵盤後，我就徹底轉投百度輸入法陣營了。這次更新的V9.0版本是一個全新的版本，更新了非常多的內容，其中變化最大的地方我認為就是加入了YAN鍵盤和對語音輸入的優化提升。
懂AI更懂你百度輸入法突破世界級語音技術限制給輸入「加速」

優秀的語音輸入,首要任務就是識別準確,在這方面百度輸入法相當有發言權。百度語音技術早在2019年年初便取得了一項對全球學術界和工業界都具備重大意義的突破——流式截斷的多層注意力建模(SMLTA),將在線語音識別精度提升了15%,超越行業最優競品15%,充分保證了用戶語音輸入的精準度與識別速度。其次,優秀的語音輸入還要照顧到不同用戶群體的需求。
離在線語音輸入智能轉換無卡頓用百度輸入法表達更順暢

早在今年一月，百度輸入法AI探索版正式問世，發布會現場就測試了包含百度輸入法在內三款不同輸入法產品的「離線語音識別能力」。經過對輸入法上嵌入式識別的Deep Peak2模型進行優化，百度輸入法大幅提升了離線語音識別準確率。
史上最強的語音輸入法誕生,百度是如何做到的?

在昨天，百度輸入法「AI·新輸入全感官輸入2.0」發布會上。百度輸入法正式對外發布了最新殺手鐧——AI探索版輸入法。這個輸入法基本上顛覆了外界的想像。作為百度眼中 AI 落地的「橋頭堡」，百度輸入法AI探索版默認將全語音作為默認輸入方式，並在豐富輸入方式上大開腦洞，圍繞表情、肢體等為用戶提供了全感官的輸入體驗。在發布會現場，臺上是嘉賓的演講，大屏幕的右側則是百度輸入法的實時同步，我注意到，即便是一些英文單詞，也能識別出來。
能讀懂你心思的AI輸入法!百度輸入法新版體驗 - 太平洋電腦網

也就是說，新版百度輸入法實現了用戶說個開頭百度輸入法就智能補足整句，字未打完句已出的黑科技功能。有了這個功能，用戶的輸入速度將大大的得到提升。圖8 淘寶對話裡的百度輸入法智能預測功能　　圖9 京東對話裡的百度輸入法智能預測功能百度輸入法的「智能預測」功能支持多款購物APP、社交APP以及王者榮耀、絕地求生。在玩遊戲的時候，這個智能預測功能更是能幫玩家節約不少的時間，你也別忘了百度輸入法在遊戲時還有快捷短語功能。
百度發布AI輸入法:語音識別精度提升15%支持凌空手寫

【網易智能訊1月16日消息】今天，百度召開新品發布會，宣布百度輸入法AI探索版正式發布，這是一款默認輸入方式為全語音輸入，並調動表情、肢體等全感官輸入的產品。據了解，百度首先宣布了在語音技術方面取得的突破，流式截斷的多層注意力建模（SMLTA）已經將在線語音識別精度提升了15%，這一技術能夠解決傳統Attention模型在識別中的時延性，以及因此導致的無法進行大規模在線語音實時交互的問題。
百度AI·輸入法,語音識別輕鬆自由說

數據進一步顯示，使用最多的第三方手機輸入分別是搜狗，百度和訊飛，搜狗和百度不分上下，的用戶佔40%以上，而訊飛的用戶佔8.4%。在用戶越來越流行的語音輸入方面，百度輸入法在中國市場排名第一。那麼，為什麼百度輸入法能在眾多輸入法和中？中佔據語音輸入的第一市場份額呢？
百度手機輸入法Android 5.1版—新增粵語語音輸入

據了解，百度手機輸入法安卓5.1版在原5.0版簡約風格的基礎上更加專注輸入，帶來了語音、英文、手寫、聯想等基礎輸入的全面提升，追求最極致的用戶輸入體驗；而全新的默認皮膚，以及新上線的Android L風格皮膚，更為大家帶來了扁平視覺的全新體驗，不免讓人眼前一亮。
百度輸入法:用完我把鍵盤都扔了!英語和方言都能識別的輸入法!

輸入法是網上交流的一種最基礎也是最重要的交流工具，一款輸入法會讓用戶用起來得心應手才是優秀的輸入法。百度輸入法的語音輸入輕鬆識別中英文混輸為什麼百度輸入法能做到如此精確的離線中英文識別？
百度語音識別上線新版本長語音轉寫告別時間限制

當語音輸入不再受時間的限制，用戶是否可以真正實現「動口不動手」?近日，百度AI開放平臺向開發者免費開放長語音識別功能，通過SDK調用服務，可將長語音轉換為文字。據了解，新版本SDK解除了對時間的限制，開發者無需再將長語音切割成60秒以內的分段，進行調用，提升了轉寫的效率和語音識別的體驗。
離線中英混合語音識別準確率超98%!百度輸入法帶你體驗「有網沒網...

這項基於中英文SMLTA模型的創新功能，讓用戶在弱網甚至無網絡環境中，依然可以順暢地進行中英文語音混輸，且識別準確率和有網絡時一樣優秀, 準確率超過98%。百度輸入法在此前推出的「在線中英自由說」功能基礎上，藉助AI技術賦能對語音輸入進行了又一次重大升級，大幅提升了用戶交互效率，全感官輸入2.0再迎重磅升級。

百度推出AI輸入法8.0 一分鐘能識別426字語音

相關焦點

百度輸入法8.0版本正式發布:主打AI語音速記/AR表情!

1分鐘可以輸入400字?百度輸入法語音輸入再升級

百度發布國內首款AI輸入法 語音技術實現世界級突破

訊飛輸入法9.0發布,語音輸入免切換高識別賦能AI

輸入法AI時代來臨,百度輸入法多重AI科技賦能,讓輸入更高效便利

第三方語音輸入法怎麼選?百度輸入法、搜狗、訊飛差距竟如此明顯...

全感官輸入2.0時代 百度輸入法AI探索版正式亮相

AI技術發威,百度輸入法日均語音輸入請求量超越搜狗

語音輸入AI黑科技圈粉老中青少,百度輸入法開啟感官輸入新時代!

一分鐘輸入500個字,百度輸入法V9.0強勢來襲

懂AI更懂你 百度輸入法突破世界級語音技術限制給輸入「加速」

離在線語音輸入智能轉換無卡頓 用百度輸入法表達更順暢

史上最強的語音輸入法誕生,百度是如何做到的?

能讀懂你心思的AI輸入法!百度輸入法新版體驗 - 太平洋電腦網

百度發布AI輸入法:語音識別精度提升15%支持凌空手寫

百度AI·輸入法,語音識別輕鬆自由說

百度手機輸入法Android 5.1版—新增粵語語音輸入

百度輸入法:用完我把鍵盤都扔了!英語和方言都能識別的輸入法!

百度語音識別上線新版本 長語音轉寫告別時間限制

離線中英混合語音識別準確率超98%!百度輸入法帶你體驗「有網沒網...

百度發布國內首款AI輸入法語音技術實現世界級突破

全感官輸入2.0時代百度輸入法AI探索版正式亮相

懂AI更懂你百度輸入法突破世界級語音技術限制給輸入「加速」

離在線語音輸入智能轉換無卡頓用百度輸入法表達更順暢

百度語音識別上線新版本長語音轉寫告別時間限制