百度推出AI輸入法8.0 一分鐘能識別426字語音

2020-12-13 智東西

智東西 文 | CJ

智東西1月17日消息,百度輸入法推出8.0版本,該版本的更新內容包括一個核心技術突破「Deep Peak 2」模型和兩個全新AI功能,包括「語音速記」和「AI表情」。

發布會開始,百度副總裁王海峰演講稱,百度在做輸入法的最初時期就運用了深度學習的算法,未來百度也將在AI技術上做出更大突破,讓AI在更多的領域提升人機互動的體驗。

一、語音識別技術突破

據百度語音技術總監高亮說,新版本的百度輸入法使用了最新技術突破「Deep Peak 2」模型,該技術全稱為「基於LSTM(Long Short-Term Memory,長短期記憶網絡)和CTC( Connectionist temporal classification,聯結主義時間分類器)的上下文無關音素組合建模」。

該技術與傳統的語音技術「上下文相關建模」的不同點在於,在「上下文相關建模」中,同一個音素,由於左右兩邊相連的音素不同,就會被定義成不同的建模單元,而在Deep Peak 2模型中,同一個音素,無論其左右兩邊的音素是否相同,都會被定義為唯一的建模單元。

得益於該項技術突破,建模單元減少10倍,同時路徑解碼部分的消耗降低10倍,解碼速度也提升10倍。

除此之外,因為該技術突破可以讓口語和正式語言結合用於深度學習訓練,使得新的語音識別模型可以識別多種語音內容,包括中英文混說、各種重口音混說的情況,現場全程使用的「實時語音識別上屏技術」也應用了最新的Deep Peak 2模型。

同時,主持人華少現場在一分鐘內進行了「426字」的快速語音播報,百度輸入法的語音識別幾乎和華少同時完成,識別內容也與華少現場所說的相差無幾。

二、兩大全新AI功能

百度輸入法負責人蔡玉婷稱,這次百度輸入法8.0版本在此前已有的AI功能上增加了「語音速記」和「AR表情」兩大全新AI功能。其中,「語音速記」功能中應用了「聲紋識別」技術,該技術針對2-3人的小型會議場景,可根據聲紋區分不同發言人的語音信息。

由於超過六成的百度輸入法用戶都會使用表情輸入,因此此次百度輸入法也推出了新的「AR表情」功能,該功能運用了人臉識別技術和AR技術,用戶可以通過相機或相冊進行人臉識別、製作表情包,還可以用自己的表情控制虛擬人物的形象。用戶製作出來的AR表情,可以直接通過輸入法搜索、語音輸入和鍵盤輸入時展示出來。

百度輸入法的工作人員也現場演示了該功能的玩法。

這次百度輸入法8.0的發布是對百度輸入法的進一步優化,通過AI技術突破強化了語音識別功能,AR技術的加入也呈現了輸入法的不同表達形式,增加了輸入內容的個性和娛樂性。

相關焦點

  • 百度輸入法8.0版本正式發布:主打AI語音速記/AR表情!
    驅動中國2018年1月17日消息 今天下午百度在北京達美會議中心正式推出了主打「百度AI輸入」的百度手機輸入法8.0版本,此次大版本更新重磅推出了語音速記和AR表情兩大功能。並首次在手機輸入法中展示了百度在AI語音識別、計算機視覺領域的硬功夫。
  • 1分鐘可以輸入400字?百度輸入法語音輸入再升級
    據我觀察,50歲以上的中老年人,手機輸入法用的基本上是手寫輸入法。效率非常慢,一分鐘頂多也就才寫十幾個字。 1分鐘,400字 五筆輸入法的極限速度是1分鐘150字,拼音輸入法則在1分鐘80字左右,這基本就是鍵盤輸入的極限了,手機上會更慢。 近段時間,百度再次完成蛻變,語音識別技術全面升級,重點加強了方言識別能力,打字效率幾乎高達1分鐘400字。
  • 百度發布國內首款AI輸入法 語音技術實現世界級突破
    【環球網科技 記者 林迪】1月16日,國內首款真正意義上的AI輸入法——百度輸入法AI探索版正式亮相百度輸入法「AI·新輸入 全感官輸入2.0」發布會。據悉,這是一款默認輸入方式為全語音輸入,並調動表情、肢體等進行全感官輸入的全新輸入產品。
  • 訊飛輸入法9.0發布,語音輸入免切換高識別賦能AI
    5月21日,科大訊飛召開新品發布會,發布了訊飛輸入法9.0。該輸入法採用自主研發的新一代語音識別模型,充分考慮使用場景和用戶體驗,將新技術最快、最好地運用到產品和服務中,基於A.I.升級驅動語音輸入再次進化,實現中英、普通話與方言以及離線與在線語音免切換輸入,與傳統拼音輸入相比打字效率提升300%,開啟語音輸入免切換時代。
  • 輸入法AI時代來臨,百度輸入法多重AI科技賦能,讓輸入更高效便利
    據調查數據顯示,九成用戶對AI功能表示肯定,能帶來交互效率升級,百度不斷創造全新輸入功能滿足用戶需求,讓交流更簡單高效,包括首發離線中英自由說,飄逸順滑的AI滑行,手寫自由寫,以及最新推出的AI助聊功能,成為更懂用戶表達的輸入法產品。
  • 第三方語音輸入法怎麼選?百度輸入法、搜狗、訊飛差距竟如此明顯...
    另外,隨著雲計算和AI人工智慧的發展,各家輸入法都推出了語音識別功能,該功能的推出將手機的輸入效率抬升到了一個全新的層次。相比傳統的拼音、手寫、筆畫等繁瑣的輸入方式,語音輸入操作更加簡單,輸入效率也大幅度的提高。
  • 全感官輸入2.0時代 百度輸入法AI探索版正式亮相
    1月16日,在百度輸入法「AI·新輸入 全感官輸入2.0」發布會上,國內首款真正意義上的AI輸入法——百度輸入法AI探索版正式亮相,這是一款默認輸入方式為全語音輸入,並調動表情、肢體等進行全感官輸入的全新輸入產品。
  • AI技術發威,百度輸入法日均語音輸入請求量超越搜狗
    看到輸入法日均語音請求3.35億次這個數據,我還是感覺到有些意外的。第一個是輸入法只是百度眾多應用的一款,不是百度App這樣的旗艦應用,會在發布財報時被李彥宏重點提及,讓人意外。7月,賽諾(SINO-MR)對外發布的《2018上半年中國手機輸入法分析報告》顯示,在手機輸入上,語音輸入正在越來越重要,拼音和手寫輸入法則有下滑趨勢,「得益於1分鐘輸入400字,提升用戶對語音輸入效率的感知,語音輸入佔比從去年下半年的38%提升至今年上半年的41%,使用佔比穩步提升。」
  • 語音輸入AI黑科技圈粉老中青少,百度輸入法開啟感官輸入新時代!
    尤其是去年,百度手機輸入法推出V9.0版本,主打皮膚新玩法。不管是愛豆美圖還是只是學習,都讓你在使用手機輸入的時候賞心悅目。今年推出的語音黑科技,更是在進一步,憑藉百度在語音和AI的深厚積蓄引領5G時代全感官輸入新體驗。
  • 一分鐘輸入500個字,百度輸入法V9.0強勢來襲
    手機輸入法已經成為我們日常不可或缺的APP,而目前國內比較出名的輸入有百度輸入法、搜狗輸入法以及訊飛輸入法等。其中搜狗輸入法以詞彙量多而出名,訊飛輸入法以語音識別準確而出名,而在V9.0版本之前的百度輸入法和其他兩個相比顯得不那麼出眾,但是自從更新到V9.0的YAN鍵盤後,我就徹底轉投百度輸入法陣營了。這次更新的V9.0版本是一個全新的版本,更新了非常多的內容,其中變化最大的地方我認為就是加入了YAN鍵盤和對語音輸入的優化提升。
  • 懂AI更懂你 百度輸入法突破世界級語音技術限制給輸入「加速」
    優秀的語音輸入,首要任務就是識別準確,在這方面百度輸入法相當有發言權。百度語音技術早在2019年年初便取得了一項對全球學術界和工業界都具備重大意義的突破——流式截斷的多層注意力建模(SMLTA),將在線語音識別精度提升了15%,超越行業最優競品15%,充分保證了用戶語音輸入的精準度與識別速度。其次,優秀的語音輸入還要照顧到不同用戶群體的需求。
  • 離在線語音輸入智能轉換無卡頓 用百度輸入法表達更順暢
    早在今年一月,百度輸入法AI探索版正式問世,發布會現場就測試了包含百度輸入法在內三款不同輸入法產品的「離線語音識別能力」。經過對輸入法上嵌入式識別的Deep Peak2模型進行優化,百度輸入法大幅提升了離線語音識別準確率。
  • 史上最強的語音輸入法誕生,百度是如何做到的?
    在昨天,百度輸入法「AI·新輸入 全感官輸入2.0」發布會上。百度輸入法正式對外發布了最新殺手鐧——AI探索版輸入法。這個輸入法基本上顛覆了外界的想像。作為百度眼中 AI 落地的「橋頭堡」,百度輸入法AI探索版默認將全語音作為默認輸入方式,並在豐富輸入方式上大開腦洞,圍繞表情、肢體等為用戶提供了全感官的輸入體驗。在發布會現場,臺上是嘉賓的演講,大屏幕的右側則是百度輸入法的實時同步,我注意到,即便是一些英文單詞,也能識別出來。
  • 能讀懂你心思的AI輸入法!百度輸入法新版體驗 - 太平洋電腦網
    也就是說,新版百度輸入法實現了用戶說個開頭百度輸入法就智能補足整句,字未打完句已出的黑科技功能。有了這個功能,用戶的輸入速度將大大的得到提升。圖8 淘寶對話裡的百度輸入法智能預測功能  圖9 京東對話裡的百度輸入法智能預測功能百度輸入法的「智能預測」功能支持多款購物APP、社交APP以及王者榮耀、絕地求生。在玩遊戲的時候,這個智能預測功能更是能幫玩家節約不少的時間,你也別忘了百度輸入法在遊戲時還有快捷短語功能。
  • 百度發布AI輸入法:語音識別精度提升15%支持凌空手寫
    【網易智能訊1月16日消息】今天,百度召開新品發布會,宣布百度輸入法AI探索版正式發布,這是一款默認輸入方式為全語音輸入,並調動表情、肢體等全感官輸入的產品。據了解,百度首先宣布了在語音技術方面取得的突破,流式截斷的多層注意力建模(SMLTA)已經將在線語音識別精度提升了15%,這一技術能夠解決傳統Attention模型在識別中的時延性,以及因此導致的無法進行大規模在線語音實時交互的問題。
  • 百度AI·輸入法,語音識別輕鬆自由說
    數據進一步顯示,使用最多的第三方手機輸入分別是搜狗,百度和訊飛,搜狗和百度不分上下,的用戶佔40%以上,而訊飛的用戶佔8.4%。在用戶越來越流行的語音輸入方面,百度輸入法在中國市場排名第一。那麼,為什麼百度輸入法能在眾多輸入法和中?中佔據語音輸入的第一市場份額呢?
  • 百度手機輸入法Android 5.1版—新增粵語語音輸入
    據了解,百度手機輸入法安卓5.1版在原5.0版簡約風格的基礎上更加專注輸入,帶來了語音、英文、手寫、聯想等基礎輸入的全面提升,追求最極致的用戶輸入體驗;而全新的默認皮膚,以及新上線的Android L風格皮膚,更為大家帶來了扁平視覺的全新體驗,不免讓人眼前一亮。
  • 百度輸入法:用完我把鍵盤都扔了!英語和方言都能識別的輸入法!
    輸入法是網上交流的一種最基礎也是最重要的交流工具,一款輸入法會讓用戶用起來得心應手才是優秀的輸入法。 百度輸入法的語音輸入輕鬆識別中英文混輸 為什麼百度輸入法能做到如此精確的離線中英文識別?
  • 百度語音識別上線新版本 長語音轉寫告別時間限制
    當語音輸入不再受時間的限制,用戶是否可以真正實現「動口不動手」?近日,百度AI開放平臺向開發者免費開放長語音識別功能,通過SDK調用服務,可將長語音轉換為文字。據了解,新版本SDK解除了對時間的限制,開發者無需再將長語音切割成60秒以內的分段,進行調用,提升了轉寫的效率和語音識別的體驗。
  • 離線中英混合語音識別準確率超98%!百度輸入法帶你體驗「有網沒網...
    這項基於中英文SMLTA模型的創新功能,讓用戶在弱網甚至無網絡環境中,依然可以順暢地進行中英文語音混輸,且識別準確率和有網絡時一樣優秀, 準確率超過98%。百度輸入法在此前推出的「在線中英自由說」功能基礎上,藉助AI技術賦能對語音輸入進行了又一次重大升級,大幅提升了用戶交互效率,全感官輸入2.0再迎重磅升級。