中文在線語音識別技術獲重大突破!百度輸入法準確率超行業最高水平...

2021-01-06 ITBear科技資訊

  當輸入告別鍵盤,語音、表情、動作都成為輸入方式,會是一種怎樣的神奇體驗?

  1月16日,在百度輸入法「AI·新輸入 全感官輸入2.0」發布會上,國內首款真正意義上的AI輸入法——百度輸入法AI探索版正式亮相,這是一款默認輸入方式為全語音輸入,並調動表情、肢體等進行全感官輸入的全新輸入產品。同時,百度宣布語音技術取得一項對全球學術界和工業界都具備重大意義的技術突破,流式截斷的多層注意力建模(SMLTA)將在線語音識別精度提升了15%,並在世界範圍內首次實現了基於Attention技術的在線語音識別服務大規模上線應用。

  發布會現場,百度高級副總裁王海峰表示,輸入法是離用戶最近的產品之一,也是AI落地的「橋頭堡」,百度全方位的AI能力正在不斷賦能輸入法,讓輸入法更「聰明」。他也給出了輸入法行業的「未來畫像」,他認為,雖然目前的輸入法產品主要應用於手機端,但未來的輸入法將應用於各種智能設備與用戶的交互,並走向世界,為全球用戶提供更多元的輸入方式。

(百度高級副總裁王海峰)

  據介紹,截至2018年底,百度輸入法月活躍人數已達5億,語音日請求量峰值突破5.5億,AR表情使用次數超過1億。同時,百度海外輸入法全球安裝量超過1億,支持120種語言,覆蓋全球190個國家地區,並已與超過100個全球知名IP達成合作,實現技術與市場的雙豐收。

  SMLTA語音識別精度全球領先 語音技術創新帶動交互變革

  百度輸入法AI探索版是百度AI落地應用的又一重要成果,全語音交互是它最大的特點之一。「雖然當前輸入法主流是鍵盤輸入,但對用戶需求變化的洞察,讓我們有信心較早地推出這款全語音交互的產品」,百度中文輸入法負責人蔡玉婷表示,相較2016年,百度輸入法日均語音請求量增長了8倍,語音輸入法的場景也從聊天和搜索拓展到遊戲、娛樂、購物等眾多場景。

(百度中文輸入法負責人蔡玉婷)

  全語音交互對於語音識別準確率要求極高,百度推出全語音交互輸入法的信心,還來自於百度領先業界的語音技術。現場,百度語音技術部負責人高亮宣布了百度語音輸入的四項重大突破和給輸入法用戶帶來的體驗提升。

  在線語音領域,百度發布流式截斷多層注意力建模(SMLTA),這是中文在線語音識別歷史上的兩個重大突破:世界上首次實現了局部注意力建模識別精度超過全局注意力模型;世界上第一次大規模部署在線語音交互注意力模型。這一技術能夠解決傳統Attention模型在識別中的時延性,以及因此導致的無法進行大規模在線語音實時交互的問題,並將在線語音識別精度提升了15%,超越行業最高水平15%。

(百度語音技術部負責人高亮)

  離線語音識別領域,為解決用戶多元輸入場景的需求,百度持續優化Deep Peak 2系統,讓離線語音輸入相對準確率再次提升,高於行業平均水平35%。即使用戶處於地鐵、電梯、隧道或人流密集等離線場景中,依然可以藉助百度輸入法進行精準的語音輸入。

  中英文混合語音輸入技術,以及方言與方言、方言與普通話的混合語音輸入技術突破,讓用戶真正實現「自由說」,無論是中英文夾雜,還是普通話家鄉話來回切換,百度輸入法都能準確識別。據介紹,百度輸入法是目前唯一實現了高精度「中英自由說」和「方言自由說」的輸入法產品。

(發布會主持人張紹剛體驗百度輸入法「方言自由說」)

  百度語音技術的突破同樣讓海外用戶帶來語音輸入的便捷體驗。本次發布會上,百度海外輸入法展示了日語識別、印地語識別和印英混輸功能,據第三方評測顯示,百度日文輸入法的語音識別精度位列行業第一,識別結果用戶可接受度佔比高達 90%,已成為日本最大的第三方輸入法產品;印度用戶語音功能的使用率已達21%,百度輸入法幫助印度用戶實現了自由溝通。

(百度海外輸入法負責人姜鋒)

  表情、動作成為輸入新方式 全感官交互創造更多想像空間

  伴隨著百度語音、視覺、自然語言處理、知識圖譜等百度AI技術落地輸入法,「全感官」的輸入變成現實。除了語音輸入,百度輸入法AI探索版還推出了拍立活、秀場、凌空手寫等新功能玩法。無論是心愛的偶像,還是日夜陪伴的寵物,「拍立活」功能都可以讓用戶通過自己的動作「驅動」對方做出相同表情;「秀場」功能運用圖像分割技術,讓用戶「穿越」到不同的虛擬場景之中,科技、清新、賽博朋克多種風格隨意挑選,表情創作更具場景感、更加生活化;凌空手寫如同隔空打怪,在空中書寫也能被流暢識別,目前整體識別率已達到大規模應用的要求。

(網絡紅人小吳現場體驗百度輸入法AR表情)

  百度輸入法全感官交互潮流也已進入海外並獲得認可。據悉,藉助AI技術的加持,百度海外輸入法已經在全球建立起最活躍、最權威的表情社區。超級IP《變形金剛》系列首部獨立電影《大黃蜂》已與百度海外輸入法聯手推出「大黃蜂」系列主題貼圖和AR表情。截止目前,百度海外輸入法已經和Hello Kitty、小黃鴨、小王子、格林奇等全球100餘個知名IP達成合作,推出了一系列深受用戶喜愛的IP皮膚和表情,同時深耕本地化運營,針對海外用戶還設計了本地網紅合作推廣等定製化傳播。2018年,百度海外輸入法的推廣視頻,總觀看次數已超過1億。

  輸入法本質上是一款人機互動的工具,AI時代正在到來,人機互動的形態也將隨之革新。「未來,百度輸入法將不僅基於手機端,還將致力於連通包括智能家居、車聯網等多種終端場景,集多種輸入方式為一體,幫助用戶在各種場景下高效、自如地傳遞信息。」 百度高級副總裁王海峰表示。

特別提醒:本網內容轉載自其他媒體,目的在於傳遞更多信息,並不代表本網贊同其觀點。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,並請自行核實相關內容。本站不承擔此類作品侵權行為的直接責任及連帶責任。如若本網有任何內容侵犯您的權益,請及時聯繫我們,本站將會在24小時內處理完畢。

相關焦點

  • 超越行業最高水平15%,語音識別精度百度輸入法更勝一籌
    據艾媒諮詢發布的《2019上半年中國第三方手機輸入法專題研究報告》(以下簡稱《報告》)顯示,百度輸入法憑藉融合強大AI技術的語音輸入能力,在準確度與體驗感兩個維度都獲得了最高評分,實力「霸榜」。百度輸入法不僅擁有高水準的離線語音識別能力,在線語音識別方面也保持不斷進步,離線、在線語音識別能力均處於行業首列。
  • 語音識別準確率行業第一,中英、方言混輸百度輸入法都沒在怕的!
    這時候就該「動口不凍手」的語音輸入來「大展拳腳」了,打開百度輸入法語音輸入,分分鐘就能幫你搞定各種輸入需求。最近,艾媒諮詢發布《中國第三方手機輸入法市場年度專題研究報告》(以下簡稱《報告》),指出了百度輸入法2019年在語音輸入領域的重大突破。
  • 語音日均請求量超10億次,準確率滿意度雙一流,百度輸入法開年持續...
    在AI技術加持下,百度輸入法在語音輸入方面重點突破,用戶體驗滿意度領跑行業,如此便捷、高效、準確的輸入方式也成為特殊時期人們的溝通首選。  隨著全面雲復工、雲複課的到來,線上溝通需求指數級增加,比打字速度更快還不用動手的語音輸入優勢凸顯,擁有在線語音識別、離線語音識別、中英自由說、方言自由說四大突破的百度輸入法備受用戶青睞。
  • 語音輸入超能打!艾媒報告顯示百度輸入法語音輸入準確率、滿意度第一
    這時候就該「動口不凍手」的語音輸入來「大展拳腳」了,打開百度輸入法語音輸入,分分鐘就能幫你搞定各種輸入需求。最近,艾媒諮詢發布《中國第三方手機輸入法市場年度專題研究報告》(以下簡稱《報告》),指出了百度輸入法2019年在語音輸入領域的重大突破。
  • 百度AI開發者大會輸入法現場大飆Rap!高難度中英文混合語音識別...
    在7月3日「Baidu Create2019」百度AI開發者大會現場,百度首席技術官王海峰在演講中表示,「百度研發了流式多級的截斷注意力模型(SMLTA),使語音識別的準確率大幅提升並保持了非常高的速度,這是首個基於流式注意力的語音識別線上服務,百度輸入法語音識別的準確率因此相對提升15%以上」。
  • 日均語音請求量突破10億次,百度輸入法讓交流更便捷
    ,目前百度輸入法日均語音請求量已經突破了10億次,取得了不俗的成績。開啟語音個性化功能後,輸入法還可以對聯繫人識別準確率進行自動優化,而且在使用過程中還會智能學習語音修改習慣,讓語音輸入越用越便捷,形成自己的專屬風格,實現千人千面的定製體驗。
  • 百度輸入法日均語音請求量破10億次,對輸入法行業意味著什麼?
    而這也使得語音識別涉及了諸如信號處理、模式識別、概率論和資訊理論、發聲機理和聽覺機理、人工智慧乃至人的體態語言等多領域。顯然這也將大大考驗輸入法廠商的技術能力。在此,百度輸入法語音輸入能在準確率、用戶滿意度上均獲行業第一,與百度世界領先的語音技術帶來的技術支撐自是密不可分。事實上百度輸入法凝聚了百度深耕多年的語音、圖像、NLP和知識圖譜等AI能力。
  • 佔內存更小精度更高 百度輸入法離在線語音輸入穩居行業第一
    早在今年一月,百度輸入法AI探索版正式問世,發布會現場就測試了包含百度輸入法在內三款不同輸入法產品的「離線語音識別能力」。經過對輸入法上嵌入式識別的Deep Peak2模型進行優化,百度輸入法大幅提升了離線語音識別準確率。
  • 百度輸入法語音輸入業內最強:支持多語種混輸,沒網也能超精準
    根據艾媒數據中心最新發布的《艾媒2020中國第三方手機輸入法市場疫期專題報告》顯示:疫情期間,百度、搜狗、訊飛三大主流手機輸入法用戶語音輸入頻率明顯增加,其中百度輸入法以11.3次/日位居第一,使用頻率最高;並且百度輸入法的日均語音請求量也是三者中最高的,達到10億次,這也預示著百度輸入法的語音輸入是當前大眾的最愛。那麼百度輸入法的語音輸入為何能圈粉眾多呢?
  • 艾媒2018年度手機輸入法報告出爐:百度輸入法是語音識別最準的輸入法
    《報告》顯示,在AI技術加速手機輸入法變革的當下,百度輸入法作為「AI輸入」領域的佼佼者,在語音輸入及多項創新功能上具有領先優勢,同時也獲得了用戶及業界夥伴的廣泛認可,百度輸入法的「語音輸入」正在AI時代改變著人們的交互模式。百度輸入法語音輸入「雙冠軍」:語音輸入用戶量第一,語音識別準確率第一語音輸入是目前用戶相對最熟悉的、應用了AI技術的輸入功能之一。
  • 百度:語音識別技術超谷歌蘋果 準確率高10%
    [摘要]百度員工發表學術論文稱,在語音識別準確率上獲得突破,比蘋果高出10%。此次發布的語音識別技術,也讓人們有機會了解百度的人工智慧研究現狀。百度共有十個人的語音識別研究小組(負責人為Awni Hannun)在美國康奈爾大學圖書館的網站arXiv.org上,發表了一篇有關語音識別研究的論文,百度自稱取得了重大進展。吳恩達稱,按照客觀的衡量正確率的標準,百度的語音識別技術已經超過了谷歌和蘋果的技術。
  • 百度AI輸入法,所想即所得
    百度AI輸入法,全新版本(v9.3.5)上線! 離線中英自由說、流光鍵盤、遊戲鍵盤……集超多炫酷功能於一身,這究竟是款什麼神仙輸入法?下面一起來看看都有哪些新玩法。百度輸入法的離線中英文語音識別系統,針對性地採用中英文混合建模技術,提出基於低幀率、低比特的中英文SMLTA模型,其中採用神經網絡語言模型替換傳統的N元語言模型,大大減少了離線識別模型的體積。與此同時,基於SMLTA的離線中英文語音識別系統還是首個基於Attention的端到端離線語音識別模型的產品部署,大幅提升了離線中英文語音識別系統的性能。
  • 百度輸入法兩個第一,率先支持多國語音互譯
    SMLTA是基於Attention技術的在線語音識別服務,百度輸入法做到了大規模上線,這在全球範圍內尚屬首次。對百度輸入法而言,這遠遠不夠,百度還把SMLTA技術應用於離線狀態。這個小改動,徹底解決了一大痛點。
  • 百度輸入法語音輸入,更便捷的輸入方式
    其中百度輸入法用戶所佔比例已超過40%,在用戶越來越喜歡的語音輸入方面,百度輸入法則以2.29億的用戶數量在中國市場的輸入法中排名第一。經過幾年的發展和努力,百度輸入法語音輸入市場已經成熟,速度已大大超過手寫輸入法,成為未來最主流、最有潛力的人機互動方式。百度輸入法也一直致力於語音輸入法的推廣和普及,並在產品升級中考慮到用戶的實際使用場景和體驗,將最新的技術應用到產品中。
  • 百度輸入法:用完我把鍵盤都扔了!英語和方言都能識別的輸入法!
    之前很多人比較排斥語音輸入,最大的原因就在於語音識別的正確率太低,一旦出錯還得修改,相當浪費時間,體驗較差。但是現在不一樣了,利用百度AI的實力,語音識別率不再有任何問題,輕鬆應對日常語音輸入,對於中英文混輸也有準確率較高的支持。
  • 百度輸入法:用完我把鍵盤都扔了!英語和方言都能識別的輸入法
    之前很多人比較排斥語音輸入,最大的原因就在於語音識別的正確率太低,一旦出錯還得修改,相當浪費時間,體驗較差。但是現在不一樣了,利用百度AI的實力,語音識別率不再有任何問題,輕鬆應對日常語音輸入,對於中英文混輸也有準確率較高的支持。
  • 網課記筆記手忙腳亂 別慌,百度輸入法語音轉文字重點內容全Get
    對此,有的同學便想起了百度輸入法的語音輸入功能,開始用「長文本語音」和「語音速記」輔助記筆記,更輕鬆地記錄網課中的滿滿乾貨。百度在智能語音領域有著全面的技術布局,在語音識別技術上更是深耕多年。近日,百度輸入法公布,自1月25日春節假期以來,百度輸入法日均語音請求量已破10億次大關,再創行業歷史新高。
  • 中文語音合成最高水平,百度語音技術打造全球首款地圖語音定製產品
    這是國際上第一個實現了語音識別領域注意力模型的大規模工業在線產品落地。SMLTA實現從語音的聲音信號到輸出文字的直接映射,使得句子的整句識別率、方言的識別以及中英文混合的識別率顯著提升,從而也讓端側的語音識別成為可能。目前,SMLTA語音模型已在百度輸入法和小度智能音箱兩款產品上線,使得識別準確率分別提升15%和20%。
  • 百度輸入法重磅升級流光鍵盤和離線語音輸入
    百度輸入法的離線中英文語音識別系統,針對性地採用中英文混合建模技術與此同時,基於SMLTA的離線中英文語音識別系統還是首個基於Attention的端到端離線語音識別模型的產品部署,大幅提升了離線中英文語音識別系統的性能。比如離線狀態下,按著語音鍵說出:「what's your name?」,「8月25日,北京天氣怎麼樣?」輸入法均可很快識別,而且識別率也比較高,尤其是英文離線語音輸入,還能練習英語口語,對學英語的朋友來說,非常好用。
  • 日均語音請求量突破10億次,百度輸入法的又一個起點
    百度去年發布的流式截斷多層注意力建模(SMLTA),則實現了中文在線語音識別的兩大突破:世界上首次實現了局部注意力建模識別精度超過全局注意力模型;世界上第一次大規模部署在線語音交互注意力模型。也正是憑藉著這一技術,百度解決了傳統Attention模型在識別中的時延性,以及因此導致的無法進行大規模在線語音實時交互的問題,將百度輸入法在線語音識別精度提升了15%,超越行業最高水平15%。同時在離線語音識別方面,即使用戶處於地鐵、電梯、隧道或者人流密集等離線場景中,百度輸入法依然可以提供準確率超過98%的語音輸入服務。