日均調用量超100億次 百度大腦正在用語音喚醒一個AI時代

2021-01-15 砍柴網

11月28日,百度大腦宣布語音能力引擎日均調用量已經超過100億次,應用規模業界第一,為開發者提供了覆蓋雲、端、芯的全棧全場景語音開放能力,推動智能語音技術在各行業落地應用。

在當天舉行的百度大腦語音能力引擎論壇上,百度大腦語音引擎全新發布和升級了14大產品內容,包括基於百度鴻鵠語音晶片的4款硬體模組、開發板及3大場景解決方案,升級了語音自訓練平臺、呼叫中心語音解決方案等。來自家電、農業、醫療等行業的合作夥伴代表也在現場分享了百度大腦語音技術賦能的成果。

(百度CTO王海峰博士致辭)

百度首席技術官王海峰博士出席論壇並致辭,他表示:「AI技術的進化和產業賦能正向循環,相互促進,AI在應用場景中不斷進化。百度的語音技術基於深度學習和產業應用加速突破,已應用到百度App,百度地圖、小度音箱,百度輸入法等百度產品,更通過AI開放平臺賦能眾多產業夥伴。百度大腦語音能力每天的調用量已經超過100億。」

現場,百度語音首席架構師賈磊正式提出基於複數CNN網絡的語音增強和語音識別一體化端到端建模技術,該方法拋棄了數位訊號處理學科和語音識別學科的各種先驗假設,消除學科間壁壘,直接端到端進行一體化建模。相較於傳統基於數位訊號處理的麥克陣列算法, 錯誤率降低超過30%。目前該方法已經被集成到百度最新發布的百度鴻鵠晶片中。

(百度語音首席架構師賈磊主題演講:百度大腦語音技術的前沿進展)

據悉,百度從2012年起就開始把深度學習用於中文語音搜索,成為全世界最早把深度學習技術落地工業化產品的企業之一。百度大腦目前已開放了雲、端、芯包含語音識別、語音合成等全棧語音引擎能力,並廣泛應用於金融、政務、文娛等多種行業和場景。百度AI技術生態部總經理喻友平表示,百度大腦語音能力引擎的應用規模已達到業界第一,同時一直在積極拓展語音能力引擎生態鏈的建設。

(百度AI技術生態部總經理喻友平介紹百度大腦語音引擎全棧開放能力)

針對智能硬體設備,百度大腦重磅發布基於百度鴻鵠語音晶片的4款硬體模組、開發板,以及智能家居、智能車載、智能IoT設備3大端到端軟硬一體遠場語音交互場景解決方案,具備交互效果優異、軟硬一體快速應用、廣泛兼容集成門檻低等優點。同時,在語音識別領域,全面升級短語音識別、實時語音識別能力,發布音頻文件轉寫能力,升級可零代碼提升業務術語識別率的語音自訓練平臺,以及呼叫中心語音解決方案;在語音合成方面,全新發布6個在線語音合成精品音庫和5個離線語音合成精品音庫。豐富的語音能力,助力智能硬體、網際網路、呼叫中心等領域智能化升級。

嘉賓分享第一排從左至右:創維、瓴嶽科技、北京子傑寶貝科技公司

第二排從左至右: 華智水稻、江西善行

論壇上,來自家居、金融、醫療、農業、公益等領域的合作夥伴,登臺分享與百度大腦合作的細節,以及如何以語音技術助力自身完成智能化升級。

創維AIoT研究院產品經理李凱介紹:「大屏IoT的行業痛點在於信息檢索難和設備控制操作複雜,通過增加語音交互能力,重構了整個AIoT設備生態的交互體驗。雙方在電視方面的合作成果已落地在10個電視晶片型號、2500萬臺電視上,助力中端及高端產品線提升了產品溢價能力。」在下一代遠場語音方案中,百度鴻鵠語音晶片為創維產品帶來了高性價比硬體、整合優化的軟體算法等價值,雙方將基於百度鴻鵠晶片展開多項產品的合作。

瓴嶽科技信貸運營總監宋力現場分享了百度大腦語音技術在貸後領域的應用,依託百度大腦呼叫中心實時語音識別等AI服務對用戶語音的準確識別,瓴嶽打造了降本提效的智慧機器人。通過貸後智慧機器人、智能語音質檢的應用,貸後人力投入降低61.47%,有效實現了合規和高效的運營體系,提高了客戶體驗。

北京子傑寶貝科技有限公司項目經理肖雲峰在會上展現了語音技術在醫療領域的應用:「我們開發的智能錄入系統在百度大腦語音自訓練平臺進行語音識別模型訓練,識別率從80%提升至95%以上,包括醫療專業生僻詞的識別,而很多廠商模型識別率都達不到這個要求。該系統有效降低了醫護人員的工作強度,提升了臨床護理效率。」

而在農業領域,也遇到了農業作物專業詞彙語音識別率低的行業問題,對此華智生物信息技術主任龍曉波表示:「得益於百度大腦語音自訓練平臺使用簡單、準確率高、可拓展等優點,經多次迭代我們的農業結構化性狀數據語音識別準確率從71.09%提升至98.75%,採集一個測試田地性狀信息從300人工時降低到160人工時,工作效率提升了一倍。」

善行智能聯合創始人黃小瑰介紹了基於百度大腦語音等技術打造的小Q智能導盲眼鏡,幫助盲人生活出行,為失能人群提供智能化的幫助。現場還發布了「因AI而聲」公益計劃:百度大腦將為提供公益性服務的公司或組織,提供語音技術免費、專屬語音技術支持等福利,為特殊群體帶去便利和幫助,讓AI有溫度。

(百度大腦語音能力引擎論壇現場)

百度大腦開放平臺是國內服務規模最大的AI開放平臺,目前已開放228項AI能力,擁有超過150萬的開發者用戶。與會人士認為,此次百度大腦語音技術能力的全新發布和升級,為開發者和企業提供了更加完善的全棧語音引擎能力,將幫助更多用戶高效打造具備語音交互能力的特色應用與產品,加快語音技術在各行各業的應用落地進程。

相關焦點

  • 百度世界2020大會硬核來襲!百度智能語音交互技術重磅迭代
    在當天的百度大腦分論壇上,百度語音首席架構師賈磊重點講解了百度端到端語音交互技術。他表示,百度語音交互技術持續迭代升級,已發展成為基於深度學習技術的端到端的語音識別和語音合成技術。在語音識別層面,百度推出端到端信號聲學一體化建模的技術,語音合成方面,最新的Meitron和單人千面合成個性化技術亮相。同時交出了百度語音技術最新成績單:日均調用量超過155億次,廣泛應用在移動端、智能家居、和語音IoT等場景,智能語音產業化成果豐碩。
  • 自研晶片+自主AI框架,百度CTO王海峰攜百度大腦6.0亮相
    那麼,到了第十個年頭,百度大腦成功升級6.0後又帶來了哪些新變化?過去一年,百度大腦又在AI計算架構、算法、能力上做出了創新和重要升級,已經成為智能時代的「AI新型基礎設施」。如果說,百度大腦的第一個十年是完成了能力進化和體系構建,那麼下一個十年,百度大腦的目標就是將最先進的AI技術落地化。
  • AI晶片、框架、語言與知識、量子計算……百度大腦6.0發布
    吳甜披露最新數據,百度大腦已經開放了273項AI能力,凝聚超過230萬開發者,創建超過31萬模型,並培養了超過100萬AI人才,有力推動了中國AI技術研發、實踐應用與生態建設。未來英特爾也將繼續與百度合作,在硬體層面為飛槳提供更多的優化與特性。此外,核心AI算法也迎來全面升級。百度語音技術迭代,語音識別層面,提出端到端的信號聲學一體化建模技術,可解決傳統數位訊號處理和語音識別級聯繫統耦合嚴重、迭代困難問題;語音合成方面,實現了個性化TTS、多角色合成、單人千面等能力。百度語音首席架構師賈磊公布,百度智能語音日均調用量超過155億。
  • 91Reading接入百度大腦語音技術,朗讀功能使用量已超越閱讀
    K12英文原版閱讀產品91Reading在接入百度大腦語音技術後,實現了「閱+讀」一體化的語言學習模式,為這一問題提供了「科技範」十足的答案。)在看過百度大腦語音技術的技術文檔並諮詢客服後,91Reading在一天內就完成了集成與調試工作。
  • 百度地圖伴留學生開啟美好2020 定製語音包緩解「每逢佳節倍思親」
    百度,用聲音傳遞兒女的陪伴:一向以「國內活地圖」自詡的父親到國外看望留學的女兒差點走丟,急脾氣的女兒「數落」了父親後回到房間,卻發現父親在地圖上做出的充滿愛的標記。不善表達的女兒用百度地圖錄製了語音包並在父親回國時分享給了父親。作為「國內活地圖」的父親收到女兒的語音包,即使回家也要用百度地圖導航,一路聽著女兒的聲音,仿佛女兒真實的陪在身邊。
  • 從語音、視覺、語義到算法,百度大腦 5.0 全方位升級
    對於落地應用正在端側呈現出巨大需求,百度大腦語音團隊研發出一款針對遠場語音交互打造的晶片——百度鴻鵠晶片。該晶片採用雙核HiFi4架構,2.8M大內存,臺積電40nm工藝,在此硬體規格上,100mw左右平均工作功耗,即可支持遠場語音交互核心的陣列信號處理和語音喚醒能力。同時,按照車規級標準打造的鴻鵠晶片,可為車載語音交互,以及智能家居等場景帶來更大想像力。鴻鵠晶片流片的同時,即實現了量產。
  • 再獲頂級諮詢機構認可 沙利文報告評百度AI實力全球第四 中國第一
    人工智慧發展60餘年,全球格局日漸清晰,在各國政策的支持引導和大型AI廠商的主導下,人工智慧正在進一步釋放能量。比如在語音領域,百度提出基於複數CNN網絡的新技術,遠場語音識別錯誤率降低30%;流式多級截斷注意力模型SMLTA全球首創,語音識別準確率早在2016年就已達97%;計算機視覺領域,百度奪得VOT 2019單目標短時跟蹤國際競賽、ICME人臉106關鍵點檢測比賽等多項世界頂級賽事冠軍,刷新史丹福大學DAWNBench四項世界紀錄,早在2018年就已將人臉識別準確率提升至99.77%;自然語言處理領域
  • 人工智慧時代的家庭影院百度再發AI新物種小度電視伴侶
    作為AI領域的新物種,小度電視伴侶定位於「人工智慧時代的家庭影院」,憑藉出眾的音質與視頻播放能力,全語音遠場交互能力以及全面接入的小度人工智慧助手,讓你徹底擺脫遙控器;而小度在家系列智能視頻音箱再推新品——小度在家1S,它擁有全新外觀設計與硬體配置,升級了頗受好評的兒童模式,並在內容資源上獲得進一步擴展。
  • 一文回顧百度人工智慧2020上半年,王海峰:百度AI助力新基建提速
    為促進疫後消費提振、激發市場活力,百度地圖與上海市消保委共建「2020體驗上海」活動,用AI開拓消費體驗場景的新「種草」方式。百度地圖遷徙大數據平臺和全國實時路況平臺,自上線以來已累計提供超25億次服務。截至2月24日,百度地圖「疫情小區」專題地圖累計查詢次數近1億次。
  • 日均調用13億次 實時翻譯直播將參與今年雙11
    央廣網杭州10月24日消息(記者張國亮) 「日均調用量超過13億次,累計3000億單詞,可提供214種語言的高質量翻譯!」在阿里達摩院創下多項業界第一AI翻譯技術的支持下,近日,全球首個實時翻譯直播上線,將全面參與今年的天貓雙11全球購物狂歡節。最重要的是:不會外語也能向全球直播!
  • 百度大腦遠場語音開發套件評測—快速上手,超讚語音交互體驗
    我也是大概在18年末開始接觸到百度AI社區,通過使用文字識別、圖像識別等百度AI技術,逐步感受到了AI技術的強大,同時也感覺到了百度AI技術的進步:AI技術領域範圍越來越廣泛,識別速度越來越快,識別準確度越來越高。這次,有幸收到百度遠場語音開發套件的測評邀請,作為一個非測試專業人員,這裡我就自己的百度遠場語音開發套件使用過程及在使用過程中遇到的問題和大家分享一下,如有錯誤,請多多指教。
  • 百度大腦AI加持語言教育,智能語音糾正口語發音、指導朗讀背誦
    因此,對於銀月網絡來說,能發揮其「沉浸式遊戲」的手段讓用戶在一個真實場景中練習口語,成為開發此款軟體的目的。而為實現在英語互動中,更準確的識別用戶所講,銀月網絡接入了百度大腦語音識別和語音合成技術,讓識別準確率提升至97%,大大提高了人與設備對話的體驗,這也讓用戶在英語口語練習上更科學,更準確,更專業。
  • 王海峰:百度翻譯日翻譯量達千億次,百度語音交流量超150億次
    新京報貝殼財經訊(記者 張思源)9月18日,中關村論壇在京召開,在AI開源創新與產業智能化論壇分論壇上,百度首席技術官、深度學習技術及應用國家工程實驗室主任王海峰介紹,早在2012年,百度即開放了31%的API全社會共享,非常多的來自各方公司、企事業單位等的開發者調用百度翻譯的API
  • 2019百度AI開發者大會前夕,解讀百度大腦的半年「豹變」
    可以看到,百度大腦的AI開放生態不僅開放,而且已經通過不斷進階實現了體系化,做出來、賣出去、做得大三步走構成了一個AI賦能產業的系統生態,成為AI落地中國的最好生態,眾多的中國AI創新企業正在從無到有、從小到大、獲得成功。
  • Yes AI Do! 百度從AI技術領先向應用領先強勢進化 | 2018百度世界...
    目前,非自動駕駛車輛除了安全以外,還面臨著交通堵塞這一嚴重問題。比如百度辦公樓臨近的著名的「後廠村路」,3.1公裡騎車15分鐘,開車1.5小時。堵車給城市投下了巨大的發展陰影,北京每年因為交通擁堵損失1500億人民幣。李彥宏談到,作為智能城市,不僅要有自動駕駛,還要有智能交通,它是一個非常綜合的大型工程。
  • 百度大腦產品上新&技術升級:圖像處理、智能寫作平臺、語音識別
    百度大腦一月一次的最新技術&產品盤點來了。在這裡,與百度大腦一起成長,見證 AI 的力量。您可以從 PC 端訪問百度 AI 開放平臺(ai.baidu.com)申請邀測,或使用最新產品。新開放 AI 技術能力語音識別語音識別極速版支持60秒內音頻使用 REST API 方式進行調用,簡單易用。
  • 尼爾森AI助手報告出爐,如何用語音喚醒下一個商業時代?
    視頻裡這位「孟同學」家中有五臺不同品牌的智能音箱,當他說「屋裡太黑了,想要開燈」時,五個音箱間進行了一番精彩的對話—— A叫B打開燈帶,B推諉C:「快去開燈」,C說:「D,你去你去」,而D的反應卻是喚醒E。最終,還是E抗下了所有,為主人打開了燈。該視頻獲得了80萬+的點讚,網友評論打趣道「最怕智能音箱嘮嗑」、「太感情用事了」。
  • 百度地圖智能化蛻變:AI技術如何讓導航更加準確、易用?
    在疫情最嚴重的時期,百度地圖還相繼上線了「發熱門診地圖」、「疫情小區」專題地圖等實用功能服務,相信不少人都體驗過。根據百度地圖的官方統計,其遷徙大數據平臺和全國實時路況平臺自上線以來訪問量已超 30 億次,這些功能為疫情防控提供了重要的數據參考。 魔幻的 2020 年即將結束。
  • AI生活化,「小度小度」喚醒百度地圖機器之心
    但實際上,人工智慧已經成為人們可觸摸、正在用的實用科技,比如我們前面提到的百度地圖就是最有力的證明之一。這是一款與人們生活息息相關的產品,駕車導航、出門找路、打車坐公交、景區遊覽甚至管理個人行程計劃,隨時隨地都有可能需要調用百度地圖來引導方向。由於地圖類應用早在PC時代就已存在於人們身邊,十幾年的陪伴反而令人們忽略了地圖不斷成長的價值。
  • 百度AI的2020
    其中,市場份額與月活躍用戶量增勢迅猛,目前月活突破6億;多項 AI 功能取得重大行業突破,其中語音輸入能力持續突破,並成為業內首個日均語音請求量破10億次大關的輸入法產品,語音識別準確率達98.6%,同時實現離線中英自由說升級突破,百度輸入法目前已成為語音輸入滲透率最高的第三方手機輸入法;手寫輸入持續升級,手寫識別準確率提升至96%,用戶認可程度高;發布 AI 助聊功能,基於百度強大的自然語言處理和知識圖譜技術