日均調用量超100億次 百度大腦正在用語音喚醒一個AI時代

2021-01-09 砍柴網

11月28日,百度大腦宣布語音能力引擎日均調用量已經超過100億次,應用規模業界第一,為開發者提供了覆蓋雲、端、芯的全棧全場景語音開放能力,推動智能語音技術在各行業落地應用。

在當天舉行的百度大腦語音能力引擎論壇上,百度大腦語音引擎全新發布和升級了14大產品內容,包括基於百度鴻鵠語音晶片的4款硬體模組、開發板及3大場景解決方案,升級了語音自訓練平臺、呼叫中心語音解決方案等。來自家電、農業、醫療等行業的合作夥伴代表也在現場分享了百度大腦語音技術賦能的成果。

(百度CTO王海峰博士致辭)

百度首席技術官王海峰博士出席論壇並致辭,他表示:「AI技術的進化和產業賦能正向循環,相互促進,AI在應用場景中不斷進化。百度的語音技術基於深度學習和產業應用加速突破,已應用到百度App,百度地圖、小度音箱,百度輸入法等百度產品,更通過AI開放平臺賦能眾多產業夥伴。百度大腦語音能力每天的調用量已經超過100億。」

現場,百度語音首席架構師賈磊正式提出基於複數CNN網絡的語音增強和語音識別一體化端到端建模技術,該方法拋棄了數位訊號處理學科和語音識別學科的各種先驗假設,消除學科間壁壘,直接端到端進行一體化建模。相較於傳統基於數位訊號處理的麥克陣列算法, 錯誤率降低超過30%。目前該方法已經被集成到百度最新發布的百度鴻鵠晶片中。

(百度語音首席架構師賈磊主題演講:百度大腦語音技術的前沿進展)

據悉,百度從2012年起就開始把深度學習用於中文語音搜索,成為全世界最早把深度學習技術落地工業化產品的企業之一。百度大腦目前已開放了雲、端、芯包含語音識別、語音合成等全棧語音引擎能力,並廣泛應用於金融、政務、文娛等多種行業和場景。百度AI技術生態部總經理喻友平表示,百度大腦語音能力引擎的應用規模已達到業界第一,同時一直在積極拓展語音能力引擎生態鏈的建設。

(百度AI技術生態部總經理喻友平介紹百度大腦語音引擎全棧開放能力)

針對智能硬體設備,百度大腦重磅發布基於百度鴻鵠語音晶片的4款硬體模組、開發板,以及智能家居、智能車載、智能IoT設備3大端到端軟硬一體遠場語音交互場景解決方案,具備交互效果優異、軟硬一體快速應用、廣泛兼容集成門檻低等優點。同時,在語音識別領域,全面升級短語音識別、實時語音識別能力,發布音頻文件轉寫能力,升級可零代碼提升業務術語識別率的語音自訓練平臺,以及呼叫中心語音解決方案;在語音合成方面,全新發布6個在線語音合成精品音庫和5個離線語音合成精品音庫。豐富的語音能力,助力智能硬體、網際網路、呼叫中心等領域智能化升級。

嘉賓分享第一排從左至右:創維、瓴嶽科技、北京子傑寶貝科技公司

第二排從左至右: 華智水稻、江西善行

論壇上,來自家居、金融、醫療、農業、公益等領域的合作夥伴,登臺分享與百度大腦合作的細節,以及如何以語音技術助力自身完成智能化升級。

創維AIoT研究院產品經理李凱介紹:「大屏IoT的行業痛點在於信息檢索難和設備控制操作複雜,通過增加語音交互能力,重構了整個AIoT設備生態的交互體驗。雙方在電視方面的合作成果已落地在10個電視晶片型號、2500萬臺電視上,助力中端及高端產品線提升了產品溢價能力。」在下一代遠場語音方案中,百度鴻鵠語音晶片為創維產品帶來了高性價比硬體、整合優化的軟體算法等價值,雙方將基於百度鴻鵠晶片展開多項產品的合作。

瓴嶽科技信貸運營總監宋力現場分享了百度大腦語音技術在貸後領域的應用,依託百度大腦呼叫中心實時語音識別等AI服務對用戶語音的準確識別,瓴嶽打造了降本提效的智慧機器人。通過貸後智慧機器人、智能語音質檢的應用,貸後人力投入降低61.47%,有效實現了合規和高效的運營體系,提高了客戶體驗。

北京子傑寶貝科技有限公司項目經理肖雲峰在會上展現了語音技術在醫療領域的應用:「我們開發的智能錄入系統在百度大腦語音自訓練平臺進行語音識別模型訓練,識別率從80%提升至95%以上,包括醫療專業生僻詞的識別,而很多廠商模型識別率都達不到這個要求。該系統有效降低了醫護人員的工作強度,提升了臨床護理效率。」

而在農業領域,也遇到了農業作物專業詞彙語音識別率低的行業問題,對此華智生物信息技術主任龍曉波表示:「得益於百度大腦語音自訓練平臺使用簡單、準確率高、可拓展等優點,經多次迭代我們的農業結構化性狀數據語音識別準確率從71.09%提升至98.75%,採集一個測試田地性狀信息從300人工時降低到160人工時,工作效率提升了一倍。」

善行智能聯合創始人黃小瑰介紹了基於百度大腦語音等技術打造的小Q智能導盲眼鏡,幫助盲人生活出行,為失能人群提供智能化的幫助。現場還發布了「因AI而聲」公益計劃:百度大腦將為提供公益性服務的公司或組織,提供語音技術免費、專屬語音技術支持等福利,為特殊群體帶去便利和幫助,讓AI有溫度。

(百度大腦語音能力引擎論壇現場)

百度大腦開放平臺是國內服務規模最大的AI開放平臺,目前已開放228項AI能力,擁有超過150萬的開發者用戶。與會人士認為,此次百度大腦語音技術能力的全新發布和升級,為開發者和企業提供了更加完善的全棧語音引擎能力,將幫助更多用戶高效打造具備語音交互能力的特色應用與產品,加快語音技術在各行各業的應用落地進程。

相關焦點

  • 91Reading接入百度大腦語音技術,朗讀功能使用量已超越閱讀
    K12英文原版閱讀產品91Reading在接入百度大腦語音技術後,實現了「閱+讀」一體化的語言學習模式,為這一問題提供了「科技範」十足的答案。)在看過百度大腦語音技術的技術文檔並諮詢客服後,91Reading在一天內就完成了集成與調試工作。
  • 百度AI開發者大會輸入法現場大飆Rap!高難度中英文混合語音識別...
    在7月3日「Baidu Create2019」百度AI開發者大會現場,百度首席技術官王海峰在演講中表示,「百度研發了流式多級的截斷注意力模型(SMLTA),使語音識別的準確率大幅提升並保持了非常高的速度,這是首個基於流式注意力的語音識別線上服務,百度輸入法語音識別的準確率因此相對提升15%以上」。
  • 搶先布局、強者恆強,「雲+AI」給百度產業智能化帶來了什麼?
    有意思的是,這些報告都沒有對規模、市場佔有過多糾結,幾份報告中,處在「規模跟隨」位置的百度是多個維度的領導者。問題來了,半年獲得超過四個權威報告背書,百度到底憑什麼?就在IDC最新報告發布的當天,百度大腦也宣布其語音能力引擎日均調用量已經超過100億次,應用規模業界第一。
  • 隔空對話張國榮、給胡歌粉絲畫像 百度大腦再秀「智商」
    「當中國的7億網民都用上智慧型手機,網際網路的發展已經不能靠人口紅利來驅動了。」9月1日,百度世界大會的開場演講中,百度董事長李彥宏這樣說。在他看來,網際網路正在進入下一幕人工智慧時代,人工智慧將使全社會迎來變革性的發展。「人工智慧是百度核心中的核心。」
  • 百度地圖智能化蛻變:AI技術如何讓導航更加準確、易用?
    在疫情最嚴重的時期,百度地圖還相繼上線了「發熱門診地圖」、「疫情小區」專題地圖等實用功能服務,相信不少人都體驗過。根據百度地圖的官方統計,其遷徙大數據平臺和全國實時路況平臺自上線以來訪問量已超 30 億次,這些功能為疫情防控提供了重要的數據參考。 魔幻的 2020 年即將結束。
  • 百度大腦給英文原版閱讀軟體91Reading裝上「耳朵」
    K12英文原版閱讀產品91Reading在接入百度大腦語音技術後,實現了「閱+讀」一體化的語言學習模式,為這一問題提供了「科技範」十足的答案。面對一系列問題,91Reading將目光投向了百度大腦。(91Reading藉助百度大腦語音技術對不同朗讀結果進行打分)在看過百度大腦語音技術的技術文檔並諮詢客服後,91Reading在一天內就完成了集成與調試工作。
  • 百度世界2020光鮮登場,百度大腦6.0、飛槳、智能雲勾勒AI藍圖
    「與我們以前見過的虛擬人相比,這個虛擬人有知識、能理解,會讓你覺得面對的是一個有思考能力的『真人』。」百度CTO王海峰揭秘。「虛擬人的背後,是視覺、語音、語言與知識等百度大腦多種AI技術的綜合應用」,王海峰表示。不止是虛擬人,百度世界上展示的無人車、小度音箱、度曉曉,以及公眾經常用到的百度搜索、地圖、輸入法、百度翻譯等產品,背後都是百度大腦在支撐。
  • 搜狗輸入法日均語音請求量突破14億,成國內第一大語音應用
    由於在疫情期間用戶對信息和效率需求的激增,搜狗手機輸入法用戶規模創歷史新高,日活躍用戶數達4.82億,同比增長9%,日均語音請求量峰值達14億,繼續穩居國內第一大語音應用寶座。而在同期發布的百度Q1財報中,輸入法部分數據則未被提及。搜狗輸入法相關指標屢創新高,得益於AI智能技術的不斷更新、迭代。
  • 百度大腦3.0首提語義價值 視覺語義化將開啟AI新風口
    被誤認為真人的AI客服是今年百度展示的AI能力之一,它的背後是百度大腦的自然語言理解和語音識別與合成技術。會上,百度大腦3.0隆重發布。「百度大腦3.0的核心是『多模態深度語義理解』」,百度高級副總裁、AI技術平臺體系總負責人王海峰表示,「百度大腦3.0已經對外開放了110多項領先的AI能力。
  • 百度世界大會亮劍多項硬核技術!AI服務人和社會更有人味兒
    ▲百度副總裁兼SLG總經理景鯤(左)2、小度助手6.0目前,小度助手DuerOS月交互次數已突破58億次,擁有超過4.2億名開發者和4000多項功能,合作品牌已超500個,並已在家庭、酒店/地產、車載和隨身等場景進行廣泛落地。
  • 語音識別準確率行業第一,中英、方言混輸百度輸入法都沒在怕的!
    這時候就該「動口不凍手」的語音輸入來「大展拳腳」了,打開百度輸入法語音輸入,分分鐘就能幫你搞定各種輸入需求。最近,艾媒諮詢發布《中國第三方手機輸入法市場年度專題研究報告》(以下簡稱《報告》),指出了百度輸入法2019年在語音輸入領域的重大突破。
  • 百度輸入法「暖冬公益行動」為流浪動物募集10噸...
    去年暑假期間,百度輸入法發起「成長蛻變」公益活動,推出多款明星定製公益皮膚,聯合滇西北支教團,為山區兒童捐獻教育課時,助力山區兒童的成長。百度地圖將自身的特色優勢與公益行動趣味融合,讓公益成為日常生活中的一件小事,並將公眾能量匯聚成為助人助社會的大愛。品牌煥新後的百度輸入法,用舒適便捷的輸入體驗「徵服」了年輕群體。
  • 百度輸入法深耕AI技術,極致語音輸入體驗隨時隨地「聽懂你」
    SMLTA技術已經應用到百度輸入法的在線語音識別、中英混合語音輸入、多方言和普通話混合語音輸入,以及離線語音等眾多功能中,將在線語音識別精度提升了15%,超越行業最高水平15%,同時離線語音識別準確率已達到在線語音識別效果。通過AI技術,百度輸入法開啟了輸入法2.0時代,無論是黑科技感、用戶體驗感和功能豐富度均備受追捧。
  • 百度AI黑幫: 李彥宏的40位「出走門徒」
    黑智聯合創業家盤點了在AI領域,百度出走「門徒」創立的共26家公司,過億美元融資,涉及機器人、深度學習、語音和自然語言理解、機器視覺、醫療、自動駕駛、企業級服務等不同領域,這些技術大牛,此前在百度聚首,如今又在AI創業領域會師鏖戰。
  • 跨越20年,康輝和Robin在百度世界大會來了一場超時空對話
    【新智元導讀】在百度世界大會的現場,「20年前」的康輝和李彥宏進行了一場別開生面的對話。Apollo實現無人車前裝量產,目前已有十萬人體驗。蕩起「飛槳」的百度大腦也實現了日均一萬億次調用。你有沒有想過有一天,和20年前的自己來一場別開生面的對話?性格、講話風格都如出一轍。
  • 百度移動正在露出真面目
    在PC時代,網際網路通過超連結實現真正的互聯互通,在移動網際網路時代,遊戲規則發生了本質的變化,每一個APP裡都成了一個圍牆花園,界限分明,移動互聯世界變成了一個個的孤島,這時候百度對抗「孤島化」的決心也逐步彰顯。
  • 獵豹移動CEO傅盛:後網際網路時代來臨,獵豹用 AI 構建大腦
    獵豹移動 CEO 傅盛作為嘉賓出席並發表主題演講—— AI 點亮營銷,闡述在後網際網路時代,獵豹如何用 AI 構建大腦,助力商業品牌升級。前不久美國商務部的部長訪華,他中午約了幾個企業家吃飯,有五個,我也是一個。2016 年我們有 45 億的年收入。在 2011 年我們大概只有 2 億多的收入。在過去六年的前五年都是 100% 以上的速度增長的。
  • 為什麼百度股價市值重回600億美元?這些關鍵詞或許是答案
    以語音交互數據為例,疫情之下,小度助手語音交互次數大幅上揚。僅僅3月份,語音交互次數就超過65億次,是去年同期的3倍。   延續與百度一直倡導的開放思維,小度技能開放平臺也坐擁數萬技能開發者,共同為小度打開的智能生態的大門,為行業創造更多可能。
  • 百度輸入法兩個第一,率先支持多國語音互譯
    數據顯示,我國有9億手機網民,其中,8億人經常使用手機輸入法。隨著技術的進步,輸入法的功能越來越多,文字輸入、語音輸入、鬥圖、手勢輸入。在筆者看來,百度輸入法就是最好的解決方案。艾媒諮詢數據顯示,百度輸入法的語音輸入準確率超越行業最優競品15%,排名第一。百度輸入法還是首家支持多語種混輸的輸入法,支持多國語音互譯。百度輸入法業內最準語音輸入的準確率,百度如何做到行業最準的呢?
  • 語音輸入AI黑科技圈粉老中青少,百度輸入法開啟感官輸入新時代!
    今年推出的語音黑科技,更是在進一步,憑藉百度在語音和AI的深厚積蓄引領5G時代全感官輸入新體驗。據悉,此次推出的語音輸入AI黑科技在在線語音識別、離線語音識別、中英自由說、方言自由說四個方面實現了重大技術突破,並且成功把這些技術都整合到SMLTA模型。