先問大家一個問題:100億,是什麼概念?
在小朋友的筆下,100億是1後面加上10個0;在廣大網友口中,100億是100個「能達到的小目標」;而在百度人和百度合作夥伴看來,這個龐大的數字,意味著我們的生活正與智能語音技術融合得越來越緊密,因為——
百度大腦語音能力引擎
日均調用量已超過100億次
應用規模業界第一!
這100億中,有你。
因為「百度大腦語音能力引擎」,這個聽起來不明覺厲的名字,你一直都在用——
用它,你再也不愁垃圾分類了,只要動動嘴,百度 APP 就給你答案;
用它,你可以向小度連著提問了,你們的對話變得越來越流暢、準確;
用它,伴侶為你錄製了百度地圖語音包,從此你有了專屬的導航語音;
用它,你在語音輸入時可以放心地夾雜英文,百度輸入法總能準準地 get 到你的國際範兒!
瀏覽器版本過低,暫不支持視頻播放
(Baidu Create 2019 百度 AI 開發者大會上,王海峰博士展示百度語音技術在百度輸入法中的應用)
這100億中,有我。
百度大腦智能語音技術的每一個功能、每一次升級,都離不開無數百度同學的付出,離不開他們的思考、探索和創造。
這100億中,還有他。
百度大腦語音能力引擎,有來自家居、金融、農業、公益等各行各業的合作夥伴。正是他們讓百度大腦的智能語音技術在各自的行業中落地,實實在在地解決問題,並幫助技術在應用中更新完善。
這是我們共同創造的100億!
在昨天的百度大腦語音能力引擎論壇上,百度大腦宣布語音能力引擎日均調用量已經超過100億次,應用規模業界第一!
語音能力引擎為開發者提供了覆蓋雲、端、芯的全棧全場景語音開放能力,推動智能語音技術在各行業落地應用。
論壇上,百度大腦語音引擎全新發布和升級了14大產品內容,包括基於百度鴻鵠語音晶片的4款硬體模組、開發板及3大場景解決方案,升級了語音自訓練平臺、呼叫中心語音解決方案等。
來自家電、農業、醫療等行業的合作夥伴代表也在現場分享了百度大腦語音技術賦能的成果。
(百度 CTO 王海峰博士致辭)
百度首席技術官王海峰博士出席論壇並致辭,他表示
AI 技術的進化和產業賦能正向循環,相互促進,AI 在應用場景中不斷進化。百度的語音技術基於深度學習和產業應用加速突破,已應用到百度 APP、百度地圖、小度音箱、百度輸入法等百度產品中,更通過 AI 開放平臺賦能眾多產業夥伴。百度大腦語音能力每天的調用量已經超過100億。
現場,百度語音首席架構師賈磊正式提出基於複數 CNN 網絡的語音增強和語音識別一體化端到端建模技術。
該方法拋棄了數位訊號處理學科和語音識別學科的各種先驗假設,消除學科間壁壘,直接端到端進行一體化建模。較於傳統基於數位訊號處理的麥克陣列算法, 錯誤率降低超過30%。目前該方法已經被集成到百度最新發布的百度鴻鵠晶片中。
(百度語音首席架構師賈磊主題演講:「百度大腦語音技術的前沿進展」)
從2012年起,百度就開始將深度學習用於中文語音搜索,成為全世界最早把深度學習技術落地工業化產品的企業之一。
百度大腦目前已開放了雲、端、芯包含語音識別、語音合成等全棧語音引擎能力,並廣泛應用於金融、政務、文娛等多種行業和場景。
百度 AI 技術生態部總經理喻友平表示,百度大腦語音能力引擎的應用規模已達到業界第一,同時一直在積極拓展語音能力引擎生態鏈的建設。
百度 AI 技術生態部總經理喻友平介紹百度大腦語音引擎全棧開放能力
針對智能硬體設備,百度大腦重磅發布基於百度鴻鵠語音晶片的4款硬體模組、開發板,以及智能家居、智能車載、智能 IoT 設備3大端到端軟硬一體遠場語音交互場景解決方案,具備交互效果優異、軟硬一體快速應用、廣泛兼容集成門檻低等優點。在語音識別領域,全面升級短語音識別、實時語音識別能力,發布音頻文件轉寫能力,升級可零代碼提升業務術語識別率的語音自訓練平臺,以及呼叫中心語音解決方案。在語音合成方面,全新發布6個在線語音合成精品音庫和5個離線語音合成精品音庫。豐富的語音能力將助力智能硬體、網際網路、呼叫中心等領域智能化升級。
(嘉賓分享)
(第一排從左至右:創維、瓴嶽科技、北京子傑寶貝科技公司)
(第二排從左至右:華智水稻、江西善行)
論壇上,來自家居、金融、醫療、農業、公益等領域的合作夥伴,登臺分享與百度大腦合作的細節,以及如何以語音技術助力自身完成智能化升級。
創維 AIoT 研究院產品經理李凱介紹:
大屏 IoT 的行業痛點在於信息檢索難和設備控制操作複雜,通過增加語音交互能力,重構了整個 AIoT 設備生態的交互體驗。雙方在電視方面的合作成果已落地在10個電視晶片型號、2500萬臺電視上,助力中端及高端產品線提升了產品溢價能力。
在下一代遠場語音方案中,百度鴻鵠語音晶片為創維產品帶來了高性價比硬體、整合優化的軟體算法等價值,雙方將基於百度鴻鵠晶片展開多項產品的合作。
瓴嶽科技信貸運營總監宋力,現場分享了百度大腦語音技術在貸後領域的應用。
依託百度大腦呼叫中心實時語音識別等 AI 服務對用戶語音的準確識別,瓴嶽打造了降本提效的智慧機器人。通過貸後智慧機器人、智能語音質檢的應用,貸後人力投入降低61.47%,有效實現了合規和高效的運營體系,提高了客戶體驗。
北京子傑寶貝科技有限公司項目經理肖雲峰,在會上講解了語音技術在醫療領域的應用:
我們開發的智能錄入系統,在百度大腦語音自訓練平臺進行語音識別模型訓練,識別率從80%提升至95%以上,包括醫療專業生僻詞的識別,而很多廠商模型識別率都達不到這個要求。該系統有效降低了醫護人員的工作強度,提升了臨床護理效率。
在農業領域,也遇到了農業作物專業詞彙語音識別率低的行業問題。對此華智生物信息技術主任龍曉波表示:
得益於百度大腦語音自訓練平臺使用簡單、準確率高、可拓展等優點,經多次迭代我們的農業結構化性狀數據語音識別準確率從71.09%提升至98.75%,採集一個測試田地性狀信息從300人工時降低到160人工時,工作效率提升了一倍。
善行智能聯合創始人黃小瑰,介紹了基於百度大腦語音等技術打造的小 Q 智能導盲眼鏡,幫助盲人生活出行,為失能人群提供智能化的幫助。
現場還發布了「因 AI 而聲」公益計劃:百度大腦將為提供公益性服務的公司或組織,提供語音技術免費、專屬語音技術支持等福利,為特殊群體帶去便利和幫助,讓 AI 有溫度。
(百度大腦語音能力引擎論壇現場)
百度大腦開放平臺是國內服務規模最大的 AI 開放平臺,目前已開放228項 AI 能力,擁有超過150萬的開發者用戶。百度大腦語音技術能力的全新發布和升級,為開發者和企業提供了更加完善的全棧語音引擎能力。
未來,我們將幫助更多用戶高效打造具備語音交互能力的特色應用與產品,加快語音技術在各行各業的應用落地進程,讓我們共同創造更多個100億!