科大訊飛拾音領域實現新突破,「諦聽」可識別30分貝超小音量

2020-11-22 雷鋒網

萬物互聯,作為人類最自然、便捷的溝通方式,語音正成為所有智能設備至關重要的入口,但入口的關鍵——拾音,效果往往差強人意。就智能家居來說,它們的拾音範圍多集中於近場環境,約為2-3米,且拾取效果欠佳,需多次喚醒。

如果把攝像機比作「眼睛」,拾音器便是「耳朵」。眼睛看到的圖像和耳朵聽到的聲音組合構成一個基本的影音記錄系統。然而這隻靈活的耳朵在應用過程中會受到諸如拾音距離、室內混響、環境噪音等諸多因素的影響,這對拾音來說是不小的挑戰。

如何真正「耳聽八方」?深耕智能語音與人工智慧領域多年的科大訊飛,近期推出了全新拾音品牌——諦聽,在超小音量拾取和降噪方面再下一城。其實,訊飛在早前推出的訊飛錄音筆、智能滑鼠、阿爾法蛋等產品均涉及語音交互。基於產品應用的技術積累,這次在拾音領域發力深耕,令人欣喜。

據了解,科大訊飛諦聽系列配備了32路麥克風,主打全自動聲源定位、自適應波束形成和混響抑制技術以及基於深度學習的噪聲抑制和語音自動增益調節算法,可實現室內說話人自動定位、噪聲與混響抑制、音量自動調節等功能,從而達到精準拾音的目的。

自動追蹤聲源,精準拾取30分貝超小音量

近日,某科技博主的一支關於拾音器的評測視頻引發關注。視頻中,科大訊飛的諦聽系列產品和德國森海塞爾、美國舒爾的同類產品「同臺競技」,訊飛表現出彩。

在模擬30分貝人耳都無法聽見的超小的音量環境下,森海塞爾拾音穩定,內容清晰,舒爾拾取的聲音小且難以分辨說話內容,訊飛諦聽拾取的內容清晰,且音質聽感較好的。

這主要由於科大訊飛採用了自主研發的全自動聲源定位技術,只要有輕微的聲音,它便如聚光燈一樣迅速定位聲源,並對來自其他方位的混響和噪音進行抑制。在實際應用中,32個麥克風組成的陣列可做到7×24小時全天候、全方位、無死角拾音,精準拾取低至30分貝的超小音量。

眾所周知,聲音在傳播過程中會發生衰減,不同方位的聲源會導致所拾取語音音量和效果差異較大,全自動聲源定位和自適應波束形成技術還使得訊飛諦聽在拾取運動的聲源方面表現出色。波束如同槍手槍擊獵物一樣,可自動「瞄準」運動的聲源方位。這意味著,對於那些仍需要預設和限制區域才能拾音的設備來說,訊飛這是一大突破。不僅如此,通過對不同音量自動調整,訊飛諦聽使得拾取的聲音更符合人耳聽覺效果。

攻克技術難點,諦聽降噪能力驚人

聲學環境比想像中更為複雜,環境噪音、幹擾噪音、電流噪音等噪聲與語音信號在時間和頻譜上常常相互交疊,再加上回波和混響的影響,想要捕捉相對純淨的語音非常困難。在評測視頻中,評測者分別模擬了環境噪音為70分貝和90分貝的情況,結果顯示即使是90分貝的極端噪音環境,諦聽都抑制了噪音,對話內容依舊清晰。

面對噪音這一挑戰,訊飛諦聽依據時域、頻域和空域的信息,能有效增強語音並顯著抑制噪音對目標語音的影響。它首先通過聲音定位技術拾取語音,進行語音增強,實現初步的降噪效果。然後通過波束形成和基於深度學習的語音增強算法和對非方向性和方向性的噪聲進行抑制,最後輸出時,對音量大小自動增益並根據人耳的聽覺特點優化,使聲音更加飽滿。

核心語音技術驅動發展,未來可賦能多場景

萬物智聯的時代已然來臨,A.I.賦能IOT將激發無限可能,前端拾取的音質高低無疑會為影響後期的語音處理的水平。

諦聽系列產品,是科大訊飛21年來始終堅持源頭核心技術自主創新的體現。憑藉「中文語音技術應由中國人做到最好」的信念,2018年至今,科大訊飛已獲得30項人工智慧國際競賽的冠軍,涵蓋語音識別、語音合成、機器閱讀理解、手勢識別、圖像識別等諸多領域。隨著一項項技大關術的突破,科大訊飛也為拾音器的多樣化應用場景落地提供了強而有力的技術支撐。以往的拾音設備成本高、音質差、指向性強,無法在大面積推廣,諦聽的推出,或許將打破這一現象。

據悉,諦聽系列產品未來可廣泛應用安防、交通、高質量會議等關鍵場所和重點部位,其實用性應用而言,可以說大有可為。以公共場所為例,以往的視頻大多無法精準拾取聲音,音頻與視頻的有效結合,全向採集視聽解決了單純視頻的圖像死角,有利於防止群體性和違規事件的發生,滿足更多現實的需求。

當今世界正經歷百年未有之大變局,而人工智慧正是引領新一輪科技革命和產業變革的戰略性技術,對於推動社會生產力的整體躍升有著重大意義。劉慶峰不止一次表示,「只有佔據核心技術的高點,才能在產業發展中贏得主動,在國際競爭中擁有話語權。」訊飛諦聽或許正是其20多年專注於人工智慧核心技術的最佳體現。

雷鋒網雷鋒網(公眾號:雷鋒網)

雷鋒網版權文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 小分貝拾取,高分貝降噪,還能場景定製!訊飛諦聽,不止於聽
    深耕於人工智慧與智能領域多年的科大訊飛拾音品牌——諦聽,近期逐漸嶄露頭角,在一條科技評測視頻中,可以精準識別低至30分貝的微小聲音,也能在90分貝得噪音環境下有效提取音頻。30分貝是什麼概念呢?普通人正常說話的音量是50分貝左右,一隻蚊子飛過的聲音大約40分貝,也就是說訊飛諦聽甚至可以捕捉蚊子飛過的聲音。
  • 科大訊飛摘得ICFHR 2020數學公式識別挑戰賽冠軍
    提起科大訊飛,人們總津津樂道於「讓機器能聽會說」的先進智能語音技術。其實除此之外,科大訊飛的「攻城獅們」也一直致力於讓機器「能看會認」。近日,科大訊飛A.I.研究院聯合中科大語音及語言信息處理國家工程實驗室,以顯著優勢獲得ICFHR 2020 OffRaSHME數學公式識別挑戰賽冠軍。
  • 科大訊飛劉慶峰:隱私保護對人工智慧未來發展至關重要
    10月23日,第三屆世界聲博會暨2020科大訊飛全球1024開發者節開幕。科大訊飛董事長劉慶峰發表主題演講時表示,AI應用正滲透到各行各業及人們生活的各個方面,但人工智慧賦能人類,而不是替代人類。未來不是屬於AI,而是屬於掌握AI的人類。同時,他介紹了未來人工智慧發展的四大機遇以及科大訊飛下一步的發展重點,強調情感計算與隱私保護對人工智慧未來發展至關重要。
  • 科大訊飛副總裁李世鵬:語音領域訊飛沒有對手
    2019蘇州智博會期間,科大訊飛副總裁李世鵬接受了TechWeb的採訪,對科大訊飛產品的研發與應用方向,以及市場競爭情況進行了簡短討論。科大是否有足夠的技術壁壘來應對?李世鵬:如果你去CES展看過,80%以上的中文對話產品都是用科大訊飛的技術。包括海爾一類大廠,前不久我們還和海爾做了一家合資企業。你也可以看到,我們能夠和大型汽車廠商合作,做車內語音控制。說心裡話,語音這一塊,科大訊飛和新入局的小公司不在一個水平上,他們稱不上是訊飛真正意義的競爭對手。
  • 中英文識別率更高,用科大訊飛翻譯機獲得滿滿體驗感
    而對於剛剛出國的人來說,即便是自己的英語水平很高,在國外想要實現無障礙交流也是一件很困難的事。為了滿足這些人的實際需求,科大訊飛打造出的訊飛翻譯機就非常的實用,翻譯速度快又準,獲得了用戶的高度評價。科大訊飛翻譯機自從上線以來,特別是3.0版本,因為功能豐富而且強大,所以備受用戶的青睞,銷量一直都保持領先。通過人工智慧技術的植入,科大訊飛翻譯機展現出了更加多出色的性能,滿足了用戶的個性化翻譯需求。
  • 科大訊飛有哪些子公司_網友中的科大訊飛怎麼樣
    科大訊飛有哪些子公司   前身安徽中科大訊飛信息科技有限公司,成立於1999年12月30日,2014年4月18日變更為科大訊飛股份有限公司 ,專業從事智能語音及語言技術研究、軟體及晶片產品開發、語音信息服務及電子政務系統集成。擁有靈犀語音助手 ,訊飛輸入法 等優秀產品。
  • 訊飛智能鍵鼠,辦公效率快人一步|鍵盤|語音識別|滑鼠|科大訊飛...
    訊飛智能鍵鼠是科大訊飛面向A.I.+辦公領域推出的提升PC使用效率的智能外設組合,即通過軟硬體結合的方式,對傳統PC外設進行改造,進而讓其擁有智能化的能力,主要包括語音識別、語音翻譯、語音控制、OCR識別等功能。截至目前,訊飛智能鍵鼠包括訊飛智能滑鼠Lite、訊飛智能滑鼠Pro、訊飛智能滑鼠標準版以及訊飛智能鍵盤K710多款產品。
  • ...科大訊飛|1024|長光衛星技術有限公司|人工智慧|雲端|開發者節
    自從2017年科大訊飛首次開啟面向全球開發者的"1024開發者節"之後,似乎每年的10月24日都已經成為開發者們的共同朝聖的節日。今年也沒有例外,在本月23日,2020科大訊飛1024全球開發者大會開幕式,將在安徽廣播電視臺亞洲一號演播廳隆重進行。那麼,對於廣大A.I.開發者來說,今年的1024開發者節又有什麼樣的乾貨呢?
  • 專業翻譯更靠譜,科大訊飛翻譯機可用於方言直接與英語對接
    而對於毫無英語基礎的人來說,又該如何實現這樣的願望呢?帶上科大訊飛翻譯機,語言交流難題將迎刃而解!而科大訊飛翻譯機就可以幫助大家解決語言溝通不暢的問題,哪方面都可以給我們提供翻譯服務。據了解,科大訊飛翻譯機覆蓋全球近200個國家和地區,支持中文與58種外國語種的在線翻譯,離線翻譯支持的語種數量及準確性都穩居同類產品之首。其次,科大訊飛翻譯機的翻譯功能更加的豐富,可以獲得更好更準確的翻譯。這臺翻譯機設備支持拍照翻譯、方言翻譯以及行業AI翻譯。
  • 鵬城實驗室與科大訊飛攜手合作 推進大灣區智慧醫療「新基建」
    (見圳客戶端、深圳新聞網記者 吳英敏 通訊員 商笑野)日前,鵬城實驗室與科大訊飛股份有限公司戰略合作籤約儀式在鵬城實驗室舉行,在鵬城實驗室主任高文院士、科大訊飛董事長劉慶峰等見證下,實驗室常務副主任鄒鵬、科大訊飛高級副總裁杜蘭代表雙方籤約。
  • AI教育築夢校園|科大訊飛劉慶峰:未來屬於掌握了人工智慧的新人類
    劉慶峰指出,從陶行知先生所說的教育孩子的6個解放,到現在,黨和國家提出「五育並舉」,要實現人的全面發展。時代在變,但教育的本質其實一直沒變。而人工智慧可以幫助師生「騰出時間」,更好的全面發展。 由科大訊飛和北師大一起承擔的教育大數據專項,統計了35億次學生的作業,發現60%左右都是無效練習。
  • 科大訊飛1024開發者節啟幕,A.I科技樹化身能力星雲服務百萬開發者
    10月23日,2020科大訊飛全球1024開發者節盛大開幕。今年這場盛會的主題為「AI煥新·更美好」,旨在通過「開放·合作·生態·共享」的理念,共建人工智慧新生態。其中,科大訊飛AI研究院常務副院長劉聰為大家帶來了一場A.I.技術的盛宴。
  • 科大訊飛連發三款車聯網新品 新版飛魚OS增加六大亮點功能
    可實現較高準確率的語音識別、語音定製,並能通過視線追蹤和唇語檢測等技術自動判定用戶意圖、提供服務。飛魚智雲1.0屬於雲端平臺解決方案,從架構上看,其核心主要包含大數據、AI和業務中臺,以及智能化雲應用。
  • 科大訊飛發布5大單品和iFLYOS 2.0
    「我們希望訊飛學習機能成為每個學生度身定製的A.I.家庭教師,幫助他們減負增效,實現兩千年來因材施教的夢想」。科大訊飛消費者BG副總裁章繼東說。據悉,這是歷史上首次參加並通過國家級權威口譯水平科研評測的人工智慧系統,這也標誌著機器自動翻譯在輔助人類跨語言信息溝通交流方面上了一個新臺階。與此同時,這也是人類在人工智慧高級階段——認知智能上的又一重大突破。
  • 一口氣發布三款產品,科大訊飛打開汽車多模態交互的大門
    科大訊飛希望通過三大核心能力為車企構建可自主化運營的軟體平臺和數位化底座。文丨AutoR智駕 諾一廣州車展前夕,科大訊飛展示了自己在車聯網領域的最新成果。今天(11月19日),在廣州W hotel,科大訊飛發布了飛魚OS MATE 2021、飛魚智能助理MM 2021、飛魚智雲1.0三大核心車聯網系統解決方案。科大訊飛希望通過三大核心能力為車企構建可自主化運營的軟體平臺和數位化底座。
  • ...科大訊飛認為高考才是考驗人工智慧的唯一標準!#2015創業邦100...
    人工智慧,應用層面關鍵在於萬物互聯, 科大訊飛將在超腦計劃基礎上推出AIUI系統和標準,搭建人工智慧產業生態鏈,實現這一目標。2015年,訊飛超腦計劃階段性進展披露,目標讓機器人在2020年考上一本。創業邦曾做報導:《剛年滿1歲的訊飛超腦,真能讓機器人3年後考上大學?》,並認為除了其基於語音交互技術系列產品帶來的大數據和漣漪效應,科大訊飛新推出的人機互動新產品AIUI和其在人工智慧領域的布局將是關鍵。
  • 科大訊飛DCASE挑戰賽奪冠,「A.I.+工業」前景廣闊
    ,這也為實現「聲學照相機」和「工業聽診器」等「A.I.  基於領先的聲音事件定位和檢測技術,科大訊飛已經研發出「聲學照相機」和「工業聽診器」等產品,並陸續在電力、水利、軌道交通、汽車製造等行業領域發揮效用。  其中,訊飛聲學照相機可以利用高精度麥克風陣列技術定位聲源位置,再配合攝像頭,實現可以直接在設備上看到聲源位置,方便工作人員的日常設備檢修。目前,訊飛聲學照相機已陸續在國內多個地區、項目中進行試點和應用。
  • 17」語音識別PK賽 英語流利說完勝科大訊飛
    17」語音識別PK賽 英語流利說完勝科大訊飛 12 月 16 日,由著名科技媒體PingWest品玩主辦的「HAY!17·無限奇境」嘉年華在北京炸裂開場。
  • 科大訊飛AI營銷雲發布30+女性洞察報告 經濟獨立有底氣
    「姐學」、「三十而已」、「乘風破浪的姐姐」…… 隨著這些熱詞的大火,「30+女性」再次大規模進入公眾討論的視野。近日,科大訊飛AI營銷雲「數說」系列洞察報告發布30+女性專題 ——《浪姐無價,又A又颯》(以下簡稱《報告》),對30-50歲一二線都市白領女性進行深度洞察。
  • +教育,科大訊飛黑科技如何提升消費者幸福感?
    作為亞太地區知名的智能語音和人工智慧企業,科大訊飛就曾被《中國青年報》以一篇名為《戰「疫」時刻,A.I.+教育成為新常態》的文章報導過A.I.+教育的相關經驗,其中重點介紹了C端產品訊飛智能學習機。不得不說,自2016年成立消費者事業群以來,秉承著「有AI生活用訊飛」的品牌主張,科大訊飛研發的C端產品涵蓋了辦公、教育、生活三大領域,正從生活工作等多場景為消費者提供便利。