(原標題:科大訊飛推出拾音品牌,從「諦聽」感知聲音力量)
從古至今,人類對世界的認知和探索從未止步。出於對宇宙的好奇,人們發明瞭望遠鏡去觀看更遠的景色,發明了顯微鏡去了解生物的結構,發明了電話讓聲音跨越空間的距離……探索微渺、洞見世界一直是人們孜孜以求的理想。在智能語音與人工智慧領域,科大訊飛也不斷深耕突破。近期,訊飛推出了全新拾音品牌——諦聽,在拾音技術上探索更多可能。
諦聽:源於中國古代的智慧象徵
神獸諦聽傳說是地藏菩薩的坐騎,在中國古代神話故事中,它集群獸的形象於一身,聚眾物的優點為一體,其耳為犬耳,尤善傾聽。諦聽可以通過聽覺來辨認世間萬物,它天耳神通,能夠捕捉天上地下的一切聲音,再細微的聲音也逃不開它靈敏的聽覺,憑其聰慧的聽力,幫助地藏修行。
另一方面,諦聽不受假象的困惑,聰明的分辨並洞察聲音背後的真相,並且擁有信息處理和判斷的智慧。在名著《西遊記》中,諦聽可以通過聽音來辨別真假美猴王,它還能清晰辨認「五蟲」、「五仙」。
古人對於聲音奧秘的探尋,從那時起已埋下伏筆。但諦聽之名,並不是只存在於古代傳說中。諦聽最原始的意思,就是好好聽,認真聽。
致敬中國古代圖騰,科大訊飛的拾音品牌——諦聽便取此寓意,懷著明辨細微之聲的願景,善聽且智慧,能夠專注細微,洞察有道。據了解,訊飛諦聽結合自主可控的智能語音與人工智慧降噪算法,可以精準識別低至30分貝的微小聲音,其基於深度學習的噪聲抑制功能,在複雜噪音環境下也能清晰識別人聲。
訊飛拾音:識微知著的聽覺延伸
最近,某科技博主將國際品牌德國森海塞爾、美國舒爾同類產品和訊飛進行了對比測評,基於實驗結果,訊飛諦聽在降噪、超小音量拾取、拾音區域等功能上表現出眾,在超低音量與較大噪音的情況下,拾音效果對比較為明顯,其強大產品力表現出不俗光採。
本次測評的諦聽產品是一款拾音設備。通過全自動聲源定位技術、自適應波束形成、混響抑制激素及基於深度學習的噪聲抑制和語音自動增益調節算法可實現室內說話人自動定位、噪聲與混響抑制、音量自動調節等功能,解決常規拾音設備語音採集質量差,小音量無法精準拾取等問題。
諦聽特點優勢一便是敏銳的「聽覺」。一隻蚊子飛過的聲音大約為40分貝,一般人說話的音量大小在50分貝左右。在評測實驗中,低至30分貝的輕聲絮語,人耳都無法聽見的超小的音量環境下,森海塞爾拾音穩定,內容清晰,舒爾拾取的聲音小且難以分辨說話內容,訊飛的諦聽拾取的內容清晰,且音量聽感較好。
其二,便是與神獸諦聽一樣,即便面對複雜的聲音環境,仍能排除嘈雜,做到拾音精細。在複雜的環境下,各種噪聲混合在一起,不僅對拾音更對噪音處理帶來挑戰。在評測視頻中,模擬環境噪音為70分貝和90分貝的情況下,諦聽都有效抑制了噪音,能夠清晰拾取對話內容,並根據人耳聽覺特點對音量和音效自動調整與優化,使聲音聽起來更加飽滿。
除此之外,諦聽還具有其他無出其右的亮點。例如說話人跟蹤功能,訊飛諦聽通過全自動聲源定位技術可實時定位人員說話位置,無需預設和限制拾音區域輕鬆實現360度無死角的拾音;7×24小時全天候穩定拾音,基於人工智慧算法,能有效對高聲喊叫等異常聲音進行預警,滿足多種場景需求。
科大訊飛:中國創新之力,洞悉萬象之音
作為人們感知外界環境的一個重要通道,聽覺在視線障礙、不利光照條件等情況中可起到視覺無法替代的作用,是視覺的重要補充,高質量的音頻都將發揮著不可忽視的作用。例如,工業界的檢測師通過聲音辨別機器是否運轉正常,民警通過汽車聲音辨別是否違法鳴笛,商鋪利用全量的音視頻採集來防止偷盜,法院、檢察院庭審過程中同步錄音錄像,保證辦案過程公正可追溯。
但拾音器這類專業設備的市場一直被海外品牌所佔據,其安全性又決定著了不能完全依賴國外產品及技術。作為亞太地區知名的智能語音和人工智慧上市企業,科大訊飛長期從事語音及語言、自然語言理解、機器學習推理及自主學習等核心技術研究並保持了國際前沿技術水平,同時承建了首個語音及語言信息處理國家工程實驗室等科技項目,其民族創新與科技創新的原生力量不言而喻。
基於多年的技術積累,科大訊飛在前端拾音技術上發力深耕,其超小音量識別和噪聲抑制出色表現,憑卓越產品力突出國際重圍,更憑卓越品牌力讓世界重新審視。我們期待,正如諦聽品牌專注細微,洞察有道的美好願景,帶領好奇的民族去探索微渺的聽覺世界,在未知領域探索更多創新與可能。