音樂雷達發布智能音頻檢索雲平臺

2021-01-09 TechWeb

如果你玩過「瘋狂猜歌」,那麼你一定有過「要是音樂本身也能百度一下就好了」之類的想法。其實這點並不難,直接用「音樂雷達」錄一段聲音就可以搜到標準答案了。這種功能就叫做「聽歌識曲」。提到這一點,不少人會想到國外的Soundhound或者Shazam,但這些應用對於中文歌尤其是新歌的支持非常有限,而且Shazam還只能搜原聲,不能搜哼唱。所以如果要找一個曲庫最大、識別最準確、速度最快而且又支持哼唱搜索的應用,那麼非最近很火的「音樂雷達」莫屬了。這裡有個對開發者而言的好消息:「音樂雷達」要把自身的音樂搜尋引擎徹底開放,向開發者提供「音頻檢索開放雲平臺」。最新一版「音樂雷達」已於近日在安卓市場首發,可以去體驗一把「瘋狂過關」。

官網連結:http://www.doreso.com/

國內首家「音頻檢索開放雲平臺」

2013年7月,音樂雷達發布了國內第一個「音頻檢索開放雲平臺」,提供開放的音頻檢索API,集成「原聲識別」、「哼唱識別」、「本地歌曲文件識別」等一系列檢索服務,不僅可以準確識別周圍環境中的音樂,還能聽懂用戶哼唱的旋律,更可以幫助用戶修正本地歌曲文件信息,成為了廣大音樂應用開發者的福音,使任何開發者都可以將音頻檢索技術集成到自己的應用中,目前已有多家合作夥伴搶先使用。

技術絕對優勢領先

面對新鮮事物,很多人肯定還會有一些顧慮,例如「智能識別技術靠不靠譜?」,「準確率有多高?」等。為此,筆者進行了詳細調查,就「音樂雷達」而言,說其技術已經達到世界領先水平也不為過。「最快1秒識別」,「極佳的抗噪能力」,「世界最大的哼唱曲庫」,這些都是用戶能夠切身感受到的。除此之外,在多次第三方技術評測中,「音樂雷達」均以明顯的優勢奪冠。另外,「音樂雷達」團隊更是在MIREX、NIST SRE等國際頂級賽事中多次奪得第一名,而該評測中其競爭對手不乏微軟、Nuance、IBM、MIT、斯坦福、騰訊、科大訊飛、清華、中科院等國內外知名企業和研究機構,這對團隊實力是權威的肯定。

「音樂雷達」的技術迭代速度是十分驚人的。據其技術團隊透露,從公司成立至今,其原聲搜尋引擎進行過至少5次大規模升級,搜索速度比最初提升了3倍,準確率則提升了40%之多,抗噪能力也有大幅度的提升。新的引擎大膽採用了信道融合技術以及綜合評價體系等一系列創新。如今,憑藉最快1秒的識別速度,98%以上的識別率和超強的抗噪能力,「音樂雷達」已絲毫不遜色於經營了十餘年,價值10億美元的Shazam,達到世界頂尖水平。Shazam日前剛剛獲得了世界首富墨西哥電信老闆Carlos Slim4000萬美元的風險投資,音頻檢索技術的市場價值可見一斑。

但諸位看官請注意,Shazam目前還只有原聲搜尋引擎,並不具備哼唱搜索的能力,而這正是音樂雷達的強項所在。由於哼唱搜索是極難模仿的技術,不光Shazam沒有哼唱搜索,連騰訊、網易、百度等也只有原聲搜索功能而已。據悉,音樂雷達團隊已擁有全球最大的哼唱曲庫和識別性能最好的哼唱識別引擎,最近,更是率先將DNN(深度神經網絡)技術融入到引擎中,大幅提升了準確率和速度,為用戶帶來更好的體驗和價值。

未來發展無限潛力

大浪淘沙,網際網路行業一直以來都不缺乏好的創意和技術,但是真正能沉澱下來的公司寥寥無幾。對於「音樂雷達」的音頻檢索引擎來說,其市場價值固然是巨大的,那他們又會如何發展呢?音樂雷達團隊表示:音樂無國界,也許有一天,「音樂雷達」會成為手機用戶的標配軟體,但是,我們不會為此封閉自己,這也是我們推出中國第一個「音頻檢索開放雲平臺」,這就意味著任何人都可以把我們的技術運用到他們的應用中,希望能夠與合作廠商合作共贏,一起推動技術革新,提升用戶體驗,進而改變世界。

( 責任編輯: 黃哲 )

相關焦點

  • 音樂信息檢索:用機器來理解音樂
    國內大陸的MIR研究起步比較晚,發展比較緩慢,工作比較零散,交流比較少,而且ISMIR會議也少見大陸學者身影;直到2013年由復旦大學和清華大學創辦了全國聲音與計算研討會(China Sound and Music Computing Workshop, CSMCW),國內MIR研究才逐漸進入到一個有組織、有交流、有平臺的領域。
  • ...音樂數據開放項目與信息檢索:從IMSLP到字節跳動GiantMIDI-Piano
    說到音樂資源的獲取,我們一般想到的是網易雲音樂、QQ音樂這樣以音頻播放功能為主的數位音樂平臺。但是音樂資源並不囿於音頻形式,在作學習或研究之用時,樂譜是和音頻同樣重要的信息資源。本期推送將介紹知名的國際音樂數字圖書館IMSLP(International Music Score Library Project)以及今年10月字節跳動發布的全球最大的古典鋼琴數據集GiantMIDI-Piano,並在結尾推薦信息檢索領域的經典書籍《信息檢索導論》。
  • 音樂雷達V2.6.7試用手記:搜歌利器一秒識別
    安卓新版音樂雷達界面  搜索效果提升:比同類產品準確度高 速度快  音頻內容檢索技術就是通過分析音頻本身,對音樂旋律進行識別和索引,技術門檻比較高,同時,音樂雷達擁有全球最大哼唱搜索資料庫和全球最大的音頻指紋資料庫。
  • 提升「智能化」音樂空間體驗,Sonos 智能音頻連接器Port 正式發售
    2019年9月,Sonos在柏林發布了全新的智能音頻連接器Sonos Port。12月15日,Sonos Port正式在中國市場發售。  作為一款智能音頻連接器,Port不僅能夠實現音頻源擴展,將傳統音響設備、黑膠唱機和CD播放器等設備轉化為智能化流式播放,更集Sonos獨特的流媒體服務、智能便捷操作、多房間系統組合、智能家居生態無縫接入等優勢於一身,可為工裝空間提供「軟硬體一體化的智能音樂空間解決方案」,同時也為擁有傳統音頻設備的家庭提供更「智能化」的音樂聆聽體驗。
  • 走進2020北京科博會 酷狗音樂帶來全能「聽歌管家」
    酷狗攜可實現語音交互功能的一系列智能音樂硬體產品亮相,為觀眾帶來全能「聽歌管家」,展現智慧音樂生活。本屆科博會以「合作創新 共迎挑戰」為主題,由科技部、國家知識產權局、中國貿促會和北京市人民政府共同主辦,是國內外展示最新科技成果的重要平臺。
  • 谷歌推出錄音程序Recorder,智能處理海量音頻信息
    如果我們能夠擁有一個智能錄音機,可以實時轉錄並標記長時間的錄音內容,幫助我們像搜索文本圖像一樣迅速定位找到相關信息,那該多好!為了解決這一問題,讓人們更為便捷地檢索錄音中感興趣的信息,谷歌為Pixel開發了一個名為Recorder的應用,將移動端機器學習的最新進展應用於對聲音、對話的記錄和轉寫、檢測和識別特定類型的音頻(包括語音、音樂、掌聲、口哨、音樂等等)並為錄音信息編制了有效的索引,從而幫助用戶可以快速地尋找到感興趣的錄音片段。
  • 自動駕駛開發者利器:華為雲自動駕駛雲服務Octopus亮相上海車展
    自動駕駛開發者利器:華為雲自動駕駛雲服務Octopus亮相上海車展    4 月 16 日- 25 日上海國際汽車工業展覽會期間,華為雲自動駕駛雲服務Octopus(八爪魚)首次亮相。
  • 8家智能製造特色產業園區獲授牌,網易雲音樂正式發布音街
    上海將重點構建無人工廠儲備庫,聚焦供給端優化能力,編制智能製造系統集成商推薦目錄,提升工業網際網路平臺知曉度和用戶黏性,融通智能製造解決方案和賦能工具箱;聚焦應用端深耕行業,持續推進汽車、電子信息、航空航天、生物醫藥、高端裝備、綠色化工及新材料等領域的智能化轉型升級。
  • 網易雲音樂、QQ音樂試水播客,大平臺能破變現難題麼?
    2020年,騰訊音樂娛樂集團(TME)推出播客App酷我暢聽、閱文集團推出閱文聽書、字節跳動推出番茄暢聽、快手則孵化出皮艇,巨頭入局讓一向平靜的播客市場迎來前所未有的熱鬧。隨著QQ音樂與網易雲音樂在近期試水播客功能,兩大音樂平臺的入局更是為今年熱鬧的播客市場增添了新的看點。
  • 領跑行業技術創新,酷狗音樂聽歌識曲打破世界紀錄奪得冠軍
    在大賽中,酷狗音樂對測試集中的5692個嘈雜音頻片段進行識別,取得了93.17%正確率的優秀成績,超越歷年所有參賽團隊,打破了由ACRCloud在四年前創造的最高記錄(91.88%正確率),推動了全球音樂檢索技術的進一步發展。
  • 索貝中標浙江廣播電視集團中國藍雲智能平臺項目
    同時智能媒資庫將與第三方系統、節目生產製作端互聯互通,高效提供媒資服務,打破廣電傳統的業務觀念,以滿足網際網路環境下的信息激增新需求,實現全域全流程全媒體媒資高效管理。本次建設的智能媒資系統支持多租戶模式,可在中國藍雲平臺上實現獨立的租戶雲媒資系統,供市縣融媒體中心使用,進一步拓展了中國藍雲平臺的運營能力。
  • 《音頻音樂與計算機的交融-音頻音樂技術》慕課(MOOC)上線了!
    本課程以同名書籍《音頻音樂與計算機的交融-音頻音樂技術》(上/下)為基礎,面向一個新興的文理融合的交叉學科領域,即音樂科技、音樂人工智慧與計算機聽覺
  • 蝦米音樂關閉後,還有哪些好用的音樂平臺?
    2月5號將正式關閉,12年的音樂軟體要下架了https://act.xiami.com/wow/z/xiami/xiami/1215隨後網易雲音樂發布微博稱支持一鍵遷移  https://weibo.com/1721030997/JBRnWwDU2
  • 網易雲音樂引入韓版《我是歌手》獨家音頻版權
    3月17日,網易雲音樂對外宣布,已正式引入韓版《我是歌手》三季全部音頻版權,其中絕大部分為中國大陸獨家版權。至此,網易雲音樂已擁有韓國原版以及中國版《我是歌手》的全部音頻版權,成為擁有《我是歌手》相關音頻版權最多的國內音樂平臺。
  • 焦點分析|網易雲音樂、QQ音樂試水播客,大平臺能破解小眾市場的...
    2020年,騰訊音樂娛樂集團(TME)推出播客App酷我暢聽、閱文集團推出閱文聽書、字節跳動推出番茄暢聽、快手則孵化出皮艇,巨頭入局讓一向平靜的播客市場迎來前所未有的熱鬧。隨著QQ音樂與網易雲音樂在近期試水播客功能,兩大音樂平臺的入局更是為今年熱鬧的播客市場增添了新的看點。
  • 切入長音頻,在線音樂走出「圍城」?
    騰訊音樂集團CEO彭迦信曾明確表示,「長音頻將是未來TME持續發力的戰略領域」。話音剛落,各大平臺紛紛發力長音頻。網易雲在9月份切入廣播劇和有聲書市場,又於11月上線迭代最大的8.0版本,重點發力「播客」。近期,QQ音樂則正式上線「播客」獨立模塊。從爭奪版權到搶灘風口上的「耳朵經濟」,在線音樂巨頭已打響新一輪戰爭。
  • 首個搭載了華為三個雷射雷達方案的智能電動車
    華為首次面向公眾正式發布車規級高性能雷射雷達產品和解決方案。 極狐HBT是ARCFOX極狐聯合華為打造的全新高性能智能電動汽車,將搭載3顆96線車規級雷射雷達,6個毫米波雷達,12個攝像頭,13個超聲波雷達,同時搭載算力可達352Tops的華為晶片,該車型將於明年亮相發布!
  • 為什麼我不看好網易雲的音樂社區,而看好騰訊的長音頻?
    那麼騰訊與網易雲兩家基於目前的版權狀況,各自的音頻娛樂生態有什麼特點,長期看哪家具有長線優勢?一、網易雲音樂代表在線音樂社區化方向豆瓣是國內小眾音樂最早的聚集地,專注個人生活記錄展示的文藝氣質,吸引了國內小眾亞文化愛好者的聚集。
  • 百度智能雲數據可視化平臺Sugar重磅發布AI問答功能
    近日,百度智能雲BI與數據可視化平臺Sugar重磅發布AI問答功能,用戶只需將想知道的數據問題輸入至提問框,AI問答這個數據管家就可以實時地用圖形化的方式給出答案。AI問答接入了百度強大的自然語言處理(NLP)技術,依託智能對話定製與服務平臺UNIT的表格問答能力,使得用戶能像使用搜尋引擎一樣便攜靈活地查詢與分析分散於各系統的數據,成為應用即問即答的數據管家。
  • 音頻玩家深度測評:小鵬P7智能音樂座艙引領智能體驗風向標
    小鵬汽車不僅在續航和性能方面不甘落後於競爭對手,在智能體驗上也充分考慮用戶的柔性需求,其新品小鵬P7的智能音樂座艙內置在線音樂和有聲讀物,可以帶給用戶超乎尋常的新奇體驗。最重要的是,以發展的眼光看P7,這個智能音樂座艙是小鵬汽車智能生態的一部分,是構建未來式智能圖景的起點。我們可以透過智能音樂座艙,窺探到小鵬汽車在智能化的探索和成就。