日常生活中,有沒有一個旋律,存在你深深的腦海裡,但你卻怎麼也記不起歌名?現在,除了繼續絞盡腦汁拼命回憶,你還可以通過「哼唱」旋律的方式找到它,即使是方言歌曲也沒什麼問題。
日前,南方日報、南方產業智庫聯合廣州市社科院、廣州市人工智慧產業發展促進會等專業機構啟動「粵港澳大灣區AI產業深調研」。4月30日,南方日報記者實地走訪酷狗,深入了解酷狗AI「黑科技」,揭秘數位音樂的「最強大腦」。
目前,依託音頻指紋技術,用戶可通過音樂軟體中「聽歌識曲」或「哼唱識曲」這兩種「智能識曲」功能找回「被遺忘」的歌曲。「目前,正常辦公環境下,『聽歌識曲』準確率高達99%以上。哼唱識曲的效果和用戶哼唱的水平有關,哼唱不錯的情況下,識別率也能達到90%以上。」據酷狗音樂智能技術負責人介紹,當下音樂軟體中的「智能識曲」功能已基本成熟,未來AI+音樂還能幫助音樂公司提高曲庫管理效率,降低用戶的創作成本和門檻,「讓人人都有機會成為周杰倫、方文山。」
「聽歌識曲」4秒解鎖音頻密碼
伴隨著網際網路、大數據、雲計算等領域的飛速發展,近年來人工智慧在數位音樂應用方面開始了頻繁的探索,許多優質功能也被逐一開發了出來。在這之中,「聽歌識曲」及「哼唱識曲」就是AI+音樂所打造出來的最具代表的功能之一。
「目前,音頻指紋技術已經較為成熟,普通辦公環境下,聽歌識曲識別率可達99%。」據酷狗音樂智能技術負責人介紹,用戶打開酷狗音樂App的「識曲」功能,讓手機儘量靠近正在播放的音源,後臺就會迅速將該歌曲中的音頻特徵跟曲庫中的歌曲進行匹配,目前技術下,「聽歌識曲」平均識別時長僅需4秒左右。
在「哼唱識曲」方面,哼唱識別的模糊匹配會受到用戶哼唱水平的影響。在用戶哼唱不錯的情況下,識別率可達90%以上。用戶連續哼唱時間越長且哼唱音準越高,系統識別準確度越高,即使是方言歌曲也能被快速識別。據了解,酷狗音樂會藉助「識曲」技術對所收錄的歌曲中包含的音頻信息進行壓縮處理,提取出其中最關鍵、最具區分度的信息點。如此一來,每當用戶使用「識曲」功能時,酷狗音樂後臺即可憑最少的信息量完成音頻匹配。「每首歌的音頻信息都有獨特的『指紋』密碼,我們要做的就是快速篩選這些音頻『指紋』信息及歌詞信息,並完成匹配和識別。」
然而,音頻指紋技術也有一個天然的「敵人」,那就是噪音。由於用戶開啟「哼唱識曲」或「聽歌識曲」功能的環境多種多樣,因此在設備識曲時很難避免噪聲對識別準確率帶來的消極影響。目前,酷狗音樂自行開發的「智能去噪」技術已能對部分現實環境中的噪音進行平滑處理,「淨化」效率和效果也在不斷優化。對此,酷狗音樂正計劃開發AI智能環境識別等功能,未來根據用戶環境的不同,可為用戶在識曲時提供不同的去噪方案,「比如在汽車站識曲,後臺技術可支持智能去除車流的噪音;在浴室識曲,能夠智能去除回聲等。」
酷狗「AI智能推歌」很「懂你」
除「智能識曲」外,「AI智能推歌」也是AI+音樂的核心應用之一。「一首歌裡往往包括情感、曲風、聲學特徵三類信息,把這個信息匯總成信息庫,我們就能「讀懂」用戶的喜好,並為他們智能推薦歌單。據介紹,基於音頻特徵分析技術以及音頻特徵推薦模型,酷狗音樂可通過用戶收藏的歌曲和平時的聽歌喜好為用戶智能推薦「每日歌單」。
記者在使用時發現,酷狗音樂的「每日歌曲推薦」功能每天會為用戶推薦30首歌曲,並根據他們的喜好差異智能篩選出古風、歡快、搖滾等不同曲風的歌曲,「用戶使用這一功能的頻率越高、時長越長,推薦也會越準確。」
然而,由於AI+音樂仍處於發展的初級階段,各個音樂平臺研發的智能推薦技術「百花齊放」,行業內對於音頻信息的分類方法等仍然缺乏一套統一的標準。「但不可否認的是,推薦算法是AI+音樂重要的應用方向之一,今後隨著行業的進步,規範也會逐步建立起來。」
未來「AI+音樂」讓人人都是周杰倫、方文山?
儘管目前AI+音樂正處於快速發展的階段,但AI目前在音樂產業的應用仍然需要基於統計和深度學習技術,「AI+音樂現階段仍然離不開模仿和統計模型」。這位負責人告訴記者,當下AI缺乏「常識性」思維,在音樂創作能力和邏輯思考能力方面與人類仍有一定距離。未來,隨著技術的發展、成熟,AI不僅應具備「識曲」、「推薦」等基礎能力,還應當承擔起「智能創作」的任務,充分降低用戶的音樂生產門檻及成本,實現「人人都能做原創」,真正激活音樂創作的活力。
「『AI智能作曲』是用戶可以期待的功能。未來用戶隨機輸入一段旋律或歌詞,人工智慧就可以根據詞曲風格智能補足整首作品,或給用戶提供修改建議,幫助他們學習音樂創作技巧。」他表示,今後在AI的幫助下,音樂產業極有可能迎來全新的樂曲風格和創作方式,許多因音樂學習、製作門檻過高而打消創作念頭的用戶也將獲得新的機遇。「AI+音樂是一種趨勢,儘管還處於發展初期,但今後它的發展潛力確實不可小覷。」 (內容來源:南方+)
(免責聲明:中國青年網轉載此文目的在於傳遞更多信息,不代表本網的觀點和立場。文章內容僅供參考,不構成投資建議。投資者據此操作,風險自擔。)