「生命,宇宙以及一切的終極答案是什麼?」
1979年,道格拉斯·亞當斯發表了讓他日後名垂青史的科幻小說《銀河系漫遊指南》。在這本小說中,他描繪了一臺名為「深思」(Deep Thought)的超級人工智慧——它的使命,便是解答上面的問題。
經過整整750萬年的運算,這臺遠超一切造物的人工智慧給出了結果:「答案就是42。」
無法解釋的荒謬答案,既反映著整個宇宙不會被人賦予意義的本質,也在一定程度上代表著世人對科技的看法:人工打造的科技,可不一定具備真正的「智能」。 今年一過,這位老先生就已駕鶴西去20年,但相較於「深思」,科技正在改變著我們的日常生活體驗,甚至在某些領域,讓我們甘拜下風。
不過,今天要講的並不是人類如何再次被科技「擊敗」,而是一個有關於「欣賞」和「辨別」的故事。
緣起:科技遇見音樂
光聽「人工智慧」這四個字,冷冰冰的感覺就湧上心頭。它不像你隔壁工位坐著的Steven Liu,在我們的認知中,它無法動用情感,更別提去鑑別,欣賞一幅畫,一首歌的美。
真是這樣嗎?
幾年前,身處新加坡科技設計大學從事音樂研究的一位熱愛音樂的科研工作者Dr. Simon(以下統一稱「雷教授」),已經開始思索這個問題:AI究竟能不能與音樂領域進行結合,碰撞出絢爛的火花?在研究的過程中,他也發現自己缺乏機遇:「沒有太多人做這個領域(AI與音樂),而我的研究成果,也很難切實地幫助音樂人。」
在2600公裡外的深圳,一群人也正在對相同的想法大搖其頭。Ben曾在偶然間發現「以往唱片公司通過人工聽Demo,來決定哪首歌值得推,但Demo的數量遠遠超過人工能聽的數量,導致很多歌從來沒有被聽過而被埋沒,十分可惜。」這一現象激發了他的思考,如果用不知疲倦的AI算法去評價歌曲,效果會怎樣?但Ben身邊的同行都不看好:「(他們認為)音樂是藝術,難以用科學或是算法去衡量它的質量。」
除了選擇音樂,在Ethan眼中,通過科技讓聽者獲得更好的音樂體驗也變得越發重要:「經過多年的技術發展,音樂技術已經從純信號處理向AI轉變。」這就意味著,科技將是改變每一位聽眾日常聽音體驗的關鍵要素,「但(相關技術)在國內音頻行業還是存在空白。」
三個人的問題其實異曲同工:如何用AI算法,鑑別、推送更為「動聽」的歌?如何藉助科技,全方位讓聽者及音樂人的音樂生活變得更美好?
或許是緣分,亦或是因為心中久久揮之不去的「執念」,念念不忘終有迴響,2018年,三個人的軌跡開始串聯在了一起。當年,騰訊音樂娛樂集團(TME)CEO彭迦信去新加坡開會,遇到了雷教授,兩人互相交流了自己對音樂的見解。雷教授發現,彭迦信的想法和自己不謀而合:「他跟我說,騰訊音樂的夢想,不只是做音樂播放器,更是要打造一個豐富、良性的音樂生態,讓音樂進入生活的每個場景,讓音樂人擁有體面的收入和生活,這一點深深打動了我。」相比於教授的身份,雷教授本身也是一位音樂人,「我在大學時期,曾在餐廳做過駐場的小提琴手,深知音樂人的不易。」
面對TME拋來的橄欖枝,雷教授並沒有顧慮太多,他加入了TME,從成為QQ音樂多媒體研發中心負責人的那一刻起,如何用科技改變音樂人及億萬用戶的方方面面……太多想做的事情縈繞在他腦海,他充滿興奮和期待,甚至讓他在入職的第一天就把行李落在了計程車上。
同年,曾在王者榮耀項目上率領AI擊敗人類冠軍戰隊的Ben,也如約加入到團隊之中,擔任多媒體研發中心創新組負責人。也正是在這裡,他們遇到愛朗聲說笑話的基礎開發組負責人Ethan——上文提到的三位「現代工匠」和他們所率領的團隊,從此將共同致力於用科技逐步改變每一位聽眾的音樂生活。
匠心:讓AI學會「聽」歌
一首歌,是怎樣送到聽眾耳邊的?
除了人工篩選,隨著流媒體平臺普及和技術進步,大家開始習慣通過播放量來選聽歌曲。「這種方式會造成鮮明的馬太效應,熱歌只會越來越熱,但0播放量的歌,(播放量)可能永遠是0。」雷教授認為業界此前通用的技術,並沒有解決音樂人的難題。
想來想去,方法其實也很簡單:為AI注入溫度,讓AI學會鑑賞歌曲,利用其對海量數據的高速處理能力,輔助人工篩選,讓有才華的作品不被埋沒。
和世間的道理一樣,都是說來容易,做起來難。AI的數據處理能力,要建立在對歌曲細顆粒度「標記」上,在這個層面有兩個難題,如何對一首歌曲進行評價,維度該如何定?作為一項「藝術」,音樂的喜好沒有恆定標準,AI的篩選,是否能說服眾人?
在想法落地的過程中,Ben拉上了他的同事Moyan, 從曲風、歌詞、音色、演唱者唱腔、到後期製作與編排等,為AI制定了詳細的評判維度——QQ音樂科技團隊雖然大多出身技術,但大家都同樣愛好音樂且具備一定的專業音樂素養。再加上QQ音樂數以億計的海量大數據,讓AI學習有了最重要的數據參考。
「當時我們都不知道要花多久,但它一定得做出來,讓優秀但暫時沒名氣的音樂作品和音樂人不再被埋沒,就是懷著這樣的信念堅持著。」靠著過硬的技術,與對音樂的深度了解,再加上多版本的迭代和打磨,Ben的團隊推出了一項名為Predictive Model(PDM)的自研技術。
通過PDM,即使是0播放量的冷啟動音樂作品,AI也能根據音頻和歌詞內容給予充分且匹配的受眾識別與推送曝光,讓歌曲得以更高效、精準地覆蓋到適合的目標人群。換句話說,就是AI能夠辨別「欣賞」歌曲,並將符合用戶喜好的歌送到億萬樂迷耳邊。AI就相當於一位慧耳識音的「伯樂」,找到好內容的「千裡馬」,並且把「千裡馬」精準地送到會喜歡它、欣賞它的人身邊。
雖然對於技術的細節不是特別了解,但資深樂迷王小毛就對PDM感觸頗深:「最近在QQ音樂上,聽到不少新歌手的新歌,而且這些歌質量都非常高。像是此前火爆全網的《微微》,聽說就是由AI技術選出來的,著實讓我感嘆了一下科技的力量。」
其實在PDM落地後,已經有數十首歌曲借其「獨具慧眼」的挖掘實現「爆紅」。 不僅是《微微》,《收斂》《厚顏無恥》《忘川彼岸》以及近期悄然走紅的《失控》等「國民級」歌曲,都得益於PDM技術的「鑑賞」,才步步「刷屏」全網。當然,億萬像王小毛一樣的樂迷,也在這個過程中發現了自己喜歡的更多類型的新歌。
得益於QQ音樂PDM技術的多首熱歌
除了用AI「欣賞」歌曲,科技也在Ethan團隊的手上,化為了找尋陌生好歌的「必備神器」。2013年上線的QQ音樂聽歌識曲技術,就一直以「穩準狠」著稱。「在看一段廣告時,可能吸引我們的並不是廣告產品本身,而是它的配樂。又或者我們非常想要知道電影背後的歌曲是什麼。」Ethan回憶起當時建立聽歌識曲團隊的初衷。
但在2019年初,聽歌識曲團隊也迎來了新挑戰。團隊成員Lester收到用戶們的反饋,稱原唱版本的歌曲都是秒速找到,但翻唱版本的歌曲卻難以識別。這在當時是一個全新的命題,由於音樂模式的逐步豐富,越來越多的歌曲有了各色翻唱版本,用戶們除了找原唱,對找翻唱、改編版本的歌曲也有很大的需求。
聽歌識曲1.0版本的識別原理,主要是「聲紋識別」,就像每個人都有自己的指紋一樣,歌曲和聲音同樣也擁有自己專屬特徵的「聲音指紋」,聽歌識曲可以通過識別一小段音頻的聲紋,就能找出對應的歌曲,這對於尋找原版歌曲可謂無往而不利;但對於翻唱版、現場Live版等版本,由於聲紋的變化,確實難以識別。
針對這一問題,Ethan和隊友開始計劃將原有的聽歌識曲技術拓展到2.0版本,並成功實現「模糊識別」,目的是為了讓在看劇、看綜藝、刷短視頻或者身處在一些小型Live現場時,卻苦於找不到當時入耳的那首歌的樂迷,能輕鬆找到自己心儀的歌曲。「至今還記得,其中有一首歌叫《一曲相思》,就花了很多努力才實現可測。」Ethan團隊對於當時的「攻堅經歷」記憶猶新。
功夫不負有心人,經過一年艱苦的研發攻堅,業界首創的聽歌識曲2.0「翻唱識別」橫空出世,領先行業,一騎絕塵。通過智能AI,它不僅能識別短視頻、綜藝裡的多輪翻唱歌曲,還能識別Live、直播等諸多場景,精準匹配度大幅提升。
值得一提的是,團隊還製作了「離線系統」的小彩蛋,在歌曲第一次未能成功識別後,系統會在一周之內自動向全曲庫發起請求,識別成功後,用戶會收到聽歌識曲小助手的反饋提醒。匠心換得真心,「他們(用戶)的反饋特別好玩,收到私信後會驚訝地問,聽歌識曲後臺是不是有人工一直守著,是不是員工偷偷識別出來的。」團隊成員Jerry笑著說。
有好幾次,Jerry在看電影時發現前排觀眾的手機屏幕亮了,界面顯示的正是在使用QQ音樂聽歌識曲,「那時候的感覺,可能就是標準的幕後英雄。」聽得出Jerry的自豪感。
QQ音樂聽歌識曲功能
讓AI學會欣賞、辨別每一首歌,對樂迷的好處顯而易見:聽見更多好歌,不會錯過任何一首喜歡的歌。但在音樂創作層面,技術的革新,還將帶來更加深遠的影響。
改變:當技術服務於藝術
「在PDM誕生之初,我們也曾請新生代歌手帶著音樂作品來做內部測試,發生了一些很有意思的事情。」Ben介紹。
「參與測試歌手」就有應嘉俐,不少聽眾都聽過應嘉俐的《涼茶》《那又如何》:「當時正好是國際Discovery頻道團隊來對QQ音樂『黑科技』進行訪問,我和我的新作品體驗PDM系統的經歷也有幸被拍攝見證。」在這次PDM的打分測試時,應嘉俐帶來了兩首全新作品《神遊星期天》和《上山來》。
「我一開始覺得,《神遊星期天》的分數不會比《上山來》更高,因為前者帶著我更多的個人印記,而《上山來》是一首命題作文,是為電影創作的插曲,編曲配樂都更加偏向流行。」應嘉俐告訴刺蝟公社(ID:ciweigongshe)。
但PDM判定的結果卻出人意料:認為《神遊星期天》的旋律更朗朗上口,更適合向受眾推廣。她對此感到十分驚訝,「打動我的也是打動PDM的一個因素,但是這個想法我並沒有告訴過PDM團隊」。
原來,《神遊星期天》的旋律雖然安靜平緩,卻讓她傾注了非常深厚的感情,而《上山來》對她來說,更像是一篇「命題作文」。「超出我想像的是,PDM好像特別了解歌手創作時的情緒和微妙的思考似的,PDM在對歌曲情感的判定上,《神遊星期天》的分數也要高很多,這跟我自己的情感感受很一致。」
這次打分,也讓應嘉俐開始重新審視技術。作為專業音樂人,她在打分之前對技術總是抱有疑問:「單從音樂技術上而言,就有非常多細化的標準,AI能夠做到專業嗎?」在看到QQ音樂的後臺系統後,她的想法大為改觀:「評價一首歌的所有細分門類和專業技術,(PDM)都有完整的體系了。」
但讓應嘉俐感觸最深的,還是經過PDM的打分,讓她更明白在創作上,要保持自己的初心,延續自己的風格,這才是創作的本質。
讓音樂人能夠不受限制地表達內心,同時又讓這些表達能夠走進億萬樂迷耳邊,「有了這些好的案例,這讓我們對技術有了更大的信心。通過PDM技術去找出滄海遺珠,酒香也怕巷子深,我們要找到懷才不遇的好音樂和音樂人,給他們更好的機會。」雷教授說。
其實,經過多年深耕,QQ音樂已走出了一條深受認可的「科技匠心」之路。2019與2020連續兩年,在國際音樂學術界公認的最權威比賽——國際音頻檢索評測大賽(MIREX)上,QQ音樂(PDM) 技術團隊不僅在「預測識別(Patterns for Prediction)」中取得突破性結果,一舉打破世界紀錄。同時,QQ音樂的「聽歌識曲」等音頻技術也奪得兩項世界冠軍,三項成績打破世界紀錄。當時連小馬哥都在朋友圈為產品獲獎成果點讚,這在內部相當罕見。
除了在國際頂級技術舞臺上拋頭露面,QQ音樂還推出了「銀河音效」,將用戶「聽」的體驗全面升級,同時上線了全新黑科技「定製音效」——通過用戶耳形特徵和聽覺特徵的智能化分析,打造「私人訂製」體驗。最近,銀河音效又「上新」了針對揚聲器聽音的「外放環繞音效」和「車載定製音效」。編輯部的黃湘就絲毫不吝惜對音效體驗的讚美,「前者能夠省下一個小音箱的錢,而後者則是駕車出遊聽歌必備。」
QQ音樂「銀河音效」上的「定製音效」
不僅在音樂實用技術上,QQ音樂多媒體技術團隊更是在科技向善的「科技+溫度」這條路上一路狂奔,基於當下年輕人對聽書這一「耳朵經濟」的進階需求,QQ音樂已獨家研發並最新上線行業首個「AI有聲書」功能,尤其是語音合成AI主播「Q音電臺bot」,是業界首個可以朗讀出極具情感表現力的嗓音,第一個成功用「黑科技」表達「聲音中的細微情緒」,為用戶提供更加聲臨其境的有聲書體驗。
13世紀,義大利畫家借用更加巧妙的化學,大幅改良了一種名為「溼壁畫」的繪畫方法,讓牆壁上的繪畫能夠保存得更久,色彩更靚麗。得益於新興的技術,當時的畫家們可以用更加新穎的主題,在大面積牆壁上繪出栩栩如生的人物。近200年以後,米開朗基羅、達文西相繼用同樣的技術,繪下了他們的傳世名作,成為文藝復興運動的「最高瑰寶」。
這個例子看似和音樂界沒有關係,但科技和藝術創作從未分開,隨著科技的革新,堅持科技向善,憑藉「科技+溫度」的藝術創作將可以用全新的方式釋放美——或許可以想像一下,在QQ音樂科技的步步「升溫」之後,會不會讓音樂創作,乃至我們每個人的音樂生活產生翻天覆地的變化?
將要發生的一切改變,值得拭目以待。
文章來源於「刺蝟公社」,作者:刺蝟君
(文中王小毛、黃湘為化名)
聲明:本站轉載此文目的在於傳遞更多信息,並不代表贊同其觀點和對其真實性負責。如涉及作品內容、版權和其它問題,請在30日內與本網聯繫,我們將在第一時間刪除內容,本網站對此聲明具有最終解釋權。