編者按:本文由微信公眾號「將門創投」(ID:thejiangmen)編譯,來源:PLAYBOY,36氪經授權發布。
日前,美國自由筆者Aaron Carnes走訪了谷歌大腦、加州大學Santa Cruz分校等從事AI和音樂結合領域的研究工作者,在切身感受了他們的日常後,記錄下了這幾個有意思的故事,讓吃瓜群眾也可以瞥到當AI進入音樂圈時,到底是令人恐慌還是充滿期待?
一這個名叫Jesse Engel的哥們兒最近正痴迷於讓自己的電腦變成一個音樂家。他30多歲,個子很高,鬍子拉碴還留著齊肩的頭髮,喜歡穿緊身牛仔褲,白色的T恤上還有萬花筒的設計…這些元素加起來,你可能也會覺得他應該是一個漂泊的貝斯手,和「谷歌研究科學家」的身份差著十萬八千裡…
Engel他們位於谷歌舊金山辦公樓五層的辦公室,其實也是一個設備齊全且精良的音樂工作室。了解谷歌Magenta項目的人都知道,這是一個利用人工智慧和機器學習來創作藝術的項目,同時為開源人工智慧平臺TensorFlow的用戶簡化這一過程。Magenta提供給用戶可以修改的代碼,包設計類似於人類大腦神經元的人工神經網絡,並預先進行各種任務。它還為創作型藝術家和技術人員提供了一個分享自己實驗的社區。
谷歌高級研究科學家Douglas Eck從15年開始設計Magenta項目,16年正式對外發布。他今年已經48歲,但看起來仍像個孩子。
沒錯,我們幾個人湊到了一起,正打算舉行一場即興演奏會。這本不是計劃中的事情,Eck和Engel屆時將會為我和我的朋友、樂隊成員Adam Davis演示一些demo。但Eck似乎對這事很隨意,如果想更好的去了解Magenta項目,還有什麼比和它一起創作更好的呢?
我站在電子鼓後,Davis抓到了一個擋板,Eck在鍵盤後面,一直想帶起節奏。在特雷門琴(theremin, 是一種不需要接觸而演奏的樂器,你可以像巫師一樣揮舞著你的手控制它)是Kory Mathewson,是谷歌暑期項目的實習生,因為他把他的空閒時間都花在了研究機器人來表演即興喜劇,Eck笑著偷偷告訴我,這也是當時為啥會讓Mathewson來這實習的一個考量。
最後要介紹的就是我們這個臨時組建的樂隊的最後一名成員——A.I. Duet,它正是使用了Magenta技術的應用程式。當你在附加的鍵盤上彈奏一段旋律,程序會根據音符的選擇、節奏、切分音和以前聽到的音樂來識別整體模式。然後它會自動計算並幫你「補完」旋律的重奏部分,幾乎可以實現「一呼一應」的演奏模式。我們所使用的內部版本可以通過設置「溫度」來控制響應的隨機性:當Engel選低音吉他模式,開始即興創作旋律;當Engel聽到了他喜歡的回應,就把設定下來。他拿起了一個黑色的Gibson Les Paul電吉他,然後演奏就這麼即興開始了。
猜猜我們都是誰~
我們的設想還是很不錯的,但令我印象深刻的是人工智慧在二重奏中彈出的低音線。如果我們是一個真正的樂隊,我相信我們也會這樣創作下去。音樂家們經常掙扎於沒有新的創作靈感,這個程序似乎會成為他們創作的源泉。
「這就像在房間裡有另一個音樂家。」 Davis說。他也參與了二重奏。當他開始演奏樂器時,他開始在原來的音線外著色,這讓我們的樂隊成員感到十分興奮。(「我們真的很期待看到人們如何打破這種局面,」Engel說。)隨著他不斷「升溫」,就產生了一種狂躁的、嚇人的旋律,與他當初輸入的東西幾乎完全不一樣。比如,他給了一個「一閃一閃亮晶晶」的節奏想看看會發生什麼,在極致的溫度下,變成了一首在糟糕旅行中的聖誕曲。
「技術對藝術來說非常重要。」Eck說。試想如果把你的吉他拔掉和弦。現在把它插入這個很棒的電吉他,你會很依賴技術來完成這項工作。他補充道,他們所做的類似於建造一個更好的吉他踏板,甚至就是一個電吉他。至少希望是這樣。現在,他們還不確定這項技術將如何影響音樂,或者它是否會被使用。這我想起了Auto-Tune,這是一種錄音軟體,它一開始是為平淡的流行音樂校正音軌的音軌;後來T-pain和Kanye West這樣的說唱歌手,就不再用它了,而是發揚了它的特點,創造出一種新奇的聲音。
不管AI的音樂生成技術如何,Eck覺得這將是不朽的。「我們將跟隨音樂家,如果有人發現我們正在做的事情,又做了一些更了不起的,我們可能會邀請他加入一起創造更多。」
聽著Eck,我可以明顯感到他的大腦就是為了探索算法而生的,同時對音樂的熱情,引領著他用技術來開發這種給各類音樂家使用的工具。當我問他關於他自己的音樂追求時,他略帶羞澀地而我分享了他在咖啡店彈吉他的美好經歷,而我則訝異於他並沒有把自己創作的最佳時期花在成堆的合成器裡。
二人工智慧和音樂的結合其實已並不是什麼新鮮事。20世紀50年代,先鋒作曲家Lejaren Hiller和Leonard Isaacson用電腦寫了一首「Illiac Suite」。 該樂譜包括了按照某些音樂原理統計生成的音符,例如諧波相互依賴,並基於作曲家對傳統音樂的知識規則合成。
直到最近,AI輔助音樂還主要停留在學術界。現在谷歌、索尼、IBM和其他公司都成立了相關的大型研究項目。還有像Jukedeck這樣的初創公司,它利用人工智慧為視頻生成廣告和背景音樂。Brain.fm提供功能性的人工智慧合成音樂,來幫助用戶放鬆、專注、和促進睡眠等,該技術已經開始盈利。
不同的項目也都看到了類似的結果,但大家都有自己的小算盤。谷歌正在為藝術家設計工具,設計開放式的實驗項目,目的是激發創造力。Jukedeck把它的資源集中在工具易用性、市場營銷以及尋求節省視頻配樂的成本。Jukedeck的聯合創始人Patrick Stobbs告訴我,公司希望擴大其客戶基礎,包括任何對製作音樂感興趣的人:它希望使用這項技術來幫助那些想要成為音樂家的人,在不學習演奏樂器的情況下就可以創作歌曲。
他說:「就像Instagram讓不是專業修圖的我們更容易創作出很棒的照片,我們把Jukedeck看作是一個創意工具,讓更多的人輕鬆地製作音樂,並擁有更多的動力。」
大約十年前,一些使用類似人工智慧技術的音樂軟體應用程式就已經出現了,其中大多是令人沮喪的結果。微軟的自動編曲軟體Songsmith在阿卡貝拉聲道上生成卡西歐鍵盤式的伴奏。這個節目激發了無數搞笑視頻的靈感,例如,Freddie Mercury的「We Will Rock You」的表演,聽起來特別像含糊的拉丁Muzak音樂。
從那以後,儘管技術和品味還在繼續發生著衝撞,但事情已經開始發生著翻天覆地的變動。從去年開始,在不久的將來,全世界都能看到人工智慧生成的音樂將會是什麼樣子。製片人Alex Da Kid與IBM Watson超級計算機合作,創造了一個朗朗上口的情感歌謠「Not Easy」。 Watson使用了5年的文化數據,包括新聞標題、網際網路搜索、電影概要和社交媒體內容,來分析他們周圍的趨勢和人們的情緒。它還處理了超過2.6萬首流行歌曲,尋找共同的主題和音樂模式。利用這一信息,超級計算機確定了近代歷史的「情感脈絡」,以及可以引起聽眾強烈情感共鳴的音樂元素。然後Alex用這些數據來選擇心碎的主題,以及他喜歡的音樂短語和抒情片段。
隨著獲得了格萊美的提名,他們又合作了創作了一首更廣域的歌曲。「Not Easy」在48小時內到達iTunes熱門歌曲排行榜上的第四名,它基本是被遺忘了,但還好還有它背後的故事。原本試圖吸引數百萬聽眾的情感溫度,似乎並沒有表達出來。和Auto-Tune的對比再次出現了:在那些追求完美流行音樂的人手中,AI可以通過數位化的方式實現其最終的成功。
2012年夏天,在歐洲研究委員會(European Research Council)的資助下,索尼計算機科學實驗室(Sony CSL)開始了一個為期5年的項目。結果介於歌曲「Not Easy」和Magenta項目之間。自上世紀90年代以來,計算機科學家、爵士樂和流行音樂家、索尼CSL的導演Francois Pachet一直在做與音樂和人工智慧有關的研究。他和他的團隊與藝術家們的合作比谷歌更直接,他們的目標是用一組更著重輸出的名為「Flow Machines」的算法來創造出全新的流行音樂。
去年9月,由Flow Machines協助完成的歌曲「Daddy’s Car」大火。這首和法國作曲家Benoît Carré一同完成的歌曲聽上去非常像上世紀60年紀中期Beatles的風格。有可能為了創作這首歌曲,Flow Machines聽了非常多Beatles的歌曲。
索尼CSL傳播部的工作人員Fiammetta Ghedini表示:「Daddy’s Car其實有一點像是模仿作品。這是對歌曲風格的一次嘗試。如果Beatles能夠再現江湖的話,你應該能夠感受到是什麼風格。」
Flow Machines對「風格」的理解是依賴於數據的,這意味著你用特定的音樂來訓練它,它就會預測創作音樂的人是想要這種風格的音樂。換句話說,它只根據所選的數據集和程式設計師設置的約束來理解音樂的規則。在創作Daddy’s Car的時候,Flow Machines給了Carré幾個Beatles式旋律和和弦的建議。
為了幫助我理解Flow Machines的藝術潛力,Ghedini向我介紹了一首Carréet 用這個軟體創作的相對不太火的歌曲,叫做「Mr. Shadow」。這首歌的訓練數據集由包括Cole Porter,George Gershwin,Richard Rodgers和Vernon Duke 在內的經典美國詞曲作家的429首歌曲組成。我一連聽了好幾遍,我能給出的唯一感受就是:令人不安的前衛流行樂。和弦序列是幽魅的,旋律又夢幻和又來勢洶洶。Youtube上有一個評論:「幾十年後,當終結者用加特林槍殺死人類的時候,這真是一首再好不過的背景音樂了。「我不知道我是否喜歡這首歌,但我覺得這讓我看到了一種不同的音樂,而且我想要聽更多這一類型的歌曲。」
2016年,在巴黎舉行了一場由多名音樂人和Flow Machines共同編曲音樂會。這些作品從藝術的角度來說都是十分迷人和獨特的,甚至比Alex Da Kid的歌曲更有趣。Carré希望在今年晚些時候發行他和Flow Machines共同發行的音樂專輯。其他藝術家可能也會效仿。
谷歌一直與藝術家們開展著克制的合作。Eck更傾向於將他的工具應用於實驗音樂,而不是大量生產熱門單曲,或者製作功能性背景音樂,儘管這些都是潛在的大市場。(Jukedeck在創建一個無限制的免費視頻歌曲庫方面取得了巨大的進步,這將有利於製作預算,但對作曲家不利。)他希望能影響音樂的藝術方向。他認為,最好的方法就是給那些可能不符合主流品味的前沿藝術家提供工具。
Eck告訴我:「我們應該積極地嘗試製作並不是每個人都喜歡的音樂。總有一些新奇的效果,你會得到一些新的和瘋狂的東西。就像從麥當娜到碧昂絲那樣的巨星們從邊緣地帶獲得靈感一樣,未來的流行歌手們也會把輔助地下藝術家的創新編織進他們的MOR圖表上。
自上世紀80年代中期以來,英國的一位教授Eduardo Reck Miranda就一直參與這一領域的研究。在他的內心深處有一個特殊的地方,那就是人工智慧能夠照亮的那些奇怪的縫隙。
Miranda出生在巴西,之前曾是一名作曲家,但卻對用科技來輔助音樂創作這個領域情有獨鍾...他告訴我為了創作《傾聽的交響曲》,他開發了人工智慧軟體,將貝多芬的第7交響曲重新組合,用大腦掃描來解構人們聽音樂的方式。
「機器真的能做到嗎?在最開始的時候我們也問過這個問題。但是,當我們意識到機器可以做到這一點的時候,我們發現原來的音樂是多單調乏味。然後我們就開始想如何才能讓這些機器做些有用的事呢?」
三關於AI是否能用於音樂創作的爭議大都是在Miranda、Eck和Pachet的實驗之前。而這裡又不得不談到一個人——David Cope,一個現代的神秘主義者,他可能比任何人都更了解人工智慧和創新大腦之間的關係。
Cope擔任加州大學Santa Cruz分校的教職長達30餘年時間。這位現年76歲、說話輕聲細語的前教授還在繼續創作音樂並進行其他藝術創作,主要在用人工智慧。
當我走進Cope舒適的位於Santa Cruz的家的樓梯時,他發出警告:「為你生命中真正的古怪時刻做好準備。」沒有進一步的解釋,他打開辦公室的門,露出一個房間,與房子的其餘部分形成鮮明對比,完全是一片混亂。吊在天花板上的是幾十個風鈴。書籍和隨機的物體到處亂扔,仿佛它們剛從龍捲風中倖存下來。在房間的中央是一輛健身車。
David Cope
他告訴我,這種混亂是有意為之的:這使他能夠看到任何兩個物體,並試圖找到它們之間的關係。就像他的軟體是為音樂而生的一樣,這種混亂是一種創造性的提示,它利用了隨機性的驚人力量。他說了很多關於這些原理的基本原理。
他十幾歲就開始寫算法了。他寫了大約100本書。在這些書裡,早在1977年就有計算機生成的音樂的內容。1980年,他開始了一項名為「音樂智力實驗」的長期項目。上世紀90年代,他又開始開發了一個名叫「Emily Howell」的新項目。這是一個以人的名字來命名的項目,部分是為了刺激一下那些聲稱機器將把人類作曲家趕出工作的反對者。 「機器做我們告訴它們做的事情,它們沒有自我意識。我把人工智慧定義為利用計算機來了解人類大腦及其工作原理的研究。僅此而已。」
Cope讓我猜猜作曲家在創作的時候都會做些什麼。我其實並不了解。
Cope表示:「我們創作的時候,其實是在借鑑。這意味著算法中最重要的部分根本不是算法。而是一堆音樂。」我把這解釋為藝術家們在創作自己作品的過程中會拼湊旋律、情緒和風格。Cope意識到計算機需要以同樣的方式運作。
1988年,他使用數百個他自己的音樂的例子創建了一個數據集。在大約24小時內,他與的程度Emmy就創作了《搖籃墜落》這首曲子,這是他所寫的最好的音樂作品之一。他說,聽《搖籃墜落》和Emmy創作的曲子證明了他的結論,作曲家們都是在借鑑。
我認識到Google和Sony正在使用的深度學習,其實是對Cope數據依賴方法的直接擴展。Miranda對此深表贊同,但他補充說:「這種方法是不完整的,這也是為什麼他的創作過程一直都是實驗性的。」
「一個人工智慧軟體不能完全體現我們如何製作音樂,」Miranda說。「我們能做的最好的事情就是把問題縮小到具體的方面。」
這又導致了創造性生成模型中固有的讓人傷腦筋的事:人工智慧音樂沒有明確的成功標準。由於機器學習技術的發展,語言翻譯軟體近年來突飛猛進。我們都同意這是多麼成功,因為結果是客觀的。但是,我們如何去贊同人工智慧軟體的成功所產生的音樂價值呢?通過在基層的流行度嗎?好評?Eck和他在Google的團隊通過藝術家的持續興趣來定義它。當音樂家們在最初的新鮮感消失後繼續使用這些工具的時候,就是人工智慧在這個巨大而混亂的音樂王國中永久佔據一席之地的時候。
結 語在我們採訪結束離開Google後,Davis和我討論了這次的採訪經歷。「我喜歡看到事物開始瓦解。在某些時候,它會脫軌。它不知道如何處理它被給予的信息。而這恰恰創造了真正有趣的音樂。」
許多藝術家和音樂愛好者都很害怕人工智慧技術會讓誠實的人失去工作,同時把創造力拖到最小的公分母上。但Davis卻很想要看到混亂的局面發生,那些出現裂縫正是像Eck、Engel、Miranda和Pachet等創新者所期待的。但,電腦也會犯錯,就像我們一樣。而我們將賦予人工智慧的那些奇怪的、不完美的、不可預測的人類本能,正是重新定義音樂的動力。