AI也能作曲!OpenAI神經網絡能生成任何流派音樂

2020-12-22 環球網

本文轉自【網易智能】;

網易智能訊5月14日,據外媒報導,人工智慧(AI)技術生成的音樂會給人以非常奇妙的體驗,這其中有兩個原因:第一,這是個非常吸引人的全新領域;第二,我們真的不知道它會走向何方。然而,AI技術實際上在音樂和商業上的應用都很有趣。

由諸多矽谷大亨聯合建立的AI非營利組織OpenAI,通過平克·弗洛伊德(Pink Floyd)、埃拉·菲茨傑拉德(Ella Fitzgerald)、2Pac等風格的歌曲創作,揭示了AI在音樂領域的全新應用,結果令人驚嘆。只是,有時候這些曲目聽起來很像許多流行音樂的醉酒卡拉OK版本。

OpenAI最近剛剛發布了音樂生成系統Jukebox,並在博客文章和論文中詳細介紹了該系統。該組織網站上稱,Jukebox是個神經網絡系統,可以生成各種流派和藝術家風格的原始音頻。

OpenAI還發布了Jukebox背後的代碼,以及一個用於探索生成音樂示例的工具。該組織承諾提供12分鐘的閱讀時間和10天的收聽時間。這是一筆不錯的交易。

Jukebox背後的科學非常有趣。為了實現上述目標,研究人員使用原始音頻來訓練模型,作為回報,模型也會生成原始音頻。為了讓該系統發揮作用,研究人員首先使用卷積神經網絡對原始音頻進行編碼和壓縮。

在那之後,他們使用所謂的變壓器來生成新的壓縮音頻,然後對其進行上採樣,將其轉換回原始音頻。通過這樣的做法,神經網絡會生成以前不存在的新歌曲。

通過流派、藝術家和歌詞作為輸入,Jukebox能夠輸出從零開始創作的新音樂樣本。舉例來說,如果你選擇了經典曲目《Never Gonna Give You Up》,Jukebox就會試圖不斷地生成更多類似風格的歌曲。

通過Jukebox Sample Explorer,我們可以瀏覽來自眾多藝術家的近8000首生成的曲目,這其中包括器樂和歌詞。如果有人已經聽厭了自己最喜歡的藝術家的所有歌曲,這對我們來說可能是一座新的「金礦」。

OpenAI團隊繼續致力於根據不同類型的啟動信息,如MIDI文件和STEM文件來生成音頻樣本。通過這種方式,他們認為自己將能夠讓音樂家對未來幾代人有更大影響力。這可能是一次會永遠改變音樂文化的嘗試。 (小小)

相關焦點

  • AI 也能作曲!OpenAI 神經網絡能生成任何流派音樂
    5月14日,據外媒報導,人工智慧(AI)技術生成的音樂會給人以非常奇妙的體驗,這其中有兩個原因:第一,這是個非常吸引人的全新領域;第二,我們真的不知道它會走向何方。然而,AI技術實際上在音樂和商業上的應用都很有趣。
  • 不會樂器也能作曲?AI開啟智能音樂創作|智周報告核心版
    智能音樂創作利用機器學習和神經網絡,能夠對音頻信號進行有效的處理,把握其中的關鍵特徵,從而生成出一大批各具特色的機器合成音樂,不僅能夠作為藝術家的靈感,還極大的充裕了市場,更解決了部分非音樂從業者對原創音樂的渴求。
  • AI也能作曲?誰來定義AI的freestyle?
    去年2月,第一部由算法創作的音樂劇《Beyond the Fence》在倫敦上演,獲得較高評價;6月,Google研發的機器學習項目Magenta通過神經學習網絡創作出了一首時長90秒的鋼琴曲;9月,索尼計算機科學實驗室人工智慧程序創作一首披頭四音樂風格的歌曲《Daddys Car》,廣受好評;百度公司人工智慧(AI)可以在分析畫作之後,作出與之風格相對應的曲子。
  • ...不用跨界也能從文本生成圖像,OpenAI新模型打破自然語言與視覺...
    這不,OpenAI 最近連發大招,提出兩個連接文本與圖像的神經網絡:DALL·E 和 CLIP。DALL·E 可以基於文本直接生成圖像,CLIP 則能夠完成圖像與文本類別的匹配。OpenAI 的新工作引起了 AI 圈的一陣歡呼。Coursera 創始人、史丹福大學教授吳恩達也表示祝賀,並選出了自己喜歡的「藍色襯衫 + 黑色長褲」AI 設計。
  • AI能寫出這樣的歌?音樂創作正被悄然改變|附7首AI作品
    他們的計算機安裝了人工神經網絡等工具,讓機器有了像小孩一樣邊做邊學的能力。至少到目前為止,這類生意似乎還沒能在音樂人圈子中引起多少焦慮。「在我們看來,我們的系統還處在嬰兒期,對於音樂學習得還不多,」Stobbs這麼說著,卻很快又轉而暗示他希望Jukedeck的音樂能如何進步:「並沒有物理規律表明計算機不能達到和人類一樣好。」讓計算機作曲並不新奇。
  • Google聯合OpenAI揭秘神經網絡黑箱:AI的智慧,都藏在「激活地圖」裡
    現在,Google和OpenAI的一場合作,以圖像分類神經網絡為例,我們揭開了神經網絡黑箱的一角。他們說,圖像分類神經網絡裡面長這樣:這不是狗頭,是一系列激活地圖(Activation Atlas)中的一張,通俗的說,就是神經網絡在學習圖像分類之後,在內心把所有學過的物品畫了一幅思維地圖,把長得像的東西放在了一起,以此作為依據,判斷之後所有的它看到的圖片是什麼。
  • AI作曲的諾亞方舟將去往何處
    同時,該項目也進一步驗證了人工神經網絡技術(Artificial Neural Networks)的蓬勃發展,有助於探索未來AI在音樂中的應用價值。造船原理-幾種算法模型現代人工智慧作曲技術背後蘊含了多種算法模型的結合運用,包含人工神經網絡、馬爾科夫鏈及遺傳算法等。
  • OpenAI發布「顯微鏡」,可視化神經網絡內部結構
    意為可以像實驗室中的顯微鏡一樣工作,幫助AI研究人員更好地理解神經網絡的結構和特徵。顯微鏡地址:https://microscope.openai.com/models如上圖所示,初始版本包含8個計算機視覺領域的神經網絡模型。每個神經網絡都用可視化的形式展示了一些重要神經元的內部結構。
  • 【乾貨】用神經網絡識別歌曲流派(附代碼)
    DataSet: 本文使用GTZAN Genre Collection音樂數據集,地址:[1]這個數據集包含1000首不同的歌曲,分布在10種不同流派,每個流派100首,每首歌曲大約30秒。MFCC數值模仿人類的聽覺,在語音識別和音樂類型檢測中有廣泛的應用。MFCC值將被直接輸入神經網絡。了解MFCC讓我們用兩個例子來說明MFCC。請通過Stereo Surgeon下載Kick Loop 5[2]和Whistling[3]。其中一個是低音鼓聲,另一個是高音口哨聲。它們明顯不同,你可以看到它們的MFCC數值是不同的。
  • AI終於攻破音樂:新歌金曲都能高仿,還會唱Rap
    連走調的部分都和人類很像——文|杜晨 編輯|Vicky Xiao註:本作品著作權歸PingWest品玩/矽星人獨家所有,授權深圳市騰訊計算機系統有限公司獨家享有信息網絡傳播權,任何第三方未經授權更為強大的生成式神經網絡模型,近幾年非常熱門。利用到 DeepFake 技術中,可以讓換臉視頻以假亂真;谷歌前年發布的 Duplex 技術,生成的機器人語音可以代替客服接聽電話,效果令人震驚。
  • 網易騰訊百度紛紛入局 AI作曲「錢」景何在?
    真沒想到,一個做遊戲起家的公司竟能研發出如此成熟的AI音樂技術,AIVA和微軟小冰或許將迎來新對手。除了作詞與編曲,以雷火音頻部提供的大量遊戲配音應用案例及龐大的歌聲資源為基礎,網易伏羲藉助神經網絡聲學模型和聲碼器自動根據曲譜,實時生成契合歌曲主題且「幾可亂真」的歌聲,並確保「主唱」在不同BPM、風格歌譜上音高、節奏的穩定性。「還可以嘛,不說還聽不出是AI唱的。」
  • 蝦米音樂如何使用AI作曲功能?使用AI作曲功能方法
    蝦米音樂APP中的AI作曲功能,估計很多小夥伴都是沒有使用過的。那麼這個功能有什麼用?怎麼使用呢?今天小編就來為大家詳細的介紹一下。蝦米音樂系列軟體最新版本下載蝦米音樂軟體版本:3.1.3 正式版影音工具立即查看蝦米音樂軟體版本:7.0.6Android軟體立即查看蝦米音樂AI作曲功能怎麼用? 1、打開蝦米音樂APP,登錄帳號,進入個人頁面。
  • 網易騰訊百度紛紛入局 ,AI作曲「錢」景何在?
    真沒想到,一個做遊戲起家的公司竟能研發出如此成熟的AI音樂技術,AIVA和微軟小冰或許將迎來新對手。除了作詞與編曲,以雷火音頻部提供的大量遊戲配音應用案例及龐大的歌聲資源為基礎,網易伏羲藉助神經網絡聲學模型和聲碼器自動根據曲譜,實時生成契合歌曲主題且「幾可亂真」的歌聲,並確保「主唱」在不同BPM、風格歌譜上音高、節奏的穩定性。「還可以嘛,不說還聽不出是AI唱的。」
  • 網易騰訊百度紛紛入局,AI作曲「錢」景何在?
    真沒想到,一個做遊戲起家的公司竟能研發出如此成熟的AI音樂技術,AIVA和微軟小冰或許將迎來新對手。除了作詞與編曲,以雷火音頻部提供的大量遊戲配音應用案例及龐大的歌聲資源為基礎,網易伏羲藉助神經網絡聲學模型和聲碼器自動根據曲譜,實時生成契合歌曲主題且「幾可亂真」的歌聲,並確保「主唱」在不同BPM、風格歌譜上音高、節奏的穩定性。
  • 能生成Deepfake也能診斷癌症,GAN與惡的距離
    在蒙特婁一個酒吧,一些朋友希望他能幫忙看看手頭上一個棘手的項目:計算機如何自己生成圖片。研究人員已經使用了神經網絡(模擬人腦的神經元網絡的一種算法),作為生成模型來創造合理的新數據。但結果往往不盡人意。計算機生成的人臉圖像通常不是模糊不清,就是缺耳少鼻。
  • 人工智慧和音樂(附AI作曲DIY途徑)
    其基本應用可分為四大部分:感知(圖像、人臉識別,對象偵測等),認知(自動駕駛,信用風險分析等),創造(作曲,小說,繪畫),智能(涉及人的自我意識,價值觀,尚未真正涉及)。隨著人工智慧的發展,音樂領域的相關作品也越來越多,不論是影視和遊戲的配樂,還是流行歌曲,亦或是有AI真正參與製作的樂曲,都引起更多人對這一科技的關注和討論。下面我就按這三個方向進行推薦。
  • 資源 | 生成對抗網絡新進展與論文全集
    其中 L1 表示 1-Lipschitz 函數集;f 是指判別器,其採用了神經網絡的形式,並通過 GAN 訓練來學習。其目標是最小化這兩個分布之間的 Wasserstein 距離。論文地址:https://arxiv.org/abs/1703.00573距離度量的泛化Arora et al 引進了一種新的距離度量:神經網絡散度(neural
  • 【Energy and AI 最新研究論文】基於火焰面生成流形與神經網絡的噴霧燃燒大渦模擬
    neural networks原文連結:https://www.sciencedirect.com/science/article/pii/S2666546820300215本文由天津大學內燃機燃燒學國家重點實驗室主任堯命發教授和瑞典隆德大學白雪松教授聯合團隊發表摘要為了緩解火焰面生成流形燃燒模型
  • 【專知薈萃11】GAN生成式對抗網絡知識資料全集(理論/報告/教程/綜述/代碼等)
    專知訪問www.zhuanzhi.ai,  或關注微信公眾號後臺回復" 專知"進入專知,搜索主題「GAN」查看。此外,我們也提供該文網頁桌面手機端(www.zhuanzhi.ai)完整訪問,可直接點擊訪問收錄連結地址,請文章末尾查看!此為初始版本,請大家指正補充,歡迎在後臺留言!
  • 引燃AI社區,OpenAI新模型打破自然語言與視覺次元壁
    這不,OpenAI 最近連發大招,提出兩個連接文本與圖像的神經網絡:DALL·E 和 CLIP。DALL·E 可以基於文本直接生成圖像,CLIP 則能夠完成圖像與文本類別的匹配。OpenAI 的新工作引起了 AI 圈的一陣歡呼。Coursera 創始人、史丹福大學教授吳恩達也表示祝賀,並選出了自己喜歡的「藍色襯衫 + 黑色長褲」AI 設計。