AI通過了藝術創作圖靈測試,你根本分不出來作者是不是人

2020-12-14 36氪

編者按:本文來自量子位,編譯:安妮 千平;36氪經授權發布。

各位親愛的文化圈權威,今年不用再看畫了:近年來最大的藝術成就已經發生了。

這項藝術成就的誕生地,不是北京、新加坡、柏林郊區顏料四濺的畫室中,不是威尼斯雙年展上。請記住它出現的地點:美國新澤西州新布朗斯維克(New Brunswick),就在Turnpike高速公路9號出口附近。

新布朗斯維克是美國羅格斯大學(Rutgers)的主校區所在地,這所學校的藝術與人工智慧實驗室(AAIL)就在這裡。與其說這個實驗室像一個藝術孵化器,不如說更像一個潦草的初創公司,裡面全是小格子間、灰地毯、白板上亂糟糟地寫滿了那些跟技術有關的東西。。

然而就在這裡,就在今年情人節那天,艾哈邁德(Ahmed Elgammal)教授讓電腦運行了一個新的藝術生成算法,接著眼睜睜的看著這個AI創造出一系列讓他震驚的畫作。

兩周之後,艾哈邁德搞了一次特殊的圖靈測試:把這些電腦生成的畫作,和幾十幅博物館藏級的油畫混合在一起,看看人類是否能分辨出來。

測試結果看文章標題想必你也知道了。

在這個隨機對照的雙盲研究中,受試者無法區分出哪些是電腦的畫作,哪些是人類藝術家的畫作(參與測試的數據集,一組選自抽象表現主義作品,另一組選自2016香港巴塞爾藝術展)。事實上,電腦的畫作常常被認為「更新穎」、「更具審美吸引力」。

隨後同行評議的論文更是催生出一個讓藝術界不安的傳言:人工智慧已經學會像畢卡索那樣作畫。

時間回到2012年,那年羅格斯大學計算機科學系建立了AAIL。這個實驗室的任務很簡單:專注於在藝術領域研發人工智慧和計算機視覺算法。其後幾年,AAIL實驗室推出的幾種創新算法,激發了策展人、歷史學家、收藏家、拍賣行的興趣。

比方其中一種算法可以從創造力和影響力等方面,衡量一幅藝術作品的價值;另一種算法能分析畫作,並根據藝術家、時期、類型等屬性進行分類;還有一個鑑別贗品的算法,能夠識別藝術家筆觸中微妙的變化。

接下來就是水到渠成的事了:一個創造新作品的算法。

艾哈邁德用超過8萬幅15-20世紀的西方繪畫,對算法進行訓練。基於這個龐大的數據集,他著手構建了一個稱為生成對抗網絡(GAN)的人工智慧。GAN已經能很好的生成鞋子和包包,但是在生成原創視覺藝術方面還不夠好。

所以,他創造了一個創意對抗網絡(Creative Adversarial Networks,簡稱CANs)。

GAN和CAN有何不同?GAN的主要任務是模仿,而CAN需要創新。艾哈邁德在論文中指出,「CAN生成的畫作不同於傳統的藝術標準流派」。

這些畫作沒什麼可識別的特徵,許多看起來非常抽象。這到底是AI無法模仿藝術作品的布局,還是嘗試突破?這一切全是創新麼?

幾個月之後,再次面對上述問題時,艾哈邁德不再猶疑。「機器發展出了一種美感」,他說AI已經學會了如何作畫。

與大多數技術突破類似,羅格斯大學的藝術算法背後,也是數千小時繁瑣的實驗室研究。在取得關鍵進展之前的三周時間裡,艾哈邁德和兩個助手對算法進行了大量的調整,試圖讓二進位代碼的創作成果看起來更像人類的手筆。

面對這些挑戰,這位45歲的AAIL主任一度感到沮喪,開始階段這些畫作既不好也不壞,它們站在了創意鐘形曲線可怕的中點上。

為了解決這個問題,團隊在算法中引入了更多「風格模糊」和「風格規範偏差」。這是一個微妙的平衡。與既有繪畫風格距離太遠,會讓觀眾感到奇怪。而如果太近,電腦的畫作又難免會讓人感覺有模仿的痕跡。

再進行更多的風格調整之後,算法再次運行。

令人驚訝的是,可怕的事情沒有再次發生,AAIL團隊搞定了這個算法。「構圖和顏色都非常好」,艾哈邁德說團隊成員都驚呼起來:「這幅畫放在博物館,肯定招人喜歡」。

但為什麼這個算法產生的是抽象畫,而不是肖像或者靜物?

這被歸因於創意對抗網絡的進化。「我們餵給機器的藝術史,是從文藝復興到現代,所以算法的學習進步也是沿著抽象美學這條線發展」,艾哈邁德說:「這很有趣,抽象是藝術史上的自然進步,而算法成功的捕捉到了這一點」。

換句話說,這個算法的所作所為,和許多人類藝術家一模一樣。簡單來說,藝術創作有點像嗑藥,藝術品的視覺刺激必須有足夠的「喚醒潛能」,來觸發心理上的「快樂反應」。

計算機藝術是新興學術領域的基石,它的歷史可以追溯到20世紀60年代早期Desmond Paul Henry的「繪圖機器」,被稱為「數字人文」。

這些精巧的設計基於二戰期間飛行員用於運送彈藥的精準計算機完成,產生的圖像都是由曲線組成,抽象且複雜。

20世紀60年代的計算機藝術運動催生了更多機器創作的圖片,比如從Alfons Schilling的低技術含量的「自旋藝術」到新澤西州貝爾實驗室中的早期數字設計和動畫製作。

1966年,工程師Billy Kluver和Fred Waldhauer聯手藝術家Robert Rauschenberg和Robert Whitman創立了貝爾實驗室(Art and Technology,E.A.T.),這是一個開創性項目,所有計算機生成的藝術都以它為基礎。

計算機創作過程極其艱辛,畫面和數據必須通過老式鍵控打孔機呈現。這些穿孔卡片接連被放進一個房間大小的電腦裡。由此產生的靜態圖像必須手動轉換成可視的輸出介質,比如鋼筆、縮微膠片繪圖機、行式印表機等。

隨著新計算機技術的出現,機器創作藝術也在更新:點陣印表機藝術(20世界70年代),視頻遊戲藝術(21世紀),3D列印藝術(2010年左右)層出不求。

和各種各樣的計算機藝術相比,艾哈邁德的CAN有它的獨特之處:它的實時創作過程完全由AI完成,人類不能參與其中。

這是人類首次被排除在藝術創作流程之外。

和谷歌Google 2015年鋪天蓋地宣傳的AI藝術項目DeepDream不同,在羅格斯大學AAIL的這個機器裡,人工幹預完全無效。只要打開電腦,艾哈邁德的算法就能自動創作。

相比之下,DeepDream需要人類的參與,它會在一張圖片上加入各種紋理,或者叫風格。這意味著DeepDream的作品實際上是由人類選擇的輸入圖像決定的。

自動的藝術算法似乎能改變一切。曾有調查讓人類對畫作的意圖、涵義、視覺結構等因素進行打分。結果表明,計算機的創作評分都高於人類藝術家。艾哈邁德教授說:「分數說明這些畫是藝術,而且很吸引人。」

這些數字遠遠超過了統計學上的意義。在2016年香港巴塞爾藝術展上,59%的作者無法猜測哪些是由機器創作的。在另一份調查中,75%的受訪者認為由算法製作的畫作實際上是由人類生成的。

這些電腦生成的畫作能與Leonardo Drew、Andy Warhol、Heimo Zobernig和Ma Kelu等藝術家的作品相媲美。大多數作品出現在AAIL實驗中的藝術家都拒絕評論艾哈邁德的研究,除了一個人:Panos Tsagaris。

這位希臘藝術家有一幅無題作品,是帶有金色葉子裝飾的混合材質畫作,曾在2015年的巴塞爾藝術博覽會上展出,後來被用作AAIL測試的樣本。

Tsagari說,人工智慧藝術「令人著迷」,他認為這種算法與人類更多的是同伴關係而不是破壞性威脅。

「我很好奇隨著技術的發展,這個項目將會如何進展,」Tsagari說,「機器作畫和人類創作看起來是一回事,把人工智慧帶到一個可以創造概念的層次,一系列的情感將會建立在它創造的畫作基礎上,這是一個全新的層次。」

美術史學家James Elkins沒有那麼樂觀,他認為機器作畫總是缺少一些深層次的東西。「這有點討厭,因為(算法)不是根據社會環境、含義和表達目的來創作,而是根據藝術風格創作。」Elkins說。這種狹義的有趣之處在於,它暗示著一幅畫的風格就能讓它成為一幅傑作。

Elkins不相信藝術家們很快就會像鞋匠和計程車司機一樣失業。「如果人類藝術家停止創作,那麼電腦也會停止創作。」他說。

數字藝術平臺Rhizome的藝術總監Michael Connor對此表示贊同。他描述了藝術家之間覺悟的鴻溝:「藝術創作並不是成為藝術家的唯一使命。還包括構建藝術體系、教學、創建品牌等。」

他認為艾哈邁德用算法產生的圖像的藝術性,就和莫奈畫作的贗品差不多:「這種算法藝術就像一種贗品,是機器學習人類文化時一種怪異的複製。」他補充說,「這並不一定是件壞事,就像羅馬雕像一樣,這些雕像是希臘原始人物的複製品,即使是複製品也可以隨著時間的推移發展出內在價值。」

艾哈邁德說,他的算法的學習曲線完全符合人類藝術家創作成熟的過程。

「在畫家職業生涯的開始,像畢卡索和塞尚這樣的藝術家都從模仿接觸過畫家的風格起步,不管是有意識的還是無意識的。」他補充說,「之後到達某種程度時,他們才走出模仿階段,探索新事物和新風格。他們從傳統肖像畫到立體派和野獸派,這正是我們試圖實現的機器學習算法。」

就像一個真正的新興藝術家一樣,這個算法會首次辦它的「個機展」。《非人類:人工智慧時代的藝術》展覽將於今年10月在洛杉磯舉辦,將會有12幅在羅格斯大學研究中使用人工智慧的畫作。

首秀之後,艾哈邁德的算法還有更大的發展空間。這是因為羅格斯實驗室的編程人員沒有用全部「對照變量」提高算法產生的圖像的「喚醒潛能」。在一定程度上喚醒潛能越高,人工智慧對人類的影響就越大,人類越有可能購買它。

儘管人工智慧創作之路從來不缺反對者,但這件事應該讓畫家和代表他們的經銷商緊張,艾哈邁德稱代碼生成的圖像隨著時間的推移會變得更好。

他自信地說:「深入挖掘藝術有助通過編寫代碼推動算法探索新的藝術元素,我們將不斷完善這些公式,提升新奇、驚喜、困惑、複雜性等美感體驗。」

計算機生成圖像的商業化探索能追溯到幾十年前。

1964年,貝爾實驗室的工程師、早期計算機先驅A.Michael Noll進行了一項畫圖測試。他用一臺IBM電腦和一個微縮膠片繪圖儀,生成了一個模仿蒙德裡安風格的算法。只有28%的受試者能正確識別哪些為計算機所作。令人震驚的是,59%的受試者更喜歡生成的圖像而不是蒙德裡安的原版。

第二年,Noll的數字藝術作品在紐約Howard Wise Gallery畫廊展出,這標誌著計算機藝術首次出現在美國藝術畫廊。《紐約時報》強烈批評了這一開創性的展覽。Noll說,公眾的反應「令人失望」,沒有一幅畫作被購買。

這次失敗的展覽沒有削弱Noll對數字藝術未來的樂觀態度,他在1967年寫道:「計算機已經證明了自己在科學領域的價值,它還想證明在藝術領域的價值。」

但是,我們應該如何看待一個新的算法呢?把它們當成藝術創作者而不是藝術家的「工具」?在現實生活中,這是個空洞的數字朋克情節:瘋狂的科學家發明了一種比人類更人性化的機器。

如果你關注當代藝術市場,就會發現其中的問題。一時間,從藝術學校到畫廊和拍賣行,流行風格全是被稱為「殭屍形式主義」(Zombie Formalism)的抽象畫。比方說上面圖中的幾幅畫,實際上都是出自不同的人類畫家,有點像人類藝術偽裝成算法的作品。

這可能有點反諷。為了重新獲得先鋒地位,並且在艾哈邁德教授下次圖靈測試中脫穎而出,人類可能必須畫得更像機器人。

如果「抽象廢物」型的人類畫家追隨人工智慧的腳步,在作品中注入一些「風格模糊」,也許能畫得更好一點。

相關論文

CAN: Creative Adversarial Networks Generating 「Art」 by Learning About Styles and Deviating from Style Norms

摘要:

我們提出一個新的藝術創作系統。系統通過觀看藝術作品和學習風格來產生新的藝術作品,並通過偏離所學習的風格來增加藝術覺醒潛力,從而使作品變得更有創造性。我們基於生成對抗網絡建造,GAN已經顯示出學會基於給定分布生成新穎圖像的能力。不過我們認為這個網絡在產生創意作品方面能力有限,我們提出對其目標進行修改,使其能夠通過最大化偏離已建立的分割,並最大限度的減少偏離藝術品分布來進行創作。

相關焦點

  • 圖靈測試錯了嗎?——後圖靈時代的思考
    同樣的道理也適用於對機器的智能測試。看過「模仿遊戲」這個電影的人都知道,圖靈的靈感來自於一個他設計的「模仿遊戲」:如果在一個裁判問了很多問題以後,還不能區分對方是人或計算機的話,那麼這個計算機就可以被認為是具有智能和思維能力的了!圖靈測試難不難?
  • 人工智慧:圖靈測試
    測試的談話僅限於使用唯一的文本管道,例如計算機鍵盤和屏幕,這樣的結果不依賴於計算機把單詞轉換為音頻的能力。測試內容:測試者與被測試者(一個人和一臺機器)在不發生物理接觸的情況下,由測試者通過一些裝置(如鍵盤)向被測試者隨意發問。經過多次測試後,如果有超過 30%的測試者不能確定被測試者是人還是機器,那麼這臺機器就通過了測試。
  • 【深度】圖靈測試已OUT,這才是測試AI的更佳方法
    >參與成員:xiaoxi,汪汪編者按:本文作者Jacob Aron 在一個人工智慧的圖靈測試當過評審,當時的參與者普遍表現不佳。他當時就覺得,還不如用面部識別或者撲克技巧測試來得方便一些。機器人內心獨白:這是樹還是花椰菜?傻傻分不清Reuters/Gleb Garanich上周六我在布萊切利園參與了一場智慧碰撞的活動,話說布萊切利園可是一個莊重的好地方,二戰時候這裡聚集了一批英國的密碼破譯員。
  • Alexa首席科學家:圖靈測試對AI沒啥意義了
    他在論文中提出了一個思想實驗,叫做「模仿遊戲」(imitation game),用於檢測計算機是否能表現出與人等價或無法區分的智能。測試的內容,簡單來說是這樣的:如果一個測試者對無法確認身份的兩個對象(一人、一機器)提出相同的一系列問題,得到的答案讓他無法區分究竟誰是機器,誰是人,那麼則認定機器通過圖靈測試。當然在實際中測試規則更加複雜,比如需要引入更多的測試者等等。
  • 谷歌通過圖靈測試,真正的人工智慧還有多遠?
    而在大會的最後一天,谷歌母公司Alphabet董事長、前斯坦福校長約翰軒尼詩道出Duplex已經通過了圖靈測試的消息,一石激起千層浪。那麼,測試人工智慧的圖靈測試究竟是怎麼一回事呢?圖靈測試一詞來源於計算機科學和密碼學的先驅阿蘭·麥席森·圖靈寫於1950年的一篇論文《計算機器與智能》。簡單來說,圖靈測試就是用來測試AI是否真正具有人工智慧這一概念的標準。
  • 【思辨】王培:圖靈測試是人工智慧的標準嗎?
    以通過圖靈測試為目標的對話程序一般稱為「chatbot」 。這個詞和機器人(robot)一詞相近,故常被譯作「聊天機器人」,但其實應當譯作「聊天程序」,因為它們都是專用軟體,而非專用硬體。這類工作在歷史上長期被大部分人工智慧研究者視為旁門左道或譁眾取寵,其中最著名的例子的是魏增鮑姆在1966年編寫的「伊莉莎」(ELIZA)。
  • 「小薇」為何能通過圖靈測試?
    你站在它面前說「向日葵」,它立馬會向你展示出梵谷《向日葵》的畫作。2017年,由北京中科匯聯科技股份有限公司研發的「小薇」作為中國第一個通過圖靈測試的作詩機器人,入選中央電視臺《機智過人》節目。圖靈測試是被譽為電腦科學之父的英國數學家圖靈,於1950年提出的一個關於判斷機器是否能夠思考的試驗。
  • AI文案通過圖靈測試!一秒生成2萬條廣告神器問世
    高度模擬人寫文案:順利通過圖靈測試阿里媽媽AI智能文案早已突破傻瓜式的機器模式,提供多種文案寫作風格:描述型、特價型、實功效型、逗趣型、古詩詞型等八種類型,風格類型也在不斷擴充中。生產出來的文案品質與人寫文案已經並無二致,順利通過了圖靈測試。
  • AI給AI論文寫了個摘要,網友戲稱為「摘要通過圖靈測試」,推特點讚上千
    細心了網友看到論文摘要結尾,才發現一個斜體備註中寫著:上面的摘要不是作者寫的,而是由研究中展示的一個模型自動生成的。以假亂真的生成質量,讓不少網友大吃一驚。並且,其生成方式也不一般:研究證明了,即使沒有複製機制,Transformer語言模型在總結長篇科學文章方面也非常有效,並且效果優於傳統的seq2seq方法。
  • 語言與圖靈測試
    自古以來, 什麼是智能就難以定義. 1950 年圖靈提出圖靈測試[1], 以是否通過人機對話測試來判定機器是否具有智能. 圖靈測試巧妙地避開了智能的內涵式定義和判定難題, 將研究智能的重點放在智能的外在功能性表現, 使得智能從工程上看是可以實現和判斷的. 現代人工智慧從此肇始. 為了通過圖靈測試, 需要研究語言.
  • 計算機被當13歲男孩 首次通過圖靈測試(圖)
    原標題:計算機被當13歲男孩 首次通過圖靈測試(圖)   6月9日消息,據國外媒體報導,最近,一個俄羅斯團隊開發的聊天機器人軟體,使得三分之一的聊天參與者,認為它是一個人類,這意味著在人類歷史上,計算機首次通過了有關計算機智能能否超過人類的圖靈測試。
  • 關於圖靈和圖靈測試
    圖靈測試:為了避免對「思維」「思想」「自由意志」應該是什麼的哲學式討論,他提出只需要比較機器的表現和人類的表現,就可以判斷一個機器人的思維能力。這是「思考」的操作性定義,而非像愛因斯坦堅持的對時間和空間的操作性定義,以便將它的理論從先驗假設中解放出來……如果機器表現出了像人類一樣的行為,那麼它正是像人類一樣在行動。我們對人類網絡意識的定義,收緊了圖靈測試:圖靈測試需要軟體說服一小組專家,而非單一個體;不只涉及偶然的對話,也關乎自律和移情。
  • Google Duplex通過圖靈測試 人工智慧還會遠嗎?
    Google Duplex通過圖靈測試 人工智慧還會遠嗎? 在大會的最後一日,Alphabet董事長John Hennessy親口承認:Google Duplex已經在預約領域通過了圖靈測試。 通過圖靈測試! 多麼令人興奮的六個字。被人工智慧所改變的世界藍圖仿佛就在我們眼前鋪展。
  • 圖靈的人工智慧世界
    圖靈曾勾勒出一幅動人圖景,可以說那裡就是圖靈營造的一個人工智慧的世界。在那個世界裡,具有自主「學習」和「思考」能力的機器分擔了人類在各個領域的工作;能「思考」的機器通過「自主」的學習可以成為工程師、醫生、詩人、棋手、科學家、畫家、音樂家……凡是人類能做的工作,能「思考」的機器都可以做。圖靈的設想及其驗證方式(圖靈測試)為人類塑造了一幅全新的世界圖景。
  • 圖靈測試已經過時,人工智慧需要建立一套全新指標
    我認為圖靈提出的努力目標對我這樣的人工智慧科學家來說並不是一個實用目標。 圖靈測試充滿了限制性因素,圖靈自己在這篇開創性論文中就討論過其中一些。隨著如今人工智慧普遍集成到手機、汽車和家庭中,一個事實越來越明顯:人們更關心他們與機器的交互是實用、無縫和透明的,實現機器與人真假難分的理念已經過時。
  • 破解圖靈測試之困,量化分析機器與人類智慧
    1950年,圖靈發表題為《機器能思考嗎?》的論文,第一次提出「機器思維」的概念。提出假想:一個人在不接觸對方的情況下,通過一種特殊的方式,和對方進行一系列的問答,如果在相當長時間內,他無法根據這些問題判斷對方是人還是計算機,那麼,就可以認為這個計算機具有同人相當的智力,即這臺計算機是能思維的。這就是著名的「圖靈測試」(Turing Testing)。
  • 外國姑娘的本科畢業論文,通過AI生成山水畫,騙過了專業繪畫家
    ,在圖靈視覺測試過程當中,成功騙過了百分之五十五的眼睛,引起了學術界的廣泛關注,而Alice Xue也憑藉這一研究成果,獲得了優秀畢業論文獎。02被誤判為人類作品雖然是用機器創作的繪畫作品,不過在參與視覺圖靈的測試過程當中,卻有一半以上的結果,被識別成了人類作品
  • 心理學測試:選一個畫出來的人物?測你是不是一個高智商的人!
    心理學測試:選一個畫出來的人物?測你是不是一個高智商的人! 心理測試:選一個畫出來的人物?測你是不是一個高智商的人!
  • 金融界的圖靈測試:2.04%的AI預測誤差,只是開始…
    「這一天,機器人可以自行撰寫研報……」1950年,計算機科學之父圖靈在《計算機器與智能》一書中,首次提到一個概念,如果電腦能回答由人類測試者提出的一系列問題,且其超過30%的回答讓測試者誤認為是人類所答,那麼機器就能通過測試,被認為具有人類智能。
  • 圖靈測試Out啦!首個為AI設置的「IQ測試」:玩遊戲、解魔方、考SAT全面評估
    最經典的方法當然是「圖靈測試」。早在1950年,圖靈發表了一篇劃時代的論文,他表示機器也可以擁有智能,像人一樣會「思考」,並且提出了圖靈測試:測試者與被測試者(一個人和一臺機器)隔開的情況下,通過一些裝置(如鍵盤)向被測試者隨意提問。進行多次測試後,如果機器讓平均每個參與者做出超過30%的誤判,那麼這臺機器就通過了測試,並被認為具有人類智能。