如果去年國際機器人藝術大賽的獲勝者能說明什麼問題的話,那就是算法在繪畫、素描和雕塑方面的精準度還不錯。最新一期出版的報紙在Arxiv上讓人覺得:,馬裡蘭大學的研究人員和Adobe研究描述一種新的機器學習系統——LPaintB能夠重現的手繪油畫風格的達文西、梵谷、維梅爾在不到一分鐘。
「隨著非真實感渲染技術的發展,包括基於筆畫的渲染和繪畫渲染,通過應用啟發式,特殊設計的或手工設計的方法可以越來越多地模擬繪畫過程,」合著者寫道。「這些算法可以生成引人注目的結果,但很難將它們擴展到新的或不可見的樣式……在本文中,我們重點構建一個智能繪畫代理,它可以用一系列繪畫動作以相同或轉換的樣式再現參考圖像。」
研究人員利用自我監督學習的方法,在有限的參考圖像上從零開始訓練一個。在這種方法中,未標記的數據與少量標記數據結合使用,以提高學習精度。通過建模系統的動作狀態數學和代替失敗的目標狀態最終狀態,團隊生成配對語料庫與積極的獎勵,他們提供給人工智慧模型,使其學會畫參考圖像所需的藝術風格。
至少一開始不是一帆風順的。研究人員指出,通常情況下,系統採樣的行為中只有一小部分具有積極的回報,他們使用一種強化學習技術來解決這個問題,該技術使用目標狀態作為配對數據來訓練策略。但是生成的策略並不特別健壯,因為用於訓練它的成對數據只包含具有積極回報的行為(這使得從返回消極回報的不受歡迎的行為中恢復變得困難)和連續一系列行為的結果的狀態。解決這一問題需要再次強化學習:它為有助於推廣模型的行為添加了噪聲,並通過獎勵對模型s的行為進行了優化。
最終的結果嗎?一個AI框架,它可以執行帶有描述筆畫大小、顏色和位置信息的參數的繪畫動作,並相應地更新畫布,帶有一個評估當前狀態和目標狀態之間距離的獎勵函數。為了編制訓練數據集,研究小組從參考圖像中隨機抽取不同尺度的特定樣式的補丁,並將其採樣到固定大小。他們將這些數據輸入模型,經過一個小時的訓練,該模型能夠在一臺裝有16核處理器和Nvidia GTX 1080圖形晶片的個人電腦上,在不到一分鐘的時間內,以20,000筆畫複製出1000 x 800的圖像。
研究人員指出,訓練模型的泛化高度依賴於訓練數據,他們的方法基於一個相當基本的繪畫環境,但他們表示,自我監督和強化學習相結合,極大地提高了策略的效率和性能。該團隊將繼續未來的工作,包括筆刷大小、顏色和位置等筆觸參數,以及構建一個基於模型的強化學習框架,該框架可以構建到繪畫模擬器中。