大數據文摘 發表於 2020-12-23 10:17:25
英偉達的研究人員創造了一種增強方法來訓練生成對抗性網絡(GAN),與先前的方法相比,這種方法需要的數據量相對更少。
英偉達的這種GAN網絡,可用於風景畫等藝術作品的創作,還可製作一些用於視頻會議的作品。(GAN是人工智慧的一種形式,它將生成器網絡與鑑別器網絡相匹配,以創建圖像或視頻。) 訓練GANs可能需要10萬張以上的圖像,但論文「利用有限數據訓練生成對抗性網絡」中提出了一種稱為自適應鑑別器增強(ADA)的方法,利用這種方法訓練GAN,可使需要的數據減少10到20倍。
「小型數據集的關鍵問題是:鑑別器會產生過擬合,訓練開始發散,使得生成器的反饋變得毫無意義『論文中這樣描述』通過在多個數據集上進行訓練,結果證明,現在只使用幾千張圖片就可以取得好的結果,而Style GAN2的訓練結果則需要與更少的圖像匹配。」
今年早些時候,來自Adobe Research、MIT和清華大學的研究人員詳細介紹了GANS增強的另一種方法DiffAugment。
英偉達副總裁,圖學研究員David Luebke聲稱,做過實用數據科學的人都知道:大部分時間都用在收集和管理數據上,這通常稱為ETL管道:提取、轉換和加載。
他說:「僅這一項工作就需要大量實地數據科學人員,我們認為這種方法非常有用,因為你無需巨量的數據,也能獲得有用的結果。」 他說:「對於那些沒有大量時間對數據進行標註的數據科學人員來說,這一點變得尤為重要。」 論文的作者認為:減少數據約束可以授權研究人員檢查GANs的新用例。除了創造人或動物的假照片外,研究人員認為GAN可能在醫學成像數據中得到應用。
「如果有一位專門研究某一特定領域的放射科醫生。..。..讓他或她坐下來給你貼上5萬張照片的標籤可能不太現實。..。..但是讓他們貼上1,000張照片的標籤似乎是完全可能的。這的確降低了數據科學家需要投入的數據管理的工作量,從而方便了研究工作,「Luebke說。
在世界上最大的年度AI研究會議——NeurIPS會議上,作為神經信息處理網絡的一部分,本周發表了一篇詳細介紹該方法的論文。
「用有限的數據訓練生成對抗性網絡」並不是唯一與GAN相關的論文。另一篇研究論文介紹了鑑別器驅動的潛在抽樣(DDLS),利用CIFAR-10數據集進行評估時,DDLS提高了GAN的性能。
這篇論文是由MILA魁北克人工智慧研究所和谷歌大腦研究人員合作撰寫,作者包括Yoshua Bengio和Hugo Larochelle,蒙特婁谷歌大腦小組組長,NeurIPS會議常務主席。
責任編輯:lq
打開APP閱讀更多精彩內容
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容圖片侵權或者其他問題,請聯繫本站作侵刪。 侵權投訴