在人工智慧和Deep-Fake日益盛行的放下,不少照片看似真實,但實際上是由電腦製作的。不過這些圖像已經相當具有欺騙性——所謂的深度假圖像是由機器學習算法生成的,人類幾乎無法將它們與真實照片區分開來。
Horst Görtz Institute的的研究人員和「大規模對手時代的網絡安全」(Casa)卓越集群開發了一種有效識別深度偽造圖像的新方法。
這種方法被讓那些由計算機算法而不是人類創建的偽造圖像「一覽無遺」。為此,他們還分析了頻域中的對象,這是一種已建立的信號處理技術。
該團隊在2020年7月15日的國際機器學習會議(ICML)上展示了他們的工作,該會議是機器學習領域的主要會議之一。此外,研究人員將他們的代碼免費發布在網上,這樣其他小組就可以複製他們的結果。
兩種算法的相互作用產生新的圖像
deep -fake images是「深度學習」(deep learning)和「fake」(fake)的合成詞,是在計算機模型的幫助下生成的,也就是所謂的「生成式對抗網絡」(Generative Adversarial Networks),簡稱GANs。
在這些網絡中有兩種算法一起工作:第一種算法根據特定的輸入數據創建隨機圖像。第二種算法需要判斷圖像是否為假圖像。如果發現圖像是偽造的,則第二種算法會向第一種算法發出修改圖像的命令——直到不再將其識別為偽造為止。
近年來,Deep-Fake這種技術已經讓那些深度的算法合成假圖像變得越來越真實。
在一些網站上,用戶可以檢查他們是否能夠區分真假照片。「在假新聞時代,如果用戶不能區分電腦生成的圖像和原始圖像,這可能會成為一個問題,」系統安全系主任託爾斯滕·霍爾茲(Thorsten Holz)教授說。
為了進行分析,Bochum Fake Image研究小組成員使用了數據集,這些數據集也構成上述頁面「哪張臉是真實的」(Which Face is Real)的基礎。
在這個跨學科項目中,系統安全系主任Joel Frank、Thorsten Eisenhofer和Thorsten Holz教授、機器學習系主任Asja Fischer教授、數位訊號處理系主任Lea Schonherr和Dorothea Kolossa教授達成了合作。
圖像頻率分析暴露了假圖像的「偽影」
到目前為止,不少研究團隊已經使用複雜的統計方法分析了偽造的圖像。而Bochum Fake Image研究小組選擇了一種不同的方法,通過使用離散餘弦變換將圖像轉換到頻域。生成的圖像因此表示為許多不同餘弦函數的和。自然圖像主要由低頻函數組成。
變換到頻域的人物圖像:左上角代表低頻圖像區域,右下角代表高頻區域。在左側,您可以看到真實人物照片的變換:頻率範圍是均勻分布的。計算機生成的照片的轉換(右)包含一個在高頻範圍內的典型網格結構-典型的偽像。
分析表明,GANs生成的圖像在高頻範圍內會顯示偽影。例如,在偽圖像的頻率表示中出現了一種典型的網格結構。「我們的實驗表明,這些偽影不僅出現在GAN生成的圖像中。它們是所有深度學習算法的一個結構性問題。系統安全主席Joel Frank解釋說。
「我們認為研究中描述的偽影將始終告訴我們該圖像是否是由機器學習創建的偽造圖像,」 Frank補充道。 「因此,頻率分析是自動識別計算機生成圖像的有效方法。」
編譯/前瞻經濟學人APP資訊組