生成「貓狗版」川普,造假臉工具StarGANv2被玩壞,算法已開源

2021-01-15 量子位

曉查 發自 凹非寺量子位 報導 | 公眾號 QbitAI

如果你想用AI把川普的臉變成貓,又或者是把自己的臉與漂亮的奧妹結合起來,你會怎麼辦?

也許你會想到兩樣AI工具。但是Deepfake生成人臉違和感太強,GAN生成假臉又很難深度定製。

現在來自韓國團隊開發的風格遷移模型StarGANv2可以完美解決這個問題。

如果你是一個對GAN長期關注的同學,那麼一定還記得StarGAN,它是韓國高麗大學和Clova AI研究院在2017年底推出的風格遷移模型。

只需輸入一張大頭照,StarGAN就能讓你知道自己改變髮型、性別、年齡後分別長啥樣。

而StarGANv2正是同一研究團隊推出的升級版本,已經被CVPR 2020收錄。最近他們在GitHub上公布了官方實現代碼,很快就被網友玩壞了。

StarGANv2有兩個訓練數據集,一個針對人臉,一個針對動物臉。

兩者本來是「井水不犯河水」,但是有人偏偏要混用,拿川普的臉輸入到動物臉預訓練模型裡。結果川普的臉轉換成貓就成了這樣:

與狗臉合成又成了這樣,模型甚至給狗穿上了西服。

安裝使用

這麼有趣的模型,如何安裝呢?好在StarGANv2的開發團隊提供了完整的代碼和預訓練模型。

先將項目克隆到本地:

git clone https://github.com/clovaai/stargan-v2.git

cd stargan-v2/

安裝依賴項:

conda create -n stargan-v2 python=3.6.7conda activate stargan-v2

conda install -y pytorch=1.4.0 torchvision=0.5.0 cudatoolkit=10.0 -c pytorch

conda install x264==』1!152.20180717』 ffmpeg=4.0.2 -c conda-forge

pip install opencv-python==4.1.2.30 ffmpeg-python==0.2.0 scikit-image==0.16.2

pip install pillow==7.0.0 scipy==1.2.1 tqdm==4.43.0 munch==2.5.0

然後下載預訓練數據集,其中前兩項是人臉數據集和預訓練模型,後一項是動物臉。

bash download.sh pretrained-network-celeba-hq

bash download.sh wing

bash download.sh pretrained-network-afhq

最後將需要轉換的照片裁切成和數據集圖片一樣的長寬比,輸入以下命令轉換圖片。

python main.py —mode sample —num_domains 2 —resume_iter 100000 —w_hpf 1 \

—checkpoint_dir expr/checkpoints/celeba_hq \

—result_dir expr/results/celeba_hq \

—src_dir assets/representative/celeba_hq/src \—ref_dir assets/representative/celeba_hq/ref

效果遠超其他GAN

StarGANv2由四個模塊組成:

生成器將輸入圖像轉換為反映特定域風格編碼的輸出圖像;映射網絡將潛在代碼轉換為訓練中隨機選擇的多個域的風格編碼;風格編碼器提取圖像的風格編碼,允許生成器執行參照物引導的圖像合成;鑑別器從多個域中區分真實圖像和虛假圖像。

作者隨機選取了10張圖像進行風格遷移的實驗,結果FID遠遠小於其他同類模型。

他們還把四種模型生成的圖像上傳到AMT平臺,交給人工評選,絕大部分測試者都認為StarGANv2生成的圖片更優質。

從人工評選的結果也可以看出,StarGANv2在生成動物臉上的效果更好,難怪網友要拿動物模型來改造川普頭像了。

傳送門

論文地址:https://arxiv.org/abs/1912.01865v2

官方實現代碼:https://github.com/clovaai/stargan-v2

相關焦點

  • 假臉,又一個人工智慧騙術
    肉眼無法察覺的是,這張奇怪的人臉實際上是一種算法的產物——親川普媒體TheBL網站用它為自己創建的眾多虛假「臉書」帳戶之一提供了身份信息,然後再用這些虛假帳戶提升網站的流量。合成圖像高度逼真專家們認為,雖然與近年來合成政客和名人的言行以譁眾取寵的「深度偽造」(deepfake)視頻相比,人工智慧(AI)生成的靜態人臉沒那麼吸引眼球,但它正在成為一種日益常見的傳播虛假信息的工具。這項技術並不是讓真人看上去在說或者做他們沒有說過或者做過的事情,而是無中生有創造出全「新」的人。
  • 這隻狗,其實是貓變的:「擼貓神器」StarGAN v2來了!
    新智元報導 來源:arxiv 編輯:大明、鵬飛 【新智元導讀】最新的神奇變臉工具StarGAN第二版來了!
  • 高效開源EDA工具鏈已在路上?
    報告4:高效開源EDA工具鏈已在路上(OpenROAD)UCSD的Andrew Kahng教授獲得了DARPA項目的資助,開展高效開源EDA工具鏈的研究。他認為EDA以前是關注質量,但現在該開始關注把易用性了。他參與的DARPA IDEA項目目標非常激進——24小時內全自動地完成IP、SoC晶片、PCB版的設計(圖12)。
  • [CVPR 2020] StarGAN v2: 多域風格圖像合成,效果驚人,史上最強!
    ,這是一種可以同時解決生成圖像多樣性和多域擴展性的單一框架。tp=&arnumber=9157662 code: https://github.com/clovaai/stargan-v2cite: @inproceedings{DBLP:conf/cvpr/ChoiUYH20, author = {Yunjey Choi and Youngjung Uh and Jaejun Yoo and Jung{-}Woo Ha}
  • 為什麼Deepfake生成的假臉會這麼自然?
    為什麼Deepfake生成的假臉會這麼自然? 李倩 發表於 2018-09-03 08:46:59 編者按:自換臉工具Deepfake風行全球後,人們開始意識到除了詐騙簡訊、詐騙電話,現在連視頻都能「詐騙」了。
  • 輸入示例,自動生成代碼:TensorFlow官方工具TF-Coder已開源
    最近,谷歌 TensorFlow 開源了一個幫助開發者寫 TensorFlow 代碼的程序合成工具 TF-Coder。TF-Coder 的合成算法如下所示:下面的動圖展示了使用 TF-Coder 解決張量操縱問題的過程:那麼,TF-Coder 工具可以在哪些場景中起到作用呢?
  • Salesforce開源構建Einstein AI模型的工具
    Salesforce今天宣布開源TransmogrifAI,這是一款用於自動化AI計劃的本土軟體,相比Oracle工具來說它解決了任務的不同方面。該工具使工程師能夠自動生成針對特定數據而量身定製的機器學習模型,被稱為是現有人工智慧自動化解決方案的更靈活的替代方案,例如谷歌基於雲的AutoML服務。據Salesforce稱,這些產品通常只支持很小範圍的用例,並且最初設計是用於處理像照片這樣的非結構化數據,而不是結構化的業務記錄。
  • 15 個開源的頂級人工智慧工具
    Artificial intelligence,AI是科技研究中最熱門的方向之一。以下這些開源人工智慧應用都處於人工智慧研究的最前沿。1. Caffe它是由賈揚清在加州大學伯克利分校的讀博時創造的,Caffe 是一個基於表達體系結構和可擴展代碼的深度學習框架。使它聲名鵲起的是它的速度,這讓它受到研究人員和企業用戶的歡迎。
  • C++ Prim算法Kruskal算法構造可以使n個城市連接的最小生成樹
    ,用Prim算法或Kruskal算法建立最小生成樹,並得到的最小生成樹的代價。要求在屏幕上顯示得到的最小生成樹中包括了哪些城市間的道路,並顯示得到的最小生成樹的代價。2、表示城市間距離網的鄰接矩陣(要求至少6個城市,10條邊)3、最小生成樹中包括的邊及其權值,並顯示得到的最小生成樹的代價。
  • 雙頭狗,三眼貓,加長林肯馬,來看硬核鏟屎官是如何給貓狗拍照的
    今天咱們聊點輕鬆的,來看看那些貓貓狗狗,在沙雕鏟屎官的手裡到底是怎樣被玩壞的。國外流行一種全景模式拍攝貓狗的照片徵集活動,這可真是一個偉大又刁鑽的話題啊。畢竟貓貓狗狗很難聽從人的指令,讓它們完全靜止不動是不可能的,所以,全世界的鬼才們紛紛打開了手機的全景模式,對著自家的貓狗按下了快門。一瞬間,各式各樣的怪物被創造了出來。▲聽到主人的召喚,狗狗從沙發上跳下緩緩走過來,眼睛溫柔禮貌的盯著鏡頭。
  • 60款流行網絡工具的開源替代選擇
    開源網絡工具能派得上用處。無論你是在管理大型企業數據中心中成千上萬的系統,還是僅僅把你家裡的幾臺電腦連接起來,開源網絡工具都能幫助你搭建和維護一個低成本的網絡。本文整理出了讓這項任務變得更容易一點的60款開源網絡工具。
  • 谷歌地球企業版開源!
    谷歌地球企業版(Google Earth Enterprise,GEE) 最初在 2006 年發布。當時的目標是,讓企業客戶能在本地數據中心部署谷歌地圖以及谷歌地球。如今,隨著越來越多的服務被搬到雲端,這項業務已被關閉。
  • Facebook開源物體識別工具Detectron,加速計算機視覺研究
    近日,Facebook的人工智慧實驗室(FAIR)開源了計算機視覺研究平臺Detectron。Detectron系統實現了最先進的物體檢測算法,包括Mask R-CNN。 它是用Python編寫的,支持Caffe2深度學習框架。
  • ppt各類輔助工具
    這是一個免費生成低多邊形特效矢量圖片的製作工具,可以非常簡單快速製作出low poly風格的圖片。使用步驟1.打開軟體,界面如下。2.導入圖片,默認源視圖。3.單擊滑鼠左鍵,順著輪廓和明暗交線方向在圖片上增加控點,可以打開mesh視圖進行查看。也可以在result視圖中查看結果,還可以微調模糊參數等。4.輸出pdf。
  • 百度開源2020年度報告:兩大開源平臺、九個捐贈項目
    導讀「從 2009年大規模定製 Hadoop到 2013年第一個前端可視化產品 ECharts率先開源,再到2016年和2017年分別正式對外開源飛槳(PaddlePaddle)、Apollo兩大平臺,截止目前,百度已在Github主導的18個開源組織累計開源項目1,023個、社區貢獻者20,000+、獲得Star總數210,000+。
  • 美國開發自動還原馬賽克的AI開源算法
    打開APP 美國開發自動還原馬賽克的AI開源算法 憲瑞 發表於 2020-12-02 13:53:07 美國杜克大學開發的AI算法就可以做到馬賽克圖片變高清。 低清變高清的算法並不稀奇,目前技術都支持了SDR超解析度技術,包括視頻畫質增強、圖片增強等領域都有這個算法的存在,它將低解析度圖片填補細節,給圖片增加像素以儘可能提高畫質。
  • QRBTF - 製作漂亮有趣二維碼的免費開源在線工具
    今天給大家推薦的工具就可以用來生成非常個性、充滿設計感的二維碼!網站首頁截圖特點無需下載或安裝任何 APP 應用,手機或電腦打開瀏覽器就能用;提供了十幾種簡約、有個性的模版 ,更重要的是在別的地方很少見,非常有特色,能給設計作品加分不少;操作簡單,一鍵生成二維碼,也支持上傳醜的二維碼重新生成;除了直接導出圖片,還能導出 svg 矢量格式的文件,
  • OpenAI開源機器人仿真軟體Roboschool:已整合OpenAI Gym
    選自OpenAI作者:JOHN SCHULMAN、JACK CLARK、OLEG KLIMOV機器之心編譯參與:黃小天、蔣思源近日,OpenAI 在其官方博客上宣布推出 Roboschool,一款用於機器人仿真的開源軟體,它基於 Bullet 物理引擎,並已實現與 OpenAI 之前發行的 Gym 之間的整合,也使得在同一環境中同時訓練多個智能體變得簡單。
  • 谷歌開源JPEG編碼器Guetzli,壓縮35%也能生成高質量圖片
    谷歌通過線上社區的形式創造了各種新的工具和工業標準雷鋒網消息,谷歌近日開源了用於數字圖像和網絡圖形的JPEG編碼器 Guetzli( [guɛtsli], 在瑞士德語中被翻譯為餅乾)。與現有的方法相比,它能將高質量圖片的大小縮小35%。這就使網站管理員可以使用更少的數據更快地加載網頁,此外,它能兼容現有的瀏覽器、圖像處理應用和JPEG標準。