一個照片「隱身衣」,讓微軟曠視人臉識別系統100%失靈|開源

2020-12-03 量子位

魚羊 蕭簫 發自 凹非寺量子位 報導 | 公眾號 QbitAI

左圖,右圖,你能看出區別嗎?

其實,算法已經悄悄給右邊的照片加上了微小的修改。

但就是這樣肉眼根本看不出來的擾動,就能100%騙過來自微軟、亞馬遜、曠視——全球最先進的人臉識別模型!

所以意義何在?

這代表著你再也不用擔心po在網上的照片被某些軟體扒得乾乾淨淨,打包、分類,幾毛錢一整份賣掉餵AI了。

這就是來自芝加哥大學的最新研究:給照片加上一點肉眼看不出來的修改,就能讓你的臉成功「隱形」。

如此一來,即使你在網絡上的照片被非法抓取,用這些數據訓練出來的人臉模型,也無法真正成功識別你的臉。

給照片穿上「隱身衣」

這項研究的目的,是幫助網友們在分享自己的照片的同時,還能有效保護自己的隱私。

因此,「隱身衣」本身也得「隱形」,避免對照片的視覺效果產生影響。

也就是說,這件「隱身衣」,其實是對照片進行像素級別的微小修改,以蒙蔽AI的審視。

其實,對於深度神經網絡而言,一些帶有特定標籤的微小擾動,就能夠改變模型的「認知」。

比如,在圖像裡加上一點噪聲,熊貓就變成了長臂猿:

Fawkes就是利用了這樣的特性。

用 x 指代原始圖片,xT為另一種類型/其他人臉照片,φ 則為人臉識別模型的特徵提取器。

具體而言,Fawkes是這樣設計的:

第一步:選擇目標類型 T

指定用戶 U,Fawkes的輸入為用戶 U 的照片集合,記為 XU。

從一個包含有許多特定分類標籤的公開人臉數據集中,隨機選取 K 個候選目標類型機器圖像。

使用特徵提取器 φ 計算每個類 k=1…K 的特徵空間的中心點,記為 Ck。

而後,Fawkes會在 K 個候選集合中,選取特徵表示中心點與 XU 中所有圖像的特徵表示差異最大的類,作為目標類型 T。

第二步:計算每張圖像的「隱身衣」

隨機選取一幅 T 中的圖像,為 x 計算出「隱身衣」δ(x, xT) ,並按照公式進行優化。

其中 |δ(x, xT)| < ρ。

研究人員採用DDSIM(Structural Dis-Similarity Index)方法。在此基礎上進行隱身衣的生成,能保證隱身後的圖像與原圖在視覺效果上高度一致。

實驗結果表明,無論人臉識別模型被訓練得多麼刁鑽,Fawkes都能提供95%以上有效防護率,保證用戶的臉不被識別。

即使有一些不小心洩露的未遮擋照片被加入人臉識別模型的訓練集,通過進一步的擴展設計,Fawkes也可以提供80%以上的防識別成功率。

在Microsoft Azure Face API、Amazon Rekognition和曠視Face Search API這幾個最先進的人臉識別服務面前,Fawkes的「隱身」效果則達到了100%。

目前,Fawkes已開源,Mac、Windows和Linux都可以使用。

安裝簡易方便

這裡以Mac系統為例,簡單介紹一下軟體的使用方法。使用的筆記本是MacBook Air,1.1GHz雙核Intel Core i3的處理器。

首先,我們從GitHub上下載壓縮安裝包,並進行解壓。

接下來,把想要修改的所有照片放入一個文件夾裡,並記住路徑。

以桌面上的一個名為test_person的圖片文件夾為例,裡面我們放了三張照片,其中一張圖片包含兩個人。

這裡的圖片路徑是~/Desktop/test_person,根據你的圖片保存位置來確定。

接下來,打開啟動臺中的終端,進入壓縮包所在的文件夾。

注意,如果MacOS是Catalina的話,需要先修改一下權限,以管理員身份運行,sudo spctl —master-disable就可以了。

這裡我們的壓縮包直接放在下載的文件夾裡,直接cd downloads就行。

進入下載文件夾後,輸入./protection -d 文件路徑(文件路徑是圖片文件夾所在的位置,這裡輸入~/Desktop/test_person),運行生成圖片的「隱身衣」。

嗯?不錯,看起來竟然能識別一張圖中的2個人臉。

緩慢地運行……

據作者介紹說,生成一張「隱身衣」的速度平均在40秒左右,速度還是比較快的。

如果電腦配置夠好,應該還能再快點。

不過,雙核的就不奢求了…我們耐心地等一下。

從時間看來,處理速度還算可以接受。

Done!

圖中來看,生成3張圖片的「隱身衣」,電腦用了大約7分鐘(一定是我的電腦太慢了)。

來看看生成的結果。

可以看見,文件夾中的3張圖片,都生成了帶有_low_cloaked的後綴名的圖片。

雖然介紹裡說,生成的後綴是_mid_cloaked的圖片,不過軟體提供的模式有「low」、「mid」、「high」、「ultra」、「custom」幾種,所以不同的模式會有不同的後綴名。

以川普為例,來看看實際效果。

兩張圖片幾乎沒有差別,並沒有變醜,川普臉上的皺褶看起來還光滑了一點。

這樣,我們就能放心地將經過處理後的人臉照片放到網上了。

即使被某些不懷好意的有心之人拿去使用,被盜用的數據也並不是我們的人臉數據,不用再擔心隱私被洩露的問題。

不僅如此,這個軟體還能「補救」一下你在社交網站上曬出的各種人臉數據。

例如,你曾經是一名衝浪達人,之前會將大量的生活照po到社交網站上——

照片可能已經被軟體扒得乾乾淨淨了……

不用擔心。

如果放上這些經過處理後的圖片,這些自動扒圖的人臉識別模型會想要添加更多的訓練數據,以提高準確性。

這時候,穿上「隱身衣」圖片在AI看來甚至「效果更好」,就會將原始圖像作為異常值放棄。

華人一作

論文的一作是華人學生單思雄,高中畢業於北京十一學校,目前剛拿到了芝加哥大學的學士學位,將於9月份入學攻讀博士學位,師從趙燕斌教授和Heather Zheng教授。

作為芝加哥大學SAND Lab實驗室的一員,他的研究主要側重於機器學習和安全的交互,像如何利用不被察覺的輕微數據擾動,去保護用戶的隱私。

從單同學的推特來看,他一直致力於在這個「透明」的世界中,為我們爭取一點僅存的隱私。

論文的共同一作Emily Wenger同樣來自芝加哥大學SAND Lab實驗室,正在攻讀CS博士,研究方向是機器學習與隱私的交互,目前正在研究神經網絡的弱點、局限性和可能對隱私造成的影響。

項目連結:https://github.com/Shawn-Shan/fawkes/tree/master/fawkes

論文連結:http://people.cs.uchicago.edu/~ravenben/publications/pdf/fawkes-usenix20.pdf

參考連結:https://www.theregister.com/2020/07/22/defeat_facial_recognition/

相關焦點

  • 給照片穿上「隱形鬥篷」,讓人臉識別失靈的新AI
    該程序主要使用AI技術,可以神不知鬼不覺地修改你的照片,以欺騙面部識別系統。下面伊莉莎白女王的兩張照片就充分展現了福克斯化腐朽為神奇的力量。如果告訴你其實這不是「一個人」,普通人很難看出有什麼區別,但對於人臉識別系統來說,這就是天壤之別。
  • 華為破解全球最厲害的人臉識別系統
    一個先進的人臉識別模型如此輕易就被 「攻破」 了! 只需一張貼紙,人臉識別系統瞬間「失靈」 不僅如此,研究人員嘗試了不同光照方向對系統的影響
  • 人臉解鎖照片能破?閉眼就廢?曠視(Face++):不存在的
    人臉識別解決方案廠商曠視(Face++)作為已為國產兩款不同機型提供人臉解鎖技術的企業,本著對技術應用一絲不苟的精神,馬上就出來闢謠了:薛之謙......啊不對,刷臉解鎖「正確」的體驗是這樣的。曠視(Face++)拿出了搭載他們家人臉解鎖技術的手機,找了他們的當家花旦演示了一番人臉解鎖遭受花式攻擊的過程,從最基本的正臉,到戴眼鏡、戴帽子、戴口罩的故意遮擋,接著升級到用美女事先拍好的照片和視頻進行攻擊,最後還特應景的真實上演「老婆」偷刷熟睡「老公」手機的段子。
  • 什麼是SeetaFace開源人臉識別引擎?
    然而,人臉識別並非完全成熟的技術,離公眾期望的全面應用尚有距離,還需要學術界、工業界的共同努力。為此,整個人臉識別社區需要有基準(Baseline)系統,而且基準系統的水平顯然會極大影響著該領域的發展水平。可是令人尷尬的是,這個領域迄今尚無一套包括所有技術模塊的、完全開源的基準人臉識別系統!我們希望改變現狀,因此開源了SeetaFace人臉識別引擎。
  • 微博推新社交 app「綠洲」;蘋果多款產品加徵關稅至 15%;曠視回應...
    國內新聞微博推出全新社交產品「綠洲」微博發布全新社交產品「綠洲」,目前正在公測階段,需要邀請碼才能開啟使用,正式上線時間尚不明確。據官方介紹稱,綠洲用戶可以通過照片和視頻的方式分享生活。從官方給出的展示圖可以看出,該款 App 界面與 Instagram 十分相似。
  • 人臉識別技術面臨的困難與挑戰
    其中,涉及的問題包括:某刷臉解鎖手機App存在"反覆明文傳輸人臉圖片""未提供註銷帳號等渠道支持用戶刪除人臉信息""使用照片即可通過刷臉核驗"等現象和問題。  無獨有偶。
  • iPhoneX的人臉識別夠安全嗎?真的是最安全的生物識別嗎
    在iPhone X 取消指紋辨識,推出人臉識別之後,很多人第一時間就對其安全性做出質疑:「會不會有人拿著我的iPhone 對我掃一下,就直接把手機解鎖了?」網路上更傳出許多搞笑的情境,像是女友趁你睡著時,拿著iPhone 晃過去就直接解鎖。
  • 35 萬行代碼,曠視重磅開源天元深度學習框架 ,四大特性實現簡單開發
    2016年,微軟開發的認知工具包CNTK問世,支持RNN和CNN類型的神經模型,成為處理圖像,手寫和語音識別問題的最佳候選者。雖然CNTK的分布式計算性能較高,但缺乏對ARM架構的支持限制了其在行動裝置上的功能。
  • 人臉識別行業分析
    人臉識別技術原理簡單來講主要是三大步驟:一是建立一個包含大批量人臉圖像的資料庫;二是通過各種方式來獲得當前要進行識別的目標人臉圖像;三是將目標人臉圖像與資料庫中既有的人臉圖像進行比對和篩選。根據人臉識別技術原理具體實施起來的技術流程則主要包含以下四個部分,即人臉圖像的採集與預處理、人臉檢測、人臉特徵提取、人臉識別和活體鑑別。1.
  • AlphaGo Zero「無師自通」背後的偉大與局限 | 曠視孫劍解讀
    10 月 20 日,曠視科技(Face++)首席科學家孫劍博士接受了多家媒體的群訪,同時對 AlphaGo Zero 的技術升級做了相關闡釋。「偉大」和「局限」是這次群訪的關鍵詞。在孫劍看來,AlphaGo Zero 的技術提升足夠偉大,但在技術轉換落地過程中卻有著眾多局限。
  • 人臉識別哪家強?看看國內30家TOP企業!
    隨著技術的進一步成熟和社會認同度的提高,人臉識別技術將應用在更多的領域。而這個行業湧現出了像北京曠視科技、北京商湯科技等一批優秀的企業。,人臉識別技術的衡量維度太多,但從技術比較,比如圖像比對級的1:1,1:N,N:N;衡量的標準和維度都不同。比如算法精確度上,國內國外的人臉識別技術大多數在開源OPENCV等開源庫上進行新規則添加(深度學習進行疊層運算),公司之間的識別正確率差異僅僅在小數點上,99.6%-99.7%提升意義不大,如果說在LFW上稱王稱霸就是世界一流,就要被內行笑話了。
  • 人臉識別哪家強?蘋果Face ID與微軟Hello比拼
    在9月的新品發布會上,蘋果公司重點介紹了其最新產品iPhone X,尤其是使用了最新的生物識別技術——人臉識別。不過,尷尬的是,現場第一次嘗試人臉識別時,居然沒有成功,這也讓許多人擔心蘋果人臉識別的效果。除了個人隱私,一些人擔心FaceID(人臉識別)不可靠或者不夠快。實際上,這些擔心太多餘。
  • PyTorch實現,GitHub4000星:微軟開源的CV庫
    機器之心報導編輯:魔王、陳萍本文介紹了微軟開源的計算機視覺庫,它囊括了計算機視覺領域的最佳實踐、代碼示例和豐富文檔。近年來,計算機視覺領域突飛猛進,在人臉識別、圖像理解、搜索、無人機、地圖、半自動和自動駕駛方面得到廣泛應用。而這些應用的核心部分是視覺識別任務,如圖像分類、目標檢測和圖像相似度。
  • CVPR 2019 | 奪取6項冠軍的曠視如何築起算法壁壘
    參加 CVPR 對以算法為核心的曠視有重要的戰略意義。2019 年伊始,在成立八年之際,曠視宣布了從品牌到戰略的全面升級,並且確立了以算法為核心基因,圍繞計算視覺及相關傳感技術開發感知、控制、優化算法,包括但不限於人臉識別、手勢識別、文字識別、物體檢測、視頻分析、三維重建、智能傳感與控制等機器學習技術。
  • 人臉識別時代來臨有多危險?央視爆用2元就買到臉造假
    相信大家對Face ID不會陌生,內地更是將這個技術運用得淋漓盡致,購物用「刷臉」支付、用手機用「刷臉」解鎖,進住宅小區用「刷臉」開門,越來越多範疇都會運用到人臉識別技術,但隨之而來的是訊息安全風險。中央電視臺就揭發了市面上只需要用2元人民幣就可以買到過千張人臉照片,不法之徒可以利用這些照片,通過「照片活化」軟體生成動態影片,欺騙人臉核驗機,從而犯案!央視引述一份報告分析,目前中國人臉識別市場規模約佔全球市場的15%左右。
  • 最近火爆的3D人臉識別,你想要了解的都在這
    fNUesmc4、人臉匹配與識別 匹配與識別是指利用上一步提取到的人臉特徵,與樣本庫中存儲的特徵模板進行搜索匹配,在這個過程中,需要預先定義一個閾值,當相似度超過該閾值,則輸出匹配結果。fNUesmc手機人臉識別產業鏈人臉識別方法大致可以分為兩類:基於2D人臉圖像的人臉識別和基於3D人臉圖像的人臉識別。
  • 雲從科技:人臉識別技術照進產業場景的距離有多遠|AI TALK
    按照發起人阿里巴巴技術委員會主席王堅的說法,2050 是一個年份,不太近,充滿想像,也不太遠,我們都能活著看到。在第一次聽到「讓世界離年青人更近,讓年青人離世界更近」這樣的辦會理念時,我們想起機器之心用前沿科技內容聚合的全球 AI 青年,從在象牙塔裡研究技術到畢業後面臨創業、擇業的選項,他們不僅應該關心技術走向,也需要了解因為這些技術的創新促成了產業正在發生的商業變革。
  • 曠視天元深度學習框架全球首發!3個實習生寫下一行代碼,27項全球AI...
    6年前3名實習生從第一行代碼寫起,艱難創業中在全球AI競賽斬獲27項冠軍,今日天元開源,敢與TensorFlow等全球主流深度學習框架爭雄。這個絕密武器又解決了開發者哪些痛點?「新智元急聘主筆、高級主任編輯,添加HR微信(Dr-wly)或掃描文末二維碼了解詳情。」
  • 百度開源業內首個口罩人臉檢測及分類模型
    2月13日,百度宣布免費開源業內首個口罩人臉檢測及分類模型。該模型可以有效檢測在密集人流區域中攜帶和未攜戴口罩的所有人臉,同時判斷該者是否佩戴口罩。目前已通過飛槳PaddleHub開源出來,廣大開發者用幾行代碼即可快速上手,免費調用。
  • 【乾貨】中國人臉識別產業鏈全景圖!
    人臉識別技術在中國的發展起步於上世紀九十年代末,經歷了技術引進-專業市場導入-技術完善-技術應用-各行業領域使用等五個階段。其中,2014年是深度學習應用於人臉識別的關鍵一年,該年FaceBook發表一篇名為「Deep Face系統:達到肉眼級別的人臉識別系統」的文章,之後Face++(曠視科技)創始人印奇團隊以及香港中文大學湯曉鷗團隊均在深度學習結合人臉識別領域取得優異效果。