可怕!被狠狠打了「馬賽克」的圖片,就這樣被AI還原了

2020-12-12 雷鋒網

『教資』成績出來了。

不知道大家報名考試了沒?考過了沒?分享了沒?

昨晚,#教師資格證書成績#話題衝上微博熱搜榜首,瀏覽量超過了21億,不少網友在微博曬出自己的成績單。

有的高分通過,準備面試;有的涼涼,準備明年再接再厲;還有的單科卡在了69.....

這個就比較扎心了。

不過更扎心的,可能是不僅教資沒過,還因為曬圖洩露了個人信息。

你可能覺得奇怪,大家明明把「姓名、身份證號、準考證號」等個人敏感信息都打上了馬賽克,為什麼還會洩露信息?難不成還可以恢復?

可能還真的可以!

同樣在昨晚,GitHub上一個AI項目衝上了熱榜,截止目前已經收穫了8.4k星標。

這個AI的主要功能就是:去除馬賽克,還原字符密碼。

AI破解『密碼』

相信不少人都認為,只要打上了馬賽克,就不會洩露敏感信息,因此,我們在朋友圈、微博等公開社交平臺,經常能夠看到打了馬賽克的結婚照、證書照、成績照等。

但事實上,無論是圖像、文字還是字符,AI還原馬賽克已經不是什麼難事了。

最近一位名為Sipke Mellema的程式設計師便開發了這樣一款工具。他說,一些公司在內部文檔中經常會使用像素化的方式顯示密碼,但沒有工具可以從這樣的圖像中恢復密碼,因此便創建了一個。

我們先來看下效果圖:

其中,第一行是被像素化後的密碼序列,被狠狠地打了一層馬賽克,看不出一點原始痕跡。

第二行是經過AI還原後的密碼,可以看到密碼序列基本被還原了,而且準確度很高,只有稍加推理就能得到第三行的原始密碼。

那麼,這個「不可思議」的AI還原技術是如何實現的?

我們知道,馬賽克是圖像像素化處理的一種手段,它通過將影像特定區域的色階細節劣化並打亂色塊,達到一種模糊圖像的效果。

像素化在許多領域被用於模糊圖像信息,其中線性盒濾波器( Linear Box Filter)是一種較為普遍的處理算法。盒子濾波也稱為方框濾波,它採用一個像素框,用該框中所有像素的平均值覆蓋像素。

像這樣,表情圖像被分為四個色塊,每個色塊被色塊平均值所覆蓋,最終形成了像素化表情,由於原始信息丟失,因此不能直接反轉濾波器。

Mellema正是利用了盒子濾波器,提出了AI還原算法-Depix。

線性盒濾波器是一種確定性算法,對相同的值執行像素化通常會產生同樣的像素塊(Block),那麼反之,使用相同位置的塊對相同文本執行像素化,是否也會得到同樣的塊值?

Mellema嘗試通過像素化文本來找出匹配的模式,結果發現確實如此。

具體來說,Mellema把每個塊或塊組合看作一個子問題。該算法要求在相同背景上,具備相同的文本大小和顏色,因此他沒有選擇創建潛在字符的查找表,因為現代文本編輯器可以添加色調、飽和度和亮度,也就是說存在海量潛在字符。

在處理字符方面,Mellema使用待處理字符的德布魯因序列(De Bruijn sequence),將其粘貼到相同的編輯器中,然後截圖。該截圖可用作相似塊的查找圖像,例如:

德布魯因序列包括待處理字符的所有雙字符組合,這一點很重要,因為一些塊會重疊兩個字符。

要找出合適的匹配需要搜索圖像中具備相同像素配置的塊。在測試中,Depix 算法無法找到字符「o」,因為在搜索圖像中,搜索塊還包含下一個字母「d」,但在原始圖像中這裡有個空格。

顯然,在創建字符的德布魯因序列時,如果加上空格會帶來同樣的問題,即算法無法找到後續字母恰當的塊。有空格又有字母的圖像需要更長的搜索時間,但結果也更好。

對於大多數像素化圖像而言,Depix可以找到塊的單個匹配結果。它先假設這些塊是正確的,然後將周圍多個匹配塊進行比較,使其與像素化圖像中的幾何距離相同,並假設這些匹配也是正確的。

在正確的塊沒有更多幾何匹配後,Depix 直接輸出所有正確的塊。對於多匹配塊,Depix 將輸出所有匹配的平均值。雖然 Depix 的輸出並不完美,但已經算不錯了。

下圖展示了包含隨機字符的測試圖像的去像素化結果,大部分字符被正確讀取:

最後需要說明的是,Mellema開發這個AI項目並不是為了竊取信息,而是利用ECB和明文攻擊(Known-Plaintext Attacks)的模式,提高信息保護技術。在他看來,不知道如何破壞當前的保護模式,是信息安全中的常見陷阱。

AI還原『人臉圖像』

如前所述,除了字符密碼,AI還原人臉照也不在話下。

今年6月中旬,杜克大學推出AI算法—PULSE,可以將低解析度的人臉圖像放大64倍,即使是打了馬賽克,面部的毛孔、皺紋,頭髮也都能變得清晰可見。

不過,被還原的人臉是一全新的虛擬面孔,並不是真實存在的。其中眼睛、鼻子、嘴巴等五官是AI在原始圖像的基礎上,自行想像出的結果。

因此,這項AI技術不能用於身份識別。比如監控攝像頭拍攝的失焦、無法辨別的圖片,不能通過PULSE還原成真實存在的人像。不過,它在醫學、顯微鏡、天文學,以及衛星圖像等領域有著廣泛的應用場景。

在技術方面,不同其他超解析度算法,PULSE不是遍歷LR(Low Resolution)圖像來慢慢添加細節,而是發現與HR相對應的LR,通過「縮減損失(Downscale)」的方式得到SR(Super Resolution)圖像。

其次,PULSE使用了生成對抗網絡(GAN)來進行模型訓練。GAN包括一個生成器(Generator)和一個鑑別器(Discriminator),在同一組照片訓練中,二者通過相互博弈的方式檢驗輸出是否足夠逼真。

最後,無論是利用AI還原字符密碼、還是人臉圖像,其初心都是科技向善。但這些AI技術不可避免地被有些人用於不良或非法用途。

因此,在這個科技高速發展的現在,保護個人數據顯得尤為重要。

引用連結:

https://www.linkedin.com/pulse/recovering-passwords-from-pixelized-screenshots-sipke-mellema/?trackingId=yYFSUnuxRXasNV%2Fh3ZsiSw%3D%3D

https://gizmodo.com/researchers-have-created-a-tool-that-can-perfectly-depi-1844051752

https://en.wikipedia.org/wiki/De_Bruijn_sequence

https://github.com/beurtschipper/Depix

雷鋒網雷鋒網雷鋒網

相關焦點

  • 可怕!被狠狠打了『馬賽克』的圖片,就這樣被AI還原了
    這個AI的主要功能就是:去除馬賽克,還原字符密碼。相信不少人都認為,只要打上了馬賽克,就不會洩露敏感信息,因此,我們在朋友圈、微博等公開社交平臺,經常能夠看到打了馬賽克的結婚照、證書照、成績照等。但事實上,無論是圖像、文字還是字符,AI還原馬賽克已經不是什麼難事了。最近一位名為Sipke Mellema的程式設計師便開發了這樣一款工具。
  • 被狠狠打了 「馬賽克」的圖片,就這樣被 AI 還原了
    這個 AI 的主要功能就是:去除馬賽克,還原字符密碼。AI 破解『密碼』相信不少人都認為,只要打上了馬賽克,就不會洩露敏感信息,因此,我們在朋友圈、微博等公開社交平臺,經常能夠看到打了馬賽克的結婚照、證書照、成績照等。但事實上,無論是圖像、文字還是字符,AI 還原馬賽克已經不是什麼難事了。
  • 被狠狠打了「馬賽克」的圖片 就這樣被AI還原了
    你可能覺得奇怪,大家明明把「姓名、身份證號、準考證號」等個人敏感信息都打上了馬賽克,為什麼還會洩露信息?難不成還可以恢復?可能還真的可以!同樣在昨晚,GitHub上一個AI項目衝上了熱榜,截止目前已經收穫了8.4K星標。這個AI的主要功能就是:去除馬賽克,還原字符密碼。
  • 打馬賽克就安全了嗎?AI消除馬賽克,GitHub開源項目上線三天收穫近...
    機器之心報導作者:魔王、小舟還在用馬賽克的方式隱藏密碼?小心被「看穿」。像素化(又稱馬賽克)是一種常見的打碼方式,通過降低圖像中部分區域的解析度來隱藏某些關鍵信息,比如:
  • 這種馬賽克,能被 AI 一鍵去除了
    而這個 AI 項目叫做 Depix,主要用處就是拿來清除馬賽克,還原字符密碼的。也就是說,大家發在社交網絡上的圖片,哪怕給個人隱私信息打了碼,有心之人也能想盡辦法去除馬賽克,盜取你的信息。Depicx 大概就是通過這樣的辦法,來達成去除馬賽克還原字符密碼的目的。雖然這個 AI 項目不一定完全能做到絕對正確,但你看看這麼高的星標數就能想到,其效果應該是非常不錯的。
  • 打馬賽克就安全了嗎?AI消除馬賽克,項目上線三天收穫近7000星
    機器之心報導作者:魔王、小舟還在用馬賽克的方式隱藏密碼?小心被「看穿」。像素化(又稱馬賽克)是一種常見的打碼方式,通過降低圖像中部分區域的解析度來隱藏某些關鍵信息,比如:再比如:看圖找馬賽克!(找不到請看右側原圖)但是,在你想隱藏信息的同時,有一些技術卻反其道而行之,試圖將圖片還原為原始狀態。
  • 馬賽克為何誕生,又為何我們去不掉它
    一張打了馬賽克的圖。聽起來是句廢話,但事實上,從這張圖被打馬賽克開始,它就變成了另一張圖,再也無法回到最初的「美好」了。因為打了馬賽克的圖,是不可逆的。儘管並非原視頻,但它在技術之下越來越接近真實,不僅會損害視頻中演員的權益,還會很大程度影響日本「馬賽克化」的影視產業。這樣的「去碼」之路,其實年年都有研究者前赴後繼,各類新軟體也已經屢見不鮮。
  • 馬賽克在AI面前可能不安全了 這種馬賽克能被 AI 一鍵去除了
    而這個 AI 項目叫做 Depix,主要用處就是拿來清除馬賽克,還原字符密碼的。     也就是說,大家發在社交網絡上的圖片,哪怕給個人隱私信息打了碼,有心之人也能想盡辦法去除馬賽克,盜取你的信息。     來來來,狐妹先給你們看下效果圖,來證明一下我可不是胡編亂造的。
  • 日本「馬賽克」不只存於 「明日花」馬賽克是隱藏還是為了展露更多
    作為潮流屆的「退隱女優」,影視圈的「快嘴Rapper」,性感女神的「業界標杆」,明日花綺羅的故事早就變成眾所周知的「秘密」。即便不再從事過去的職業,但明日花的實質依然是一名知名演員。自打隱退後,粉絲們自始至終未停住「重歸」的呼籲,不久前也是在粉絲的渴望下,宣布參演了《鋼鐵女孩:最後戰役》,重返經典。
  • Github高贊:給文字打馬賽克=形同虛設,AI看透你一切小心思
    截止發文,此項目已經火速達到1w+的star量:而就是這項技術,能夠解碼被打上馬賽克的文字,你的所有努力,甚至有了」欲蓋彌彰「的效果。其實在有心人看來,你的操作可以馬上成為徒勞:只需要再次利用手機的圖片編輯功能,將曝光、鮮明度、高光、陰影、亮度等參數全部調至+100,然後再將對比度參數調至-100,然後,神奇的事情發生了:行家都知道,相比於塗鴉,馬賽克卻無法被修復和逆轉,令人非常的安心。
  • AI一秒還原馬賽克
    據說它能夠將圖像原始解析度放大64倍,任何渣畫質都可以秒變高清、逼真圖像,甚至被打了馬賽克的人臉圖像,毛孔、皺紋,頭髮也都能被清晰還原。馬賽克秒變高清人像PULSE是一種新型超解析度算法,它通過潛在空間探索對照片採樣,可以將16x16像素的低解析度(Low Resolution,簡稱LR)放大到1024x1024像素的高解析度(High Resolution,簡稱HR),在幾秒內增加了64倍,而傳統方法最多只能放大8倍。
  • 只知道 AI 深不可測,沒想到還能去馬賽克 | 愛範兒
    一般的水印或者馬賽克,用 Photoshop 的「內容識別」工具就能搞定。只需要框選水印區域,選擇「填充」-「內容識別」,軟體便會根據選區周邊的內容自動填充,在那些構圖和色彩簡單的圖片上可以輕鬆去除不想要的元素。
  • Github高贊:給文字打馬賽克=形同虛設,AI看透你一切小心思,已開源
    而就是這項技術,能夠解碼被打上馬賽克的文字,你的所有努力,甚至有了」欲蓋彌彰「的效果。 Depix——修復厚碼文字內容,現已開源 Depix的主要功能,就是利用AI算法,將被像素化的文本內容從馬賽克中還原出來。
  • 還原線下一對一教學場景,「AI音樂學院」利用樂音識別技術實現邊看...
    還原線下一對一教學場景,「AI音樂學院」利用樂音識別技術實現邊看邊練個性化教學 作者:畢果 發布時間:
  • 已開源 美國開發全新AI算法:馬賽克美女自動還原
    看到模糊的照片,是不是有還原真實面目的衝動?以前的技術做不到,在AI時代一切皆有可能。美國杜克大學開發的AI算法就可以做到馬賽克圖片變高清。低清變高清的算法並不稀奇,目前技術都支持了SDR超解析度技術,包括視頻畫質增強、圖片增強等領域都有這個算法的存在,它將低解析度圖片填補細節,給圖片增加像素以儘可能提高畫質。
  • 美國杜克大學開發全新算法:AI去馬賽克 毛孔、頭髮都能給你還原了
    AI人工智慧技術近年來大熱,尤其是在圖像識別領域,大家很期待的一個功能就是AI去馬賽克。美國杜克大學的研究人員日前發明了一種新的PULSE算法,它可以將低分辨圖片變成高清圖片,細緻到毛孔、頭髮都能神還原。
  • 馬賽克技術在AI面前會被攻破嗎?
    人們收看電視經常會看見一些法制節目中犯罪嫌疑人臉部被打碼,也就是所謂的馬賽克技術,它是一種常見圖像與視頻的處理手段。可以將關鍵信息部位色階細節劣化造成模糊效果,從而達到無法辨認的效果。如今隨著人工智慧的發展,AI技術也被用於方方面面的領域,對於一些老照片可以進行細節修復,黑白照片可以還原成彩色照,甚至也可以將靜態圖片變為動態。而最近AI技術在處理視頻照片方面又有了重大突破,一款名為Depix的項目由於能解碼被打上馬賽克文字而引起廣泛爭議讓馬賽克在AI面前都顯得不安全,但目前只適用於使用線性方框濾波器創建的像素化圖像。
  • 機器會給你的照片打「壞人」標籤?國外網紅項目聚焦 AI 偏見
    ImageNetRoulette 數字藝術項目通過使用 AI 分析描述用戶上傳的圖片,揭示出了這一嚴峻問題。本期全媒派(ID:quanmeipai)獨家編譯《紐約時報》對 ImageNetRoulette 項目的評論,為你呈現人工智慧背後的「隱形偏見」。
  • 再厚的馬賽克都能被扒乾淨?這款開源「去碼」神器火了
    在個人隱私極其容易洩露的網絡時代,大家可能都會使用馬賽克來遮蓋圖片上的敏感信息。  比如身份證號、姓名、地址,用馬賽克掩蓋後,就能有效達到保護信息安全的目的。    讓它火出圈子的,就是下面這張效果圖:  如圖所示,第一行是打了一層巨厚馬賽克完全像素化後的文本內容,看不出一點原始痕跡。
  • CallmeMOSAIC馬賽克書店與睿本MOP 堅持做自己「信」的事
    所以原先的商業被網際網路衝成廢墟無可避免,品牌要做的是在廢墟上以「增加顧客價值」的方式重建。我們每個人其實都有這樣的感受,如果只是為了購物,相比於人擠人的商場,我們更願意在網上點點滑鼠。而走進實體店,顧客更想要的是體驗,或者說「享受」。