馬賽克在AI面前可能不安全了,新技術讓厚碼文字被還原

2020-12-16 騰訊網

相信不少人都認為,只要打上了馬賽克,就不會洩露敏感信息,因此,我們在朋友圈、微博等公開社交平臺,經常能夠看到打了馬賽克的結婚照、證書照、成績照等。但事實上,無論是圖像、文字還是字符,AI 還原馬賽克已經不是什麼難事了。

12月14日,據媒體報導,一個名為Depix的項目引發熱議。Depix能夠解碼被打上馬賽克的文字,但只適用於使用線性方框濾波器創建的像素化圖像。除了Depix,谷歌的超強像素遞歸方案、杜克大學的AI算法PULSE,也能將面目模糊的人像變得清晰可辨。

看一下效果圖,其中,第一行是被像素化後的密碼序列,被狠狠地打了一層馬賽克,看不出一點原始痕跡。

第二行是經過 AI 還原後的密碼,可以看到密碼序列基本被還原了,而且準確度很高,只有稍加推理就能得到第三行的原始密碼

那麼,這個「不可思議」的 AI 還原技術是如何實現的?

我們知道,馬賽克是圖像像素化處理的一種手段,它通過將影像特定區域的色階細節劣化並打亂色塊,達到一種模糊圖像的效果。

像素化在許多領域被用於模糊圖像信息,其中線性盒濾波器( Linear Box Filter)是一種較為普遍的處理算法。盒子濾波也稱為方框濾波,它採用一個像素框,用該框中所有像素的平均值覆蓋像素。

像這樣,表情圖像被分為四個色塊,每個色塊被色塊平均值所覆蓋,最終形成了像素化表情,由於原始信息丟失,因此不能直接反轉濾波器。

AI 還原算法 - DepixMellema 正是利用了盒子濾波器 。

線性盒濾波器是一種確定性算法,對相同的值執行像素化通常會產生同樣的像素塊(Block),那麼反之,使用相同位置的塊對相同文本執行像素化,是否也會得到同樣的塊值?

Mellema 嘗試通過像素化文本來找出匹配的模式,結果發現確實如此。

具體來說,Mellema 把每個塊或塊組合看作一個子問題。該算法要求在相同背景上,具備相同的文本大小和顏色,因此他沒有選擇創建潛在字符的查找表,因為現代文本編輯器可以添加色調、飽和度和亮度,也就是說存在海量潛在字符。

在處理字符方面,Mellema 使用待處理字符的德布魯因序列(De Bruijn sequence),將其粘貼到相同的編輯器中,然後截圖。該截圖可用作相似塊的查找圖像,例如:

德布魯因序列包括待處理字符的所有雙字符組合,這一點很重要,因為一些塊會重疊兩個字符。

要找出合適的匹配需要搜索圖像中具備相同像素配置的塊。在測試中,Depix 算法無法找到字符「o」,因為在搜索圖像中,搜索塊還包含下一個字母「d」,但在原始圖像中這裡有個空格。

顯然,在創建字符的德布魯因序列時,如果加上空格會帶來同樣的問題,即算法無法找到後續字母恰當的塊。有空格又有字母的圖像需要更長的搜索時間,但結果也更好。

對於大多數像素化圖像而言,Depix 可以找到塊的單個匹配結果。它先假設這些塊是正確的,然後將周圍多個匹配塊進行比較,使其與像素化圖像中的幾何距離相同,並假設這些匹配也是正確的。

在正確的塊沒有更多幾何匹配後,Depix 直接輸出所有正確的塊。對於多匹配塊,Depix 將輸出所有匹配的平均值。雖然 Depix 的輸出並不完美,但已經算不錯了。

下圖展示了包含隨機字符的測試圖像的去像素化結果,大部分字符被正確讀取:

最後需要說明的是,這個 AI 項目並不是為了竊取信息,而是利用 ECB 和明文攻擊(Known-Plaintext Attacks)的模式,提高信息保護技術。在他看來,不知道如何破壞當前的保護模式,是信息安全中的常見陷阱。

AI 還原『人臉圖像』

如前所述,除了字符密碼,AI 還原人臉照也不在話下。

今年 6 月中旬,杜克大學推出 AI 算法—PULSE,可以將低解析度的人臉圖像放大 64 倍,即使是打了馬賽克,面部的毛孔、皺紋,頭髮也都能變得清晰可見。

不過,被還原的人臉是一全新的虛擬面孔,並不是真實存在的。其中眼睛、鼻子、嘴巴等五官是 AI 在原始圖像的基礎上,自行想像出的結果。

因此,這項 AI 技術不能用於身份識別。比如監控攝像頭拍攝的失焦、無法辨別的圖片,不能通過 PULSE 還原成真實存在的人像。不過,它在醫學、顯微鏡、天文學,以及衛星圖像等領域有著廣泛的應用場景。

在技術方面,不同其他超解析度算法,PULSE 不是遍歷 LR(Low Resolution)圖像來慢慢添加細節,而是發現與 HR 相對應的 LR,通過 「縮減損失(Downscale)」的方式得到 SR(Super Resolution)圖像。

其次,PULSE 使用了生成對抗網絡(GAN)來進行模型訓練。GAN 包括一個生成器(Generator)和一個鑑別器(Discriminator),在同一組照片訓練中,二者通過相互博弈的方式檢驗輸出是否足夠逼真。

最後,無論是利用 AI 還原字符密碼、還是人臉圖像,其初心都是科技向善。但這些 AI 技術不可避免地被有些人用於不良或非法用途。

因此,在這個科技高速發展的現在,保護個人數據顯得尤為重要。

相關焦點

  • 新技術還原厚碼文字,以後馬賽克也不安全了啊
    關注科技百話,帶給你不一樣的科技訊息!提到馬賽克,很多人應該都比較熟悉吧,有些時候,在網上交流發送訊息的時候,如果有些地方不想要別人看到,大部分都會選擇使用打上馬賽克這種方式,確實,這也是一種非常不錯的「掩蓋信息」的途徑。
  • Github高贊:給文字打馬賽克=形同虛設,AI看透你一切小心思
    【新智元導讀】繼修復塗鴉圖片之後,厚碼文字也不再安全了?近日,名為Depix的Github項目火爆全網,一切故意而為之的「文字密碼」,在這一AI技術的處理下,瞬間就「暴露於光天之下」。「來P個圖吧!」 「好呀,不過這段話得打碼,不然就麻煩了!」
  • 馬賽克在AI面前可能不安全了 這種馬賽克能被 AI 一鍵去除了
    川北在線核心提示:原標題:馬賽克在AI面前可能不安全了 這種馬賽克能被 AI 一鍵去除了 說到馬賽克這東西,一直以來都讓人又愛又恨。 這東西讓人恨在什麼地方,我就不直說了吧? 各位老司機一定比我這個 18 歲的少女懂的多了去了。
  • 馬賽克在AI面前可能不安全了,你會擔心隱私安全嗎?
    8、全球累計新冠確診病例達72196732例,死亡病例達1630521例。9、日本首相菅義偉上臺已滿三個月,然而,11月中旬以後,日本新冠疫情急轉直下,菅義偉的應對方案備受批評,導致其支持率跌至新低。10、致36人遇難的京都動畫縱火案迎重要節點!嫌疑人被起訴。
  • Github高贊:給文字打馬賽克=形同虛設,AI看透你一切小心思,已開源
    新智元報導編輯:keyu【新智元導讀】繼修復塗鴉圖片之後,厚碼文字也不再安全了?不,這不是聳人聽聞, 最近 一個名為Depix的GitHub項目火了,上線僅僅三天,star量就已經高達7K。 截止發文,此項目已經火速達到1w+的star量:而就是這項技術,能夠解碼被打上馬賽克的文字,你的所有努力,甚至有了」欲蓋彌彰「的效果。
  • 馬賽克技術在AI面前會被攻破嗎?
    如今隨著人工智慧的發展,AI技術也被用於方方面面的領域,對於一些老照片可以進行細節修復,黑白照片可以還原成彩色照,甚至也可以將靜態圖片變為動態。而最近AI技術在處理視頻照片方面又有了重大突破,一款名為Depix的項目由於能解碼被打上馬賽克文字而引起廣泛爭議讓馬賽克在AI面前都顯得不安全,但目前只適用於使用線性方框濾波器創建的像素化圖像。
  • 馬賽克這東西越來越不行了,開源AI已能恢復文字馬賽克
    馬賽克在我們現在的數字生活時代中可以說是隨處可見,它已經普及到了我們大量的日常的工具中了。出於安全或規避等心態考慮,我們往往會利用馬賽克技術擦除必要的信息,以便達到保護和隱藏的目的。雖然一直以來,馬賽克都已經被公認為是一種可靠的技術了,可是不幸的是「萬惡」的人工智慧技術來了。
  • 「馬賽克去除器」,利用AI技術還原馬賽克,好事還是壞事
    所以對於馬賽克,大部分人是十分討厭的,因為有時候就是這些方塊的小格子,阻擋了我們的視野,讓我們不能看清圖片之後到底是什麼。所以關於攻破「馬賽克」的技術就成為了很多業界大佬們想要完成的目標。所以我們也經常能夠在一些雜誌網頁上瀏覽到一些關於「馬賽克去除器」的廣告,當然大部分都是虛假的,並沒有什麼實際效果。但是要知道人外有人,天外有天,還真就有人製作出了馬賽克去除器。
  • 馬賽克美女有救了,美國新AI算法可以還原馬賽克畫面內容
    在很多場合下,打馬賽克都是很有用也很必要的,比如出於安全和保護的初衷。不過人類就是這麼奇怪,娛樂般的好奇心總是這麼永無止境,就好像很多年輕的朋友一樣,好奇心泛濫,對馬賽克畫面深惡痛絕,看到很多模糊的照片,打馬賽克的照片,總是想一窺究竟,想還原一下馬賽克下面到底是什麼樣的畫面?
  • 被狠狠打了 「馬賽克」的圖片,就這樣被 AI 還原了
    不過更扎心的,可能是不僅教資沒過,還因為曬圖洩露了個人信息。你可能覺得奇怪,大家明明把 「姓名、身份證號、準考證號」等個人敏感信息都打上了馬賽克,為什麼還會洩露信息?難不成還可以恢復?可能還真的可以!這個 AI 的主要功能就是:去除馬賽克,還原字符密碼。AI 破解『密碼』相信不少人都認為,只要打上了馬賽克,就不會洩露敏感信息,因此,我們在朋友圈、微博等公開社交平臺,經常能夠看到打了馬賽克的結婚照、證書照、成績照等。但事實上,無論是圖像、文字還是字符,AI 還原馬賽克已經不是什麼難事了。
  • 被狠狠打了「馬賽克」的圖片 就這樣被AI還原了
    你可能覺得奇怪,大家明明把「姓名、身份證號、準考證號」等個人敏感信息都打上了馬賽克,為什麼還會洩露信息?難不成還可以恢復?可能還真的可以!同樣在昨晚,GitHub上一個AI項目衝上了熱榜,截止目前已經收穫了8.4K星標。這個AI的主要功能就是:去除馬賽克,還原字符密碼。
  • 被狠狠打了「馬賽克」的圖片,就這樣被AI還原了
    不過更扎心的,可能是不僅教資沒過,還因為曬圖洩露了個人信息。你可能覺得奇怪,大家明明把「姓名、身份證號、準考證號」等個人敏感信息都打上了馬賽克,為什麼還會洩露信息?難不成還可以恢復?可能還真的可以!但事實上,無論是圖像、文字還是字符,AI還原馬賽克已經不是什麼難事了。最近一位名為Sipke Mellema的程式設計師便開發了這樣一款工具。他說,一些公司在內部文檔中經常會使用像素化的方式顯示密碼,但沒有工具可以從這樣的圖像中恢復密碼,因此便創建了一個。
  • 再厚的馬賽克都能被扒乾淨?這款開源「去碼」神器火了
    也有人說,馬賽克就是阻礙人類進步的絆腳石。  從功能上講,馬賽克是一種用來遮蓋原畫面的手段,有利也有弊。  從技術上講,馬賽克的原理是將某一個像素的顏色塗抹到整個範圍而造成原畫信息丟失。  所以,這個過程是不可逆的。
  • 馬賽克已經不安全了
    說到馬賽克這東西,一直以來都讓人又愛又恨。 這東西讓人恨在什麼地方,我就不直說了吧? 大家都以為,只要打了馬賽克就能避免讓其他人看到自己不想被別人看到的信息。 但事實上真是如此嗎? 不不不,今天我必須要用現實殘忍地擊碎大家這個想法。
  • 打馬賽克就安全了嗎?AI消除馬賽克,GitHub開源項目上線三天收穫近...
    機器之心報導作者:魔王、小舟還在用馬賽克的方式隱藏密碼?小心被「看穿」。像素化(又稱馬賽克)是一種常見的打碼方式,通過降低圖像中部分區域的解析度來隱藏某些關鍵信息,比如:
  • 打馬賽克就安全了嗎?AI消除馬賽克,上線三天收穫近7000星
    還在用馬賽克的方式隱藏密碼?小心被「看穿」。像素化(又稱馬賽克)是一種常見的打碼方式,通過降低圖像中部分區域的解析度來隱藏某些關鍵信息,比如:看圖找馬賽克!(找不到請看右側原圖)但是,在你想隱藏信息的同時,有一些技術卻反其道而行之,試圖將圖片還原為原始狀態。
  • 打馬賽克就安全了嗎?AI消除馬賽克,項目上線三天收穫近7000星
    機器之心報導作者:魔王、小舟還在用馬賽克的方式隱藏密碼?小心被「看穿」。像素化(又稱馬賽克)是一種常見的打碼方式,通過降低圖像中部分區域的解析度來隱藏某些關鍵信息,比如:再比如:看圖找馬賽克!(找不到請看右側原圖)但是,在你想隱藏信息的同時,有一些技術卻反其道而行之,試圖將圖片還原為原始狀態。
  • AI黑科技真的能去馬賽克嗎
    馬賽克的原理很簡單,把大量的小像素點合併到一個大的像素點,並取平均色,就製造成了馬賽克。馬賽克顯然屬於不可逆運算,你無法從一個平均數,推斷出它是由哪幾個數平均而來的。然而,馬賽克是否當真完全不可能還原?一般來說,要消除馬賽克,需要人進行想像腦補,然後把缺失的內容重新畫出來。這種方法效率低,而且效果並不穩定。近幾年AI技術的風行,帶來了很多不可思議的應用。
  • 美國開發全新開源AI算法:馬賽克美女自動還原
    看到模糊的照片,是不是有還原真實面目的衝動?以前的技術做不到,在AI時代一切皆有可能。美國杜克大學開發的AI算法就可以做到馬賽克圖片變高清。低清變高清的算法並不稀奇,目前技術都支持了SDR超解析度技術,包括視頻畫質增強、圖片增強等領域都有這個算法的存在,它將低解析度圖片填補細節,給圖片增加像素以儘可能提高畫質。
  • AI智能去除馬賽克!AI技術就是這麼給力,保證原本高清度
    眾所周知,當代技術已經到達了一個爐火純青的地步,正所謂,沒有網際網路科技辦不到的事情,這句話說的一點也不假。如今,通過快速的網絡以及發達的人工智慧,我們的生活已經產生的無數的便捷,而且,在未來,科技的力量是無法預估的。