打馬賽克就安全了嗎?AI消除馬賽克,GitHub開源項目上線三天收穫近...

2020-12-14 澎湃新聞

機器之心報導

作者:魔王、小舟

還在用馬賽克的方式隱藏密碼?小心被「看穿」。

像素化(又稱馬賽克)是一種常見的打碼方式,通過降低圖像中部分區域的解析度來隱藏某些關鍵信息,比如:

再比如:

看圖找馬賽克!(找不到請看右側原圖)

但是,在你想隱藏信息的同時,有一些技術卻反其道而行之,試圖將圖片還原為原始狀態。

最近,一個名為 Depix 的 GitHub 項目爆火,上線三天 star 量已經高達 6.9k。項目作者 Sipke Mellema 是一名信息安全顧問。

項目地址:https://github.com/beurtschipper/Depix

Depix 能夠從像素化圖像截圖中恢復原圖中包含的文字密碼。該項目適用於使用線性方框濾波器(linear box filter)創建的像素化圖像。如下圖所示,項目作者給出了像素化圖像、恢復之後的效果和原圖的對比結果:

馬賽克打得夠嚴實了,不過 Depix 還是基本解讀出了被隱藏的信息。

如何使用

使用 Depix 從像素化圖像截圖中恢復文字密碼,操作也比較簡單:

從截圖中分割出矩形像素化 block;

在具有相同字體設置(包括文本大小、字體、顏色、hsl)的編輯器中,粘貼待處理字符的德布魯因(De Bruijn sequence)。

給該序列截圖,儘可能使用和像素化圖像相同的截圖工具。

執行命令:

python depix.py -p [pixelated rectangle image] -s [search sequence image] -o output.png

Depix 算法利用線性方框濾波器單獨處理每一個 block 這一事實。它對搜索圖像中的每一個 block 執行像素化以尋找直接匹配。

對於大部分像素化圖像,Depix 儘量尋找單匹配結果,並假設這些匹配是正確的。至於周圍多匹配 block 的結果被看作像素化圖像中相同的幾何距離,並認為這些匹配也是正確的。該過程重複多次。

在正確的 block 沒有更多幾何匹配後,Depix 將直接輸出所有正確的 block。對於多匹配 block,Depix 將輸出所有匹配的平均值。

Depix 背後的算法

像素化常使用線性方框濾波器實現。線性方框濾波器的實現很簡單,速度很快,可以並行處理多個 block。

由於線性方框濾波器是一種確定性算法,對同樣的值執行像素化通常會產生同樣的像素化 block。使用同樣位置的 block 對相同文本執行像素化,會得到同樣的 block 值。我們可以嘗試像素化文本來找出匹配的模式。幸運的是,這對於秘密值的一部分同樣奏效。我們可以把每個 block 或 block 組合看作一個子問題。

項目作者沒有選擇創建潛在字體的查找表。該算法要求在相同背景上具備相同的文本大小和顏色。現代文本編輯器還會添加色調、飽和度和亮度,也就是說存在海量潛在字體。

項目作者給出的解決方案也很簡單:使用待處理字符的德布魯因序列,將其粘貼到相同的編輯器中,然後截圖。該截圖可以用作相似 block 的查找圖像,例如:

德布魯因序列包括待處理字符的所有雙字符組合。這很重要,因為一些 block 會重疊兩個字符。找出恰當的匹配需要搜索圖像中具備相同像素配置的 block。

在以下測試圖像中,Depix 算法無法找到「o」的一部分。這是因為在搜索圖像中,搜索 block 還包含下一個字母(「d」)的一部分,但在原始圖像中這裡有個空格。

創建字母的德布魯因序列時加上空格顯然會帶來同樣的問題:算法無法找到後續字母的恰當 block。有空格又有字母的圖像需要更長的搜索時間,但結果也更好。

對於大部分像素化圖像而言,Depix 似乎能夠找到 block 的單匹配結果,並假設這是正確的。然後將其周圍多匹配 block 的匹配結果看作在像素化圖像中處於相同的幾何距離,並假設這些匹配也是正確的。

在正確的 block 沒有更多幾何匹配後,Depix 直接輸出所有正確的 block。對於多匹配 block,Depix 將輸出所有匹配的平均值。雖然 Depix 的輸出並不完美,但已經算不錯了。

下圖展示了包含隨機字符的測試圖像的去像素化結果,大部分字符被正確讀取:

對這個項目感興趣的讀者,可以自行嘗試。

以後截圖時給敏感信息打碼,看來不能簡單地用「馬賽克了」。

參考連結:

https://www.linkedin.com/pulse/recovering-passwords-from-pixelized-screenshots-sipke-mellema/?trackingId=yYFSUnuxRXasNV%2Fh3ZsiSw%3D%3D

「WAVE SUMMIT+2020 深度學習開發者峰會」由深度學習技術及應用國家工程實驗室與百度聯合主辦,來自行業內的人工智慧專家和開發者們將分享 AI 時代的最新技術發展和產業應用經驗,諸多頂級高校人工智慧專家將就 AI 人才培養展開對話,AI 開源產品及社區專家也將共話開源趨勢。

本次峰會既有乾貨滿滿的分享、討論,又有豐富多彩的展示、體驗、互動,為開發者打造專屬的 AI Party。

12 月 20 日,北京 798 藝術園區 751 罐,點擊閱讀原文,參與報名。

© THE END

轉載請聯繫本公眾號獲得授權

投稿或尋求報導:content@jiqizhixin.com喜歡此內容的人還喜歡

原標題:《打馬賽克就安全了嗎?AI消除馬賽克,GitHub開源項目上線三天收穫近7000星》

閱讀原文

相關焦點

  • 打馬賽克就安全了嗎?AI消除馬賽克,項目上線三天收穫近7000星
    像素化(又稱馬賽克)是一種常見的打碼方式,通過降低圖像中部分區域的解析度來隱藏某些關鍵信息,比如:再比如:看圖找馬賽克!(找不到請看右側原圖)但是,在你想隱藏信息的同時,有一些技術卻反其道而行之,試圖將圖片還原為原始狀態。
  • 打馬賽克就安全了嗎?AI消除馬賽克,上線三天收穫近7000星
    還在用馬賽克的方式隱藏密碼?小心被「看穿」。像素化(又稱馬賽克)是一種常見的打碼方式,通過降低圖像中部分區域的解析度來隱藏某些關鍵信息,比如:最近,一個名為 Depix 的 GitHub 項目爆火,上線三天 star 量已經高達 6.9k。項目作者 Sipke Mellema 是一名信息安全顧問。
  • 打馬賽克就安全了嗎?AI消除馬賽克,上線三天收穫近7000星
    最近,一個名為 Depix 的 GitHub 項目爆火,上線三天 star 量已經高達 6.9k。項目作者 Sipke Mellema 是一名信息安全顧問。項目地址:https://github.com/beurtschipper
  • Github高贊:給文字打馬賽克=形同虛設,AI看透你一切小心思,已開源
    不,這不是聳人聽聞, 最近 一個名為Depix的GitHub項目火了,上線僅僅三天,star量就已經高達7K。 截止發文,此項目已經火速達到1w+的star量:而就是這項技術,能夠解碼被打上馬賽克的文字,你的所有努力,甚至有了」欲蓋彌彰「的效果。
  • AI消除馬賽克,上線三天人氣爆棚,視頻能用嗎?
    馬賽克——這個小夥伴們青年時代最為痛恨的三個字——就是通過像素化也就是降低指定區域的解析度來隱藏某些信息。有人想要隱藏信息,自然有人想要解開這些信息,最近一個名為Depix的GitHub項目火了,上線三天star量已經高達6.9K,項目作者是一名信息安全顧問。Depix 能夠從像素化圖像截圖中恢復原圖中包含的文字密碼。該項目適用於使用線性方框濾波器(linear box filter)創建的像素化圖像。
  • Github高贊:給文字打馬賽克=形同虛設,AI看透你一切小心思
    如果現在告訴你,」打碼「已經不再安全,你所想保護的信息,已然如」皇帝的新衣「,你會作何想?不,這不是聳人聽聞,最近一個名為Depix的GitHub項目火了,上線僅僅三天,star量就已經高達7K。截止發文,此項目已經火速達到1w+的star量:而就是這項技術,能夠解碼被打上馬賽克的文字,你的所有努力,甚至有了」欲蓋彌彰「的效果。
  • 馬賽克這東西越來越不行了,開源AI已能恢復文字馬賽克
    馬賽克在我們現在的數字生活時代中可以說是隨處可見,它已經普及到了我們大量的日常的工具中了。出於安全或規避等心態考慮,我們往往會利用馬賽克技術擦除必要的信息,以便達到保護和隱藏的目的。雖然一直以來,馬賽克都已經被公認為是一種可靠的技術了,可是不幸的是「萬惡」的人工智慧技術來了。
  • AI 去馬賽克體驗:馬賽克是否完全不可還原
    人們都不喜歡馬賽克,以至於誕生出了「馬賽克阻止人類文明進步」的箴言。影片裡看到馬賽克,你會索然無味;文檔裡看到馬賽克,你會興致掃地……無數朋友都在尋找一個問題的答案——馬賽克真的是不可消除的嗎?有碼能不能用什麼黑科技,一鍵變成無碼?  從原理上來說,馬賽克屬於永久性的信息丟失。
  • AI真能去馬賽克-馬賽克,AI ——快科技(驅動之家旗...
    人們都不喜歡馬賽克,以至於誕生出了「馬賽克阻止人類文明進步」的箴言。影片裡看到馬賽克,你會索然無味;文檔裡看到馬賽克,你會興致掃地……無數朋友都在尋找一個問題的答案——馬賽克真的是不可消除的嗎?有碼能不能用什麼黑科技,一鍵變成無碼?從原理上來說,馬賽克屬於永久性的信息丟失。
  • 馬賽克也不安全?「大片」中的馬賽克,能被AI一鍵去除了
    你知道嗎?馬賽克也不安全了!欸,朋友們好啊,我是極果網最能吃的鍵盤俠極果君。剛才有個朋友問我,極果君發生什麼事啦?我說怎麼回事,給我發了幾張截圖。原來是上個月,世界最大同性交友平臺GitHub網站火了一個項目
  • AI黑科技真的能去馬賽克嗎
    [PConline 雜談]人們都不喜歡馬賽克,以至於誕生出了「馬賽克阻止人類文明進步」的箴言。影片裡看到馬賽克,你會索然無味;文檔裡看到馬賽克,你會興致掃地……無數朋友都在尋找一個問題的答案——馬賽克真的是不可消除的嗎?有碼能不能用什麼黑科技,一鍵變成無碼?  從原理上來說,馬賽克屬於永久性的信息丟失。
  • 馬賽克在AI面前可能不安全了 這種馬賽克能被 AI 一鍵去除了
    川北在線核心提示:原標題:馬賽克在AI面前可能不安全了 這種馬賽克能被 AI 一鍵去除了 說到馬賽克這東西,一直以來都讓人又愛又恨。 這東西讓人恨在什麼地方,我就不直說了吧? 各位老司機一定比我這個 18 歲的少女懂的多了去了。
  • 你的隱私正在被 AI 「窺探」,馬賽克也不管用了
    讓人意想不到的是,AI 還原馬賽克技術已經成熟到讓你無法想像的地步了。近日,一個名為 Depix 的項目火爆 GitHub,上線沒幾天,在 GitHub 上標星已超過11.3k,累計分支超過1.1k個。
  • 馬賽克也不安全?「大片」中的馬賽克,能被AI一鍵去除了
    你知道嗎?馬賽克也不安全了!欸,朋友們好啊,我是極果網最能吃的鍵盤俠極果君。剛才有個朋友問我,極果君發生什麼事啦?我說怎麼回事,給我發了幾張截圖。我一看,哦——原來是上個月,世界最大同性交友平臺GitHub網站火了一個項目,名叫Depix。這個名字很好理解,「反像素」嘛,也就是利用AI技術去除馬賽克。這事有好有壞。
  • 馬賽克已經不安全了
    大家都以為,只要打了馬賽克就能避免讓其他人看到自己不想被別人看到的信息。 但事實上真是如此嗎? 不不不,今天我必須要用現實殘忍地擊碎大家這個想法。
  • 馬賽克都能消除?打碼已經不夠安全,網友:視頻的能消除嗎?
    一般來說發到社交媒體上的圖片都是經過處理的,像女生們的照片可能處理的步驟多一些,但是總之都是有一個原則,那就是不能夠將一些具體的信息暴露出來,像什麼地名、車牌號、手機號、二維碼、條形碼等等,都是非常要緊的信息,一旦上傳到網上,很有可能會給自己的招來許多的麻煩,所以咱們這個時候一般都是會用上馬賽克這個東西
  • 被狠狠打了「馬賽克」的圖片,就這樣被AI還原了
    你可能覺得奇怪,大家明明把「姓名、身份證號、準考證號」等個人敏感信息都打上了馬賽克,為什麼還會洩露信息?難不成還可以恢復?可能還真的可以!同樣在昨晚,GitHub上一個AI項目衝上了熱榜,截止目前已經收穫了8.4k星標。
  • 打馬賽克也沒用!「反馬賽克」神器已開發
    (原標題:馬賽克沒用了!這才是遮擋關鍵隱私部位的「神器」)在個人信息日益敏感化的網絡時代,網際網路用戶一般都會習慣用「模糊」或「馬賽克」來遮蓋照片上的敏感信息。
  • 被狠狠打了 「馬賽克」的圖片,就這樣被 AI 還原了
    你可能覺得奇怪,大家明明把 「姓名、身份證號、準考證號」等個人敏感信息都打上了馬賽克,為什麼還會洩露信息?難不成還可以恢復?可能還真的可以!同樣在昨晚,GitHub 上一個 AI 項目衝上了熱榜,截止目前已經收穫了 8.4k 星標。這個 AI 的主要功能就是:去除馬賽克,還原字符密碼。
  • 馬賽克技術在AI面前會被攻破嗎?
    而最近AI技術在處理視頻照片方面又有了重大突破,一款名為Depix的項目由於能解碼被打上馬賽克文字而引起廣泛爭議讓馬賽克在AI面前都顯得不安全,但目前只適用於使用線性方框濾波器創建的像素化圖像。說到馬賽克的作用,不僅可以在法制節目中保護受害人的隱私,免去被打擊報復,還可以起到保護他們名譽權的效果。