打馬賽克就安全了嗎?AI消除馬賽克,GitHub開源項目上線三天收穫近...

2020-12-14 澎湃新聞

機器之心報導

作者：魔王、小舟

還在用馬賽克的方式隱藏密碼？小心被「看穿」。

像素化（又稱馬賽克）是一種常見的打碼方式，通過降低圖像中部分區域的解析度來隱藏某些關鍵信息，比如：

再比如：

看圖找馬賽克！（找不到請看右側原圖）

但是，在你想隱藏信息的同時，有一些技術卻反其道而行之，試圖將圖片還原為原始狀態。

最近，一個名為 Depix 的 GitHub 項目爆火，上線三天 star 量已經高達 6.9k。項目作者 Sipke Mellema 是一名信息安全顧問。

項目地址：https://github.com/beurtschipper/Depix

Depix 能夠從像素化圖像截圖中恢復原圖中包含的文字密碼。該項目適用於使用線性方框濾波器（linear box filter）創建的像素化圖像。如下圖所示，項目作者給出了像素化圖像、恢復之後的效果和原圖的對比結果：

馬賽克打得夠嚴實了，不過 Depix 還是基本解讀出了被隱藏的信息。

如何使用

使用 Depix 從像素化圖像截圖中恢復文字密碼，操作也比較簡單：

從截圖中分割出矩形像素化 block；

在具有相同字體設置（包括文本大小、字體、顏色、hsl）的編輯器中，粘貼待處理字符的德布魯因（De Bruijn sequence）。

給該序列截圖，儘可能使用和像素化圖像相同的截圖工具。

執行命令：

python depix.py -p [pixelated rectangle image] -s [search sequence image] -o output.png

Depix 算法利用線性方框濾波器單獨處理每一個 block 這一事實。它對搜索圖像中的每一個 block 執行像素化以尋找直接匹配。

對於大部分像素化圖像，Depix 儘量尋找單匹配結果，並假設這些匹配是正確的。至於周圍多匹配 block 的結果被看作像素化圖像中相同的幾何距離，並認為這些匹配也是正確的。該過程重複多次。

在正確的 block 沒有更多幾何匹配後，Depix 將直接輸出所有正確的 block。對於多匹配 block，Depix 將輸出所有匹配的平均值。

Depix 背後的算法

像素化常使用線性方框濾波器實現。線性方框濾波器的實現很簡單，速度很快，可以並行處理多個 block。

由於線性方框濾波器是一種確定性算法，對同樣的值執行像素化通常會產生同樣的像素化 block。使用同樣位置的 block 對相同文本執行像素化，會得到同樣的 block 值。我們可以嘗試像素化文本來找出匹配的模式。幸運的是，這對於秘密值的一部分同樣奏效。我們可以把每個 block 或 block 組合看作一個子問題。

項目作者沒有選擇創建潛在字體的查找表。該算法要求在相同背景上具備相同的文本大小和顏色。現代文本編輯器還會添加色調、飽和度和亮度，也就是說存在海量潛在字體。

項目作者給出的解決方案也很簡單：使用待處理字符的德布魯因序列，將其粘貼到相同的編輯器中，然後截圖。該截圖可以用作相似 block 的查找圖像，例如：

德布魯因序列包括待處理字符的所有雙字符組合。這很重要，因為一些 block 會重疊兩個字符。找出恰當的匹配需要搜索圖像中具備相同像素配置的 block。

在以下測試圖像中，Depix 算法無法找到「o」的一部分。這是因為在搜索圖像中，搜索 block 還包含下一個字母（「d」）的一部分，但在原始圖像中這裡有個空格。

創建字母的德布魯因序列時加上空格顯然會帶來同樣的問題：算法無法找到後續字母的恰當 block。有空格又有字母的圖像需要更長的搜索時間，但結果也更好。

對於大部分像素化圖像而言，Depix 似乎能夠找到 block 的單匹配結果，並假設這是正確的。然後將其周圍多匹配 block 的匹配結果看作在像素化圖像中處於相同的幾何距離，並假設這些匹配也是正確的。

在正確的 block 沒有更多幾何匹配後，Depix 直接輸出所有正確的 block。對於多匹配 block，Depix 將輸出所有匹配的平均值。雖然 Depix 的輸出並不完美，但已經算不錯了。

下圖展示了包含隨機字符的測試圖像的去像素化結果，大部分字符被正確讀取：

對這個項目感興趣的讀者，可以自行嘗試。

以後截圖時給敏感信息打碼，看來不能簡單地用「馬賽克了」。

參考連結：

https://www.linkedin.com/pulse/recovering-passwords-from-pixelized-screenshots-sipke-mellema/?trackingId=yYFSUnuxRXasNV%2Fh3ZsiSw%3D%3D

「WAVE SUMMIT+2020 深度學習開發者峰會」由深度學習技術及應用國家工程實驗室與百度聯合主辦，來自行業內的人工智慧專家和開發者們將分享 AI 時代的最新技術發展和產業應用經驗，諸多頂級高校人工智慧專家將就 AI 人才培養展開對話，AI 開源產品及社區專家也將共話開源趨勢。

本次峰會既有乾貨滿滿的分享、討論，又有豐富多彩的展示、體驗、互動，為開發者打造專屬的 AI Party。

12 月 20 日，北京 798 藝術園區 751 罐，點擊閱讀原文，參與報名。

轉載請聯繫本公眾號獲得授權

投稿或尋求報導：content@jiqizhixin.com喜歡此內容的人還喜歡

原標題：《打馬賽克就安全了嗎？AI消除馬賽克，GitHub開源項目上線三天收穫近7000星》

閱讀原文

相關焦點

打馬賽克就安全了嗎?AI消除馬賽克,項目上線三天收穫近7000星

像素化（又稱馬賽克）是一種常見的打碼方式，通過降低圖像中部分區域的解析度來隱藏某些關鍵信息，比如：再比如：看圖找馬賽克！（找不到請看右側原圖）但是，在你想隱藏信息的同時，有一些技術卻反其道而行之，試圖將圖片還原為原始狀態。
打馬賽克就安全了嗎?AI消除馬賽克,上線三天收穫近7000星

還在用馬賽克的方式隱藏密碼？小心被「看穿」。像素化（又稱馬賽克）是一種常見的打碼方式，通過降低圖像中部分區域的解析度來隱藏某些關鍵信息，比如：最近，一個名為 Depix 的 GitHub 項目爆火，上線三天 star 量已經高達 6.9k。項目作者 Sipke Mellema 是一名信息安全顧問。
打馬賽克就安全了嗎？AI消除馬賽克，上線三天收穫近7000星

最近，一個名為 Depix 的 GitHub 項目爆火，上線三天 star 量已經高達 6.9k。項目作者 Sipke Mellema 是一名信息安全顧問。項目地址：https://github.com/beurtschipper
Github高贊:給文字打馬賽克=形同虛設,AI看透你一切小心思,已開源

不，這不是聳人聽聞，最近一個名為Depix的GitHub項目火了，上線僅僅三天，star量就已經高達7K。截止發文，此項目已經火速達到1w+的star量：而就是這項技術，能夠解碼被打上馬賽克的文字，你的所有努力，甚至有了」欲蓋彌彰「的效果。
AI消除馬賽克,上線三天人氣爆棚,視頻能用嗎?

馬賽克——這個小夥伴們青年時代最為痛恨的三個字——就是通過像素化也就是降低指定區域的解析度來隱藏某些信息。有人想要隱藏信息，自然有人想要解開這些信息，最近一個名為Depix的GitHub項目火了，上線三天star量已經高達6.9K，項目作者是一名信息安全顧問。Depix 能夠從像素化圖像截圖中恢復原圖中包含的文字密碼。該項目適用於使用線性方框濾波器（linear box filter）創建的像素化圖像。
Github高贊:給文字打馬賽克=形同虛設,AI看透你一切小心思

如果現在告訴你，」打碼「已經不再安全，你所想保護的信息，已然如」皇帝的新衣「，你會作何想？不，這不是聳人聽聞，最近一個名為Depix的GitHub項目火了，上線僅僅三天，star量就已經高達7K。截止發文，此項目已經火速達到1w+的star量：而就是這項技術，能夠解碼被打上馬賽克的文字，你的所有努力，甚至有了」欲蓋彌彰「的效果。
馬賽克這東西越來越不行了,開源AI已能恢復文字馬賽克

馬賽克在我們現在的數字生活時代中可以說是隨處可見，它已經普及到了我們大量的日常的工具中了。出於安全或規避等心態考慮，我們往往會利用馬賽克技術擦除必要的信息，以便達到保護和隱藏的目的。雖然一直以來，馬賽克都已經被公認為是一種可靠的技術了，可是不幸的是「萬惡」的人工智慧技術來了。
AI 去馬賽克體驗:馬賽克是否完全不可還原

人們都不喜歡馬賽克，以至於誕生出了「馬賽克阻止人類文明進步」的箴言。影片裡看到馬賽克，你會索然無味；文檔裡看到馬賽克，你會興致掃地……無數朋友都在尋找一個問題的答案——馬賽克真的是不可消除的嗎？有碼能不能用什麼黑科技，一鍵變成無碼？　　從原理上來說，馬賽克屬於永久性的信息丟失。
AI真能去馬賽克-馬賽克,AI ——快科技(驅動之家旗...

人們都不喜歡馬賽克，以至於誕生出了「馬賽克阻止人類文明進步」的箴言。影片裡看到馬賽克，你會索然無味；文檔裡看到馬賽克，你會興致掃地……無數朋友都在尋找一個問題的答案——馬賽克真的是不可消除的嗎？有碼能不能用什麼黑科技，一鍵變成無碼？從原理上來說，馬賽克屬於永久性的信息丟失。
馬賽克也不安全?「大片」中的馬賽克,能被AI一鍵去除了

你知道嗎？馬賽克也不安全了！欸，朋友們好啊，我是極果網最能吃的鍵盤俠極果君。剛才有個朋友問我，極果君發生什麼事啦？我說怎麼回事，給我發了幾張截圖。原來是上個月，世界最大同性交友平臺GitHub網站火了一個項目
AI黑科技真的能去馬賽克嗎

[PConline 雜談]人們都不喜歡馬賽克，以至於誕生出了「馬賽克阻止人類文明進步」的箴言。影片裡看到馬賽克，你會索然無味；文檔裡看到馬賽克，你會興致掃地……無數朋友都在尋找一個問題的答案——馬賽克真的是不可消除的嗎？有碼能不能用什麼黑科技，一鍵變成無碼？　　從原理上來說，馬賽克屬於永久性的信息丟失。
馬賽克在AI面前可能不安全了這種馬賽克能被 AI 一鍵去除了

川北在線核心提示：原標題：馬賽克在AI面前可能不安全了這種馬賽克能被 AI 一鍵去除了說到馬賽克這東西，一直以來都讓人又愛又恨。這東西讓人恨在什麼地方，我就不直說了吧？各位老司機一定比我這個 18 歲的少女懂的多了去了。
你的隱私正在被 AI 「窺探」,馬賽克也不管用了

讓人意想不到的是，AI 還原馬賽克技術已經成熟到讓你無法想像的地步了。近日，一個名為 Depix 的項目火爆 GitHub，上線沒幾天，在 GitHub 上標星已超過11.3k，累計分支超過1.1k個。
馬賽克也不安全?「大片」中的馬賽克,能被AI一鍵去除了

你知道嗎？馬賽克也不安全了！欸，朋友們好啊，我是極果網最能吃的鍵盤俠極果君。剛才有個朋友問我，極果君發生什麼事啦？我說怎麼回事，給我發了幾張截圖。我一看，哦——原來是上個月，世界最大同性交友平臺GitHub網站火了一個項目，名叫Depix。這個名字很好理解，「反像素」嘛，也就是利用AI技術去除馬賽克。這事有好有壞。
馬賽克已經不安全了

大家都以為，只要打了馬賽克就能避免讓其他人看到自己不想被別人看到的信息。但事實上真是如此嗎？不不不，今天我必須要用現實殘忍地擊碎大家這個想法。
馬賽克都能消除?打碼已經不夠安全,網友:視頻的能消除嗎?

一般來說發到社交媒體上的圖片都是經過處理的，像女生們的照片可能處理的步驟多一些，但是總之都是有一個原則，那就是不能夠將一些具體的信息暴露出來，像什麼地名、車牌號、手機號、二維碼、條形碼等等，都是非常要緊的信息，一旦上傳到網上，很有可能會給自己的招來許多的麻煩，所以咱們這個時候一般都是會用上馬賽克這個東西
被狠狠打了「馬賽克」的圖片,就這樣被AI還原了

你可能覺得奇怪，大家明明把「姓名、身份證號、準考證號」等個人敏感信息都打上了馬賽克，為什麼還會洩露信息？難不成還可以恢復？可能還真的可以！同樣在昨晚，GitHub上一個AI項目衝上了熱榜，截止目前已經收穫了8.4k星標。
打馬賽克也沒用!「反馬賽克」神器已開發

（原標題：馬賽克沒用了！這才是遮擋關鍵隱私部位的「神器」）在個人信息日益敏感化的網絡時代，網際網路用戶一般都會習慣用「模糊」或「馬賽克」來遮蓋照片上的敏感信息。
被狠狠打了「馬賽克」的圖片,就這樣被 AI 還原了

你可能覺得奇怪，大家明明把「姓名、身份證號、準考證號」等個人敏感信息都打上了馬賽克，為什麼還會洩露信息？難不成還可以恢復？可能還真的可以！同樣在昨晚，GitHub 上一個 AI 項目衝上了熱榜，截止目前已經收穫了 8.4k 星標。這個 AI 的主要功能就是：去除馬賽克，還原字符密碼。
馬賽克技術在AI面前會被攻破嗎?

而最近AI技術在處理視頻照片方面又有了重大突破，一款名為Depix的項目由於能解碼被打上馬賽克文字而引起廣泛爭議讓馬賽克在AI面前都顯得不安全，但目前只適用於使用線性方框濾波器創建的像素化圖像。說到馬賽克的作用，不僅可以在法制節目中保護受害人的隱私，免去被打擊報復，還可以起到保護他們名譽權的效果。

打馬賽克就安全了嗎?AI消除馬賽克,GitHub開源項目上線三天收穫近...

相關焦點

打馬賽克就安全了嗎?AI消除馬賽克,項目上線三天收穫近7000星

打馬賽克就安全了嗎?AI消除馬賽克,上線三天收穫近7000星

打馬賽克就安全了嗎？AI消除馬賽克，上線三天收穫近7000星

Github高贊:給文字打馬賽克=形同虛設,AI看透你一切小心思,已開源

AI消除馬賽克,上線三天人氣爆棚,視頻能用嗎?

Github高贊:給文字打馬賽克=形同虛設,AI看透你一切小心思

馬賽克這東西越來越不行了,開源AI已能恢復文字馬賽克

AI 去馬賽克體驗:馬賽克是否完全不可還原

AI真能去馬賽克-馬賽克,AI ——快科技(驅動之家旗...

馬賽克也不安全?「大片」中的馬賽克,能被AI一鍵去除了

AI黑科技真的能去馬賽克嗎

馬賽克在AI面前可能不安全了 這種馬賽克能被 AI 一鍵去除了

你的隱私正在被 AI 「窺探」,馬賽克也不管用了

馬賽克也不安全?「大片」中的馬賽克,能被AI一鍵去除了

馬賽克已經不安全了

馬賽克都能消除?打碼已經不夠安全,網友:視頻的能消除嗎?

被狠狠打了「馬賽克」的圖片,就這樣被AI還原了

打馬賽克也沒用!「反馬賽克」神器已開發

被狠狠打了 「馬賽克」的圖片,就這樣被 AI 還原了

馬賽克技術在AI面前會被攻破嗎?

馬賽克在AI面前可能不安全了這種馬賽克能被 AI 一鍵去除了

被狠狠打了「馬賽克」的圖片,就這樣被 AI 還原了