Github高贊:給文字打馬賽克=形同虛設,AI看透你一切小心思,已開源

2020-12-21 網易新聞

新智元報導

編輯:keyu

【新智元導讀】繼修復塗鴉圖片之後,厚碼文字也不再安全了?近日,名為Depix的Github項目火爆全網,一切故意而為之的「文字密碼」,在這一AI技術的處理下,瞬間就「暴露於光天之下」。

「來P個圖吧!」 「好呀,不過這段話得打碼,不然就麻煩了!」

如果現在告訴你,」打碼「已經不再安全,你所想保護的信息,已然如」皇帝的新衣「,你會作何想?

不,這不是聳人聽聞, 最近 一個名為Depix的GitHub項目火了,上線僅僅三天,star量就已經高達7K。 截止發文,此項目已經火速達到1w+的star量:

而就是這項技術,能夠解碼被打上馬賽克的文字,你的所有努力,甚至有了」欲蓋彌彰「的效果。

手機塗鴉如同「徒勞」,外行也能輕易恢復隱藏信息

前段時間,網絡上爆出,使用手機塗鴉對圖片所進行的操作,其實可以輕易被恢復:

簡單拿微信聊天截屏的文字塗鴉來說:

我們身邊太多的人,都可能會用這種塗鴉技術,遮蓋自己想保密的信息。

看似很安全,對不對?

其實在有心人看來,你的操作可以馬上成為徒勞:

只需要再次利用手機的圖片編輯功能, 將曝光、鮮明度、高光、陰影、亮度等參數全部調至+100,然後再將對比度參數調至-100 ,然後,神奇的事情發生了:

行家都知道,相比於塗鴉,馬賽克卻無法被修復和逆轉,令人非常的安心。

可是,放在現在,在AI面前,修復厚碼圖片中隱藏的內容,也成為了可能:

Depix——修復厚碼文字內容,現已開源

Depix的主要功能,就是利用AI算法,將被像素化的文本內容從馬賽克中還原出來。其適用於用線性盒過濾器創建的像素化圖像。

其目的不是去馬賽克,而是做文字恢復使用 。 雖說這可能令一些宅男失望,但其作用依舊強大且有意義。

此項目是由信息安全顧問Sipke Mellema 開發的,目前僅支持英文字母、數字和英文標點符號 。

而任何此個開源項目的使用者,簡簡單單使用以下指令,就可以恢復你想「窺探」的文字內容:

python depix.py -p images/testimages/testimage3_pixels.png -s images/searchimages/debruinseq_notepad_Windows10_closeAndSpaced.png -o output.png

完整操作如下:

從截圖中剪出像素化的方塊,作為一個矩形。

將De Bruijn序列粘貼到編輯器中,使用相同的字體設置(文本大小、字體、顏色、hsl)。

製作序列的截屏。如果可能的話,使用同樣的截圖工具來創建像素化的圖像。

運行 run python depix.py -p [pixelated rectangle image] -s [search sequence image] -o output.png

算法原理簡單:分割小塊,德布魯因序列字符庫助力像素匹配

Depix的原理是將馬賽克區域的內容分割成許多個小塊,然後將每個小塊都和預先設置好的字符庫(德布魯因序列(De Bruijn sequence))進行像素匹配。

具體算法流程如下:

該算法利用了 線性盒濾波器 ,來分別處理每個塊的特性。對於每個塊,它對搜索圖像中的所有塊進行像素化,以檢查是否直接匹配。

對於大多數像素化的圖像,Depix設法找到單一匹配的結果。它假設這些都是正確的。然後,將周圍的多匹配塊的匹配在幾何上與像素化圖像中的相同距離進行比較。匹配也被視為正確。這個過程要重複幾次。

當正確的塊沒有幾何匹配時,它將直接輸出所有正確的塊 。對於多匹配塊,它輸出所有匹配的平均值。

開發這個AI項目,Mellema並不是為了竊取信息,而是 利用ECB和明文攻擊的模式,提高信息保護技術 。

在他看來,不知道如何破壞當前的保護模式,是信息安全中的常見陷阱。

Depix主要是針對打碼文字的處理,而說到修復馬賽克像素級別圖片的技術,我們不得不提杜克大學的AI算法PULSE:

宅男福利?渣畫質修復還要看杜克PULSE

杜克大學的AI算法PULSE(Photo Upsampling via Latent Space Exploration), 可以將像素渣到馬賽克級別的圖片修復 :

該算法 可以將模糊、無法識別的人臉圖像轉換成計算機生成的圖像,並且具有比之前任何時候都更加精細、逼真的細節 。

按照之前的方法,想要把一張模糊的大頭照變清晰,最多只能將這張照片縮放到原始解析度的八倍。

而PULSE,可以僅在幾秒鐘內,就可以把 16x16 像素的低解析度小圖,放大 64 倍,變成 1024 x 1024 像素的高解析度圖像。

這種將像素放大 64 倍級別的,絕對是業界首次 。

原本低解析度照片中無法看到的細節,比如毛孔、細紋、睫毛、頭髮和胡茬等,經過PULSE算法處理後,都能看得一清二楚:

涉及到實際應用方向上,論文的共同作者 Sachit Menon 介紹稱:

「在這些研究中,我們只是用面部作為概念驗證。

但從理論上講,該技術是通用的,從醫學、顯微鏡學到天文學和衛星圖像,都可以通過該技術改善畫質。」

與此類似的,還有谷歌的超強像素遞歸方案,感興趣的朋友可以自行探索。

Depix項目地址 :https://github.com/beurtschipper/Depix

PULSE項目地址 :https://github.com/adamian98/pulse

https://www.maxiaobang.com/6570.html

https://github.com/beurtschipper/Depix

https://github.com/adamian98/pulse

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺「網易號」用戶上傳並發布,本平臺僅提供信息存儲服務。

相關焦點

  • Github高贊:給文字打馬賽克=形同虛設,AI看透你一切小心思
    【新智元導讀】繼修復塗鴉圖片之後,厚碼文字也不再安全了?近日,名為Depix的Github項目火爆全網,一切故意而為之的「文字密碼」,在這一AI技術的處理下,瞬間就「暴露於光天之下」。「來P個圖吧!」 「好呀,不過這段話得打碼,不然就麻煩了!」
  • 馬賽克這東西越來越不行了,開源AI已能恢復文字馬賽克
    馬賽克在我們現在的數字生活時代中可以說是隨處可見,它已經普及到了我們大量的日常的工具中了。出於安全或規避等心態考慮,我們往往會利用馬賽克技術擦除必要的信息,以便達到保護和隱藏的目的。雖然一直以來,馬賽克都已經被公認為是一種可靠的技術了,可是不幸的是「萬惡」的人工智慧技術來了。
  • github | 馬賽克去除項目
    一直以來,號稱能去除馬賽克的軟體層出不窮,但大多都是掛著羊頭賣狗肉的惡意病毒軟體。然而近期在Github上,又出現了一款號稱能抹去馬賽克讓原圖重現的神器,引發海內外熱議。這款工具名為Depix,上線沒幾天就在GitHub上標星已超過一萬多,截止目前累計分支也超過了1.3k個。如圖所示,第一行是打了一層巨厚馬賽克完全像素化後的文本內容,看不出一點原始痕跡。
  • 再厚的馬賽克都能被扒乾淨?這款開源「去碼」神器火了
    自從人類世界出現了馬賽克後,自然也有人專注於如何去碼。一直以來,號稱能去除馬賽克的軟體層出不窮,但大多都是掛著羊頭賣狗肉的惡意病毒軟體。然而近期在Github上,又出現了一款號稱能抹去馬賽克讓原圖重現的神器,引發海內外熱議。這款工具名為Depix,上線沒幾天就在GitHub上標星已超過一萬多,截止目前累計分支也超過了1.3k個。
  • 不到1000行代碼,GitHub 1400星,天才黑客開源深度學習框架tinygrad
    項目地址:https://github.com/geohot/tinygrad根據 GitHub 內容,下文對 tinygrad 的安裝與使用做了簡要介紹。感興趣的同學也可通過 George Hotz 的 YouTube 視頻進行學習。
  • 馬賽克,能去除了 !
    這款工具名為Depix,上線沒幾天就在GitHub上標星已超過一萬多,截止目前累計分支也超過了1.3k個。這意味著,就算大家以後把姓名/身份證號/電話等個人敏感信息都打上了馬賽克發布到網上,也有可能被別人扒得一乾二淨。那麼,這個不可思議的AI還原技術是如何實現的?
  • 被狠狠打了「馬賽克」的圖片,就這樣被AI還原了
    你可能覺得奇怪,大家明明把「姓名、身份證號、準考證號」等個人敏感信息都打上了馬賽克,為什麼還會洩露信息?難不成還可以恢復?可能還真的可以!同樣在昨晚,GitHub上一個AI項目衝上了熱榜,截止目前已經收穫了8.4k星標。
  • 10月份Github上熱門的開源項目
    10月份GitHub上最熱門的Java開源項目排行已經出爐啦,一起來看看上榜詳情吧:1. base-adminhttps://github.com/huanzi-qch/base-adminStar 1499Base Admin一套簡單通用的後臺管理系統
  • Github黑暗模式正式發布,Reddit4k高贊
    【新智元導讀】在 GitHub Universe 2020上,其中發布的新特性中最大的改變就是正式推出了黑暗模式,同時還宣布了針對公司的 GitHub 贊助功能,允許公司對關心的開源項目進行投資等。你是否有過打開電腦被晃「瞎」的感覺?
  • GitHub重新上架星標7.2萬熱門開源項目YouTube-dl,是...
    昨日,其代理律師公司電子前沿基金會EFF(Electronic Frontier Foundation)已向GitHub發出審理通知,通知中明確指出,其開源項目YouTube-dl未違反DMCA第1201條款。
  • 17種GAN變體的Keras實現請收好 | GitHub熱門開原始碼
    乾貨往下看:https://github.com/eriklindernoren/Keras-GANAC-GAN帶輔助分類器的GAN,全稱Auxiliary Classifier GAN。這些例子,你大概不陌生:
  • 黑客全家桶、文字提取利器、深度學習 500 問 | GitHub 熱點速覽
    →https://github.com/Z4nzu/hackingtool1.2 文字提取利器:Easy OCR想提取圖片文本信息嗎?Easy OCR 是一個使用 Python 實現的 OCR 識別引擎,支持中文、日文、韓文在內的 40+ 語言。→https://github.com/JaidedAI/EasyOCR
  • 你還相信馬賽克可以遮擋敏感信息嗎?來欣賞一款強大的去碼神器!
    自從人類世界出現了馬賽克後,自然也有人專注於如何去碼。一直以來,號稱能去除馬賽克的軟體層出不窮,但大多都是掛著羊頭賣狗肉的惡意病毒軟體。然而近期在Github上,又出現了一款號稱能抹去馬賽克讓原圖重現的神器,引發海內外熱議。這款工具名為Depix,上線沒幾天就在GitHub上標星已超過一萬多,截止目前累計分支也超過了1.3k個。
  • NB的開源項目遍地開花——GitHub熱點速覽 Vol.41
    如果你覺得 nb 不過如此,GHunt 便是另外一個 NB 的項目,沒想到有一天你可以通過一個 gmail 郵箱,便可以了解到這個帳號對應的「隱私」信息吧。使用 nb,你可以在 Vim、Emacs、VS Code、Sublime Text 及你喜歡的任何其他文本編輯器編寫注釋。
  • 億景智聯宣布成立Spatial-Go開源組織,發布首個開源項目GEOOS
    我們認為,「十四五」時期,以新型舉國體制提升科技創新能力,借鑑開源模式是必經之路。畢竟,其協同創新模式、扁平化自洽以及敏捷開發,使它成為了移動網際網路時代的先鋒。  億景智聯作為一家以多源數據融合為基礎,致力於利用人工智慧、大數據打造的行業智能引擎的創新型科技公司,一直在開源生態方面努力,目的就是要將開源的時空數據智能引擎融入到各行各業。
  • 挑戰TensorFlow、PyTorch,誰才是中國AI開源框架之星?
    目前來看,基於各自的技術優勢,各家的開源框架都已初具規模,並不斷從產品和生態上進行擴展,步步為營。其中,曠視天元MegEngine在開源後,連續在技術和生態上大踏步邁進。
  • GitHub 開源官方命令行工具登頂 TOP1,5 分鐘極速上手!
    官方版的 GitHub CLI 終於問世了,一經開源便火速衝上了 GitHub Trending 榜 TOP1,接下來,就讓我們一起來看,如何在短短 5 分鐘便可迅速上手玩轉 CLI!對於 macOS 上:brew install github/gh/gh對於 Windows,有三種安裝方式,其中之一如下所示:scoop bucket add github-gh https://github.com/cli/scoop-gh.gitscoop
  • 能去除馬賽克的開源神器 DeepCreamPy,看片無碼無壓力
    設為 「星標」,每天帶你逛
  • AI 修圖 PULSE 一秒還原馬賽克,杜克大學出品
    據說它能夠將圖像原始解析度放大64倍,任何渣畫質都可以秒變高清、逼真圖像,甚至被打了馬賽克的人臉圖像,毛孔、皺紋,頭髮也都能被清晰還原。馬賽克秒變高清人像PULSE是一種新型超解析度算法,它通過潛在空間探索對照片採樣,可以將16x16像素的低解析度(Low Resolution,簡稱LR)放大到1024x1024像素的高解析度(High Resolution,簡稱HR),在幾秒內增加了64倍,而傳統方法最多只能放大8倍。
  • Github爆火!21歲理工男開源的十六進位編輯器爆贊
    開源最前線(ID:OpenSourceTop) 猿妹整編