可去圖像馬賽克的工具發布

2021-02-13 二道情報販子

Depix是用於從馬賽克後的截圖中,恢復密碼(字符)的工具。

此實現適用於使用線性濾波器創建的像素化(馬賽克後)的圖像。

項目執行命令以及效果

python depix.py -p images/testimages/testimage3_pixels.png -s images/searchimages/debruinseq_notepad_Windows10_closeAndSpaced.png -o output.png

用法

從屏幕快照中將像素化的塊切出為單個矩形。

在具有相同字體設置(文本大小,字體,顏色,hsl)的編輯器中,粘貼帶有預期字符的De Bruijn序列。

製作序列的屏幕截圖。如果可能,請使用與創建像素化圖像相同的屏幕截圖工具。

運行 python depix.py -p [pixelated rectangle image] -s [search sequence image] -o output.png

算法

該算法利用線性濾波器分別處理每個塊。對於每個塊,它將對搜索圖像中的所有塊進行像素化以檢查直接匹配。

對於大多數像素化圖像,Depix設法找到單匹配結果。假設這些是正確的。然後,將周圍的多匹配塊的匹配進行比較,以在幾何上與像素化圖像中的距離相同的距離進行比較。匹配也被視為正確。重複此過程幾次。

正確的塊不再具有幾何匹配之後,它將直接輸出所有正確的塊。對於多匹配塊,它輸出所有匹配的平均值。

技術原理分析文章

https://www.linkedin.com/pulse/recovering-passwords-from-pixelized-screenshots-sipke-mellema/

項目地址

https://github.com/beurtschipper/Depix

技術原理谷歌翻譯

什麼是像素化(馬賽克)?

像素化(馬賽克)描述了部分降低圖像解析度以檢查信息的過程。我算法的實現攻擊了普通的線性盒濾波器。線性框濾鏡採用一個像素框,然後用該框中所有像素的平均值覆蓋像素。它的實現非常簡單,並且可以快速運行,因為它可以並行處理多個塊。

下圖顯示了線性盒式濾波器的示例。表情符號的圖像分為四個塊。塊的平均顏色會覆蓋塊的像素,從而產生最終的像素化圖釋。由於原始信息丟失,因此無法直接反轉過濾器。

去模糊工具,歷史和研究

圖像可以通過多種方式進行模糊處理,通常稱為模糊處理。使用盒式濾波器的像素化可以看作是模糊技術的子集。大多數模糊算法在嘗試模仿由搖晃的相機或聚焦問題引起的自然模糊時,往往會散布像素。

這些工具具有許多 用於常見任務的去模糊 工具,例如銳化模糊的照片。不幸的是,我使用的像素化密碼只有幾個塊的高度,因此沒有什麼可以提高的。

人工智慧的最新發展引起了人們的關注,例如「研究人員創造了一種可以完美消除臉部像素的工具」。但是,人工智慧沒有做到這一點。最新的PULSE算法與2016年以來的Google的RAISR算法相似。AI生成的面孔在像素化後會生成相同的圖像,但它恢復的面孔並非原始面孔。

諸如PULSE之類的算法似乎很新,但是它們源於一長串的去模糊工具。MW Buie於1994年編寫了一個工具(!),用於生成「 Plutos」,對其進行模糊處理並將其與觀察到的圖像進行匹配。

在2006年發表的一篇廣為人知的文章中,D。Venkatraman解釋了一種用於恢復像素化信用卡號的算法。這個想法很簡單:生成所有信用卡號,對它們進行像素化,然後將結果與像素化的數字進行比較。

在2019年,S.Sangwan解釋了如何通過銳化圖像並通過Google圖像查找來利用Photoshop為OSINT恢復面部。它與其他技術類似,因為它使用Google對圖像中的臉部「強力」。

請注意上述解決方案之間的相似之處。如果沒有足夠的信息來適當地平滑圖像,則選擇的技術是將相似數據像素化並檢查是否匹配。這也是我從屏幕快照中恢復密碼的算法的基礎。

算法說明

由於線性盒式濾波器是確定性算法,因此將相同的值進行像素化將始終導致相同的像素化塊。使用相同的塊位置對相同的文本進行像素化將產生相同的塊值。我們可以嘗試對文本進行像素化以找到匹配的模式。幸運的是,這甚至可以為部分秘密價值發揮作用。每個塊或塊的組合都可以視為一個子問題。

我沒有選擇創建潛在字體的查找表。該算法要求在相同背景上具有相同的文本大小和顏色。現代的文本編輯器還添加了色相,飽和度和亮度,從而允許使用大量可能的字體設置來拍攝屏幕截圖。

該解決方案非常簡單:採用De Bruijn預期字符序列,將其粘貼到同一編輯器中,並進行截圖。該屏幕截圖用作類似塊的查找圖像。例如:

該序列包括預期字符的所有2個字符的組合。使用2個字符的組合很重要,因為某些塊可以重疊兩個字符。

要找到合適的匹配項,需要在搜索圖像中存在相同像素配置的精確塊。在測試圖像中,我的算法找不到'o'的一部分。我注意到這是因為在搜索圖像中,搜索塊還包含下一個字母的一部分(「 d」),但是在原始圖像中有一個空格。

創建一個在其周圍帶有空格的De Bruijn字母序列顯然會帶來相同的問題:該算法將無法為連續字母找到合適的塊。帶有間隔和接近的字母的圖像需要更長的搜索時間,但會產生更好的結果。

對於大多數像素化圖像,該工具似乎可以找到塊的單匹配結果。假設這些是正確的。然後,將周圍的多匹配塊的匹配進行比較,使其與像素化圖像中的幾何距離相同。這些匹配也被視為正確。

正確的塊不再具有幾何匹配之後,它將直接輸出所有正確的塊。對於多匹配塊,它輸出所有匹配的平均值。它的輸出遠未達到完美的水平,但性能相當不錯。下圖顯示了帶有隨機字符的測試圖像。大多數字符都可以正確讀取。

相關焦點

  • 馬賽克圖片
    所以,就有人評選出了人類罪惡的十大發明,這其中有毒品,核武器,香菸還有就是馬賽克。有人認為,馬賽克將原本色彩斑斕、清晰奪目圖像給遮擋了起來,影響了欣賞圖像的視覺享受;但也有人認為,馬賽克模糊掉了那些恐怖和血腥的畫面,能夠保護到觀看者心靈不受傷害。
  • 打馬賽克就安全了嗎?AI 消除馬賽克,開源項目上線,文末附教程
    像素化(又稱馬賽克)是一種常見的打碼方式,通過降低圖像中部分區域的解析度來隱藏某些關鍵信息,比如:但是,在你想隱藏信息的同時,有一些技術卻反其道而行之,試圖將圖片還原為原始狀態。最近,一個名為 Depix 的 GitHub 項目爆火,上線三天 star 量已經高達 6.9k。項目作者 Sipke Mellema 是一名信息安全顧問。
  • 美國馬賽克戰概念發展分析
    2019年9月,DARPA資助米切爾航空航天研究所發布報告,研究了馬賽克戰的核心思想、組成和原則等。馬賽克戰主要針對對手「反介入/區域拒止」能力而研發,被DARPA視為引領美軍未來20年國防科技發展的頂層兵力設計概念,將為美軍作戰力量構建、作戰概念和技術研發、作戰規劃、作戰指揮控制提供指導原則。自二戰以來,美軍兵力作戰一直以從美國本土投送大量兵力為基礎。
  • 破解馬賽克戰之系統發展思考
    2019年9月,美國米切爾航空航天研究所發布研究報告,詳細分析了美軍面臨的國際軍事挑戰,以及馬賽克戰的作戰概念、框架計劃和技術布局是如何應對軍事挑戰的,指出「馬賽克戰是一種面向未來的兵力運用理念,能夠利用部隊結構與作戰概念的動態關係來實現對任何對手的進攻主動權,以及對各軍事行動的高度適應性」[11]。
  • 不用再「心中無碼」,這些馬賽克終於能被去掉了!
    馬賽克,男同胞們共同的敵人。
  • 訓練馬賽克消除器
    Pix2Pix 的 Generator 導入的 U-Net 模型架構如下:U-Net 這個名稱來自於它的網絡架構形狀,從 U 字左側開始,輸入圖像後依次進行傳統的 Conv/Pooling下採樣,接著在右側進行 Deconv 反卷積上採樣(其實原本 U-Net 最主要的應用在於圖像的語意分割,但導入 GAN 模型後,下採樣的特徵可作為產生圖片 Deconv 反卷積時的參考特徵
  • pdf轉換格式|截圖工具|不火但是很實用的工具值得收藏!
    今天分享幾個不火但是好用的官方軟體,是可支持在線使用、win系統和mac系統下載使用的哦~1⃣️迅捷PDF轉換器前些時候刷知乎看到有人在推薦它,小助也去自己體驗了一下,發現確實挺好用,功能也很多,而且沒有花裡胡哨的廣告和按鈕,主界面如下:界面簡單,功能齊全,可以將pdf格式的轉換成其他格式,小助用過一次之後就深深喜歡上了~小夥伴覺得好用可以下載或者添加網頁書籤哦
  • 10 個 Python 圖像編輯工具
    同時,在 Python 生態當中也有很多可以免費使用的優秀的圖像處理工具。下文將介紹 10 個可以用於圖像處理任務的 Python 庫,它們在編輯圖像、查看圖像底層數據方面都提供了簡單直接的方法。1、scikit-imagescikit-image 是一個結合 NumPy 數組使用的開源 Python 工具,它實現了可用於研究、教育、工業應用的算法和應用程式。
  • 【圖像數據標註】工具的測評集合
    在對比市面上現有的標註工具時,我們發現Github有許多免費且好用的開源工具,於是我們選擇了幾款最受歡迎的圖像/視頻標註工具進行測評,其中包括覆蓋全部標註類型甚至支持協同標註的CVAT,最受歡迎的Labelme,人臉標註神器VIA-VGG Image Annotator等,文中還提供了標註工具的連結
  • 震驚,被馬賽克的圖片竟然還可以恢復
    其實之前在我用馬賽克對圖片進行模糊處理的時候,我就思考過這個問題,這些被馬賽克的地方能不能被恢復出來,萬一能恢復,當時就覺得細思極恐。你說巧不巧還真能恢復。在介紹今天的項目之前,我們先來看一下以下這張圖片,相信你也會跟我一樣震驚的。
  • 圖像傳感器的這9個知識點,你都懂嗎?
    如果元件尺寸小於可捕獲的可見光波長(如長度為400納米的藍光),那麼為了校正圖像顏色,在傳感器設計中必須克服其他問題。傳感器廠商花費大量精力來設計優化元件大小,以確保所有的顏色能同等成像(如圖3所示)。
  • Photoshop(第三章:圖像之位圖詳解①)
    對於設計初學者來說必須先了解常見的圖像類型,但是教學中我們發現很多同學對所謂的位圖、像素圖、點陣圖、矢量圖、向量圖總是一知半解,似懂非懂,今天老崔帶你了解了解馬賽克
  • MATLAB基於直方圖的圖像去霧
    執行變換x=H(x),表示對步驟1中得到的直方圖使用步驟2得到的灰度值變換表進行查表變換操作,通過遍歷整幅圖像的每一個像元,將原始圖像灰度值x放入變換表H(x)中,可得到變換後的新灰度值x'。       根據資訊理論的相關理論,我們可以知道圖像經直方圖均衡化後,將會包含更多的信息量,進而能突出某些圖像特徵。下面就為大家介紹三種常用的圖像去霧方法。
  • 【情報工具】P圖P到真假難辨,推薦8種圖像情報分析工具教你一眼識別
    此類數據可用於各種 OSINT 原因調查。比如調查相機類型,或者照片的 GPS 坐標來尋找某人的位置。有許多工具可用於查看 EXIF 數據,包括只需右鍵單擊圖像並轉到詳細信息。反向圖像搜索可用於驗證照片、WhatsApp 圖像、屏幕截圖和 Internet 模因的來源。記者可以使用反向搜索選項來查找圖片的原始來源或了解圖片首次 在 Internet 上發布的大概日期 。
  • Python中的十大圖像處理工具
    Python之成為圖像處理任務的最佳選擇,是因為這一科學程式語言日益普及,並且其自身免費提供許多最先進的圖像處理工具。讓我們看一下用於圖像處理任務的一些常用Python庫。01 scikit Imagescikit-image是一個基於numpy數組的開源Python包。
  • 谷歌發布自動去水印算法,其實是為了保護版權
    水印,是攝影師、畫師和圖像網站保護版權的武器。有了水印,即使圖片被盜用,也能明顯看出歸屬者。
  • 倒計時五天 | 馬賽克2021「超時空要塞」即將開啟
    超時空要塞即將正式開放 ……  馬賽克「超時空要塞」2021 Synth Live Tour不止給你Mini Concert體驗感的Live現場 ▲馬賽克「超時空要塞」預告片除了之前透露的「經典作品新編+新歌首演」的驚喜外,這次馬賽克特還將邀兩位嘉賓樂手,舞臺以六人大編制陣容亮相,再次升級馬賽克豐富的聲音系統,帶給觀眾全新的現場感受。馬賽克的舞臺向來很注重舞美與音樂主題的融合,不管是「回到未來」的時空派對,還是「勁歌熱舞」熱力現場,每次精心的舞臺設計,都讓樂迷有著煥然一新的體驗。
  • 總結 | 計算機視覺中的圖像標註工具
    因此,選擇合適的標記工具至關重要。轉載自丨CV技術指南在這裡,我們總結了一些用於計算機視覺任務的最佳圖像標記工具:labelme、labelImg、CVAT和hasty.ailabelme地址:https://github.com
  • 工具分享——光柵圖像轉CAD圖紙文件
    有時我們我們想把一下光柵圖像上的圖形轉換到CAD中去,這些圖像中可能是一些手繪的圖案,也可能是圖紙輸出的圖像或圖紙的掃描件。將光柵圖像轉換為矢量圖紙的工具很早就有了。上世紀90年代「甩圖板」的時候因為有大量紙質圖紙需要電子化,光柵矢量化軟體還是很流行的,當時配合大的工程掃描儀,賣得很貴。還有數位化儀也是為了滿足類似需求的一種類似描圖板似的設備。
  • 技術前沿:CMOS(互補金屬氧化物半導體)圖像傳感器
    注意,基本顏色區域相互重疊, 對所有的顏色而言,綠色是一個很好的單色替代品3、傳感器配置:馬賽克、Faveon和BSI圖4顯示了多光譜傳感器設計的不同片內配置,包括馬賽克和堆疊方法。在馬賽克方法中,顏色過濾器被裝在每個元件的馬賽克模式上。