這個「不可思議」的AI還原技術是如何實現的?

2020-12-26 電子發燒友

這個「不可思議」的AI還原技術是如何實現的?

機器人大講堂 發表於 2020-12-23 10:56:58

12月14日,據媒體報導,一個名為Depix的項目引發熱議。Depix能夠解碼被打上馬賽克的文字,但只適用於使用線性方框濾波器創建的像素化圖像。

除了Depix,谷歌的超強像素遞歸方案、杜克大學的AI算法PULSE,也能將面目模糊的人像變得清晰可辨。

該技術會讓那些草草打馬就以為能夠隱藏機密信息的人捏把汗。

據悉,該技術開發者初中並非竊取信息,而是為了提醒人們注重信息安全。

最近一位名為Sipke Mellema的程式設計師便開發了這樣一款工具。他說,一些公司在內部文檔中經常會使用像素化的方式顯示密碼,但沒有工具可以從這樣的圖像中恢復密碼,因此便創建了一個。

我們先來看下效果圖:

其中,第一行是被像素化後的密碼序列,被狠狠地打了一層馬賽克,看不出一點原始痕跡。

第二行是經過AI還原後的密碼,可以看到密碼序列基本被還原了,而且準確度很高,只有稍加推理就能得到第三行的原始密碼。

那麼,這個「不可思議」的AI還原技術是如何實現的?

我們知道,馬賽克是圖像像素化處理的一種手段,它通過將影像特定區域的色階細節劣化並打亂色塊,達到一種模糊圖像的效果。

像素化在許多領域被用於模糊圖像信息,其中線性盒濾波器( Linear Box Filter)是一種較為普遍的處理算法。盒子濾波也稱為方框濾波,它採用一個像素框,用該框中所有像素的平均值覆蓋像素。

像這樣,表情圖像被分為四個色塊,每個色塊被色塊平均值所覆蓋,最終形成了像素化表情,由於原始信息丟失,因此不能直接反轉濾波器。

Mellema正是利用了盒子濾波器,提出了AI還原算法-Depix。

線性盒濾波器是一種確定性算法,對相同的值執行像素化通常會產生同樣的像素塊(Block),那麼反之,使用相同位置的塊對相同文本執行像素化,是否也會得到同樣的塊值?

Mellema嘗試通過像素化文本來找出匹配的模式,結果發現確實如此。

具體來說,Mellema把每個塊或塊組合看作一個子問題。該算法要求在相同背景上,具備相同的文本大小和顏色,因此他沒有選擇創建潛在字符的查找表,因為現代文本編輯器可以添加色調、飽和度和亮度,也就是說存在海量潛在字符。

在處理字符方面,Mellema使用待處理字符的德布魯因序列(De Bruijn sequence),將其粘貼到相同的編輯器中,然後截圖。該截圖可用作相似塊的查找圖像,例如:
 


德布魯因序列包括待處理字符的所有雙字符組合,這一點很重要,因為一些塊會重疊兩個字符。

要找出合適的匹配需要搜索圖像中具備相同像素配置的塊。在測試中,Depix 算法無法找到字符「o」,因為在搜索圖像中,搜索塊還包含下一個字母「d」,但在原始圖像中這裡有個空格。


顯然,在創建字符的德布魯因序列時,如果加上空格會帶來同樣的問題,即算法無法找到後續字母恰當的塊。有空格又有字母的圖像需要更長的搜索時間,但結果也更好。

對於大多數像素化圖像而言,Depix可以找到塊的單個匹配結果。它先假設這些塊是正確的,然後將周圍多個匹配塊進行比較,使其與像素化圖像中的幾何距離相同,並假設這些匹配也是正確的。

在正確的塊沒有更多幾何匹配後,Depix 直接輸出所有正確的塊。對於多匹配塊,Depix 將輸出所有匹配的平均值。雖然 Depix 的輸出並不完美,但已經算不錯了。

下圖展示了包含隨機字符的測試圖像的去像素化結果,大部分字符被正確讀取:


最後需要說明的是,Mellema開發這個AI項目並不是為了竊取信息,而是利用ECB和明文攻擊(Known-Plaintext Attacks)的模式,提高信息保護技術。在他看來,不知道如何破壞當前的保護模式,是信息安全中的常見陷阱。

責任編輯:lq

 

打開APP閱讀更多精彩內容

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容圖片侵權或者其他問題,請聯繫本站作侵刪。 侵權投訴

相關焦點

  • 真正ai換臉是對現實行為的一種抽象模擬
    ai換臉技術引起很多人的擔憂,因為現在很多人把換臉技術用於反騙,這對我們有什麼影響呢?帶著這樣的疑問,我們前天晚上請來一位ai換臉專家,給我們分享關於ai換臉的方方面面。他講述的換臉實驗讓我印象很深刻,換的姿勢不同,效果卻完全不同,換臉技術被人類技術迷戀已久,有人說:ai換臉等於自閉智能,我們還只是一些人工智慧,才被人類僅僅掌握,要知道自閉和語言智能是兩個概念,兩者之間最大的區別就是大腦的執行邊界在哪裡,我們又該如何看待ai換臉技術,真正的ai換臉究竟是什麼呢?換臉並不是人類製造出來的。
  • OpenShift TV專訪先智數據:基於AI的主動管理在多雲環境如何實現...
    Ming還展示了Federator.ai與Datadog Monitoring Services集成的相關產品演示。先智數據是家怎樣的公司?先智數據團隊由一群在IT管理,基礎架構和雲運營,數據科學和AI技術方面具有專業知識的業內資深人士組成。
  • 被狠狠打了『馬賽克』的圖片,就這樣被AI還原了
    這個AI的主要功能就是:去除馬賽克,還原字符密碼。AI破解『密碼』相信不少人都認為,只要打上了馬賽克,就不會洩露敏感信息,因此,我們在朋友圈、微博等公開社交平臺,經常能夠看到打了馬賽克的結婚照、證書照、成績照等。但事實上,無論是圖像、文字還是字符,AI還原馬賽克已經不是什麼難事了。
  • 被狠狠打了「馬賽克」的圖片,就這樣被AI還原了
    第二行是經過AI還原後的密碼,可以看到密碼序列基本被還原了,而且準確度很高,只有稍加推理就能得到第三行的原始密碼。那麼,這個「不可思議」的AI還原技術是如何實現的?我們知道,馬賽克是圖像像素化處理的一種手段,它通過將影像特定區域的色階細節劣化並打亂色塊,達到一種模糊圖像的效果。
  • 杜甫在線演唱《奇蹟再現》、兵馬俑真人還原……用AI技術打破次元...
    這位原本將自己定位為「遊戲」的博主,憑藉AI還原技術一夜之間在微博「出圈」了。那麼,大谷到底做了什麼,讓大家對他如此關注?他利用AI技術,讓歷史照片/畫像穿越到真實世界,變得活靈活現,還會說話。有圖有真相,看這位從秦國穿越過來的大哥,光看陶俑的時候可能覺得特徵不明顯,但還原真人之後,是不是有點像你認識的誰?還有激情翻唱《迪迦奧特曼》片頭曲《奇蹟再現》的杜甫,你細品他的表情!看起來更像是現代人利用藝術相機拍攝的小視頻。
  • AI是如何檢測色情片的?
    目前該公司並未對此有任何回應,也不清楚Tumblr使用的是何種內容過濾技術,或者是否創建了自己的內容過濾系統,但顯然,社交網站在政策和技術方面都陷入了困境。例如,關於「女性乳頭」和「藝術裸體」的外延,Tumblr 認為是取決於上下文語境,這透露出Tumblr自己也不確定它想要在平臺上禁止什麼內容。也難怪,站在企業的立場,究竟該如何定義「淫穢」內容呢?
  • 只需1 分鐘,這個網站用 AI 分離歌曲的人聲、伴奏和樂器聲
    整理 | Just 疫情期間,在家待著閒來無事,一些技術人員就喜歡以技術的方式找點樂子,順帶賺錢最好了。 將歌曲中的人聲和樂器聲分離是一件讓想使用音樂伴奏的人頭疼的事情,傳統的音樂製作軟體使用門檻較高,處理起來不光費時而且效果不一定好。
  • AI+光學技術,用眼鏡讓色盲患者重新看到世界的色彩
    試想一下,通過隱形眼鏡看到超過自身識別率500%的顏色,一副搭配無色防藍光鏡片且時尚的色彩增強眼鏡能夠讓色盲患者以正常的視角看到這個世界,是一件多麼不可思議的事情。通過色彩增強隱形眼鏡,讓色盲患者以正常的視角重新看到世界,發掘超過其以往識別能力5倍的顏色,是一種怎樣的改變生活的體驗?而與此同時,這種不可思議的眼鏡,本身卻是無色的、時尚的,且非常方便攜帶。
  • Cerence推出認知仲裁器,應用AI技術實現車內多個語音助手靈活交互
    其當務之急是在全球市場實現客戶對語音助手的自由選擇性,並藉助不同平臺的優勢,提供無縫體驗。主要優點包括:1、由Cerence提供技術支持的車載助理和其他助手之間完全可以互操作;其中包括蘋果Siri、亞馬遜 Alexa、Google Assistant以及微軟小娜等主流通用助手;阿里巴巴、騰訊和Yandex等全球化消費科技公司的語音助手;OpenTable和Spotify等內容服務可以共存於一個語音界面,通過語音助手和服務之間全智能化切換,將誤差降至最低;
  • Drive.ai 王弢:自動駕駛的賽道上,如何與時間賽跑 | 2018 全球智能...
    本次峰會上,Drive.ai聯合創始人,研發與工程總監王弢發表了題為《自動駕駛技術的快速迭代與落地》的主題演講。今年 7 月,Drive.ai 首批 3-4 輛(高峰期 4 輛)自動駕駛廂式車開始在德州弗裡斯科市的 Hall Park 園區和 The Star 商業區之間進行試點服務,開啟為期6個月的運營,為園區內上萬名僱員提供最後一英裡的免費出行服務。
  • 國外大神用AI實現龍珠現實版,弗利薩和布歐高度還原龜仙人太傳神
    《龍珠》至今沒有出真人版的原因也十分簡單,其一是粉絲們的強烈反對,其二是龍珠的題材太過於科幻,真人版很難高度還原,如果操作不好的話極有可能會毀掉這一部經典的作品。雖然說官方沒有出真人版,但國外大神通過AI技術高度還原了龍珠中的角色,接下讓我們一起來看看龍珠中的角色,在現實生活中到底長什麼樣子吧!
  • Anthem在數位化轉型中擁抱RPA和AI技術 - CIO頻道 - 企業網D1Net...
    健康保險公司正在使用機器人流程自動化技術來平衡數據中心的工作負載,這是CIO Tim skein為提高IT運營的靈活性所做的部分努力。 機器人流程自動化( RPA )已經成為保險公司尋求自動化數據輸入和實現無紙化辦公的熱門技術。
  • AI已經如此神奇:自動給黑白底片上色,神奇還原歷史照片
    這張是最讓我佩服的,竟然還原了羽絨服和汽車的顏色。這個功能如果自己開發的話,學習功能是有限的,當然AI的圖片分析功能是開源的我們可以自己部署並使用,但是最簡單的是百度AI提供的圖像處理接口,就提供了這個功能。功能介紹:圖像趣味處理,開展懷舊等主題活動時,可接入服務,開發活動小程序或網頁等。
  • Securiti.ai 為何成為2020 RSAC創新沙盒冠軍得主?
    2020 RSA 創新沙盒大賽塵埃落定,冠軍花落Securiti.ai公司。作為本次大賽冠軍,Securiti.ai是如何從十大「勁敵」中脫穎而出的呢?之前,綠盟君已經為大家分析過Securiti.ai的產品特點,今天,綠盟君再次帶大家詳細了解一下這所公司的與眾不同。
  • 如何用 AI 技術保護隱私安全?
    我們的隱私便是實現這些智能的「代價」。當然,這個代價並不一定是你願意拱手付出的。那如何保護隱私?我不用行嗎?你以為關閉手機GPS就無法定位你的位置?你的手機還有陀螺儀、內置羅盤、氣壓計等裝置,還是可以用來定位你的位置。只要使用手機,就不存在絕對的隱私保護。
  • 還原招股書中的AI生意經
    但是,把人從這個迴路裡面完全剔除不太可能。無人駕駛汽車等許多問題太過複雜,複雜到無法通過當前的AI技術實現完全的自動化。安全、公平以及信任等問題也需要人的監督——美國、歐盟和其他地區當前正在制定的AI法規裡面可能會體現這一事實。即便我們最終實現了某些任務的完全自動化,也還不清楚這樣就可以提高多少的利潤。AI應用的基本功能是處理輸入數據流並生成相關的預測。
  • AI熱潮來了,大學生可以報考這個專業嗎?
    人工智慧的大多數技術都可以在相關專業中學習,包括數據挖掘,機器學習等領域,其實跟編程,算法等對口的更多的是前端。主要還是看你更喜歡那個方向,計算機是一個需要反覆修煉的技能。一步步來,技術一旦有了,不著急去找工作,你還有很多時間去學習。學計算機,比起寫代碼,ai更加難。
  • 騰訊互娛謝海天:《王牌戰士》如何用3D技術還原2D卡通效果
    他以《王牌戰士》為例,從色彩、造型、動畫特效(包括動畫中間幀、黑白閃、幀內、表情線)三個角度,講解了如何用3D技術還原2D卡通效果。以下是演講內容,有刪減:大家好,我是謝海天。我這次分享的主題黑科技,一句話來說,就叫用3D技術還原2D卡通效果。裡面有兩個關鍵點,一個是3D技術,一個是2D卡通效果。3D技術是因為,我們通常看到的遊戲,基本上是用PBR技術來做一些比較寫實的效果,《吸血鬼獵人D》是在賽璐璐的畫面上用逐幀的手繪方式來畫的,有一些藝術加工的效果。
  • AI大事件丨Paige.ai斥資將機器學習帶入癌症病理學
    Paige.ai斥資2500萬美元將機器學習帶入癌症病理學來源:TECHCRUNCH.COM連結:https://techcrunch.com/2018/02/05/paige-ai-nabs-25m-inks-ip-deal-with-sloan-kettering-to-bring-machine-learning-to-cancer-pathology
  • ai本身涉及到的東西有哪些?核心是什麼
    人工智慧的大多數技術都可以寫出像網頁一樣的代碼,可以使用類似python的庫。也有相應的專用語言支持ai,主要是一些工具語言(比如python的pypcgl,perl的scip)。部分ai庫內置了機器學習的算法,這些算法實際上大多都是在離散數學中的概率論中的數學模型。