碎紙恢復還原技術對載體銷毀的重要啟示

2021-03-01 中國保密協會科學技術分會

      碎紙自動拼接技術作為信息還原的重要技術,可應用於碎紙重建拼接工作。通過圖像提取技術獲取碎紙片的形狀、顏色等信息,利用這些特徵對碎紙進行自動或半自動拼接恢復。碎紙自動拼接在司法技術鑑定、歷史文獻修復以及軍事情報獲取等領域都有著重要應用。國際上有著許多關於碎紙恢復還原的重要案例。

案例1:德國情報機構「斯塔西」文件恢復工程,試圖尋找一種非人工幹預的新技術,可以在5年內,將那些在德國統一前夕被前東德情報機構撕成6億多塊碎紙片的絕密文件(手工恢復要400年)進行還原。[1]其中應標的德國弗勞恩霍得研究院設計科技公司(Fraunhofer Institute for Design Technology)宣布,已經開發出一種名為「E-Puzzler」的先進儀器,專門用於完成還原工作。該儀器能夠精確識別紙質碎片的特徵並將它們重組,還原文件的內容高達70%。弗勞恩霍得研究院稱,如果德國政府批准「E-Puzzler」正式投入使用,那麼完成全部工作的時間將縮短至5年,平均每年耗資700萬英鎊。

案例2:美國國防部高級研究計劃局(DARPA)曾表示,軍方常在戰場上收集到撕碎的文件殘片,但恢復文件原樣卻是一件望而生畏的艱巨任務,需要大量人工幹預,效率極低,而有價值重要情報通常都是有時限的。2011年10月29日,DARPA組織了一場碎紙復原挑戰賽,旨在尋找到高效的算法,對碎紙機處理後的碎紙屑進行復原。全美9000支隊伍參與角逐,最終由來自舊金山的三名程式設計師組成的名為「All Your Shreds Are Belong To U.S.」參賽隊伍獲勝。其解決方案是:基於計算機視覺、圖形學、紙張碎片的邊緣性狀等特徵,設計出自動搜尋到最可能匹配的紙張碎片的仿真算法,同時對可能的碎片對進行人工篩選。然而考慮到實際問題的複雜性以及安全保密管理要求的規範性,此種方案並未能夠真正投入軍方使用。

傳統上,恢復還原工作大部分都是由人工半自動方式完成,準確率較高,但效率很低。隨著計算機技術的發展,人們試圖開發碎紙片的自動拼接技術,以提高恢復還原效率。雖然國內外對這項工作進行了一些研究,但由於碎紙自動修復技術應用背景的特殊性,目前公開的可以參考研究資料並不多,提出的解決方法主要有兩種:一是基於輪廓的拼接[2,3];二是基於內容的拼接[4,5]。其中,前者的研究較多一些。基於輪廓的碎片自動拼接方法,可分為兩個步驟:局部形狀匹配分析和全局恢復重建(目前大部分研究都是以第一步為主)。

針對局部形狀分析研究,碎片通常被表示為其輪廓曲線的形式,以輪廓曲線的方法進行局部形狀匹配分析。Wolfson H[6]提出了一種基於弧長-累積轉角圖分析(Arclength Versus Total Turning Angle Graph)的形狀匹配方法來解決工業中工件自動裝配和識別的問題,這是一種通過串匹配的方式來尋找最大公共子段的方法。為了解決大規模文物碎片的修復問題,Leitão H C等人[7]給出了一種基於多尺度的二維碎片拼接方法,該方法通過對輪廓採樣點的曲率串進行多尺度分析,利用動態規劃技術對匹配對進行精化處理。布朗大學的Kimia B等學者[8]提出了一種基於彈性匹配的碎片自動拼接算法,該方法可以提高匹配的效率,但對雙對應曲線的採樣分布有較強的依賴性。

對於全局恢復重建方法,朱良家、周宗潭和胡德文[9]提出了一種實現全局一致性最大的鬆弛法全局匹配方法。鬆弛法通過局部輪廓匹配產生的候選匹配,對不同碎片之間在空間上的約束關係來剔除部分不合理匹配,保留在全局意義下更優的匹配,並取得了很好的效果。何鵬飛,周宗潭,胡德文[10]提出基於蟻群優化(ACO)的全局匹配算法,其採用基於ψ-s分析的局部輪廓匹配方法,利用多Agent間接通信和直接利用變化媒介質,在ACO算法的框架下將碎片全局匹配問題看作是一個求解整體且沒有矛盾的最小拼接代價的優化問題。

通常來說,碎片恢復還原工作主要分為以下三個步驟:

1.對紙質碎片進行預處理,即通過特徵檢測提取等一系列圖像預處理過程,將紙質碎片數位化。

2.圖像碎片匹配,即通過各種匹配算法模型找出相互匹配的圖像碎片。

3.圖像碎片的拼合,將步驟2中找到的相互匹配的圖像碎片拼合在一起得到最終的正確結果。

文獻10主要是對條狀及粒狀碎紙機碎紙的拼接復原問題進行分析、建模,並討論單面及雙面碎紙片復原的問題。本文結合文獻10的建模方法對上述三個步驟進行簡要概述。

預處理包括特徵提取、圖像掃描、圖像分割等技術手段。特徵提取的關鍵技術是紙輪廓提取,其直接影響著碎紙拼接結果的精度和效率。利用碎紙輪廓的形狀特徵,通過輪廓信息尋找輪廓形狀的相似性進行局部形狀匹配,再逐步完成全局的恢復重建。針對圖像掃描技術的應用,文獻10利用matlab軟體對碎紙片進行了雙面掃描,根據像素值提取0-1矩陣(0代表有字部分,1代表空白部分)。通過紙張像素分析,將至少有一面全為非0的紙張挑選出來,放入單面列印紙張;其餘的紙片為雙面列印。此外,對於圖像分割的預處理技術,文獻2提出了一種基於Level Set方法的圖像分割算法,之後再對提取出的輪廓進行鏈碼提取操作,根據紙片的大小,設定閾值,過濾掉鏈碼面積。小於閾值的區域,即所得到的鏈碼就是我們要提取的輪廓信息部分。(水平集方法是一種描述曲線以曲率相關的速度演化的有效方法,在醫學圖像處理、自然現象的模擬以及計算機視覺等領域得到了廣泛的應用。)

國內外研究者對於圖像碎片復原方法的研究主要集中在步驟2——圖像碎片匹配算法模型的研究上。文獻10在完成數據0-1矩陣提取的前提下,分別建立了三種模型以適應不同類型的紙質碎片拼接,包括條狀單面列印碎紙片的拼接模型、條狀雙面列印碎紙片的拼接模型及針對粒裝正反面列印碎紙片的拼接模型(聚類模型)。其中前兩種類型的圖像碎片匹配模型流程圖分別如圖2、圖3所示。第三種模型則是基於粒裝雙面拼接技術,其應用了聚類模型來衡量矩陣相關性,將強相關矩陣對應的圖像碎片劃分成一類,之後再利用模型二進一步實現拼接。

對於雙面碎紙的情況,文獻10定義了能夠拼接在一起的條件,條件1、2滿足其一,即可拼接成功:

條件1:第i張碎紙片a面的右邊界與第j張碎紙片a面的左邊界拼接成功,且第i張碎紙片b面的左邊界與第j張碎紙片b面的右邊界拼接成功;

條件2:第i張碎紙片a面的右邊界與第j張碎紙片b面的左邊界拼接成功,且第i張碎紙片b面的右邊界與第j張碎紙片a面的左邊界拼接成功。

圖2條狀單面列印碎紙片的拼接模型,其算法核心步驟為Step3,計算左右邊界歐式距離為公式(1);Ai代表第i張碎紙片的左邊界像素矩陣,Bj代表第j張碎紙片的右邊界像素矩陣。圖3條狀雙面列印碎紙片的拼接模型定義了碎紙片的a、b雙面,其中Ari代表第i張碎紙片a面右邊界對應的0-1矩陣;Ali代表第i張碎紙片a面左邊界對應的0-1矩陣;Bri代表第i張碎紙片b面右邊界對應的0-1矩陣;Bli代表第i張碎紙片b面左邊界對應的0-1矩陣;Jij,Lij,Mij,Nij為兩張碎紙片相應邊界的差值矩陣;pij,qij分別代表a~a面拼接的匹配度和b~b面拼接的匹配度;表示A的2-範數。

歐式距離計算公式:

在匹配算法模型中,較為創新的一種策略是基於群智能優化的全局匹配算法來實現圖像匹配[11,12]。群智能優化算法是一種離散優化問題的元啟發式算法,其利用生物種群行為優化機制來完成對問題的求解。通過優化的搜索學習策略將碎紙拼接匹配問題轉換成優化問題,模擬種群生物的進化機制來不斷迭代,最終尋找到碎紙對匹配的最優解。

在碎片還原恢復的最後階段,是將相互匹配的圖像拼接起來,恢復圖像原貌。在此階段,有幾點值得注意的是,考慮到會存在遺失碎片的可能以及相應的虛擬重建等問題,圖像碎片的拼合還需確保兩兩匹配碎片間匹配邊界拼合的嚴密性。[13]同時,由於碎片在數位化過程中的不同位置,導致了各個碎片與自身原始位置產生了角度變化,即部分碎片的局部坐標系也產生了不同,對於在拼合前的相互匹配的兩兩碎片,就需要根據共有的曲線或直線段的不同角度,將它們轉化到同一個坐標系中。

縱觀目前國內外碎紙標準規範情況,美國在碎紙方面的標準有《NSA/CSS Specification 02-01,High Security Paper Shredder》,其要求碎紙顆粒寬度不大於5mm,碎紙顆粒的面積不大於5mm2;德國標準《DIN 63399》代替了原來的《DIN 32757》標準,新的標準定義了七種安全等級,其中最高等級P-7對應的建議如:考慮採用最高安全預防措施的情況的帶有非常機密數據的數據載體,材料顆粒表面5mm2,對於整齊顆粒條寬1mm;國內碎紙一級標準應滿足碎紙顆粒達到2mm*1mm的紙質載體銷毀要求,以確保紙質及其同行載體銷毀的安全性。此外,對於一般辦公室使用的碎紙機碎紙後的顆粒尺寸也能達到2mm*0.8mm,碎紙機桶一般能盛放粉碎後的A4紙1000張,一張A4紙張按2mm*1mm標準粉碎後產生碎紙顆粒31185個。

因此,無論是從粉碎顆粒的規格大小還是顆粒粉碎數量來看,對於有相似性候選顆粒進行計算機碎紙恢復模型分析的複雜度是呈指數級增長的。綜上所述,從目前碎紙拼接恢復還原技術的研究趨勢分析,結合國家秘密載體銷毀安全保密要求,針對涉密紙張粉碎銷毀提出以下幾點安全性相關建議:

1、紙張安全銷毀設備的研製亟需滿足自主可控的信息化建設要求。以國產化軟硬體等安全可靠的支撐環境為依託,研製符合系統建設以及分級保護要求的紙張安全銷毀設備,確保設備全生命周期中具備有效可控的安全防護措施以及運維管理措施。

2、明確載體銷毀分級標準規範要求,確保涉密載體銷毀過程安全可控,安全評估載體銷毀中存在的失洩密風險。建議參照國外碎紙標準,對不同密級涉密載體以及定密等中間過程產生的涉密載體按照分級銷毀技術要求進行銷毀,防止因粉碎不徹底而導致可能通過拼接恢復還原出信息。

3、在粉碎過程中,嚴格執行安全保密管理措施,流程化人工幹預方式以及幹預時間點。結合碎紙拼接還原技術,目前仍需依賴人工幹預手段進行恢復,那麼反觀紙質粉碎銷毀過程,人工幹預問題對安全保密有著重要的影響。

4、從現實情況來看,許多碎紙自動拼接模型的仿真實驗資料庫和實際情報處理的大規模碎紙數據量相比差距甚遠,綜合考慮碎紙顆粒被掃描的速度和拼接候選等因素,實際利用碎紙自動拼接還原技術進行大規模碎紙顆粒還原恢復還存在一定難度。

[1] 春風, 麥吉爾. 前東德情報機構被撕碎的16000袋絕密文件將修復[J]. 蘭臺世界月刊, 2009(23):58-59.

[2] 張欣, 卜彥龍, 朱良家,等. 物證復原系統中的碎紙輪廓提取技術研究[J]. 計算機仿真, 2006, 23(11):184-187.

[3] 賈海燕, 朱良家, 周宗潭,等. 一種碎紙自動拼接中的形狀匹配方法[J]. 計算機仿真, 2006, 23(11):180-183.

[4] 金明婭, 孫丹蕾, 趙豔,等. 單面英文碎紙片的拼接復原及算法實現[J]. 延安大學學報(自然科學版), 2015, 34(1):14-18.

[5] 陳黎黎, 國紅軍. 基於文檔內容的碎紙拼接技術[J]. 衡水學院學報, 2014(4):34-37.

[6] Wolfson H. On Curve Matching[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1990, 12(5):483-489.

[7] Leitão H C D G, Stolfi J. A Multiscale Method for the Reassembly of Two-Dimensional Fragmented Objects[M]. IEEE Computer Society, 2002.

[8] Mcbride J C, Kimia B. Archaeological Fragment Reconstruction Using Curve-Matching[C]// Computer Vision and Pattern Recognition Workshop, 2003. CVPRW '03. Conference on. IEEE, 2003.

[9] Zhu L, Zhou Z, Hu D. Globally consistent reconstruction of ripped-up documents.[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2007, 30(1):1-13.

[10] 王晨, 曾騫. 關於碎紙機中碎紙片拼接復原的研究[J]. 大眾科技, 2014(3):15-17.

[11] 何鵬飛, 周宗潭, 胡德文. 基於蟻群優化算法的碎紙拼接[J]. 計算機工程與科學, 2011, 33(7):67-73.

[12] 張亮, ZhangLiang. 基於聚類優化模型的碎紙自動拼接方法研究[J]. 計算機應用與軟體, 2015, 32(12):218-221.

[13] 廖敏瑜, 謝睿誠, 餘聲宇. 碎紙片自動拼接復原[J]. 汕頭大學學報(自然科學版), 2018(1).

相關焦點

  • 破鏡可以重圓、碎紙能夠重拼嗎?
    被碎紙萬段以後還能不能重新復原?為了測試算法的有效性,賽事組委會挑選了五道智力題,寫在五張紙上,再將這些紙分別投入碎紙機,形成碎片。由這個例子得知碎紙還原並非不可能,但難度極高,如同保密等級一樣,德國DIN32757-1也有一套銷毀標準,分為五個級別。
  • Win10創建還原點及快速恢復系統
    ,來恢復系統到正常狀態。PS:我們在下圖可以看到打開此保護的用處:「啟用系統保護後,你可以通過及時將計算機還原到以前的某個狀態點來撤消不需要的更改」這裡寫的意思就是:你打開這個功能後,如果你在更新後;刪除系統文件後;或者誤操作等引起電腦出現了問題,它都可以利用還原點來幫你恢復到你改動之前好的狀態
  • 怎麼快速恢復win7系統以及創建系統還原點
    只需要在最初安裝好系統以及所有生活中需要用到的重要軟體之後做一個系統備份,也就是還原點,在電腦出現問題後我們就可以利用這個還原點來恢復到最早備份好的那個階段,也可以指定時間還原。;                    二、快速恢復系統;下面我們具體講下怎麼創建系統還原點,以win7旗艦版系統為例:操作方法:
  • 還原點恢復系統教程
    理論上,我們可以通過系統還原、重裝系統來解決。不過小編還發現了一種更簡答的方法,無需麻煩的重裝系統,只需要藉助系統還原點恢復系統。下面,小編以安裝Win7系統的筆記本為例,教大家如何恢復系統,解決奔潰問題。1、點擊打開Win7開始菜單,然後在【計算機】上點擊滑鼠右鍵,然後打開【屬性】,如下圖所示。
  • 用技術還原色彩,用數據守護文明:《數據保護產業發展圓桌宣言》與華為OceanProtect新品發布
    隨著物理世界不斷映射到數字世界,數據成為文明傳承新的重要載體,數據保護也被推上了前所未有的新高度。就在今天,以「全場景數據保護,為智能世界保駕護航」為主題的2021數據保護產業論壇暨華為OceanProtect數據保護新品發布會在甘肅敦煌舉辦。
  • 硬體設計之項目3-碎紙機系統
    1、項目背景介紹負責碎紙機電氣方面的設計。要求:成本低廉穩定可靠。輸入電壓:交流220V,交流馬達。開機有電源指示燈,可實現自動進紙功能,一次最多進紙5張,6張以上實現自動退紙功能。當紙屑箱滿後能夠實現自動停機並有紅LED指示。
  • 馬斯克的啟示:跨領域學習很重要
    一項耐人尋味的研究成果恰好證明了該觀點:它研究了 20 世紀最頂尖的 59 位歌劇作曲家如何鑽研技術。傳統觀點認為,頂級藝術家的成功只是源於刻意練習和專業化。馬斯克的學習遷移過程的第二步將他在人工智慧、科技、物理和工程學中學到的基礎原則在不同領域重構:在航空航天界,創立美國太空探索技術公司(SpaceX); 在航空界,設計可垂直起飛降落的電動飛機;在汽車界,發明具備自動駕駛功能的特斯拉(Tesla);在火車界,設計超迴路列車(Hyperloop
  • WIN10系統恢復出廠設置
    以上兩種方法都可以進入電腦恢復出廠系統的界面。進入恢復出廠界面以後,選擇最後一個「還原系統」。出廠鏡像還原,點「下一步"選擇是否需要備份電腦文件,沒有重要文件的話就選擇「跳過」到這裡電腦恢復系統過程就完全完成了,注意電腦恢復系統會清空電腦文件,注意保存個人重要文件哦。
  • 四點倡議,四大啟示 !
    昨天,聯合國隆重舉行紀念峰會,銘記世界反法西斯戰爭歷史經驗和教訓,重申對聯合國憲章宗旨和原則的堅定承諾,具有重要意義。主席先生!人類正在同新冠肺炎疫情進行鬥爭。病毒肆虐全球,疫情不斷反覆。我們目睹了各國政府的努力、醫務人員的付出、科學工作者的探索、普通民眾的堅守。各國人民守望相助,展現出人類在重大災難面前的勇氣、決心、關愛,照亮了至暗時刻。
  • 電腦怎麼恢復出廠設置windows7
    隨著計算機技術的不斷發展,計算機系統已經推出了很多版本,現在最新的系統是Win10,但是使用Win7的用戶比Win10多,因為Win10不是Win7的穩定性,那麼你知道一些與Win7系統有關的情況嗎?比如,如何在Windows 7中恢復出廠設置?今天小編就給大家詳細介紹一下吧!如何在Windows 7中恢復出廠設置?
  • 安全輕鬆的恢復win10系統
    電腦的Windows10自帶有系統恢復功能和一鍵還原(系統還原)功能,在電腦系統出現問題的時候可以很輕鬆的恢復系統。
  • 未爆彈如何銷毀——「拆彈精兵」從這裡走向戰場
    「未爆彈聚能銷毀技術其本質是利用射孔彈射出的高溫高速金屬射流侵徹未爆彈殼體……」課堂上,該基地某大隊金建峰副大隊長娓娓道來,詳細地介紹了未爆彈聚能銷毀技術及其應用。已至下課時間,參訓學員們卻絲毫沒有離開的意思,拋出一個又一個問題,金建峰副大隊長妙語連珠,將學員們拋出的「問號」一一拉直。整整一個上午的理論輔導,為學員們打下了堅實的專業知識基礎。
  • 系統還原
    如果電腦系統出現故障無法解決的話,我們可以考慮給電腦還原出廠設置恢復系統,還原系統呢?
  • 施樂105加載體
    富士施樂105/205系列的黑白列印,不拆機添加載體,是進入機器的診斷模式,強行下載體到機器顯影倉的,此方法只能針對:機器本身自帶顯示屏和方向鍵的用戶使用。方法是開機後按下綠色的啟動鍵5秒以上鬆手。)溫馨提示:請嚴格按照以上步驟,逐步操作!
  • 【功能使用-系統管理】備份和還原
    答案:只需要點擊上邊的【勤哲Excel伺服器進階學習訂閱號】關注即可勤哲提供了備份和還原的功能,剛接觸的用戶對於這個操作很模糊,也不是特別的重視。其實備份相當的重要,一旦機器出現問題,我們至少還有備份在,這樣就可以避免數據的丟失。
  • Linux 系統的備份、恢復
    點擊上方「民工哥技術之路」,選擇「設為星標」
  • 重裝系統還原數據太麻煩?1分鐘學會實時自動備份Win10重要文件!
    重裝驅動程序、重裝軟體、恢復系統偏好設置……忘記備份的數據也一去不復返!其實,Windows 10 系統自帶的備份還原功能就同樣好用,而且可以實時備份,隨時隨地恢復數據與設置,操作步驟也極為簡單。首先,我們需要準備一個大於32GB*的U盤或者移動硬碟,連接電腦。