從使館焚燒文件說說碎紙及復原技術
7月21日,美國政府悍然要求中國在72小時內關閉駐休斯敦總領館,且只給出中方3天的撤離時間。當日下午,中國駐休斯敦總領館人員開始進行文件焚燒,處理相關機密文件。領事館焚燒文件引起了美國民眾的廣泛關注,社交媒體上也一邊倒地認為中國在燒毀證據。其實,對于機密文件的銷毀,焚燒文件僅僅是一種普通、簡單但又行之有效的文件銷毀方式。但在日常生活當中,我們一般采用碎紙機粉碎的方式來處理內部文件。但是碎紙機粉碎文件真的安全嗎?有沒有可能被拼湊復原呢?
碎紙機的核心部件是刀具,這組刀具是可以旋轉的,刀刃互相咬合,當有紙張進入時,旋轉的刀刃會把紙張切碎成條狀或者顆粒狀,如圖1所示。
圖1 碎紙機刀具示意圖
碎紙機的性能除了碎紙顆粒的大小外,還包括一次性碎紙的紙張厚度、持續碎紙的時間等等。但最關鍵的指標,仍然是碎紙顆粒的大小。
從電商網站上搜索碎紙機可以發現,目前商用碎紙機的指標一般采用德國標準DIN 66399。如圖2所示,德國紙張粉碎標準分為P2-P7級,其中P2級最低,P7級最高。P2級用于內部非涉密資料的紙張銷毀,粉碎后的顆粒表面積不超過800平方毫米,P3用于敏感保密信息,粉碎后的顆粒表面積不超過320平方毫米。以此類推,P7用于最高等級的紙質資料銷毀,粉碎后的顆粒表面積不超過5平方毫米。
圖2 德國紙張粉碎標準
以一張A4紙為例。A4紙的尺寸是210mm*297mm,面積62370平方毫米,按照P2級粉碎,可得到78個顆粒,P3方法粉碎后得到196個顆粒,P7方法粉碎后可以得到約12474個顆粒,如圖3所示。
圖3 一張A4紙在德國標準下的粉碎顆粒數
而普通三號字的尺寸是5.64mm*5.64mm,按照P2至P7的方法可以粉碎成為不同大小的顆粒。
同時,碎紙機粉碎顆粒還原技術的研究也一直沒有停歇。
1979年,伊朗爆發伊斯蘭革命,發生了美國大使館人質事件,事前美國大使館人員確實也進行了文件銷毀,但由于火爐故障,只是使用碎紙機對文件進行了粉碎。結果后來被伊朗把粉碎的紙條給拼回去,還原了機密文件(如圖4),并且因此揭發了不少美國針對伊朗的計劃。
圖4 伊朗人還原的文件
2011年,美國國防部公開舉辦了一場碎紙拼湊挑戰賽,要求參賽者將5份粉碎的文件重新拼湊復原出來,這五份文件一共7頁A4紙,都是手寫的文件,這些文件被破碎成為10000多個碎紙顆粒,在指定時間內恢復最快的團隊將獲得5萬美元的獎勵。這項比賽吸引了全球近9000個團隊參加。由于賽程的時間限制,美國國防部高級研究計劃局局長在一份聲明中說道“很多專家都懷疑是否能在短時間內提出解決方案。”。
其中加州大學的團隊,采取了“眾包”的方式來解決謎題,創建了一個在線程序,讓來自世界各地的人可以一起解決拼湊問題。
維吉尼亞州的一家文檔成像公司的聯合創始人蘭德魯姆獨自解決這個問題,他費力地將每一張碎紙拼湊在一起,仿佛在做一個拼圖游戲。
最終,這場挑戰賽的獲勝隊伍利用10000多個碎片完成了七頁紙的復原拼湊。他們使用了計算機的圖像識別技術,當用戶點擊特定的紙碎片時,可以推薦可能的匹配項,以此來完成高效的拼湊,并且該應用程序由8個人用了1個月的時間開發。
圖5 美國國防部碎紙拼湊挑戰賽
這場競賽顯示,盡管碎紙是一個由來已久銷毀技術,但碎紙技術和對應的碎紙顆粒還原技術一直在“相生”“相克”,不斷發展,同時也是保密領域中不可或缺的重要一環。盡管碎紙技術仍屬于物理安全范疇,但是碎紙顆粒的還原技術已經涉及當前最新的技術領域,比如圖像識別、群智眾籌算法、人工智能、芯片計算能力等等,碎紙技術的指標必須在充分了解這些技術水平的基礎上才能制定。
而作為碎紙機的使用者,我們日常處理碎紙顆粒的時候同樣需要根據碎紙顆粒中信息的重要程度,妥善處理已經破碎的顆粒,時刻牢記在代價足夠的時候,是存在能夠提高碎紙顆粒還原效率的計算機輔助算法的。
同時,碎紙機還有效率的問題。地處異國他鄉,碎紙機的效率難以滿足銷毀的時限要求,且碎紙顆粒無法帶回妥善處理的時候,焚燒是最快的解決辦法。
參考文獻:
[1] 德國銷毀設備產品手冊. http://www.hsm.eu/uploads/media/EN_HSM_Broschure_DIN_norm66399_22.pdf
[2] Chen J , Ke D , Wang Z , et al. A high splicing accuracy solution to reconstruction of cross-cut shredded text document problem[J]. Multimedia Tools and Applications, 2018, 77(15):19281-19300.
【本文為51CTO專欄作者“中國保密協會科學技術分會”原創稿件,轉載請聯系原作者】