數據脫敏:數據大爆炸時代的隱私保護利器

2020-12-08 199IT

數據脫敏(Data Masking),又稱數據漂白、數據去隱私化或數據變形。百度百科對數據脫敏的定義為:指對某些敏感信息通過脫敏規則進行數據的變形,實現敏感隱私數據的可靠保護。這樣,就可以在開發、測試和其它非生產環境以及外包環境中安全地使用脫敏後的真實數據集。
可以看到數據脫敏具有幾個關鍵點:敏感數據、脫敏規則、使用環境。
敏感數據,又稱隱私數據,常見的敏感數據有: 姓名、身份證號碼、地址、電話號碼、銀行帳號、郵箱地址、所屬城市、郵編、密碼類 ( 如帳戶查詢密碼、取款密碼、登錄密碼等 )、組織機構名稱、營業執照號碼、銀行帳號、交易日期、交易金額等。
隨著大數據時代的到來,大數據商業價值的挖掘,用戶的精準定位,大數據中蘊藏的巨大商業價值被逐步挖掘出來,但是同時也帶來了巨大的挑戰–個人隱私信息的保護。個人信息與個人行為(比如位置信息、消費行為、網絡訪問行為)等,這些都是人的隱私,也是我們所關注的一類敏感信息,在大數據價值挖掘的基礎上如何保護人的隱私信息,也將是數據脫敏必須解決的難題。
脫敏規則,一般的脫敏規則分類為可恢復與不可恢復兩類。
可恢復類,指脫敏後的數據可以通過一定的方式,可以恢復成原來的敏感數據,此類脫敏規則主要指各類加解密算法規則。
不可恢復類,指脫敏後的數據被脫敏的部分使用任何方式都不能恢復出。一般可分為替換算法和生成算法兩大類。替換算法即將需要脫敏的部分使用定義好的字符或字符串替換,生成類算法則更複雜一些,要求脫敏後的數據符合邏輯規則,即是「看起來很真實的假數據」。
使用環境,主要指脫敏之後的數據在哪些環境中使用。普遍按照生產環境和非生產環境(開發、測試、外包、數據分析等)進行劃分。
在最近一期的Gartner關於數據脫敏的報告(Magic Quadrant for Data Masking Technology-2014年12月)中根據數據脫敏產品應用場景的將數據脫敏劃分為靜態數據脫敏(static data masking[SDM])和動態數據脫敏(dynamic data masking[DDM])。
靜態數據脫敏(SDM)與動態數據脫敏(DDM)主要的區別是:是否在使用敏感數據當時進行脫敏。
靜態數據脫敏(SDM)一般用在非生產環境,在敏感數據從生產環境脫敏完畢之後再在非生產環境使用,一般用於解決測試、開發庫需要生產庫的數據量與數據間的關聯,以排查問題或進行數據分析等,但又不能將敏感數據存儲於非生產環境的問題。
動態數據脫敏(DDM)一般用在生產環境,在訪問敏感數據當時進行脫敏,一般用來解決在生產環境需要根據不同情況對同一敏感數據讀取時需要進行不同級別脫敏的問題。
在上文中提到的Gartner是全球最具權威的IT市場與顧問諮詢公司,就IT的研究、發展、評估、應用、市場等領域,為客戶提供客觀、公正的論證報告及市場調研報告,協助客戶進行市場分析、技術選擇、項目論證、投資決策。Gartner每年都在關鍵領域,採用「魔力象限圖」對主要廠商進行定位,是在某一特定時間內的對市場情況進行的圖形化描述。魔力象限的四個象限依次分別為領導者(Leaders)、挑戰者(Challengers)、有遠見者(Visionaries)和特定領域者(Niche Players)。
數據脫敏首次作為一個單獨的魔力象限被Gartner發布是在2012年12月,每年的12月Gartner會發布當年數據脫敏方面的分析報告,迄今為止一共發布了3期。
我們在這三份報告的基礎上分析近年來數據脫敏方面的變化,並對未來的發展進行展望。

1、數據脫敏市場定義與描述比較(Market Definition/Description)

可以看出,關於在最近一期的報告中,並沒有把「結構化/非結構化」(即是否是關係型數據類型)單獨作為一個分類的標準,而是將「實時/非實時」以及「生產/非生產」作為了關鍵指標。沒有強調非結構化數據(Data redaction masks)作為一個單獨分類。

2、評價標準比較
  Gartner對數據脫敏產品的評價,主要分為執行能力和完整的願景兩方面,具體的方面見下圖:

比較近三年的報告,上圖中紅色部分的評價標準發生了變化,具體內容如下:

可以看到,在13年評價標準發生了一個較大的變化,就是從原來的關注SDM轉變為SDM與DDM均有,並且開始關注大數據與雲數據安全。在13年產品與服務類別,評價中考慮是否提供了其他的安全產品相配合;而到14年數據智能被提到更重要的位置上作為產品與服務的評價項目。
3、象限位置定義
  對於象限的定義上,13年與14年沒有什麼差別,而12年的差別也是在於12年從SDM上考慮的多,而DDM幾乎沒有被考慮,這裡不再進行比較。在分析了14年的報告以後,得出的象限標準如下圖:

在過去的幾年,層出不窮的隱私數據洩密事件已經證明,企業和政府機構的數據安全,內部人的洩密比外部黑客攻擊後果更嚴重。
近年來數據脫敏歷經了一個從重視靜態數據脫敏(SDM)到靜態數據脫敏(SDM)、動態數據脫敏(DDM)同樣重視的程度,即覆蓋面正在從非生產系統到生產系統。
隨著大數據、雲平臺的發展,大數據平臺與雲平臺上數據隱私保護的研究與產品也將長足發展,同時敏感數據的智能探測、智能分析與統計、智能處理也將會被作為一個重要的產品發展方向。

作者為 亞信科技(中國)有限公司網絡安全事業部 尹雯玉

相關焦點

  • 《大數據時代》作者:當下數據隱私保護方式是完全錯誤的
    大數據可提供對世界更深入的洞察,對人類社會的促進作用自然巨大,然而,個人隱私如何保護?誰有權收集和處理某些數據?也是產業健康發展不得不解決的問題。「我們當前的方式是詢問每一個客戶、個人是否同意搜集其個人數據,」維克託•邁爾-舍恩伯格,《大數據時代》一書作者,在北京出席第八屆中國雲計算大會期間向第一財經記者表示。
  • 大數據時代,如何保護個人隱私?
    導語:   大數據時代,各大網站和商業機構,完善了對網絡用戶各種數據和訪問記錄的採集、跟蹤與收集。大數據時代,如何保護個人隱私?作者:卡爾赫林大數據時代,個人隱私數據如何保護?可以把數據資料保存到移動硬碟上,存儲重要數據的移動硬碟不外借不隨便插接公用電腦。及時更新電腦和手機上的殺毒和安全軟體,並不定期殺毒,使用電腦和手機後及時清理垃圾和痕跡。(網盤和雲存儲雖然便捷,但有洩密風險,重要文件、隱私信息和商業秘密、公司內部文件切不可保存到網盤和雲存儲上。)
  • 陳根:隱私保護之痛下,隱私計算將成數據價值釋放突破口
      隱私保護之痛數字經濟時代下,數據作為生產要素的重要性日益凸顯。加上數據的頻繁洩露,數據隱私安全成了時下亟待解決之痛。而現有的隱私保護主要從信息處理過程中的隱私保護、隱私度量與評估兩個方面入手。從信息處理過程中的隱私保護方法來看,主要分為訪問控制技術方法、信息混淆技術方法、密碼學技術方法三類。
  • 嚴守用戶隱私!華為EMUI10通過歐洲隱私保護認證ePrivacySeal
    在歐洲最大的消費電子展IFA上,華為消費者BG軟體部總裁王成錄宣布:華為EMUI10關鍵特性獲得ePrivacySeal隱私證書。通過GDPR(歐盟「通用數據保護條例」,General Data Protection Regulation)隱私合規認證,充分體現了世界權威認證機構對華為保護用戶隱私的認可。
  • 給數據加「噪音」,差分隱私如何保護用戶數據安全和隱私
    《MIT科技評論》認為未來數據保護的難度會越來越高,解決這個問題的方法之一就是差分隱私,這種技術可以建立信任機制。什麼是差分隱私那麼什麼是差分隱私?它是一種數學技術,它能夠在給數據添加噪聲的同時,一直計算隱私提升的程度,從而使得增加「噪音」的過程變得更加嚴謹。它是對所有數據查詢、分析過程進行約束,儘可能減少隱私洩露的風險。
  • 隱私計算:拿什麼保護我們的數據安全?
    我們到底把多少隱私信息留在了網上,留給了多少平臺,恐怕多到連自己都記不清了。而我們對於這些數據最終的去向、用途和安全性幾乎一無所知。近年來,我國在公民的個人數據和隱私保護上已經開始了相關立法,比如《網絡安全法》《民法典》,當中都有相關個人信息保護的法律規定。而《數據安全法》《個人信息保護法》也處於向全社會公開徵求意見的過程中。
  • 大數據時代下信息隱私與定位發展的矛盾
    同時也有人說,大數據時代下每個人都是透明的,你的每一項動作都會有相應的數據記載,包括我們的分享記錄、通話記錄、查找記錄、交易記錄等等,是生活的方方面面,生活如同窺視鏡下,得不到自我隱私的保護。由此,值得人們思考:大數據時代下隱私與定位發展之間的矛盾如何權衡;如何發揮法律在其中的效力發揮。首先,是關於大數據時代所帶來的定位發展。
  • 個人健康醫療數據隱私安全法律法規研究
    那麼,個人健康信息該受到怎樣的保護呢?通過比較美國和中國在隱私安全方面的法律條款,我們將對國內個人健康隱私安全法律法規的制定提出建議。在隨後幾年,HIPAA相關補充法案進一步發布,美國形成了一整套針對個人健康信息的隱私安全法律保護體系。
  • EXIN PDPF 谷安隱私與數據保護認證正式上線!
    大數據時代,在充分挖掘和發揮大數據價值的同時,解決好數據安全與個人信息保護等問題刻不容緩。 另外在全球一體化、數位化飛速發展的當下,中國、歐盟、以及其他相關國家和區域,幾乎不約而同出臺數據安全及個人信息保護相關法律保護規定,如中國《網絡安全法》《數據出境辦法》、歐盟《一般數據保護條例》 (General Data Protection Regulation簡稱GDPR)等。
  • 大數據時代的客戶隱私,我們在意的究竟是什麼?
    海量數據聚集和挖掘,其商業價值不言而喻,然而商業價值和個人隱私保護之間如何平衡,這是所有人都將面對的問題。隨著大數據相關應用的日益普及和深入,更多的雲,更多的各類應用程式,更多的數據採集硬體,隱私收集,不知不覺已隨時隨地侵入你我的工作和生活,我們實際上已經處於幾近赤裸的狀態。  不可否認,大數據本身是柄雙刃劍,無論我們如何不願意自己的隱私被感知,被統計,我們還是受不了他所帶來的無論是商業價值和社會價值等方面的誘惑。
  • 什麼是大數據?大數據正在吃掉你的隱私?
    近幾年來,網際網路行業發展風起雲湧,而移動網際網路、電子商務、物聯網以及社交媒體的快速發展更促使我們快速進入了大數據時代。但你真的了解大數據嗎?什麼是大數據大數據。他是數據的集合,簡單來說就是體量巨大的數據。
  • 隱形之戰:個人隱私在大數據時代的窺視與死亡
    質疑運營機構「為了方便之名」《大數據時代的隱私》,特蕾莎 M·佩頓 西奧多·克萊普爾 著,鄭淑紅 譯,上海科學技術出版社2017年1月版。序言作者為霍華德·A·施密特(曾任歐巴馬政府網絡安全特別助理)。
  • 數據「去識別」指南:如何在報導中保護隱私信息?
    原創 Vojtech Sedlak 全球深度報導網對於數據記者來說,在報導中公開重要信息和保護信息背後的個人隱私之間需要取得平衡。當今這個無處不在收集數據的時代,這種挑戰尤其突出。記者如何在不影響報導的前提下保護隱私數據?
  • 華為Mate40系列搭載EMUI11,隱私安全更安心!
    不追蹤:你的隱私數據,由你自己掌控 說到個人隱私的安全,此次EMUI 11推出的全新"照片分享脫敏"功能就可以保護用戶的隱私信息。當你剛用手機拍攝完的照片想要分享時,在分享界面就可以選擇對照片進行"脫敏"傳送,隨即去除位置信息、拍攝數據等敏感信息,讓你的精彩與人分享的同時,避免將一些隱私信息透露給他人。
  • 數字經濟時代,數據是怎樣一種關鍵要素?
    數據已成為新的生產要素  所謂生產要素,是一個經濟學的範疇,它指的是生產經營中所需要的各種社會資源。在不同的時代、不同的生產力條件下,生產要素所包含的內容有很大不同。  在農業社會中,生產的投入主要是土地和勞動力,因此這兩者就是最重要的生產要素。威廉·配第說「土地是財富之母,勞動是財富之父」就是這個道理。
  • 用戶信息安全無小事,EMUI11隱私安全再發力
    不追蹤:你的隱私數據,由你自己掌控說到個人隱私的安全,此次EMUI 11推出的全新「照片分享脫敏」功能就可以保護用戶的隱私信息。當你剛用手機拍攝完的照片想要分享時,在分享界面就可以選擇對照片進行「脫敏」傳送,隨即去除位置信息、拍攝數據等敏感信息,讓你的精彩與人分享的同時,避免將一些隱私信息透露給他人。除了為照片隱私數據脫敏之外,EMUI 11在應用權限方面進一步加強了管控和監測。
  • 數據要素時代金融業的使命
    規劃要求,充分釋放大數據作為基礎性戰略資源的核心價值,推動形成金融業數據融合應用新格局。同時,金融業正在開展人工智慧、區塊鏈、大數據、雲計算等多項金融行業標準的制定工作,並發布《個人金融信息保護技術規範》,將為金融數據要素化奠定標準基礎。 三是數據安全融合技術研發取得突破性進展,為開創數據要素新時代奠定技術基礎。
  • 大數據時代,我們的隱私是怎麼樣「自我暴露」的?
    在當下這個大數據時代,你是否經常被一些推銷、詐騙廣告光顧,通過電話、簡訊、郵件,甚至快遞等等方式?你是否會疑惑,他們是如何獲取信息的?當然,你也可能已經習以為常,而不覺得有什麼奇怪或者不妥了,因為我們一直就是這麼赤裸裸地暴露在這個大數據的時代,沒有遮掩,沒有秘密。
  • 網絡隱私保護神器——代理IP
    遇到這種情況,我們該如何保護自己的隱私安全呢?網絡隱私保護神器——代理IP這時就可以用代理IP來解決。IP是我們連接網絡的通行證,就像街道的門牌號,電話的號碼一樣。黑客一般會通過IP來獲取個人隱私,代理IP則可以讓你換個身份去訪問網絡。
  • 邢會強:大數據時代個人金融信息的保護與利用
    大數據時代的個人金融信息保護需求對現行法律理論、相關制度與機制以及金融機構的個人信息保護管理能力都帶來了挑戰。在大數據時代,金融法需要被重新定義,即金融法實際上是包括企業信息和個人信息在內的數據管理、共享與利用之法。在大數據時代,個人金融信息保護法需要轉型升級。法律需要明確信息和數據的權屬,對個人金融信息實行特別保護,完善事中和事後保護機制,完善保密規則的例外情況。