GEO:網際網路大數據技術藍皮書之隱私保護

2020-12-25 199IT

一、概述

「大數據」無疑是近年來最熱門的科技名詞,「大數據廣告」、「大數據電商」、「大數據金融」、「大數據醫療」甚至是「大數據農業」,這些「大數據」令人眼花繚亂。「大數據」給產業帶來了巨大的變革,不但改變了一些行業慣有的思維方式,同時也帶來了很多爭議,用戶隱私安全便是首當其衝的一個。

二、什麼是隱私數據

研究用戶隱私保護技術,首先要明確什麼是用戶隱私數據,GEO對用戶隱私數據做了如下分類:

1、 PII (Personal Identifiable Information),也就是能夠明確標識一個人身份的數據,比如用戶的姓名、手機號、身份證號、電子郵箱、住址等。

2、 用戶相關信息,比如用戶的年齡、性別、公司、職業等信息。這類信息雖然不能直接標識一個用戶,但是把這些條件組合在一起,還是有相當的隱私風險的。比如「年齡36歲,在天恆大廈工作,擔任集奧聚合GEO的架構師」,通過這些條件很容易定位出一個人,這就是所謂的「Quasi-identifier」。

3、 用戶屬性標籤,為了解決「Quasi-identifier」的問題,很多人會把用戶信息進行一定的泛化,比如上面的例子可以泛化成「30-40歲,在東直門附近工作,IT行業,喜歡汽車」,相較之下這樣會顯得模糊一些,也就是常說的「k-anonymity」。但嚴格來說,這些數據還是會涉及用戶隱私,並非絕對安全。

三、國內外相關法律法規

在用戶隱私安全保護方面,國外起步較早,形成了許多法律法規,國內目前還處於起步階段:

四、隱私保護技術

 

1、 統一標識,不採用任何Cookie、PII或PII加密後的數據作為用戶標識,而是對用戶隨機編號,我們稱之為User ID。該ID沒有任何物理意義,僅僅是一個編號,不同來源的數據採取統一的User ID進行交換,有效解決PII問題。

2、 流處理技術,對於數據本身存在的用戶隱私數據,只要存儲在一個物理介質上的就是不安全的。因此,技術平臺對這類數據的過濾採用了流處理技術,脫密前的原始隱私數據不會保存,即使系統被黑客攻破也不會導致隱私洩露。

3、 標籤化處理,用戶標籤主要有兩類,一類是用戶原始標籤,一類是廣告標籤。原始標籤保存在經過授權的第一方或第三方資料庫中,廣告標籤保存在廣告投放系統中。廣告標籤在第一方或第三方資料庫中計算得到,也就是說我們不知道每個人是誰,也沒有保存個人身份和興趣標籤,我們只知道該給他投放什麼廣告。

4、 自動處理技術,廣告標籤計算完全憑藉自身的自動算法實現,沒有人為介入,整個流程不可逆,完全是一個黑盒子,避免了人為原因造成的風險。

5、 加密技術,採用三個層架實現數據加密處理:網絡層、數據匯聚層和應用層。網絡層主要通過傳統的防火牆、IDS等方式實現數據通道安全;數據匯聚層通過專有硬體實現數據的加密、過濾和去隱私化處理;應用層主要從分布式存儲、數據交換、業務模型等方面進行數據加密,保證系統的安全性。

6、 系統管理能力,系統的安全離不開有效的監控和管理。專門開發了具備多級監控、調度和管理能力的iManager系統,能有效管理全國幾十個數據中心,配合相應的管理制度,最大限度的保證隱私數據安全。

7、 用戶可管理性,用戶可以了解自己的哪些數據被用作了哪些用途,並且用戶可以要求系統停止使用這些數據。比如用戶可以要求終止個性化廣告展示服務。這個能力只有基於非Cookie技術才能實現。我們都知道Cookie的生命周期短,用戶必須不斷告知系統停止服務,然而非Cookie技術就不存在這個問題。

相關焦點

  • 個人隱私無小事,大數據時代需要怎樣的隱私保護技術?
    導語:隱私保護VS數據共享,如何取捨?在日常生活中,你是否會接到莫名奇妙的推銷電話,或者是收到很符合需求的推送?這些都是你的個人數據被洩露的表現。大數據時代,人們的個人信息、消費需求、甚至生活習慣都會形成數據,由個人數據織成的信息網覆蓋範圍極廣,且能產生巨大經濟價值,網上甚至形成了販賣用戶信息的「黑產」鏈條。
  • 教育大數據隱私保護機制與技術研究
    如何保障教育數據安全,對教育數據進行合理、合規的分析和利用是當前亟須解決的問題。基於教育大數據的特徵,重點闡明了教育大數據的隱私內涵,圍繞教育數據生命周期內各利益相關方的隱私保護需求,提出了教育大數據隱私保護框架,並針對性地梳理了目前可用於教育領域的隱私保護技術體系,以期為教育大數據各個應用環節提供支撐,推動教育大數據的規範有序發展。
  • 大數據時代,如何更好的保護隱私
    導語:中國的網民規模龐大,網民在網絡上的個人信息組成了規模更大的數據。而數據具有雙重屬性,既有隱私屬性,同時有價值屬性。在移動網際網路時代,數據的隱私屬性越來越強,尤其是社交網站中經常會分享照片、位置等等,這些內容都需要被保護。但隨著數字經濟的興起,數據成為了競爭力,依靠數據可以獲取更好的發展。
  • 探討大數據安全與隱私信息保護
    論壇圍繞網絡安全領域重大社會需求和供給側技術發展前沿,就大數據安全面臨的挑戰、隱私信息保護等方面展開研討交流。  論壇以「大數據安全與隱私信息保護」為主題,邀請國家信息中心副主任馬忠玉,審計署原辦公廳巡視員兼信息辦主任周德銘,國家信息中心辦公室副主任、國信衛士網絡空間安全研究院網絡治理研究室主任呂欣,大數據協同安全技術國家工程實驗室副主任左英男等嘉賓,圍繞政務信息共享的信息安全保障、網絡空間數據治理、大數據時代的身份安全管理、大數據安全和隱私保護技術框架等議題,分享了最新研究成果,為產業界與國家工程實驗室等學術機構建立合作平臺
  • 探尋大數據邊界:商業化與隱私保護應雙贏
    劉心田:大數據時代的用戶隱私更需要保護,技術手段和法律手段都不可或缺。之所以強調技術手段,是因為現在大數據領域區塊鏈、多方安全計算、聯邦學習、XID等新技術已日益得到廣泛應用,很多技術、手段可以解決數據「可用不可見」問題,即在不侵犯個人隱私的情況下,數據應用仍可以得到大數據所需要的結果。
  • 大數據安全 用戶隱私該如何保護
    但在2018中國國際大數據產業博覽會上,一場如何構建數據安全新秩序的高端論壇讓她怎麼也沒有想到,自己每天上網的一個個小動作,會給自己帶來隱私洩露的風險。從Facebook用戶數據洩露,到攜程利用大數據「殺熟」,再到今日頭條虛假廣告風波……論壇嘉賓舉出的一個個案例,讓這個90後大學生意識到,隨著大數據產業的飛速發展,中國正在迎來一場空前的「隱私危機」。
  • 區塊鏈讓數據「可用不可見」 支付寶隱私保護引入技術保障
    11月23日,在杭州召開的2019網際網路法律大會上,螞蟻金服發布了《隱私保護和數據安全白皮書》。白皮書顯示,支付寶在行業內率先推出的「摩斯」安全計算平臺(MORSE),通過結合區塊鏈等技術,能有效解決商業醫療保險、政務服務等數據共享中的隱私保護問題。
  • 陳根:大數據時代下隱私洩露頻繁,拿什麼保護我們的隱私?
    文/陳根研究顯示,過去幾年中人類製造的數據佔整個人類歷史數據量的95%,換言之,大數據時代已經真正降臨。與此同時,隱私問題也逐漸成為焦點。在5G技術支持下的大規模數據收集會更多地觸及個人信息和隱私信息,雖然這些信息在整體信息中佔據的比重會有所降低,但是從絕對數量上看,則會同步大幅增加。
  • 這項技術可以讓隱私數據「可用不可見」
    大數據時代,企業數據需求量增加,跨行業的數據共享和應用成為企業剛需。但是大數據流通市場仍存在諸多的風險,如個人隱私保護方面,當機構通過服務方查詢數據時,服務方可能留存用戶資料,數據開放和數據安全之間如何達成平衡成為大家思考的問題。
  • 疫情大數據回顧系列三:數據隱私保護向左還是向右?
    收集或掌握個人信息的機構要對個人信息的安全保護負責,採取嚴格的管理和技術防護措施,防止被竊取、被洩露。交通部在1月30日發布緊急通知,要求依法嚴格保護個人隱私和個人信息安全,除因疫情防控需要,向衛生健康等部門提供乘客信息外,不得向其他機構、組織或者個人洩露有關信息、不得擅自在網際網路傳播。
  • 大數據時代如何保護隱私 信息安全攻防戰永無止境
    原標題:大數據時代,如何保護用戶隱私   大規模用戶隱私洩露事件又一次被爆出:萬豪國際集團旗下酒店客房預訂資料庫被黑客入侵,約5億名客人的信息或被洩露。業界稱,這是自之前雅虎30億用戶信息被竊以來規模最大的一次。   今年以來,用戶隱私洩露事件時有發生。
  • 給數據加「噪音」,差分隱私如何保護用戶數據安全和隱私
    對於一家人工智慧公司來說,數據是他們訓練、調整算法和模型的關鍵,也是安身立命之本。但要安全處理數據,並讓數據產生自己想要的結果,並不簡單。為了應對攻擊,有研究人員提出了一種數據加密技術,稱為差分隱私。《MIT科技評論》評選的2020年十大突破技術中,就有差分隱私。《MIT科技評論》認為未來數據保護的難度會越來越高,解決這個問題的方法之一就是差分隱私,這種技術可以建立信任機制。什麼是差分隱私那麼什麼是差分隱私?
  • 《2020國家能源網際網路發展藍皮書》發布
    清華大學能源網際網路研究院院長、清華大學電機系主任康重慶教授在解讀藍皮書時表示,《2020國家能源網際網路發展藍皮書》(以下簡稱「藍皮書」)由清華大學能源網際網路研究院編制,從技術發展角度總結了能源網際網路技術的發展現狀
  • 人民日報人民時評:讓隱私保護跟上大數據時代
    登錄電商網站,推薦商品多是依據瀏覽痕跡;打開微博微信,廣告投放定向植入;打開理財客戶端,首頁也因人而異……通過對瀏覽記錄、點擊頻次的統計分析,從中挖掘出性別、職業、喜好、消費能力等信息,被不少企業視為理所當然的商機,然而在隱私保護方面鮮有人投入同等的關注,這無疑潛藏著巨大的風險。   大數據算法在商業應用中一騎絕塵,說明在個人和商家的博弈框架內無力解決好隱私保護問題。
  • 劉世平:大數據時代反壟斷、反不正當競爭和隱私保護非常必要
    因此,《反壟斷法》的執行是非常必要的,但是在大數據時代反不正當競爭和隱私保護同樣重要。   隱私保護   數據已經成為我們日常生活的重要組成部分,數據也已經成為非常重要的現代生產要素。數據的生成、收集、存儲、傳輸、利用也幾乎遍布各個行業。數據改變了我們的生活,數據給我們帶來了極大的便利。
  • ETNews | 《中國基礎教育大數據發展藍皮書》發布:從」走向數據驅動的精準教學「到」大數據助力教育治理現代化「
    京時間2018年5月30日,《中國基礎教育大數據發展藍皮書(2016-2017)》發布會暨第四屆「網際網路+教育」創新周閉幕式在北京世紀金源大飯店舉行,此次發布會上,《中國基礎教育大數據發展藍皮書(2016-2017)》正式對外發布。此份藍皮書由北京師範大學未來教育高精尖創新中心、江蘇省教育信息化工程技術研究中心與北京拓思德科技有限公司聯合編制。
  • 網際網路數據保護的規矩怎麼立?
    以個人數據保護為突破口,不少國家加快了網際網路數據管理的規則制定,歐盟的GDPR是其中的一個代表。未來,更加平衡、完善和科學的網際網路數據管理方法,需要兼顧數字經濟的發展、個人隱私的保護和國家安全三方面的正當訴求,可以有所側重,但不能出現顯著偏頗,更不能用「回到過去」的方式消極應對。
  • 個人數據隱私保護管理體系認證代辦
    ISO 29151是個人信息保護的行為準則、是個人身份信息保護的實踐指南。個人數據隱私保護管理體系從而保護企業和相關方的信息系統安全、智慧財產權、商業秘密等。維護企業的聲譽、品牌和客戶信任證書的獲得,可以強化員工的信息安全意識。個人數據隱私保護管理體系認證代辦
  • 在0和1構築的數據之網內,保護好隱私才是你的智慧
    這種故事就是我們生活在大數據的時代經常發生的事情。我們在享受大數據製造的便捷生活和網絡社交,虛擬的網絡社會和真實世界早已密不可分,但同時我們的隱私也在不知不覺中洩露。關於我們對大數據的依賴和困惑,作家夏予川所作的長篇小說《大數據時代》為我們進行了全面的分析解讀。
  • EXIN PDPF 谷安隱私與數據保護認證正式上線!
    大數據時代,在充分挖掘和發揮大數據價值的同時,解決好數據安全與個人信息保護等問題刻不容緩。 另外在全球一體化、數位化飛速發展的當下,中國、歐盟、以及其他相關國家和區域,幾乎不約而同出臺數據安全及個人信息保護相關法律保護規定,如中國《網絡安全法》《數據出境辦法》、歐盟《一般數據保護條例》 (General Data Protection Regulation簡稱GDPR)等。