GEO:網際網路大數據技術藍皮書之隱私保護

2021-01-10 網際網路數據資訊網

一、概述

「大數據」無疑是近年來最熱門的科技名詞，「大數據廣告」、「大數據電商」、「大數據金融」、「大數據醫療」甚至是「大數據農業」，這些「大數據」令人眼花繚亂。「大數據」給產業帶來了巨大的變革，不但改變了一些行業慣有的思維方式，同時也帶來了很多爭議，用戶隱私安全便是首當其衝的一個。

二、什麼是隱私數據

研究用戶隱私保護技術，首先要明確什麼是用戶隱私數據，GEO對用戶隱私數據做了如下分類：

1、 PII (Personal Identifiable Information)，也就是能夠明確標識一個人身份的數據，比如用戶的姓名、手機號、身份證號、電子郵箱、住址等。

2、用戶相關信息，比如用戶的年齡、性別、公司、職業等信息。這類信息雖然不能直接標識一個用戶，但是把這些條件組合在一起，還是有相當的隱私風險的。比如「年齡36歲，在天恆大廈工作，擔任集奧聚合GEO的架構師」，通過這些條件很容易定位出一個人，這就是所謂的「Quasi-identifier」。

3、用戶屬性標籤，為了解決「Quasi-identifier」的問題，很多人會把用戶信息進行一定的泛化，比如上面的例子可以泛化成「30-40歲，在東直門附近工作，IT行業，喜歡汽車」，相較之下這樣會顯得模糊一些，也就是常說的「k-anonymity」。但嚴格來說，這些數據還是會涉及用戶隱私，並非絕對安全。

三、國內外相關法律法規

在用戶隱私安全保護方面，國外起步較早，形成了許多法律法規，國內目前還處於起步階段：

四、隱私保護技術

1、統一標識，不採用任何Cookie、PII或PII加密後的數據作為用戶標識，而是對用戶隨機編號，我們稱之為User ID。該ID沒有任何物理意義，僅僅是一個編號，不同來源的數據採取統一的User ID進行交換，有效解決PII問題。

2、流處理技術，對於數據本身存在的用戶隱私數據，只要存儲在一個物理介質上的就是不安全的。因此，技術平臺對這類數據的過濾採用了流處理技術，脫密前的原始隱私數據不會保存，即使系統被黑客攻破也不會導致隱私洩露。

3、標籤化處理，用戶標籤主要有兩類，一類是用戶原始標籤，一類是廣告標籤。原始標籤保存在經過授權的第一方或第三方資料庫中，廣告標籤保存在廣告投放系統中。廣告標籤在第一方或第三方資料庫中計算得到，也就是說我們不知道每個人是誰，也沒有保存個人身份和興趣標籤，我們只知道該給他投放什麼廣告。

4、自動處理技術，廣告標籤計算完全憑藉自身的自動算法實現，沒有人為介入，整個流程不可逆，完全是一個黑盒子，避免了人為原因造成的風險。

5、加密技術，採用三個層架實現數據加密處理：網絡層、數據匯聚層和應用層。網絡層主要通過傳統的防火牆、IDS等方式實現數據通道安全；數據匯聚層通過專有硬體實現數據的加密、過濾和去隱私化處理；應用層主要從分布式存儲、數據交換、業務模型等方面進行數據加密，保證系統的安全性。

6、系統管理能力，系統的安全離不開有效的監控和管理。專門開發了具備多級監控、調度和管理能力的iManager系統，能有效管理全國幾十個數據中心，配合相應的管理制度，最大限度的保證隱私數據安全。

7、用戶可管理性，用戶可以了解自己的哪些數據被用作了哪些用途，並且用戶可以要求系統停止使用這些數據。比如用戶可以要求終止個性化廣告展示服務。這個能力只有基於非Cookie技術才能實現。我們都知道Cookie的生命周期短，用戶必須不斷告知系統停止服務，然而非Cookie技術就不存在這個問題。

相關焦點

達摩院發布2020十大科技趨勢,預測保護數據隱私的AI技術加速落地

達摩院分析，2020十大科技趨勢將分別是人工智慧從感知智能向認知智能演進，計算存儲一體化突破AI算力瓶頸，工業網際網路的超融合，機器間大規模協作成為可能，模塊化降低晶片設計門檻，規模化生產級區塊鏈應用將走入大眾，量子計算進入攻堅期，新材料推動半導體器件革新，保護數據隱私的AI技術將加速落地，雲成為IT技術創新的中心。
2020世界網際網路大會藍皮書乾貨來了!

傳播君潘樹瓊/攝主要內容大會藍皮書由《世界網際網路發展報告2020》和《中國網際網路發展報告2020》兩本報告組成，反映了網際網路發展與治理的進程、現狀和態勢，涵蓋信息基礎設施、網絡信息技術、數字經濟、數字政府和電子政務、網絡媒體建設、網絡安全、網絡空間法治建設、網絡空間國際治理等重點領域，全面展現過去一年世界和中國網際網路發展的新理念
2020年世界網際網路大會藍皮書的三大看點

世界網際網路進入「烏鎮時間」，中國網絡空間研究院11月23日在世界網際網路大會·網際網路發展論壇上發布了《世界網際網路發展報告2020》和《中國網際網路發展報告2020》兩本藍皮書。
差分隱私 x MACE:小米MIUI 12隱私保護技術亮相

IT之家4月23日消息今日小米MIUI正式官宣旗下全新的「小米隱私品牌」，官方也在午間介紹了其所運用的隱私保護技術。官方表示，小米自研並開源了專為移動終端開發的MACE（Mobile AI Compute Engine）AI框架。
第四範式戴文淵提AI發展三大挑戰:數據科學家數量少、數據隱私保護...

但如果是通過電子渠道，這樣大的任務量，不可能通過人工和人力來完成。因此，這是典型適合人工智慧的場景，AI充分利用線上的用戶行為數據，可以實現個性化的營銷以及精準匹配的推送。但核心問題是，行業中數據科學家數量遠遠不夠，就算是MIT的數據科學家也不能夠解決所有企業的所有需求和問題。
支付寶推安全計算平臺「摩斯」,用區塊鏈等技術解決隱私保護問題

首頁 > 見聞 > 關鍵詞 > 支付寶最新資訊 > 正文支付寶推安全計算平臺「摩斯」，用區塊鏈等技術解決隱私保護問題
用技術解決數據「可用不可見」螞蟻鏈隱私計算平臺通過信通院全項...

來源：金融界網站國內首個權威大數據產品評測再度更新，隱私計算領域的測評引發關注。進入數字經濟時代，保障數據安全且可用不可見的技術，才能實現產業間高效協同，具有戰略意義。為幫助行業、機構實現數據價值的共享與協作，近幾年來，各大網際網路巨頭紛紛布局隱私計算領域，確保數據「可用不可見」。此次測評也包含了該領域，共7個企業產品參與。
Mozilla、Reddit 和 Twitter 等呼籲立法保護網際網路瀏覽隱私

Mozilla 在博客中表示：「我們希望立法者修改該法案，以限制政府對沒有證據的網際網路瀏覽和搜索歷史的訪問。」「仍然有太多的搜索和瀏覽歷史記錄收集並存儲在 Web 上。我們認為，當政府尋求訪問時，這些數據應受到強有力的法律保護，但是在許多情況下，保護是不確定的。」
南都舉辦數據治理論壇:三份報告聚焦隱私、人臉識別、網際網路壟斷

網際網路反壟斷監管呼聲為何高漲?12月22日,2020南都智庫產品發布周的第二天,由南都個人信息保護研究中心舉辦的「啄木鳥數據治理論壇」在北京召開。　　會上,南都個人信息保護研究中心發布三份報告——《個人信息安全年度報告》《網際網路平臺競爭與壟斷觀察報告》《移動端人臉識別應用合規報告》。
姜鼎:多源數據融合及應用對安全保護技術提出了更高要求

日前，「2020北京國際金融安全論壇」在北京召開，我是中國信息通信研究院安全研究所副所長姜鼎在會上表示，大數據在金融的應用場景有風控、徵信、反欺詐、量化投資等等，這些應用也帶來了新的安全風險，比如說大數據平臺成為了攻擊者重點關注的目標，多源數據的融合以及應用對數據管理安全防護技術以及隱私安全保護技術都提出了更高的要求。
隱私計算「四小龍」將如何重塑未來網際網路 |艾問人物

隱私安全，成為懸在企業頭上的「達摩克利斯之劍」，也成了普通消費者心口的軟刺，時時隱痛。在萬物互聯，海量數據匯聚的當今社會，該如何去保護人們的隱私數據？只有通過技術。破解矛與盾熵增科技創始人楊更曾說，隱私就是我們故意要保持的信息不對稱。
隱私瀏覽模式:保護哪些,又不保護哪些?

神譯局是 36 氪旗下編譯團隊，關注科技、商業、職場、生活等領域，重點介紹國外的新技術、新觀點、新風向。編者按：「隱私瀏覽」這個名稱給人一種穿上哈利·波特隱身衣穿梭在網絡世界中的感覺，誰也看不見，但這恰恰是名字帶來的誤解。事實上，隱私瀏覽模式對隱私的保護很可能比你想像得要少。
5.38億微博用戶數據洩露,隱私保護漏洞何時能堵住?

即便微博同樣是受害者，上億條關聯了微博ID、手機號以及粉絲、地理信息的數據，在暗網公開叫賣，說明地下黑產已經運作了很久。事實上，微博方面也承認，此次數據洩露可以追溯到2018年底，有用戶在微博接口通過批量手機批量上傳通訊錄，匹配出幾百萬個帳號暱稱。用戶數據被大規模收集匹配，微博隱私安全保護機制的漏洞難辭其咎。
讓數據可用不可見,隱私計算聯盟欲提升產業安全性

如今公眾個人隱私洩露的情況時有發生，然而「大數據時代」絕不會成為「侵權時代」，有關各方採取相關行動的腳步也在加快。記者12月21日獲悉，由中國信通院、中國通信標準化協會、中國網際網路協會聯合舉辦的「2020數據資產管理大會」在京召開。
翼方健數張霖濤:隱私安全計算實現「精準數據「與「計算創新「的...

翼方健數首席科學家張霖濤在會上發表題為《隱私安全下數據和計算的互聯互通思考》的演講，清晰闡述對於隱私安全計算的認知和理解，並描繪了建立"數據和計算網際網路IoDC"的願景和路徑。相應地，在數據成為生產要素的過程中自然地出現了一系列的挑戰：諸如數據如何確權、數據安全如何保護、數據價值分享、乃至交易該如何達成?這些都是迫切需要解答的問題。張霖濤認為，數據並非產生後就可直接使用，現實中數據仍需經過加工鏈才能達到可用狀態。將泛數據加工到大數據，再通過一系列技術方案使之成為對數據需求方有價值的"精準數據"。
亞信田溯寧:產業網際網路的競爭剛剛開始數據安全與隱私面臨挑戰

來源：新浪科技亞信聯合創始人、寬帶資本董事長田溯寧新浪科技訊 11月19日下午消息，在今日的亞布力年會「網際網路論壇」環節，在新浪高級副總裁鄧慶旭的主持下，亞信聯合創始人、寬帶資本董事長田溯寧，當當網執行董事俞渝，字節跳動副總裁謝欣
人工智慧打造智能化網際網路交友平臺大數據為「殺豬盤」畫像

青島嘉信訊通信息有限公司在今年為青島婚慶禮儀行業協會打造的網際網路交友平臺過程中，針對各種安全問題進行了深入分析。在系統中引入了「區塊鏈」、「大數據畫像」、「人工智慧數據分析」等技術，通過技術手段，斬斷婚戀交友過程中的「黑手」，為島城年輕人創建一個安全、整潔的婚戀交友平臺。
從原理到落地,支付寶如何打造保護隱私的共享智能

文/周俊隨著網際網路技術發展,人們對於隱私保護的要求不斷提升,世界各國紛紛都出臺法律法規保護人們的隱私。前段時間我國發布了《民法典》,明確了個人隱私權和信息保護的辦法。而這對於數據時代的技術提出了更高要求。
高度重視信息安全與隱私保護小米AIoT安全峰會現場為白帽子頒獎

以行業最嚴格的隱私標準捍衛用戶數據權利，深受用戶喜愛。同時小米發布了「小米隱私」品牌，這是小米對用戶隱私保護的一份承諾。「小米早在2012年便成立了專門的安全團隊，2014年開始布局IoT，也就是生態鏈或者智能家居、智能設備。2015年我當時對安全團隊說我們不能僅僅局限於網際網路安全、手機安全，我們應該拓展到IoT安全，IoT這塊是很大的疆土。」
潮科技 | 隱私計算技術的三大主流門派

這些數據由於數據安全和隱私的考慮，往往是不對外開發，例如政府數據由於政策保密性完全不能對外公布，運營商、網際網路公司收集到的客戶數據，也不能透露給第三者，因此形成了一個個數據孤島，數據之間不能互通，數據的價值無法體現。如何應用海量的數據，實現數據流動，同時能夠保護數據隱私安全、防止敏感信息洩露是當前大數據應用中的重大挑戰。隱私計算就是為了解決這些問題應運而生。

GEO:網際網路大數據技術藍皮書之隱私保護

相關焦點

達摩院發布2020十大科技趨勢,預測保護數據隱私的AI技術加速落地

2020世界網際網路大會藍皮書乾貨來了!

2020年世界網際網路大會藍皮書的三大看點

差分隱私 x MACE:小米MIUI 12隱私保護技術亮相

第四範式戴文淵提AI發展三大挑戰:數據科學家數量少、數據隱私保護...

支付寶推安全計算平臺「摩斯」,用區塊鏈等技術解決隱私保護問題

用技術解決數據「可用不可見」 螞蟻鏈隱私計算平臺通過信通院全項...

Mozilla、Reddit 和 Twitter 等呼籲立法保護網際網路瀏覽隱私

南都舉辦數據治理論壇:三份報告聚焦隱私、人臉識別、網際網路壟斷

姜鼎:多源數據融合及應用對安全保護技術提出了更高要求

隱私計算「四小龍」將如何重塑未來網際網路 |艾問人物

隱私瀏覽模式:保護哪些,又不保護哪些?

5.38億微博用戶數據洩露,隱私保護漏洞何時能堵住?

讓數據可用不可見,隱私計算聯盟欲提升產業安全性

翼方健數張霖濤:隱私安全計算實現「精準數據「與「計算創新「的...

亞信田溯寧:產業網際網路的競爭剛剛開始 數據安全與隱私面臨挑戰

人工智慧打造智能化網際網路交友平臺 大數據為「殺豬盤」畫像

從原理到落地,支付寶如何打造保護隱私的共享智能

高度重視信息安全與隱私保護 小米AIoT安全峰會現場為白帽子頒獎

潮科技 | 隱私計算技術的三大主流門派

用技術解決數據「可用不可見」螞蟻鏈隱私計算平臺通過信通院全項...

亞信田溯寧:產業網際網路的競爭剛剛開始數據安全與隱私面臨挑戰

人工智慧打造智能化網際網路交友平臺大數據為「殺豬盤」畫像

高度重視信息安全與隱私保護小米AIoT安全峰會現場為白帽子頒獎