從華為差分隱私技術看保護個體數據有多重要

2021-01-10 顧可可回來了

數據分析在各個行業領域中的運用已經顯而易見。它可以通過大數據統計分析對大批量群體特徵數據進行信息的萃取與提煉,不斷提取有用信息,形成研究報告和概括總結,最終幫助大部分機構或公司挖掘出數據更多的內在價值。比如,公司根據數據分析的精準結果做出粗略判斷,判斷產品生命周期的時長、產品的投放區域、大眾喜好的顏色等。

在過去,收集個人數據的方式非常直接,街頭問卷調查可以將姓名、性別、手機號、習慣喜好等全部收集起來,如此一來,個人隱私的洩露也更加直觀。隨著科技、人工智慧的發展,在各個平臺上收集群體特徵已經不再是難事,但是洩露隱患也隨之增加。

我們在數據使用過程中,主要的隱私洩露風險有三種:直接識別個體、連結攻擊和推理攻擊。可以肯定的是,刪除姓名、證件號等身份標識能夠在一定程度上保護個人隱私,但是並不能完全保證隱私信息的安全性。因為每個參與統計的個體都上傳了其個體特徵,用於分析的數據集一旦公開發布,攻擊者就可以利用連結攻擊和推理攻擊等差分攻擊技術,從最終分析結果中獲取用戶數據,比如個人消費習慣、收入情況、醫療就診記錄等。

這是發生在1997年的經典案例,卡內基梅隆大學的教授Latanya Sweeney,她將匿名化的GIC資料庫(包含每位患者的出生日期、性別和郵政編碼)與選民登記記錄相連,從而找出了麻薩諸塞州州長William Weld的病歷。由於大數據報表只需要呈現群體特徵,不需要知道每個人的具體情況,因此,保護每個參與統計的個體數據就顯得至關重要。

Latanya Sweeney

DWORK於2006年提出了差分隱私(differential privacy)技術,這是一項針對加入失真數據做統計的技術,它可以用噪聲幹擾計算過程,把原始數據淹沒在噪音中,別有用心的人就無法從大數據報表中反推出原始數據。數據在離開個人設備之前,為數據添加噪聲,這樣雲側也無法識別單個個體的數據。簡而言之,攻擊者無法判斷某個用戶的數據是否在這個數據集中,也無法識別至單個人的隱私數據,以此保證多個場景下的個人隱私。比如一名男性參與了抽菸習慣研究的資料庫,他不用擔心其他分析資料庫的人可以找到他的相關信息,甚至不用擔心能否查詢到他的數據是否在資料庫中。

為了在更有效的保護個體用戶隱私的基礎上,提升用戶的使用設備體驗,華為在2018年率先將差分隱私技術引入到"用戶體驗改進計劃"中。

在"用戶體驗改進計劃"中,華為希望通過收集用戶的設備上有關可靠性、性能、功耗統計數據,故障和錯誤信息,以及有關用戶設備和應用軟體使用方式的數據,為用戶提供更加可靠、流暢、省電的軟硬體系統,打造極致的使用體驗。但是只有在獲得用戶明確同意後,數據才會發送給華為,同時運用差分隱私技術可以在數據中添加隨機噪聲,華為無法獲得真實數據,只有在與其他大量用戶數據結合,並且平均掉隨機添加的噪聲,相關統計信息才會顯現。

如此一來,華為在無法獲得用戶原始數據的基礎上既能識別出某些特性的群體使用率、使用次數、留存率等分析數據,不斷提升用戶使用體驗,又可以防止攻擊者無法反推出用戶的原始隱私數據。

2019年,華為將差分隱私技術應用到華為音樂的"統計分析場景"。通過該技術,華為在實現統計分析的同時改進華為音樂的相關服務與應用,別有用心的攻擊者也無法基於差分上報的匿名化數據來推測用戶的真實數據。

在隱私保護方面,差分隱私技術具有重大意義。它可以保護很多場景下的個人信息,也讓科研人員使用多個資料庫研發出新的發現成為可能,攻擊者想要再通過差分攻擊獲取用戶數據的可能性已微乎其微。對於華為來說,差分隱私的重要性在於它可以讓華為一直堅持把隱私保護作為產品設計的前提,致力於構建用戶信任的隱私保護品牌。華為將差分隱私技術應用在"用戶體驗改進計劃"和華為音樂中,為的就是在保護用戶隱私的基礎上,持續提升用戶的設備體驗,讓用戶可以更安心的掌控自己的隱私。現在不妨打開華為音樂,聽一首悠閒的音樂吧。

*部分圖片來源於網絡。

相關焦點

  • 給數據加「噪音」,差分隱私如何保護用戶數據安全和隱私
    三年後,Netflix最終因隱私原因宣布停止該比賽,並付出了九百萬美元的高額賠償金。對於那些手握大量人口數據的部門,這種攻擊可能就是致命的。因為傳統的做法是對數據的敏感列作匿名化,但這些做法並不能完全保證數據安全,攻擊者還可以對分析結果的差分攻擊以及查表撞庫等方法反推原數據。為了應對攻擊,有研究人員提出了一種新的方法,稱為差分隱私。
  • 兼顧隱私與權利,華為以「科技有道」,實現「隱私無價」
    艾媒數據有調研顯示,2020年中國手機網民手機APP同意隱私條款原因,有54.3%手機網民是因為格式條款只能選同意,才同意APP隱私條款,否則無法使用軟體。應用開發商及運營者耍流氓的時候,個體也只能「被逼就範」。
  • 數據隱私保護的公共議題:從GDPR到技術倫理思辨
    嵌入技術設計的倫理價值觀關於數據隱私與安全的保護研究很多,但討論其實質,包括對個人權利和自由的侵犯,自動化決策算法帶來不平等的政治經濟學主張,以及相關文件中包含的機器對人類進行控制和影響的相關內容並不多。
  • 如何用 AI 技術保護隱私安全?
    歐盟的GDPR具有全球影響力,它讓用戶對自己的個人數據有絕對的掌控權,讓全球在發展新技術的同時必須開始關注隱私問題,世界各國已經紛紛出臺自己的數據保護法規。關於隱私保護,一切才剛剛開始。因此,保護隱私的 AI 技術的落地使用成為 AI 領域最亟待實現的目標。保護隱私的 AI 主要通過數據加密、分布式計算、邊緣計算、機器學習等多種技術的結合來保護數據安全,近期比較熱門的有Differential Privacy(差分隱私)、FederatedLearning(聯邦學習,也叫聯盟學習、聯合學習、共享學習)。
  • 保護數據安全,華為手機有一套
    但如果把資料存儲在華為雲空間情況就不一樣了,在華為雲空間的資料安全有保障,因為華為雲空間的所有數據都經過了加密保護措施。 華為對信息安全的重視不止局限在設備,旗下的軟體也在信息保護上下足了工夫。在暢連APP中,選擇暢連信封消息功能,發送消息可以以信封形式發出,消息內容被隱藏在信封當中,對方需要點擊打開方可閱讀,而且消息也不可被截屏、錄屏和轉發等,充分保護了重要信息的隱私安全。
  • 如何保護手機裡的隱私安全?華為P40系列準備了這些終極大招!
    所以,隱私安全不僅需要用戶的防範意識,還需要手機廠商的硬體有核心技術能力,更重要的是,手機廠商對用戶隱私保護的重視態度,以及為保護用戶隱私所做的努力。華為P40系列從底層晶片、系統、上層應用到雲端,為用戶建起了全方位的隱私安全保障體系。
  • 華為、小米手機隱私保護研究報告
    華為、榮耀(EMUI):華為最新的EMUI 10的介紹頁面,提到了信息安全的兩個方面。一個是隱私保護:全程加密,隱私無憂隱私至上,由你掌控。本地數據全盤加密,數據傳輸、存儲全流程加密,保障你的數據安全。隱私空間、應用鎖、密碼保險柜等更多安全功能,竭力守護你的隱私。
  • 華為瀏覽器獲BSI權威認證 多舉措保護用戶信息和隱私安全
    、CSA STAR四項國際信息安全和隱私保護領域的權威認證。華為瀏覽器面向全球用戶提供服務,此次通過認證,意味著其產品技術能力和運營管理能力已獲得國際標準組織認可。隨著移動網際網路的發展,用戶個人信息和隱私安全問題受到越來越多關注。
  • 潮科技 | 隱私計算技術的三大主流門派
    聯邦學習被用來保護用戶數據的隱私,但是它和上述的隱私保護理論,如差分隱私保護(Differential Privacy)、K匿名(K-Anonymity)和 L-多樣化(L-Diversity)等方法還是有較大的差別的。
  • 嚴苛的隱私安全防護華為AppGallery保護全球消費者應用安全
    TEE OS可對包括華為應用市場在內的HMS生態應用進行隔離保護,並對通過指紋識別、人臉識別等生物識別技術進行應用付費的行為,提供獨立的安全隱私保障服務。因此用戶在華為應用市場內登入華為帳號、使用華為錢包支付等一系列行為都置於TEE OS的妥善保護之下。在應用下載階段,華為應用市場通過應用完整性校驗、籤名校驗、威脅檢測及AI安全防護等積極主動的措施,有效防止了開發者的應用被惡意篡改。
  • 10月16慕尼黑 看Mate 10上演如何保護你的隱私安全
    但人工智慧是基於用戶數據的深度學習,面臨用戶隱私如何有效保護的問題。一直以來,業界僅依靠雲側防護,無法很好解決人工智慧的用戶隱私保護問題。如今,華為宣布能更好地搬掉這個「攔路虎」——麒麟970通過採用On-DeviceAI以及「雲側+端側」安全,更能保護用戶隱私。對此很多人發出疑問,為何說有了端側安全加持,華為就能在人工智慧時代更好構築用戶隱私的「萬裡長城」?
  • 隱私計算技術發展報告發布:解決數據隱私保護難題的「關鍵之鑰」
    報告從市場與技術兩方面對隱私計算進行深入的解析,並從隱私計算發展、主流隱私計算技術介紹、技術項目簡介、隱私計算應用場景等多維度展現隱私計算全景,詳解隱私計算在數字時代背景下的機遇與挑戰。報告指出,伴隨著數字經濟的蓬勃發展,作為新一代生產要素,數據蘊含的巨大價值得到逐步釋放,與此同時,數據隱私問題卻日益凸顯,用戶數據隱私如何保護的問題亟待解決,隱私計算則被視為解決此問題的「關鍵之鑰」。
  • 隱私保護新突破:高斯差分隱私框架與深度學習結合
    機器之心發布機器之心編輯部人工智慧中的隱私問題已經公認為一個重要並且嚴肅的問題。近日,賓夕法尼亞大學的研究組開發了一個新的數據隱私分析框架,可以在多個類型的機器學習問題中有效保護個人隱私。一種簡單的隱私保護方法就是「匿名」:將收集到的數據中涉及個人信息的特徵剔除。可惜這種方法並不可靠,曾有研究將 Netflix 匿名處理過的觀影記錄通過交叉對比 IMDb 資料庫解匿成功,這直接導致了第二屆 Netflix 數據分析大獎賽的取消。2006 年,隱私算法的研究迎來了新的裡程碑。
  • 華為手機保護隱私分為兩大點 AI信息保護和生物識別與密碼
    大數據智能時代,信息安全和個人隱私保護變得越來越重要。手機裡的照片、聊天記錄、密碼等個人數據需要得到更好的保護,今天我們來看看華為手機在用戶隱私保護方面是怎麼做的,看完之後你會更加安心地使用手機。 文件保密櫃AI信息保護:你的設備可以智能識別機主,當有隱私信息彈出時,只有你能看到,若有其他人注視屏幕,消息會自動隱藏;安全輸入鍵盤:當你登錄應用、支付等需要輸入密碼時,手機會自動啟用安全輸入鍵盤
  • 如何尋求數據開發與隱私保護的平衡
    平衡數據驅動創新與個人信息保護之間的關係,在實際操作中有多種模式。尋求數據應用與保護的平衡範式,是日本當下探討的重要課題,並且已經有一些實踐探索,以下僅以日本醫療數據為考察對象,對其規制模式進行系統考察。
  • 中安網脈副總經理:大數據時代數據安全與隱私保護有兩個難題
    講座上,中安網脈副總經理、大數據安全事業部總經理查正朋以「大數據時代,信息安全如何守護?」為主題進行了分享。查正朋認為,目前隱私保護的實踐方法在大數據時代基本上形同虛設。大數據時代的數據安全與個人隱私保護面臨兩個難題:一是隨著物聯網的快速發展,海量數位化基礎設施隨時隨地在收集個人隱私,如何做好安全運營維護;二是海量數位化基礎設施必然帶來漏洞的快速增長,如何面對漏洞激增。
  • 擔心AI侵犯數據?隱私計算技術受關注
    在一場智能數據云端峰會上,與會嘉賓討論了聯邦學習和多方安全計算等隱私計算技術,這有望打破數據流通的瓶頸。圖靈獎得主、中國科學院院士姚期智在今年的上海世界人工智慧大會開幕式上強調,人工智慧的相關研究需要重視理論研究和隱私保護學習。姚期智認為,將人工智慧與多方計算技術相結合,有望實現數據隱私保護。
  • 蘋果公司升級隱私保護,限制APP追蹤用戶數據會影響廣告業?
    科技公司規模越來越龐大,收集的私隱信息越來越多。在帶來各種便利的同時,也引起了大眾私隱保護的焦慮。所幸,已經開始有科技公司採取措施,試圖保護用戶隱私了。大牌場BIG哥了解到,12月15日起蘋果公司將「隱私慣例摘要」進一步升級。據悉,更多的保護措施還將在隨後推出。
  • 保護隱私快速訓練,Facebook開源Opacus,用差分隱私訓練PyTorch
    機器之心報導編輯:小舟、陳萍隱私保護是機器學習領域的重要倫理問題之一,而差分隱私(DP)是行之有效的隱私保護手段。那麼,如何方便地使用差分隱私來訓練機器學習模型呢?Opacus 庫開源地址:https://github.com/pytorch/opacusOpacus 庫的目標受眾主要為以下兩類人群:機器學習從業者:可以使用該庫輕鬆了解如何利用差分隱私訓練模型,該庫支持以最少代碼更改來訓練模型;差分隱私科學家
  • 隱私保護安全華為瀏覽器為您提供更安全、更可靠的網絡環境
    面對複雜的網絡世界,當用戶打開各種網頁時,除了睜大眼睛、努力鑑別真偽之外,擁有一個能夠幫助用戶密切識別惡意網址並在網際網路上安全暢遊的瀏覽器尤為重要。華為瀏覽器幫助用戶識別惡意網址,創造舒適的瀏覽環境。網絡釣魚網站被認為是每個人都熟悉的,他們或多或少都遇到過。打著「移磚套利」和「投資空域」的旗號,他們欺騙用戶轉帳或輸入自己的交易信息,從而竊取受害者的資產。另一種網站是威脅網站。