蘋果的差分隱私對你的數據意味著什麼?

2020-12-11 造就

蘋果正在加緊向人工智慧領域發起衝擊,以趕上競爭對手的步伐。此前,其他企業一直在機器學習AI的高速公路上全速前進,這得益於它們挖掘起用戶數據來毫不手軟。

蘋果則不然,在一大群對數據如饑似渴的企業之中,蘋果獨以用戶數據守衛者的角色自居。當其他數據「吸血鬼」們悄悄上傳位置信息、鍵盤行為和搜索詞條的時候,蘋果對用戶信息不聞不問,還不斷推出新的硬體解決方案,讓自己(以及黑客、政府和身份信息盜用者)無從訪問用戶數據,而且,其數據分析歷來都限制在用戶設備上,不會上傳到蘋果伺服器。

但iOS中有幾道繞不過去的坎,蘋果需要知曉用戶行為,才能對特定功能進行精細的調整,對於一家將隱私放在第一位的公司,問題就出現了。差分隱私(differential privacy)的概念由此登場。在近日召開的全球開發者大會(WWDC)上,蘋果軟體工程高級副總裁克雷格·費德裡吉(Craig Federighi)就此作了簡要的討論。

「差分隱私是統計和數據分析領域的一個研究課題,指使用散列、子採樣和噪聲注入等方式,在每個用戶的信息仍然完全保密的情況下,使眾包形式的學習成為可能,」費德裡吉解釋說。

差分隱私並非蘋果首創;學術界多年前就開始研究這一概念。但隨著iOS 10的逐步推出,蘋果將開始使用差分隱私來收集並分析來自鍵盤、Spotlight和Notes的用戶數據。

差分隱私的原理是用算法加擾個人用戶數據,使之無法回溯到個人,然後對數據進行批量分析,得出大規模的趨勢規律。其目標是保護用戶身份信息和數據細節,同時提取機器學習所需的通用信息。

重要的是,iOS 10會先對單個用戶的數據進行隨機化處理,再將設備數據集體發送給蘋果公司,保證任何時候都不會以不安全的格式傳輸。蘋果也不會收集用戶鍵入的每一個單詞或搜索關鍵字——該公司表示,對於從每個用戶那裡獲取的數據量,它會設置一個上限。

頗不尋常的是,蘋果公司還將其差分隱私執行文件交給賓夕法尼亞大學教授亞倫·羅斯(Aaron Roth),接受同行評審。這位計算機科學教授是差分隱私領域的權威人士,著有《差分隱私的算法基礎》一書。費德裡吉說,羅斯用「開創性」一詞評價了蘋果在差分隱私方面的工作。

蘋果表示,它可能會在iOS 10發布之前,發布差分隱私實施政策和數據保留政策方面的更多細節。

那麼,這一切對你來說意味著什麼呢?

鍵盤

在WWDC主旨演講中,蘋果宣布了iMessage的重大改進。差分隱私是這些改進的一大組成部分,因為蘋果希望收集數據,用以改進QuickType和表情符號鍵盤的建議功能。在iOS 9中,QuickType在用戶的個人設備上學習短語並更新字典——新詞輸入達到一定次數以後,自動更正就會停止修改動作。

但在iOS 10中,蘋果將使用差分隱私,識別數十億用戶的用語趨勢——因此,你可能會驚奇地發現,鍵盤給出的建議是你從未使用過的某個俚語。

「當然,讓軟體更加智能的重要工具之一,就是在眾多用戶之中發現使用規律,」費德裡吉解釋說。「比如,找出時下流行的新詞,使QuickType鍵盤對新詞信手拈來。」

差分隱私也一勞永逸地解決了常用表情符號之爭,給表情符號鍵盤重新排序,愛心符號再也不會藏在散亂的星座符號和鳶尾花之間了。

Spotlight

在此之前,iOS 9為改進Spotlight搜索功能,引入了深度連結(deep linking)。費德裡吉在去年的WWDC上揭曉了深度連結,他在演示中用Spotlight搜索了「土豆」,出現的是設備上其他應用中的菜譜,而不僅僅是網頁搜索結果。

如今,被孤立在應用程式之中的信息越來越多,超越了傳統搜尋引擎的覆蓋範圍,為了這些內容變得可搜索,深度連結就成為必須。然而iOS 9該如何對深度連結的搜索結果進行排名,以防止不相關的建議泛濫Spotlight,這方面依然存在問題。

蘋果計劃使用差分隱私來解決這個問題。憑藉被擾亂的用戶數據,蘋果可以將極受歡迎的深度連結識別出來,並分配以較高的排名——故而當你用Spotlight查找土豆食譜時,你會得到像Yummly這樣的應用提供的最美味的土豆食譜。

Notes

iOS 10用差分隱私來加以改進的最後一項功能是Notes。

在主旨演講中,費德裡吉還討論了Notes的改進。在iOS 10中,Notes將變得更具互動性,可操作信息將著重顯示——打個比方,如果你在Notes中記下一位朋友的生日,它可能會著重顯示該日期,建議你創建日曆事件以得到提醒。

為提供此類智能建議,蘋果需要知道用戶普遍喜歡記錄何種筆記,而這就要用到差分隱私。

工作原理

那麼,差分隱私究竟是什麼?它不是一種單一技術,賓夕法尼亞州立大學計算機科學與工程系副教授亞當·斯密(Computer Science)說,他與羅斯一道,從事這方面的研究已有十多年。

它其實是一種數據處理方式,在數據中加入限制,防止通過數據聯繫到具體個人。它允許你對數據進行總體分析,但會在提取自單獨設備的數據中注入噪聲,讓數據在接受批量處理的同時,不至於危及個人隱私。

「嚴格來說,這是一個數學定義。它限制了你處理數據的方式,在數據集裡面間隔取點的時候,任何點都不會鏈向太多信息,」史密斯說。

他用沒有調準的電臺打了個比方,差分隱私就好比在一層靜態噪聲之下,聽到背後的旋律。「一旦你知道自己在聽什麼,忽略靜態噪聲就很容易了。你了解不到什麼個人信息,但可以看到比較清晰的整體規律。

「如果對自己不加約束,不插入這些噪聲,得到的規律還會更加清晰、準確。但為了更有力地保障用戶隱私,這是必須作出的犧牲,」史密斯說。

史密斯認為,蘋果是第一家嘗試大規模採用差分隱私的公司,儘管他也承認,其他大型商業實體(如AT&T)也曾做過這方面的研究(可能讓人意想不到的是,谷歌也通過Rappor項目做過這方面的研究)。他指出,初創企業也表現出了興趣。

雖然除蘋果之外,沒有其他商業實體大規模部署差分隱私,但史密斯表示,這一概念的穩妥性是毋庸置疑的,不過他指出,實施也要得當才行。

「與任何事關安全性的技術一樣,魔鬼就在細節間。落實必須非常妥善。但背後思路是非常穩妥的,這一點沒有爭議。」

AI的未來將受何影響?

史密斯說,蘋果公司採用差分隱私是AI領域的一件大事,差分隱私或能給機器學習技術發揮作用的方式帶來翻天覆地的變化。

在矽谷,隱私之爭往往以執法視角呈現,體現為用戶與美國國家安全之爭。但在科技企業,隱私之爭就成了用戶隱私與功能之間的取捨。蘋果引入差分隱私,可能會從根本上改變這場辯論。

谷歌和Facebook就一直困擾於這個問題:如何提供功能豐富同時又保護隱私的產品。谷歌的最新消息應用Allo以及Facebook的Messenger都不將端到端加密設為默認,因為兩家公司都需要大量用戶對話來提升機器學習,使聊天機器人運轉起來。蘋果也想從用戶數據中獲取深入的信息,但它不願讓端到端加密的iMessage開倒車。

史密斯說,蘋果選擇差分隱私,將使企業重新權衡保護隱私與改進機器學習之間的取捨。「我們現在收集那麼多數據,但真正需要的根本沒那麼多,」史密斯說。「這類技術絕對是隱私保護的另一條出路。」

雖然iOS 10隻會用差分隱私來改進鍵盤、深度連結及Notes,但史密斯指出,如果試水成功,蘋果可能將此策略延伸到地圖、語音識別等功能。史密斯說,蘋果還可以看看人們在一天中哪些時段使用哪些應用。

蘋果不收集原始用戶數據,或能提升用戶對它的信賴,同時在政府面前,蘋果也可以展現出更加強硬的立場——在近期與FBI的官司大戰之中,蘋果就為了用戶隱私據理力爭。

由於差分隱私研究已有十年的積澱,它對蘋果來說是個相對低風險的安全策略。史密斯表示,這個概念找到了創新和用戶安全之間的「最佳位置」。

「無論蘋果的成功是否徹底,這都將徹底改變隱私對話,」史密斯說。「我認為,人們對私人信息收集的看法將因此改變。這可能是蘋果公司這一項目的最大遺產,也許會遠遠超出它對蘋果業績的影響。」

翻譯:雁行

來源:TECHCRUNCH

造就:線下劇院式的演講平臺,發現最有創造力的思想

相關焦點

  • 給數據加「噪音」,差分隱私如何保護用戶數據安全和隱私
    為了應對攻擊,有研究人員提出了一種數據加密技術,稱為差分隱私。《MIT科技評論》評選的2020年十大突破技術中,就有差分隱私。《MIT科技評論》認為未來數據保護的難度會越來越高,解決這個問題的方法之一就是差分隱私,這種技術可以建立信任機制。什麼是差分隱私那麼什麼是差分隱私?
  • 你沒看隱私條款,被蘋果知道了
    尤其是當我打開某一個 App 時,在使用之前,它總會彈出這樣一個隱私協議:「是否同意獲取你的隱私權限」?而當我勾選了「我已閱讀並同意上述條款」,才能進行下一步。但我們都知道,你其實並沒有讀,也不知道你究竟同意了什麼條款。
  • 系統智能化大步向前 詳解蘋果"差分隱私」機制
    兩周前,WWDC 2016向世界展示了蘋果在AI應用方面的一系列進展,最重要莫過於通過應用「差分隱私機制」提升iOS/macOS系統的智能化程度——Siri和QuickType鍵盤都將通過這一機制獲取大數據
  • 大數據時代,用戶的隱私如何守護
    近幾年各大公司均持續關注用戶的隱私安全。例如蘋果 在2016 年 6 月份的WWDC 大會上就提出了一項名為Differential Privacy 的差分隱私技術。蘋果聲稱他能通過數據計算出用戶群體的行為模式,但是卻無法獲得每個用戶個體的數據。那麼差分隱私技術又是怎麼做的呢?在大數據時代,如何才能保證我們的隱私呢?
  • 隱私保護新突破:高斯差分隱私框架與深度學習結合
    這個框架現已成功和深度學習結合,並在多個需要保障隱私的深度學習任務中達到最高準確率。什麼是差分隱私在這個大數據時代,如何妥善獲取和使用與真人相關的數據,漸漸成為迫切需要解決的問題。沒有人希望自己生個病,上個網,買件衣服都會被人隨意知曉,更別提手機裡沒有修過的自拍了。
  • 蘋果修改iOS14隱私條款 廣告商跟蹤用戶數據將更難
    iOS14隱私條款的修改引發市場關注。  即將更新的iPhone作業系統iOS14關於隱私條款的修改引發了市場廣泛關注。蘋果表示,在iOS14上,APP將需要獲得用戶的許可,才能跟蹤其他APP和網站上的用戶數據。此外,新的隱私條款也將適用於iPadOS14和tvOS14其他設備類型的作業系統。
  • 從隱私設定看Google與蘋果的區別
    在Android上安裝應用時,系統會詢問是否授權地理位置、通訊錄等信息,不同意則不會安裝;而iOS在安裝應用時不會問什麼(除非有進行內容分級),有些內容是一定會授予的,比如聯網,而照片和位置等敏感信息,應用在使用時就需要獲得授權。後者似乎顯得更符合常理。
  • 蘋果推App Store新規則:你的數據去哪了這次一目了然
    這麼說可能有些複雜,簡單點講就是,蘋果要求開發者把 「收集、追蹤用戶數據」這件事擺在明面上,清清楚楚告訴用戶,他們的數據都去哪了,做什麼用了。之所以分成以上三種類型,是因為蘋果認為這三個類型用戶最容易理解,也對用戶隱私影響最大。
  • 蘋果隱私標籤打臉Facebook:收集信息超級多
    據報導,本周早些時候蘋果更新App Store,裡面開始顯示App收集的用戶數據類型。其中,Facebook收集的信息格外引人關注。App Store標籤顯示Facebook收集多種用戶數據,光是標籤長度就有好幾頁。
  • 隱私計算就在身邊,五大案例帶你認識
    儘管隱私計算行業尚處早期,相關技術尚未成熟,但並不意味著隱私計算只是「飄在空中」的美好理想。縱觀全球,隱私計算已經在人工智慧、金融、醫療等許多場景中應用落地。本地加密、密文數據對比等可以說是隱私計算基本概念的教科書式展現,也令其成為數據安全共享的典型科普案例。iOS基於差分隱私技術"把隱私鎖在本地"——在手中的隱私計算移動網際網路時代,手機裡幾乎承載了一個人收集所有的秘密。舉例來說,如果一個被移除ID類信息的數據集發布,從法律和倫理來說這個數據集因為沒有涉及個人隱私,因此是合法合規的。
  • 隱私計算就在身邊, 五大案例帶你認識
    從產業視角來看,隱私計算已成為當下創投圈的熱點話題,國內外眾多網際網路及科技巨頭紛紛投身該賽道,一批創業企業也各有所長,顯示出了強勁實力。儘管隱私計算行業尚處早期,相關技術尚未成熟,但並不意味著隱私計算只是「飄在空中」的美好理想。縱觀全球,隱私計算已經在人工智慧、金融、醫療等許多場景中應用落地。
  • 蘋果推App Store新規則:你的數據去哪了 這次一目了然
    這麼說可能有些複雜,簡單點講就是,蘋果要求開發者把「收集、追蹤用戶數據」這件事擺在明面上,清清楚楚告訴用戶,他們的數據都去哪了,做什麼用了。之所以分成以上三種類型,是因為蘋果認為這三個類型用戶最容易理解,也對用戶隱私影響最大。簡單解釋一下這三個類型:用於追蹤您的數據——我們比較熟悉,它會把收集到的用戶數據和其他企業的數據結合,給用戶做定向廣告推送。
  • 小心隱私,你的手機和智能音箱都在錄音給別人聽……
    你平時和 Siri 說的話,真的有小概率會被錄音,而且給蘋果外包的第三方做分析。 而這麼做的原因,和蘋果之前寫在隱私說明裡的目的是一致的:提升 Siri 的用戶體驗。
  • 蘋果新隱私功能上線,180萬APP被影響,再不能濫用我們的信息了!
    不過,對於現在的蘋果用戶來說,終於可以安心一點點了。近日,蘋果為系統添加了一條隱私政策,給APP的數據收集上了一道枷鎖。比如今天你搜索了一下「鞋子」,第三方商城就會給你推送關於「鞋子」的廣告,就是因為你搜索的數據被跟蹤了,其實也就是日常見到的精準推送。關聯到您的數據,就是各種APP上的用戶帳戶,設備標識符,還有其他的與用戶身份關聯的數據。
  • 蘋果CEO蒂姆·庫克呼籲:加強對數據隱私的監管
    【網易智能訊3月26日消息】針對Facebook用戶信息發生洩露事件,蘋果公司執行長蒂姆·庫克呼籲,加強對數據隱私的監管以避免數據濫用情況的出現。他的言論將增加Facebook和其他科技公司的壓力,這些公司依賴於從數十億用戶中收集海量數據,為他們的產品、服務和銷售提供動力。此前有報導稱,Facebook公司許可劍橋分析公司積累了5000萬用戶信息。消息傳出後,Facebook聯合創始人馬克·扎克伯格才姍姍來遲地為未能更好地管理客戶數據而道歉。
  • 蘋果發布APP隱私保護說明:適用於所有iOS應用程式
    在網際網路高速發展的今天,不管是蘋果用戶還是安卓用戶,都深受隱私洩露的困擾。現在,蘋果公司決心要改變這一局面了。今天,蘋果公司發布了App Store上App隱私保護的詳細說明,旨在保護用戶隱私,打擊APP隱私竊取。
  • 醫療做AI,不能不顧隱私
    通過應用聯邦學習,數據是不用上傳了,但通過數據訓練出來的神經網絡依舊要上雲,這些神經網絡雖然不包括最直接的源數據,可通過對神經網絡進行分析和反推算,依舊能夠找出部分源數據,也就是說隱私依舊得不到保障。這個時候我們就要祭出另外一項法寶技術:差分隱私。這項技術其實在2016年就被蘋果在WWDC上提出來說過一波。
  • 在毫無隱私的數字時代 你的蘋果在怎樣保護你
    在我們進入高速發展的數字時代後,隱私問題就成了最常見的話題。而消費者們也將手機行業分為蘋果和安卓兩大陣營,反覆進行對比,有人認為蘋果對於隱私的保護比大多安卓手機強,但蘋果卻總曝出Siri語音流向等問題,讓人捉摸不透。
  • WhatsApp 抗議蘋果 App Store 隱私標籤
    IT之家12月10日消息 外媒 MacRumors 報導,WhatsApp 正在抗議蘋果要求開發者提交他們收集的用戶數據信息,以便在 App Store 上創建新的隱私標籤。
  • App都收集了你的什麼數據?今天起蘋果用戶可以明確知曉
    記者 | 伍洋宇1在今年6月的WWDC上蘋果曾宣布,要讓用戶能在App Store的App產品頁面清楚看到開發者的隱私慣例摘要。歷經半年時間,12月15日,這項功能將正式向用戶開放。隱私慣例摘要是什麼?