「一鍵」切換隱私模式 隱私計算+AI如此簡單?

2021-02-13 矩陣元


本文轉發自量子位

脫了馬甲我照樣兒認識你!

這句在2000春晚趙本山的經典臺詞,放在隱私圈有了新的解釋:在不看到數據「真面目」的情況下,照樣能得到答案。

數據的進擊與人工智慧的野望

隨著人工智慧(AI)技術的不斷發展和各種產品落地,數據作為各種人工智慧算法的原材料,其價值已經普遍得到大家認可。各個公司能夠採集到的數據畢竟有限,想得到更精準的訓練模型,就需要將數據聯合起來挖掘更大的價值。

但真正讓數據「流動」並不簡單,對於擁有數據的各個企業來說,面臨著很大的矛盾:通過數據分享和交互顯然可以提升AI算法的效果,但同時又必須要保障自己的數據不洩露出去。

Rosetta讓隱私計算與AI攻守結合

而解決數據的動態使用、分享中的安全問題,正是「隱私計算+AI」技術的專長。其融合在數據的使用、處理過程之中,保障計算過程本身(廣義的講,還包括計算結果)不會洩露原始明文數據本身的信息。

國內首個自主研發的基於主流TensorFlow框架的隱私AI框架可以解決以上種種問題:Rosetta (https://github.com/LatticeX-Foundation/Rosetta)

「Rosetta」名稱取自古埃及的羅塞塔石碑(Rosetta Stone)。其上記載著古埃及象形文字、埃及草書和古希臘文三種文字。

這裡寓意著Rosetta框架將承載和結合AI、隱私AI和區塊鏈三種典型的技術。這使得Rosetta的發展方向聚焦在以下三個方面:

面向AI需求,服務AI開發者

完全開源,透明開放

持續集成高效、可擴展的隱私保護技術後端

目前開源的 Rosetta 0.2.0版本中,以TensorFlow這一流行AI框架為基礎,深度改造其python前端和後端kernel,融合了最前沿的安全多方計算(MPC)算法協議。

那麼讓我們揭開Rosetta的神秘面紗,先睹為快,舉一個簡單的「硬核」例子:

假設現在有三個個體A,B和C各自都具有自己採集到的一批私有數據,並且已經各自經過標準的特徵工程等方式將其表達為三個矩陣,和,正如大部分的AI算法(比如推薦系統)那樣,某一個步驟中需要執行矩陣乘法這樣的算子操作。

顯然為了保護數據的隱私,三方之間是不能將各自的數據直接明文的傳輸給其他參與者的,而這樣的計算又必須要進行數據的交互,這時,用戶可以引入Rosetta框架後很快的解決這一問題。

Rosetta框架實例分析

比如,各方在本地有一樣的如下腳本rosetta_demo.py (這裡為了更加直觀的體驗,我們以各方通過console輸入簡單的數據來示例,真實場景下可以調用隱私數據文件讀取接口來輸入):

#!/usr/bin/env python3

# Import rosetta package

import latticex.rosetta as rtt

import tensorflow as tf

# You can activate a backend protocol, here we use SecureNN

rtt.activate("SecureNN")

# Get private data from every party

matrix_a = tf.Variable(rtt.private_console_input(0, shape=(3, 2)))

matrix_b = tf.Variable(rtt.private_console_input(1, shape=(2, 1)))

matrix_c = tf.Variable(rtt.private_console_input(2, shape=(1, 4)))

# Just use the native tf.matmul operation.

cipher_result = tf.matmul(tf.matmul(matrix_a, matrix_b), matrix_c)

# Start execution

with tf.Session() as sess:

   sess.run(tf.global_variables_initializer())

   # Take a glance at the ciphertext

   cipher_result = sess.run(cipher_result)

   print('local ciphertext result:', cipher_result)

   # Set only party a and c can get plain result

   a_and_c_can_get_plain = 0b101

   # Get the result of Rosetta matmul

   print('plaintext matmul result:', sess.run(rtt.SecureReveal(cipher_result, a_and_c_can_get_plain)))

A 、B和C方在完成配置好網絡拓撲配置文件後,分別運行

python rosetta_demo.py --party_id=0

python rosetta_demo.py --party_id=1

python rosetta_demo.py --party_id=2

然後,各方分別按照提示在終端中輸入各自的私有數據,比如A方可以按照如下提示輸入其對應的矩陣元素值:

[2020-07-29 20:10:49.070] [info] Rosetta: Protocol [SecureNN] backend initialization succeeded!

please input the private data (float or integer, 6 items, separated by space): 2 3 1 7 6 2

假設A方輸入的私有矩陣為 , B 方輸入的私有矩陣為 , C 方輸入的素有矩陣為 

我們先直接列印出算子計算的結果,此時各方本地輸出的是各不相同的被編碼後的密文信息,比如:

local ciphertext result: [[b'D\xa9P\xfeul\x00\x00#' b'\xcbj\x1c\x1f*D\x00\x00#' b'\xef\xdb\xa2\xddS\x90\xff\xff#' b'\xaa:\xbcD\x96\x83\xff\xff#']

[b'\x16\xb3\xf6\xa9@x\x00\x00#' b'4\xff/\x99\xc9\xbb\xff\xff#' b'8\x11\xfa\xa1Y<\x00\x00#' b'_9\x92>\xea6\x00\x00#']

[b'\xeb)\xf3\xa0\xfa\xc6\xff\xff#' b"\x1c'\xec\x80\xa1%\x00\x00#" b'\xf4\xcd\xc4\xb6\xfb\x1a\x00\x00#' b'B\x10\xeeNd\xe6\xff\xff#']]

在上述腳本的最後我們顯式的調用了SecureReveal接口來將隱私AI的結果「解密」出來,且通過設定參數為5來要求只有A和C可以得到明文值,所以A方和C方將得到類似如下的正確明文結果:

plaintext matmul result: [[b'8.000000' b'14.000000' b'18.000000' b'4.000000']

[b'4.000000' b'7.000000' b'9.000000' b'2.000000']

[b'24.000000' b'42.000000' b'54.000000' b'12.000000']]

[2020-07-29 20:11:06.452] [info] Rosetta: Protocol [SecureNN] backend has been released.

而B方則不會得到正確的明文計算結果,其輸出是:

plaintext matmul result: [[b'0.000000' b'0.000000' b'0.000000' b'0.000000']

[b'0.000000' b'0.000000' b'0.000000' b'0.000000']

[b'0.000000' b'0.000000' b'0.000000' b'0.000000']]

[2020-07-29 20:11:06.558] [info] Rosetta: Protocol [SecureNN] backend has been released.

可以看出除了必要的數據預處理接口外,我們完全的復用了TensorFlow中的算子,在更複雜的計算邏輯圖中,你可以像這個trivial例子中的Matmul一樣,直接使用native TensorFlow的算子即可,不需要感知任何後端複雜的隱私協議!

AI開發者能在不需要對隱私AI技術有任何了解的情況下,只需要改動兩三行代碼即可將現有AI代碼轉換為具備數據隱私保護功能的程序,Rosetta可以說是AI開發者的「貼心小馬甲」。

為了更相近了解這種隱私保護技術,量子位邀請到矩陣元算法科學家謝翔博士進行直播分享, Rosetta如何將隱私計算能力賦予人工智慧,讓我們的隱私更安全。

分享內容

隱私計算背景介紹

如何實現隱私保護

什麼是Rosetta

Rosetta運行原理

Rosetta的應用場景

未來的規劃

嘉賓介紹:

謝翔,中國科學院軟體研究所博士,矩陣元算法科學家,負責公司整體隱私計算技術的預研和產品化,主導設計和開發Rosetta開源框架。

格密碼理論、同態加密、零知識證明、安全多方計算等密碼學算法和協議設計的專家。發表論文10餘篇,曾在密碼學的頂尖學術會議Eurocrypt,CCS上發表論文。

直播&報名直播時間:

2020年8月6日(周四),19:00-20:30

其中分享時間為60分鐘,問答交流環節30分鐘

報名方式:

掃碼添加小助手,備註「隱私」,將邀請您加入直播群。歡迎大家與謝翔老師、更多開發者一起探討和交流隱私AI,也歡迎分享給需要的朋友:

Tips:關注「矩陣元」,回復「區塊鏈」,免費獲取全網最全的區塊鏈入門資料。

為了數據的流動

關注矩陣元 了解隱私計算

--長按二維碼 識別關注--

戳閱讀原文,走進矩陣元!

相關焦點

  • 一鍵切換隱私計算模式!矩陣元Rosetta最新版本正式發布
    自今年5月隱私AI開源框架Rosetta發布以來,引發了業內持續關注,「一鍵」切換隱私計算模式,AI數據秒換隱身衣的神奇操作給人留下了深刻印象,並獲得了開發者的廣泛認可。新版本不僅延續了Rosetta強大的隱私AI能力,加入了全新特性;並且通過系統優化,系統性能與穩定性進一步提升。
  • 360瀏覽器推出「隱私保護器」 一鍵清理隱私Cookie
    一方面,Cookie能夠對網絡服務帶來便利,但另一方面,如果Cookie處理不當造成洩露,也會成為吞噬人們隱私安全的黑洞。為此,360安全瀏覽器6.2Beta版推出「網站隱私保護器」,可一鍵清除Cookie隱私文件,同時也是全球首家提供清除Flash Cookie的瀏覽器。
  • 矩陣元算法科學家謝翔:Rosetta如何連接隱私計算與AI?
    主要的方向是隱私計算,以及基於密碼學的隱私開源框架—Rosetta。隱私計算時代來臨?目前數據面臨著一些挑戰。隨著數位化的發展,數據量指數級增加,一些核心的、關鍵的數據保護做得遠遠不夠。如何能夠在保護數據隱私的前提下,把各不同源、不同企業之間的數據能夠融合運用?在目前傳統的技術方法裡很難解決這個問題,所以成為了AI可能面臨的一大痛點。因此也引出了「隱私計算」的概念。關於隱私計算,簡單來說就是保證數據在使用和融合過程中,保護隱私的綜合性技術,而不是簡單的一項技術。
  • 隱私計算就在身邊, 五大案例帶你認識
    而近年來,隨著隱私計算技術的出現,數據共享即將告別瞻前顧後的窘境,引領「主動出擊」新趨勢。簡單來說,隱私計算就是通過技術實現數據「可用不可見」,讓不同來源的數據安全共享,產生更大價值,具體包括了如TEE(基於晶片的可信計算環境)、基於密碼學的安全多方計算(MPC)、源自人工智慧的聯邦學習等在內的各類技術的單項或綜合使用。
  • 隱私計算就在身邊,五大案例帶你認識
    而近年來,隨著隱私計算技術的出現,數據共享即將告別瞻前顧後的窘境,引領「主動出擊」新趨勢。簡單來說,隱私計算就是通過技術實現數據「可用不可見」,讓不同來源的數據安全共享,產生更大價值,具體包括了如TEE(基於晶片的可信計算環境)、基於密碼學的安全多方計算(MPC)、源自人工智慧的聯邦學習等在內的各類技術的單項或綜合使用。
  • 隱私計算技術法律合規研討會在中國信通院召開
    ,相關技術產品不斷豐富,隱私計算成為平衡個人信息的商業流通價值與個人權益兩種法益可行的技術解決方案之一。但我國法律尚未對隱私計算等技術的合法性和合規性做出明確規定,致使企業在技術產品設計、業務流程設計方面急需規範的指引。本次研討會旨在溝通技術界與法律界,為隱私計算技術和產業合法合規推進提供指導。
  • 完美保護隱私的AI,存在嗎?
    使用隱私保護技術時,相關立法突然變得不那麼困難了,同樣,確保數據安全以維護用戶信任也變得簡單了。數據隱私是訓練和測試AI模型的核心問題,對於那些依賴敏感數據進行訓練和推斷的AI模型更是如此。然而,目前為止,何為完美保護隱私的AI,尚未有任何已發布的指南可供參考。現介紹實現完美保護隱私的AI所需的四個支柱,並討論哪些技術可以幫助建立每個支柱。
  • 隱私計算助推城市數位化轉型 布局「中國方案」
    其中,數據的共享開放尤為關鍵,數據只有流通應用起來,才能最大程度發揮其要素身份的價值,數據以直接給予的方式進行流通,在這種模式下,雖有嚴格的法律保護,但仍不乏鋌而走險者,嚴重的隱私洩露事件時有發生。隱私保護便是數據流通所面臨的重要挑戰。2020年被稱為隱私計算的元年,該技術目前被認為是使數據安全流通的唯一技術解。
  • 達樸匯聯榮登【2020隱私計算產業30強】
    7月5日,國內首個隱私計算產業論壇【「隱私計算:讓數據安全有序流動起來」暨2020隱私計算產業30強榜單頒獎典禮】在杭州區塊鏈國際周上召開。本次活動由算力智庫、長三角大數據產業合作聯席會議、安徽省大數據產業聯盟等機構共同舉辦。
  • 魅友都不知道的功能:如何利用Flyme的平行空間來保護隱私?
    自從 Flyme6 開始,魅族就推出了一個非常好用的隱私管理模式,稱之為「平行空間」;提供正常模式、隱私模式和訪客模式三種。三種模式均可以通過設置指定的指紋和密碼在鎖屏界面無縫切換。不同於其他手機,Flyme 是從系統底層相應,在不知不覺中實現無縫轉換,避免掉很多尷尬。
  • 中國金融行業需要怎樣的隱私計算?
    隱私保護是數位化時代下人類面臨的一個重大命題,隱私計算也因此成為全球矚目的最新技術。業界許多人都期待這項技術落地,相較於目前許多對隱私計算的討論和落地停留在與大數據結合層面,致力於中國可信計算基礎設施建設的令致科技進一步認為,隱私計算必然最先在金融等核心行業落地,然後帶領全行業爆發。
  • AI,隱私,機器人
    從來沒有哪個時代像當今一樣到處充滿了對個人隱私的侵犯,也沒有哪個時代像當今這樣對隱私看得如此之重。事實上,你的隱私將無處可藏。數據對於AI來說,就像煤炭之於蒸汽機,電能之於燈泡,汽油之於汽車。近年來,AI這臺發動機已經再次發動,只有源源不斷地餵給它更多的燃料,才能朝著遠方前進。
  • 潮科技 | 隱私計算技術的三大主流門派
    隱私計算,廣義上是指面向隱私保護的計算系統與技術,涵蓋數據的生產、存儲、計算、應用等信息流程全過程。 隱私計算經過近幾十年的發展,目前在產業網際網路、人工智慧、金融科技、醫藥保護共享數據等方面發揮重要的作用。目前在對數據隱私的保護方面,隱私計算技術的應用主要可以分為可信硬體, 多方安全計算,聯邦學習三個主要流派。
  • 潮科技|隱私計算技術的三大主流門派
    隱私計算,廣義上是指面向隱私保護的計算系統與技術,涵蓋數據的生產、存儲、計算、應用等信息流程全過程。隱私計算經過近幾十年的發展,目前在產業網際網路、人工智慧、金融科技、醫藥保護共享數據等方面發揮重要的作用。目前在對數據隱私的保護方面,隱私計算技術的應用主要可以分為可信硬體, 多方安全計算,聯邦學習三個主要流派。
  • IJCAI 2020 | 星雲Clustar展示隱私計算方案
    星雲Clustar於會議上展示了星雲自主研發的聯邦學習隱私計算方案。 聯邦學習國際研討會(International Workshop on Federated Learning for User Privacy and Data Confidentiality)是專門為聯邦學習而設立的學術研討會,也是本年度IJCAI會議中的重要組成部分。
  • 「隱私計算+區塊鏈」在信用卡發卡審批業務中的落地構想
    並通過隱私計算技術使得各企業數據在鏈上安全的流通共享,可打破現有的「數據孤島「問題,從而實現合作共贏。近年,我國的隱私計算技術產業化也在快速啟動,螞蟻、騰訊等在2019年紛紛推出了各自的隱私計算產品。同樣,對於數據應用有高度需求的信用卡行業,隱私計算也有合適的落地場景,本文將通過信用卡前端的重點業務——「發卡審批「,探討如何將業務現狀與 「隱私計算+區塊鏈」技術結合,進一步在效率、合規性、拓展性上實現對業務的優化升級。
  • 個人隱私無小事,大數據時代需要怎樣的隱私保護技術?
    數據時代的隱私保護正在成為備受大眾、監管、企業等多方關注的話題。隱私計算迎元年,聯邦學習讓數據「可用不可見」2020年,《數據安全法(草案)》、《網絡數據安全標準體系建設指南(徵求意見稿)》、《電信和網際網路行業數據安全標準體系建設指南(徵求意見稿)》等監管政策相繼出爐,數據安全問題備受重視,隱私計算有望迎來新的發展突破。
  • 隱私計算2020盤點: 數據安全流動新藍海業已形成
    歲末年初,網際網路領域打響反壟斷戰役,但值得深思的是,相關業務模式壟斷的背後,是對數據的長期壟斷。 由於技術流派多樣,發展尚處早期,隱私計算也有各種新的說法,如Gartner提出的「隱私增強計算」、信通院提出的「隱私保護計算」隱私安全計算、隱私計算企業翼方健數提出的「隱私安全計算」,名稱不同但殊途同歸,其目標都是實現數據安全、保護隱私地流動與共享,讓數據「可用不可見」。
  • 兼顧保護隱私和打通數據孤島 藍象智聯發布GAIA系列隱私計算產品
    12月5日,在由巴比特主辦的2020世界區塊鏈大會·武漢分論壇現場,藍象智聯發布戰略性金融級隱私計算產品品牌GAIA,成為國內首個金融級隱私計算技術平臺,也是目前已投產、最多金融機構參與的多方安全計算聯盟平臺的底層技術平臺。
  • 翼方健數獲評信通院2020大數據「星河」隱私計算標杆案例
    案例徵集主要面向三大方向:行業大數據應用、數據資產管理以及隱私計算。徵集活動自11月初啟動以來,受到業界的廣泛關注和踴躍報名,共收到申報項目239份。數據要素有序流通是數據生產要素市場培育的核心內容,隱私計算旨在保障數據隱私和安全的情況下,建立數據協同應用平臺的模式,發揮數據價值。隱私計算在金融、政務、醫療等領域有著廣泛的應用前景。尤其是在醫療領域,針對醫療數據的安全問題,長時間反覆被提及卻又無破解之法。隨著隱私計算技術的逐漸成熟,令這一局面大為改觀。