數據「可用不可見」?讓數據安全共享流通的清華技術來了

2020-12-17 騰訊網

◎ 科技日報記者 操秀英

對於清華大學交叉信息研究院長聘副教授徐葳來說,成為華控清交信息科技(北京)有限公司(「華控清交」)首席科學家,是「誤打誤撞」。

從單純想解決科研過程中的數據獲取問題,發一篇不錯的論文,到成立華控清交,基於圖靈獎獲得者姚期智教授40年前的理論成果,自主開發一系列基於多方安全計算的隱私計算技術,實現數據「可用不可見」,為我國人工智慧和大數據產業發展提供保障,這是一個「從0到1」的原創成果轉化為技術、產業的案例,這也是以清華控股為代表的高校企業探索科技成果轉化新路徑的故事。

即便是發論文也要發「有用」的論文

這個故事要從徐葳加入清華大學交叉信息研究院說起。

作為一個標準「學霸」,徐葳本科時從清華大學到賓夕法尼亞大學,從加州大學伯克利計算機科學博士畢業後加入谷歌公司。「做了幾年的工程師,但我的理想還是做學術,所以接到姚老師的邀請,我毫不猶豫地回到了清華。」徐葳說,他開始做大數據方面的研究。

聚集不同學科、不同背景的人才,正是姚期智成立交叉信息研究院的初衷。

「做研究過程中我發現最大的難題是我拿不到數據。」徐葳回憶,「經常也有人打電話到我們實驗室,說想委託我們去做個什麼事情,但說到最後的結果基本都是讓我去他們公司使用數據,而不願意把數據拷給我們。」

徐葳說他完全理解這種做法。近年來隨著大數據技術的發展和應用,有關數據洩露的風險和討論也層出不窮。他印象比較深的是,幾年前,一家名叫Cambridge Analytica劍橋分析的數據分析公司,通過臉書平臺開發的性格小測試程序,獲取了5000+萬的用戶數據,也給臉書造成了巨大的損失。

徐葳開始想嘗試解決這一問題。「最開始的想法僅僅是能儘快發一篇論文。」徐葳坦言,「但我們學院和姚老師的要求是,需要發表有影響力的論文,所以我們開始朝著把姚老師四十年前的理論成果變成可用的方向努力。」

姚期智於1982年通過提出和解答著名的百萬富翁問題,並隨後用數學理論證明了凡是可以在數據明文上進行的計算,理論上都可以在密文上直接進行計算,並得出與明文計算完全一致的結果,從而創立了「多方安全計算」(Secure Multi-Party Computation,簡稱MPC)的理論框架。在密碼學領域,這個問題可以描述成,「一組互不信任的參與方之間在保護隱私信息以及沒有可信第三方的前提下的協同計算問題」。

作者供圖

「當然,天下沒有『免費的午餐』,對於相同的計算過程密文計算要比明文計算付出幾個數量級的算力,這使得多方安全計算在三十多年前僅有理論上的可行性。」徐葳說,三十多年前對數據使用的需求並沒有那麼迫切,而且也很少有人會去琢磨這個理論怎麼應用。「這就是在清華、在高校做研究的好處,只有一個方向,不知道能不能成功,你也可以放心大膽去探索。」徐葳感嘆。

科學家意識到自己不適合做企業家,就是個進步

「這一探索,就一頭扎進去了。」徐葳說。用兩三年時間,徐葳帶領他的學生們,通過工程實現,將多方安全計算的效率大大提升。

「這個時候已經能用了,更重要的是,我們知道這個技術方向走得通,並且知道怎麼繼續優化。」 徐葳說,他清楚意識到,接下來工程化的過程需要大量人力物力財力,且並非高校老師們舉一己之力所能完成。「而且,我肯定不是個能成為企業家的人。」

此時,徐葳並沒有成立企業,進行產業化的清晰想法。「我們當時想的最多的還只是這個研究能解決科研人員的數據使用問題。」

直到他與前高盛全球合伙人張旭東的一次談話。「我和張總有一次聊天,我向他介紹了我們正在做的一些課題,其他的他都沒說啥,但認為密文計算這個事情可以做大。」徐葳回憶,「都說數據是重要的資產,但它的價值如何體現?張總敏銳意識到,我們的技術可以解決這一問題。」

早在2017年,習近平總書記強調,「網際網路經濟時代,數據是新的生產要素,是基礎性資源和戰略性資源,也是重要生產力」「要構建以數據為關鍵要素的數字經濟」。

2020年3月30日,中共中央和國務院發布的《關於構建更加完善的要素市場化配置體制機制的意見》,明確把數據列為生產要素,並提出了加快培育數據要素市場的三點要求:推進政府數據開放共享、提升社會數據資源價值、加強數據資源整合和安全保護。

2020年5月11日,《中共中央、國務院關於新時代加快完善社會主義市場經濟體制的意見》中明確提出:「加快培育發展數據要素市場,建立數據資源清單管理機制,完善數據權屬界定、開放共享、交易流通等標準和措施,發揮社會數據資源價值。推進數字政府建設,加強數據有序共享,依法保護個人信息。」

雙方一拍即合。在清華控股有限公司的支持下,華控清交於2018年6月成立。張旭東任CEO,徐葳成為首席科學家。

徐葳最大的感觸是,科技成果轉化,一定要讓合適的人去做專業的事情。「現在越來越多科學家意識到自己不適合做企業家,這就是個很大的進步。我在做這件事情中也逐步明白,很多工程上的細節也不應該是我要去管的,通過設立成果轉化的公司,我們可以引進更加專業的團隊來完善這些細節。這樣我的精力就可以一直放在解決基礎的、前沿的問題上。」

產品已在金融和政務領域有多個案例應用

「目前我們已經讓密文計算的效率和規模接近於明文大數據系統,我們原本計劃將速度進一步提升、系統更優化之後再推向市場,但很多用戶得知我們的成果後主動找上門來,希望產品儘快上市,目前我們的產品已經有多家金融和政府部門用戶,未來產品一定會隨著技術的進一步優化和創新,持續迭代更新。」

簡單來講,華控清交的產品打消了數據擁有方有關數據洩露和「用一次就失去價值」的顧慮,真正實現數據「可用不可見」,讓數據流通起來,變成資產。比如,A機構想要某些用戶群體的數據畫像,但僅憑該群體在本機構的記錄,得出的畫像比較粗略,如果加上B機構、C機構的數據,畫像就更為精準。「以前別的機構不願意分享這些數據,華控清交的產品可以實現,在不把數據洩露給任何人的情況下,讓程序在B、C的密文數據上『跑』一圈,讓A、B、C的數據結合起來得到這個群體的畫像。既得到精準畫像,又保護了隱私。」徐葳形象地介紹。

「目前我們已完成兩輪融資,其中,港交所為了投資我們,專門在內地成立了一家全資子公司。」徐葳說。

「但科技成果產業化的過程千頭萬緒,並不是一件容易的事。術業有專攻,清華控股多年來在科技成果轉化領域有許多成功案例,也有一支專業的團隊。他們主動對接學校院系,和老師們一起設計商業模式,尋找合適的職業經理人,幫助對接資本等各類資源,共同推進科技成果落地,彼此間很信任,溝通也順暢。」在徐葳這樣的清華老師看來,清華控股更像是科研人員成果轉化的「專業經紀人」。

據悉,華控清交是清華控股探索推進清華科技成果轉化新模式的一個典型案例。清華控股作為清華大學服務社會的重要平臺,一直致力於推動清華大學科技成果轉化和產業化,助力社會創新發展,已累計轉化56項國家級重大科技成果,實現60多項重大技術突破,推動實施3項國家科技重大專項的項目轉化,取得了一批具有國際影響力的標誌性成就。

來源:科技日報

編輯:嶽靚

審核:朱麗

終審:冷文生

相關焦點

  • 華控清交CEO張旭東:數據「可用不可見」和「規定用途用量」,讓數據...
    然而,不同於土地、資本和技術等生產要素,數據一旦「被看見」就會洩露具體信息,難以限制用途和用量,使得各方的數據都不願不敢共享,當下數據割裂、數據壁壘和數據孤島現象嚴重。同時,數據極易被無限複製的特性也使得價值難以衡量,無法通過市場供需進行定價或者交易,阻礙了數據作為生產要素在市場上的大規模有序流通。
  • 區塊鏈讓數據「可用不可見」 支付寶隱私保護引入技術保障
    11月23日,在杭州召開的2019網際網路法律大會上,螞蟻金服發布了《隱私保護和數據安全白皮書》。白皮書顯示,支付寶在行業內率先推出的「摩斯」安全計算平臺(MORSE),通過結合區塊鏈等技術,能有效解決商業醫療保險、政務服務等數據共享中的隱私保護問題。
  • 這項技術可以讓隱私數據「可用不可見」
    大數據時代,企業數據需求量增加,跨行業的數據共享和應用成為企業剛需。但是大數據流通市場仍存在諸多的風險,如個人隱私保護方面,當機構通過服務方查詢數據時,服務方可能留存用戶資料,數據開放和數據安全之間如何達成平衡成為大家思考的問題。
  • 華控清交:解析數據安全融合平臺的運作邏輯以及應用場景
    在展會現場,「華控清交」的展臺與高通、華為相鄰,公司介紹本次活動的目的是向受眾科普數據可用不可見以及規定數據用途用量的必要性和實踐方式,重點展示了公司的數據安全融合平臺的設計邏輯、特點、效果以及相關的硬體產品。
  • 華控清交CEO張旭東:數據的交易流通之痛與隱私計算之道
    國家講得很清楚,要健全數據等生產要素,由市場評價貢獻、按貢獻決定報酬的機制,其中就提到了市場化的定價。價格是報酬的決定因素,數據作為生產化要素的報酬,那麼如何形成定價呢?這就需要流通,需要由市場來進行,需要由供需來決定。我們用一個模型算出來這個數據值多少錢,是不是它的價格?
  • 阿里數據安全技術首次登頂世界冠軍
    只需20秒,多個醫院就能使用「可用不可見」技術,完成多個患者數據的聯合建模,且每個患者的數據均不需要離開各自的醫院。近日,阿里安全雙子座實驗室和螞蟻金服摩斯團隊在由美國國立衛生研究院 (NIH)、加州大學聖地牙哥分校(UCSD)、印第安納大學等聯合主辦的iDASH 安全計算賽事中,獲得了「安全多方計算」賽道的並列第一名。這是自2014年iDASH 舉辦比賽至今,首次由中國大陸代表隊奪冠。據悉,iDASH競賽旨在探索解決雲環境下海量基因組分析期間的數據隱私和安全性問題。
  • 「數據寡頭時代」傳統領域如何藉助優刻得創新技術彎道超車
    如何在確保數據安全的前提下,讓數據在良性流通中發揮更大價值,成了當下政府、傳統企業需要緊迫思考的課題。  一些政府和傳統企業率先啟動了數據開放共享試點,對於市場是一種啟發。比如,廈門市政府,在全國率先實現政務數據互聯互通和無障礙共享,針對旗下掌握的包含人口、法人、空間、證照、信用、健康、交通、旅遊、公共安全等在內的超過200億條數據,建成全國首個大數據安全開放平臺。
  • 何寶宏:推廣數據資產管理 促進數據在陽光下安全流通
    數據成為生產要素內外因及四大特點2020年數據產業重啟數據流通,由關注技術變成關注數據生產要素。此外,他認為,數據作為生產要素,相對於傳統的生產要素有很多區別,第一,虛擬化的數據要素天然具有無限複製的特性,可以無限複製、共享、增長、供給。第二,數據要素打破了要素的形態和時空的限制,在各專業、全行業都具備普遍的適用性。第三,數據的生產要素化過程,就是重構原有產業的資源配置狀態,推動形成智能化的數字經濟體系的過程。
  • 數據可用不可見是大勢所趨,這裡有一份來自同盾科技的「知識聯邦...
    簡單直接共享這些數據資產無法保護用戶隱私,顯然是不安全的,如果數據不對外共享,可以保證數據對外不可見,但也不利於數據經濟價值的發掘。把數據資產根據場景提取有用的知識,把知識開放共享才是保證數據可用的一種合理解決方案,這就是資產知識化。 從數據資產化和資產知識化可以看出一種數據應用的新趨勢——數據可用不可見。
  • 隱私計算2020盤點: 數據安全流動新藍海業已形成
    12月8日,中國銀保監會主席郭樹清在演講中表示,一些科技企業在採集、使用企業和個人數據時嚴重侵犯企業利益和個人隱私,大型科技公司實際上擁有數據的控制權,需要儘快明確各方數據權益,推動完善數據流轉和價格形成機制。 大規模利用和濫用數據的遠不止網際網路巨頭。數字經濟時代大數據賦能各行各業,數據只有在流通共享中才能發揮更大價值,卻日益受到隱私安全問題掣肘。
  • 個人隱私無小事,大數據時代需要怎樣的隱私保護技術?
    導語:隱私保護VS數據共享,如何取捨?在日常生活中,你是否會接到莫名奇妙的推銷電話,或者是收到很符合需求的推送?這些都是你的個人數據被洩露的表現。大數據時代,人們的個人信息、消費需求、甚至生活習慣都會形成數據,由個人數據織成的信息網覆蓋範圍極廣,且能產生巨大經濟價值,網上甚至形成了販賣用戶信息的「黑產」鏈條。
  • 優刻得安全屋獲評「2020行業大數據應用優秀案例」
    優刻得UCloud安全屋憑藉在廈門大數據安全開放平臺中的落地應用,從239份申報案例評選中脫穎而出,被授予「星河案例-2020行業大數據應用優秀案例」。本屆大會以「聚焦數據要素 釋放數據價值」為主題,聚焦於加快培育數據要素市場、充分發揮數據作為生產要素的獨特價值,推動大數據在社會生產生活中的廣泛應用。
  • 關於數據要素交易流通模式的新思考 | DataLaws
    ,發展大數據技術、培育數據要素市場、促進數據交易流通是經濟社會創新發展的必然要求。早在2015年10月召開的十八屆五中全上,「實施國家大數據戰略,推進數據資源開放共享」便被正式提出。今年以來,國家加速培育數據要素市場並密集出臺多項政策和立法,核心都著眼於數據更加高效和安全的流通和開放。
  • 基於區塊鏈的鏈上數據安全共享體系研究
    而針對數據應用場景與應用需求,數據管理又可被細分為科學數據管理、信息管理、內容管理等。本文提到的基於區塊鏈的鏈上數據安全共享體系更多地依賴於科學數據管理以及內容管理中的關鍵技術,以此保證數據的安全共享與有效利用。
  • 衝量在線:數據流通背後的護航者
    近日,《中華人民共和國數據安全法(草案)》結束徵求意見,草案中明確開展數據活動的組織、個人的數據安全保護義務,落實了數據安全保護責任規定支持促進的具體措施。大數據時代,數據價值與安全問題並行。在數據安全問題頻出的時代,致力於解決數據安全流通中遇到的問題的企業,也逐漸展露頭腳,作為數據流通的護航者,不斷前行。隱私計算是什麼?
  • 清華姚班的科研能力,能孵化出一家怎樣的公司?
    分析起來,原因其實很簡單:數據安全問題正在影響數據流通,掣肘數字經濟發展。 在數字經濟時代,數據可以說是關鍵生產要素。 人工智慧技術能在寒冬之後再次復甦,引領時代技術潮流,就得益於網際網路帶來的海量數據。
  • 天金讀書會丨上海高金金融研究院吳方偉:讓數據之光照耀經濟實踐
    該書由清華大學技術創新研究中心發起,聯合國家部委研究機構、高校、行業協會、產業企業、專業媒體等權威專家學者共同編寫,面向各級政府、企事業單位領導幹部,重點宣傳數據要素國家戰略與政策,介紹數據要素產業發展現狀和趨勢等。天津金融資產交易所總裁、天津金融資產登記結算公司董事長丁化美先生受邀執筆撰寫的《數位化技術引發的信用革命》一文入編該書。
  • 優刻得獲得CSA 2020安全磐石獎
    CSA雲安全聯盟是國際雲計算業的權威安全組織,12月4-6日在上海舉行了2020雲安全聯盟大中華區大會,優刻得創始人兼CEO季昕華作為雲安全領域前沿技術專家,發表了《數據安全流通 創造無窮價值》主題演講。
  • 基於極速分析技術的數據共享平臺
    、分布式內存資料庫SAP Hana(OLAP)、Kafak流處理、ODG數據複製等新技術能力,構建了一個數據共享平臺,該平臺主要為了完成一下目標:1、建設實時數據共享中心:將CRM/經分/大數據平臺資料庫的數據通過goldengate/ODG產品技術,實時同步到實時數據共享中心
  • 大數據協同安全技術國家工程實驗室打造「超級智囊團」
    360公司作為國內網絡安全領域的龍頭企業,積累了雄厚的大數據處理能力,擁有世界領先的大數據安全分析技術與安全大數據資源。因此,2017年2月21日,由360公司牽頭的大數據協同安全技術國家工程實驗室正式獲批組建。據悉,該實驗室由360公司牽頭,復旦大學、中測安華公司、安天公司等多家單位聯合參與建設。