華控清交CEO張旭東:數據「可用不可見」和「規定用途用量」,讓數據...

2021-01-10 36kr

在長達數千年的農業社會,經濟發展的決定因素是土地和勞動。進入工業時代,資本和技術等要素逐漸成為更重要的社會資源。而當數字經濟時代到來,大數據人工智慧等前沿科技不斷湧現,全球數據呈現爆發性增長的趨勢,海量數據在AI、金融、醫療等領域的價值已經成為各方共識,數據儼然正成為這個時代最核心的生產要素,驅動人類社會邁向更高發展階段。

然而,不同於土地、資本和技術等生產要素,數據一旦「被看見」就會洩露具體信息,難以限制用途和用量,使得各方的數據都不願不敢共享,當下數據割裂、數據壁壘和數據孤島現象嚴重。同時,數據極易被無限複製的特性也使得價值難以衡量,無法通過市場供需進行定價或者交易,阻礙了數據作為生產要素在市場上的大規模有序流通。

具體到現實生活中,數據已經被各行各業視為一種「隱形資產」,許多企業都在積極探索如何通過技術手段來解決數據流通和隱私數據保護之間的的矛盾,從而能夠使手中的數據能夠真正成為一種「隱形資產」進行增值。目前業內摸索出的解法是通過隱私計算的方式,幫助各方在使用數據時只獲取數據價值,避免暴露原始數據,使數據「可用不可見」。據36氪了解,自2018年起,提供隱私計算解決方案的公司逐步增多,資本市場的關注度也隨著市場趨勢提高。 

華控清交信息科技(北京)有限公司(以下簡稱華控清交)是該行業的知名公司之一。該公司是由清華大學於2018年6月發起的信息技術公司,專注於研究、開發和建設基於現代密碼學和博弈論的大數據安全融合技術、標準和基礎設施。前高盛全球合伙人張旭東先生出任CEO,清華大學徐葳教授擔任首席科學家。

目前華控清交員工團隊近百人,其中75%以上擁有博士和碩士學位,員工來自華為、阿里、百度、IBM、谷歌、甲骨文和湯森路透等科技行業頭部公司。公司的主要股東包括清華大學、中國網際網路金融協會、北京市海澱區創業扶持基金、香港交易及結算所有限公司(港交所)、聯想集團和高榕資本。

在產品端,該公司目前已自主開發並推出了基於多方安全計算(MPC)的數據安全融合平臺,可以使多個非互信資料庫在數據相互保密的前提下進行高效數據融合計算。該平臺運用嚴格數學證明的密碼學理論,在計算機指令集和編譯器層面用密文計算替代明文計算,數據提供方和數據使用方之間的基於計算合約來調配算力執行隱私計算服務,並把計算結果給到合約指定的結果獲得方,從而真正實現了「數據可用不可見」同時「規定數據的用途和用量」(「計算合約」)。

並且,華控清交開發的數據融合平臺是一個擁有企業級部署、開發便利、承載技術和計算擴展性的通用性平臺。同時還可以提供靈活組合的多層次產品和服務。           

華控清交的的數據融合平臺

事實上,早在上個世紀八十年代,圖靈獎得主姚期智院士就用數學理論證明了凡是可以在數據明文上進行的計算理論上都可以在密文上直接進行計算並得出與明文計算完全一致的結果,從而創立了多方安全計算理論。

然而往往理論到現實之間常常有著難以逾越的鴻溝。在日前的一次直播分享中,華控清交CEO張旭東介紹說,多方安全計算的安全性雖然很早就得到數學理論驗證,但是和明文計算相比,全密文的計算對於算力和性能的要求也要多出百萬倍以上。如何實現多方安全計算密碼學理論到隱私計算技術的跨越在全球範圍都是一個巨大的挑戰。

據他介紹,華控清交已經通過一系列工程化研究的探索和實踐,以實現數據「可用不可見」的多方安全計算技術為基礎,結合聯邦學習、可信計算,數據脫敏和差分隱私等基於明文的數據隱私保護技術和區塊鏈存證技術,開發創建了一套基於多方安全計算的密文計算和明文計算相結合的隱私計算技術體系,實現了多方安全計算技術的實用化和產品化,使得密文計算的性能提升到可以滿足商業應用的水平。

張旭東認為,密文計算和明文計算並不是競爭關係,而是相輔相成的關係。在解決計算效率問題時,需要將明文計算和密文計算結合,前者保證效率,後者在最關鍵處保證數據的隱私安全。兩者靈活運用才能最大程度平衡計算的準確性、保密性和效率。

從密碼學理論到通用隱私保護計算技術體系

在「規定用途和用量」方面,張旭東進一步解釋,規定用途就是指定算法,規定用量就是限定使用的次數或頻率。數據計算過程中的數據使用方和數據提供方根據需求在發起計算任務前達成一個使用協議,按約定的協議進行計算,這也就是前文提到的「計算合約」。在合約的約束下完成計算任務,則數據提供方所共享的使數據的特定使用權,而不暴露任何明文信息。華控清交表示通過建立從密碼學理論到通用隱私保護計算體系,能夠為助力數據的要素化提供技術抓手,並為建設數據互聯、融合與流通的基礎設施奠定基礎。

據36氪了解,目前業內已有不少關於隱私計算技術手段的研究和探索,且各有優劣。在行業中也已有多家公司提供隱私計算相關解決方案,各公司由於背景和技術積澱差異性,對各技術路線的倚重也有所不同,不過各方都認為單獨一項技術手段難以滿足現實場景中數據安全融合的實際需求,切實可用的方案必然是結合多種技術的綜合性解決方案。

目前常用的隱私計算技術手段

36氪通過採訪發現,目前隱私計算的主流技術路線主要可分為多方安全計算(MPC)、可信執行環境(TEE)和聯邦學習等。華控清交目前可提供全面的隱私計算解決方案,廣泛適用於查詢、聯合統計、聯合建模等多種場景。業內其他相關公司還包括數牘科技、翼方健數、鍩崴科技等,BAT也有自身的方案提供。

在直播裡,華控清交CEO張旭東從行業趨勢出發,圍繞「數據成為生產要素」的原因、難點、如何做以及對未來的展望四個方面剖析了自己對數據生產要素化的理解,並通過對數據價值「波粒二象性」的重新定義,提出了如何在數據流通中通過採用數據安全融合的新方式,使用數據的計算價值,解決傳統信息共享的發展瓶頸。36氪也根據相關內容進行了整理。

數據成為生產要素的前提

張旭東認為,隨著生產力發展水平,不同歷史時期有著不同的核心生產要素,農業社會是土地和勞動力,工業社會是資本、技術與管理,資訊時代是知識,而如今的數字經濟時代,數據是信息處理和計算的對象與結果載體,是對自然資源和社會資源在分配和使用時進行優化的決策依據,利用數據對社會資源和自然資源進行整體監測調控和局部優化分析,可以大幅度提高社會勞動生產率。這是數據「天然」是數字經濟的核心要素。

但是,數據不會「天然」成為生產要素,要解決兩個核心問題才會真正成為生產要素。一是流通,二是確權。

數據有著與其他生產要素的不同的特徵:複製成本低、可以無限地被複製、可以同時被多方使用、同時使用過程中還會生產出新的數據。傳統的信息基於明文數據分享,而明文數據一旦被看見就會洩露具體信息,難以限制其用途和用量,難以釐清「責、權、利」,這導致了明文數據難以通過供需關係定價,難以大規模市場流通。

針對這些,張旭東提出了數據的「波粒二象性」,即數據的價值一方面在於其可見的信息價值,類似於量子力學的「粒子」;另一方面在於其參與計算得出的結果價值,即其計算價值,類似於量子力學的「波」。

數據「可用不可見」和規定計算價值用途用量的意義

在大數據、人工智慧得以廣泛應用的今天,數據的價值被更多的地體現在其計算價值上。將數據承載的信息價值和計算價值分開,使得數據「可用不可見」,才能避免明文數據因被看見導致的無限供應和使用。

同時需要規定數據計算價值的具體用途和用量,只有這樣才能實現對數據定性定量的供應。因此,通過市場進行定價並大規模進行流通的將不是數據本身,而是數據的特定使用權。數據「可用不可見」和「規定用途和用量」可以實現數據的歸屬權、使用權、受益權和處置權的分立,為數據真正成為生產要素奠定確權基礎。

張旭東也強調了「數據融合」的概念,即多種數據一起使用,可以疊加數據的內在維度,大幅提高(1+1>2)數據的計算價值。數據的計算價值是通過計算體現出來的,將多方的數據通過「可用不可見」的方式按規定用途進行計算,每一個算法產生的計算結果就是一個新的價值,而每次參與運算的數據就是一次對特定使用權的消費。「數據融合」可以有效解決之前數據「不能共享」、「不願共享」、「不敢共享」的流通難題。

數據實現生產要素化的展望

在展望未來時,張旭東用「數據打電話」對數據實現生產要素化的藍圖進行了比喻。用「電話機」比喻客戶端數據服務(DS),DS將遍布每個提供或使用數據特定使用權的社會個體,用「程控交換機」比喻隱私計算服務,在「電話機」和「程控交換機」之間流動的是計算因子- 數據的密文碎片,本身不承載任何可以「看見」的信息。「程控交換機」和「程控交換機」之間還將連接成一張多維立體的國家數據網,可以連接每一個社會個體。

數據要素化基礎設施的基本模塊

整體來看,張旭東認為基於合約的隱私計算技術能夠有效地構建社會化數據閉環,真正打消數據價值鏈的不同環節對數據歸屬、數據安全和隱私保護的顧慮,為數據融合、為數據參與社會化大生產、為數據真正成為生產要素奠定技術基礎。

相關焦點

  • 阿里牽頭全球首個安全多方計算國際標準 讓「可用不可見」數據更安全
    近年來,數據安全保障技術一直被業內關注討論。數據「可用不可見」就是關鍵技術之一。其實,無論是快遞外賣還是疫情防控,都面臨數據的流動與安全問題。如何在發揮數據流動價值與確保數據安全之間找到平衡點,成為行業性難題。據了解,為避免數據協作共享過程中的信息洩露風險問題,傳統解決方案是通過一個可信的第三方實現數據的安全共享和計算,但「可信第三方」有時也會成為信任的瓶頸。
  • 阿里高級安全專家自述:阿里如何實現數據「可用不可見」
    其核心思想是以可信硬體為載體,提供硬體級強安全隔離和通用計算環境,在完善的密碼服務加持下形成「密室」,數據僅在「密室」內才進行解密並計算,除此之外任何其他方法都無法接觸到數據明文內容,數據在離開「密室」之前又會被自動加密,從而實現「可用不可見」。
  • 數據要素時代金融業的使命
    特別是近年來已經成熟的多方安全計算(MPC)技術,能直接以數據的計算因子進行融合計算,實現數據「可用而不可見且按規定的用途和用量使用」,將利用明文數據轉變為利用數據的計算價值,從而為數據要素化掃清了最後的發展障礙。 金融數據要素化的時代使命 金融數據要素時代不是「後大數據時代」。
  • 北京中交興路信息科技有限公司:基於車聯網大數據的保險風控AI雲...
    北京中交興路信息科技有限公司:基於車聯網大數據的保險風控AI雲平臺建設與實施一、前言北京中交興路信息科技有限公司(簡稱「中交興路」)是一家以數據為核心,為公路貨運行業提供多元化產品與服務的科技創新企業,致力於打造中國領先的公路貨運綜合服務平臺。
  • 淺談數據要素與金融業相結合的意義
    金融數據是金融業在提供服務時所產生的和所需要使用的數據,數據金融則是金融業對數據要素提供的服務。一方面,單個生產要素無法獨立產生價值,不同的生產要素只有相互結合才能發揮作用。在市場經濟中,資本和金融業是最直接的經濟利益傳導機制和資源效率放大器。
  • 交控科技(688015)融資融券信息(07-25)
    交控科技(688015)2019-07-25融資融券信息顯示,交控科技融資餘額24,033,231元,融券餘額0元,融資買入額19,878,130元,融資償還額16,720,915元,融資淨買額3,157,215元
  • 這個學物理的男博士,想用「華爾街+矽谷」讓大數據變現
    「你們怎麼可能比我們銀行更懂風控呢?」三年前,當量化派創始人、ceo周灝去拜見一位全國性大銀行的風控負責人時,被兜頭澆了一頭冷水。這位銀行人士可能想不到,三年後,周灝的量化派三年後獲得了5億c輪融資,領頭人包括陽光保險,以及有中國巴菲特之城的郭廣昌的復星系。
  • 隱私計算2020盤點: 數據安全流動新藍海業已形成
    由於技術流派多樣,發展尚處早期,隱私計算也有各種新的說法,如Gartner提出的「隱私增強計算」、信通院提出的「隱私保護計算 」隱私安全計算、隱私計算企業翼方健數提出的「隱私安全計算」,名稱不同但 殊途同歸,其目標都是實現數據安全、保護隱私地流動與共享,讓數據「可用不可見」。
  • 清控環保陳家軻:抓住汙水深度處理最後的風口——總氮的深度去除
    蘇州清控環保科技有限公司(以下簡稱「清控環保」)成立於2017年,是一家專注於水汙染物深度去除的企業。其聯合清華大學與江南大學共同研發的「無碳源高效除總氮技術」在總氮廢水處理處於國際領先水平。
  • 數據通信中的模擬數據和數字數據
    打開APP 數據通信中的模擬數據和數字數據 發表於 2019-08-26 11:50:53 模擬數據在時間上和幅度取值上都是連續的,其電平隨時間連續變化。例如,語音是典型的模擬信號,其他由模擬傳感器接收到的信號如溫度、壓力、流量等也是模擬信號。數字數據在時間上離散的,在幅值上是經過量化的,它一般是由0、1的二進位代碼組成的數字序列。在通信系統中,模擬數據表示的信號稱做模擬信號,由數字數據表示的信號稱做數位訊號。二者是可以相互轉化的。
  • ...列2015年Gartner數據倉庫和分析型數據管理解決方案魔力象限的...
    中國,北京 - 全球領先的數據分析平臺、應用和服務供應商Teradata天睿公司(Teradata Corporation,紐交所:TDC)宣布名列Gartner公司首次發布的《2015年數據倉庫和分析型數據管理解決方案魔力象限報告》(Data Warehouse and Data Management Solutions
  • 張掖交投大數據遷移華為張掖雲籤約儀式舉行
    甘肅張掖網訊 12月30日上午,由張掖市工信局主辦、市交投公司承辦的張掖交投公司大數據遷移華為張掖雲暨供應鏈和創新信息業務戰略合作籤約儀式舉行。此次籤約,是全面貫徹落實市委、市政府加快全市信息平臺互聯互通、數據資源開放共享、產業結構優化升級戰略部署及公司創新及信息業務發展規劃的一項重要舉措,標誌著市交投公司信息化整合及創新業務發展水平邁向了一個新的臺階。張掖交投公司作為市屬國有投融資平臺,肩負著推動全市經濟社會發展的社會責任。
  • 大數據時代下審時度勢 雍堯會的風控思維
    大數據近年來因網際網路和信息行業,再度躍升為炙手可熱話題。數據時代降臨,改變人們固有的生活模式。在網際網路金融行業中,大數據已然成為一項站在頂峰的指標。為提升自身企業風險控制能力,加深對大數據風控的認識與理解、提升風控效能、降低金融服務成本、促進行業創新規範發展,雍堯會與各大數據風控領域專家積極參與網際網路金融協會舉辦的大數據風控專題培訓會,同各企業領導進行一連串風險控制方面的參透與探討。  現今社會,企業廣泛利用大數據進行各項指標發展,不斷開拓業務、創新運營模式。
  • 色譜數據完整性理論
    而色譜數據完整性更是體現在色譜系統、對照品管理、樣品管理、原始記錄管理以及Excel驗證等方面。色譜工作站色譜工作站獲得的色譜數據應當可靠、安全、完整、可溯源。藥物製造者應該選擇、安裝和使用適合其既定用途的色譜系統,並可以得到穩定的售後服務。
  • ZRobot拒做「大數據公司」背後的數據技術商業邏輯
    「盤古信用模型」則利用多維度的貸前數據,預測客戶的綜合逾期風險,信用分數對不良客戶具有高區分度和低誤判率,不同機構可根據自身業務需求,結合ZRobot信用分數,定製風險管理策略。  值得一提的是,通常經濟計量模型對於數據要求很高,數量和質量直接決定模型的有效性和預測能力就越強。
  • 浮遊植物|一種簡單的方法實現從衛星數據進行藻華與藻種識別
    藻種,甲藻,硅藻作者:Fang Shen*, Rugang Tang, Xuerong Sun, Dongyan Liu本研究提出了可以簡便利用衛星數據監測藻華和藻華優勢種的算法。遙感技術能夠在大範圍內進行連續觀測,因此使用遙感技術監測藻華成為了一個熱門的研究方向。需要發展簡單有效的方法,通過衛星觀測確定藻華出現的地點、區域、持續時間和種類,以協助對海洋環境進行業務和緊急監測。a. 根據三波段混合模型,提出RDI(Red tide Detection Index)指數,用於在渾濁近岸水體探測藻華。
  • 不碰數據 又要建模?中國版FICO如何駕馭無數據場景|算力隱私專欄
    其中,背靠螞蟻金服的芝麻信用和騰訊旗下的騰訊徵信因其用戶覆蓋面廣、數據規模龐大、技術實力雄厚而最具競爭力。另外,前海徵信因背靠中國平安也被視為有力的競爭者。此外,考拉徵信則匯集了拉卡拉平臺上進行信用卡還款、轉帳、公共繳費等個人用戶數據。
  • [堅決打贏疫情防控阻擊戰]儋州啟動流行病學調查組:利用大數據科學...
    儋州新聞中心消息  2月13日,國務院應對新型冠狀病毒感染肺炎疫情聯防聯控機制第二十工作指導組組長張旭東率隊來到我市檢查指導疫情防控工作,對我市面對疫情行動迅速、周密部署、科學防控、精準施策,強化聯防聯控、群治群控等方面給予高度肯定,特別是在了解到我市啟動流行病學調查組