阿里巴巴達摩院1月2日發布《2020十大科技趨勢》,預測蓄勢已久的智能革命將迎來顛覆性的技術變局。它們均與數據密切相關,所以這場「智能革命」是以數據資源為基礎,也可以稱之為「數據智能革命」。
根據國際數據公司(IDC)和數據存儲公司2019年研究,全世界產生的新數據將從2018年33 ZB增至2025年175 ZB,中國將從2018年7.6 ZB增至2025年48.6 ZB,從而為數據智能革命的興起創造了堅實的基礎。
達摩院分析,2020十大科技趨勢將分別是人工智慧從感知智能向認知智能演進,計算存儲一體化突破AI算力瓶頸,工業網際網路的超融合,機器間大規模協作成為可能,模塊化降低晶片設計門檻,規模化生產級區塊鏈應用將走入大眾,量子計算進入攻堅期,新材料推動半導體器件革新,保護數據隱私的AI技術將加速落地,雲成為IT技術創新的中心。
在「保護數據隱私的AI技術將加速落地」方面,達摩院認為,數據流通所產生的合規成本越來越高。使用AI技術保護數據隱私正在成為新的技術熱點,其能夠在保證各方數據安全和隱私的同時,聯合使用實現特定計算,解決數據孤島以及數據共享可信程度低的問題,實現數據的價值。
達摩院指出,數字經濟時代,數據成為社會經濟發展的新生產要素,數據流動價值也越來越受到人們的重視。然而在企業數位化建設過程中,由於規劃、設計、管理等方面存在的問題,導致業務系統在功能上不關聯互動、信息不共享交換,在各個系統之間容易出現數據孤島問題,進一步制約數據共享所帶來的流動價值。
在越來越多對數據隱私的擔憂聲中,政府開始制定數據使用合規法案,大量的數據因為需要依法保護而無法被聯合在一起計算。針對「數據孤島」現象,目前大部分數據共享平臺本質上都是基於中心化的數據交換機制,存在過程複雜、通信成本高、效率低、所有權模糊化、數據洩露風險大的缺點,而且無法保護用戶的個人隱私。
因此,達摩院認為,保護隱私的AI安全技術能夠在保證各方數據安全和隱私的同時,聯合使用各方數據達到特定的訓練與使用AI的目的,大大降低信任成本與財務成本,從而充分發揮數據的價值,解決數據孤島以及數共享可信程度低的問題。
據達摩院介紹,保護數據隱私的AI安全技術拓展傳統分布式計算以及信息安全範疇,為網絡協作計算提供一種新的計算模式。它可通過多種技術結合保護數據安全,包括安全多方計算、差分隱私、同態加密、混淆電路、加密搜索與計算、可信軟硬體等;也可利用人工智慧保障模型魯棒與安全性,如模型加固、數據毒化防禦、對抗性樣本防禦等。基於隱私保護技術為核心構建數據安全體系,必將成為發展大數據、雲計算和物聯網的基石。
一直以來,平衡發展效率和安全風險是大數據產業的核心問題,擁有海量數據的政府企事業等組織一方面對數據的隱私負有重要的保護責任,另一方面也享有數據的使用價值;作為終端用戶的個體在法律法規的保護下可以控制個人數據的訪問權,也能參與價值分配。而在AI安全技術的保障下,組織或個人不必轉讓數據的擁有權,而是通過出租數據的使用權與價值分配。以聯邦學習為代表的安全多方計算應用,能解決行業大數據聚合過程遇到的挑戰,例如購物平臺和銀行等金融機構的產品推薦所面臨的數據屬性維度不足,以及醫療診斷和語音助手行業的數據用戶量不足等問題,並促使公共政務數據得以開放惠民新業。