網際網路時代,一切源於數據。
隨著人工智慧技術的興起,數據的質量和數量,已經成為了影響機器學習模型效果最重要的因素之一。然而數據在使用的過程中,也面臨著諸多問題,如數據的隱私問題和數據的不規則、不完整等問題。
為了讓大家更好的了解數據隱私與數據的非結構化問題,12月8日晚7點,智東西公開課聯合英特爾推出了英特爾AI百佳創新激勵計劃數據智能專場,由英特爾AI百佳創新激勵計劃優秀企業代表富數科技和Zilliz共同參與。其中富數科技首席科學家陳立峰的講解主題為《基於TEE增強的聯邦學習與多方安全計算平臺解析》,Zilliz 數據工程師李晴的講解主題為《開源向量相似搜尋引擎Milvus的框架與應用》。
數據的隱私問題一直是人們所關心的焦點問題。尤其是工業界來說,隨著對數據安全的重視和隱私保護法案的出臺,以前粗放式的數據共享受到挑戰,各個數據擁有者重新回到數據孤島的狀態。
而如何解決數據孤島,成為AI行業需要解決的首要問題之一。當前業界解決隱私洩露和數據濫用的數據共享技術主要有三條路線。一條是基於硬體可信執行環境(TEE:Trusted Execution Environment)技術的可信計算,TEE字面意思是可信執行環境,核心概念為以第三方硬體為載體,數據在由硬體創建的可信執行環境中進行共享。一條是基於密碼學的多方安全計算(MPC:Multi-party Computation)。第三條路線是最新提出的一種人工智慧基礎技術-聯邦學習(Federated Learning)。
國內對於數據共享場景的機器學習解決方案主要是聯邦學習,那麼如何基於TEE增強聯邦學習並構建多方安全計算的平臺呢?在本次的專場講解中,陳立峰老師將會從工業界中的數據隱私問題出發,詳解Intel SGX軟體保護方案以及Avatar平臺中的TEE聯邦學習與算法邏輯保護實現,同時也會介紹一些Avatar安全計算平臺的應用案例。
隨著數據量的指數級增長,如何挖掘數據的價值成為了企業面臨的巨大挑戰。同時,現有的數據多為沒有預定義的數據模型,不方便使用資料庫二維邏輯表來表現的非結構化數據。其數據特徵多為高緯度的特徵,如描述圖像視覺特徵的數據基本是百維以上。
而隨著深度學習算法在非結構化數據處理中的廣泛應用,對深度學習模型的主要輸出-高緯度特徵向量,進行準確、高效的檢索已經成為了數據分析中的關鍵問題。而「維度災難」問題導致傳統的樹形高維索引性能急劇下降,在數據規模和檢索性能上很難滿足需求。
那麼如何構建高效、方便、可擴展並可滿足需求的搜尋引擎呢?Ziliiz公司在2019年開源了一款面向非結構化數據近似檢索和分析的向量搜尋引擎。在本次的專場的講解中,Ziliiz數據工程師李晴將會從非結構化數據的分析出發,向大家全面解析向量相似搜尋引擎Milvus的框架以及基於Intel AVX-512的向量搜索優化,最後也會介紹到Milvus的應用案例。
專場內容
主題一
《基於TEE增強的聯邦學習與多方安全計算平臺解析》
提綱:
1、工業界中的數據隱私問題
2、Intel SGX軟體保護方案
3、Avatar平臺中的TEE聯邦學習與算法邏輯保護實現
4、Avatar安全計算平臺的應用案例
主題二
《開源向量相似搜尋引擎Milvus的框架與應用》
提綱:
1、如何分析非結構化數據
2、開源向量相似搜尋引擎Milvus的框架解析
3、基於Intel AVX-512 的向量搜索優化
4、Milvus的應用案例
講師介紹
陳立峰,富數科技首席科學家,約克大學博士後,師從中國金融數學第一人彭實戈院士;曾在加拿大Maple Ridge Capital公司擔任金融分析師;是科技部973重大項目「金融風險控制中的定量分析與計算」項目組的主要成員;現主持富數科技核心聯邦學習、多方安全計算算法研究與產品化、富數Avatar隱私保護計算平臺搭建等工作。
李晴,Zilliz數據工程師、Developer Advocate ,畢業於東北大學計算機科學與技術專業;擅長CV 算法與 Docker 部署;自加入 Zilliz 以來,致力於為 Milvus 開源項目探索各類計算機視覺方向的解決方案與教學工作,幫助了許多用戶實現應用場景落地。
直播信息
直播時間:12月8日19:00
直播地點:智東西公開課小程序
加入主講群
本次專場我們將建立主講群,並邀請講師加入。感興趣的朋友,可以添加智東西公開課小助手甜甜(ID:hitian20)進行免費報名,一起聽課和交流。