...AI百佳數據智能專場上線!兩位專家詳解TEE聯邦學習與開源向量...

2020-12-05 智東西

網際網路時代,一切源於數據。

隨著人工智慧技術的興起,數據的質量和數量,已經成為了影響機器學習模型效果最重要的因素之一。然而數據在使用的過程中,也面臨著諸多問題,如數據的隱私問題和數據的不規則、不完整等問題。

為了讓大家更好的了解數據隱私與數據的非結構化問題,12月8日晚7點,智東西公開課聯合英特爾推出了英特爾AI百佳創新激勵計劃數據智能專場,由英特爾AI百佳創新激勵計劃優秀企業代表富數科技和Zilliz共同參與。其中富數科技首席科學家陳立峰的講解主題為《基於TEE增強的聯邦學習與多方安全計算平臺解析》,Zilliz 數據工程師李晴的講解主題為《開源向量相似搜尋引擎Milvus的框架與應用》。

數據的隱私問題一直是人們所關心的焦點問題。尤其是工業界來說,隨著對數據安全的重視和隱私保護法案的出臺,以前粗放式的數據共享受到挑戰,各個數據擁有者重新回到數據孤島的狀態。

而如何解決數據孤島,成為AI行業需要解決的首要問題之一。當前業界解決隱私洩露和數據濫用的數據共享技術主要有三條路線。一條是基於硬體可信執行環境(TEE:Trusted Execution Environment)技術的可信計算,TEE字面意思是可信執行環境,核心概念為以第三方硬體為載體,數據在由硬體創建的可信執行環境中進行共享。一條是基於密碼學的多方安全計算(MPC:Multi-party Computation)。第三條路線是最新提出的一種人工智慧基礎技術-聯邦學習(Federated Learning)。

國內對於數據共享場景的機器學習解決方案主要是聯邦學習,那麼如何基於TEE增強聯邦學習並構建多方安全計算的平臺呢?在本次的專場講解中,陳立峰老師將會從工業界中的數據隱私問題出發,詳解Intel SGX軟體保護方案以及Avatar平臺中的TEE聯邦學習與算法邏輯保護實現,同時也會介紹一些Avatar安全計算平臺的應用案例。

隨著數據量的指數級增長,如何挖掘數據的價值成為了企業面臨的巨大挑戰。同時,現有的數據多為沒有預定義的數據模型,不方便使用資料庫二維邏輯表來表現的非結構化數據。其數據特徵多為高緯度的特徵,如描述圖像視覺特徵的數據基本是百維以上。

而隨著深度學習算法在非結構化數據處理中的廣泛應用,對深度學習模型的主要輸出-高緯度特徵向量,進行準確、高效的檢索已經成為了數據分析中的關鍵問題。而「維度災難」問題導致傳統的樹形高維索引性能急劇下降,在數據規模和檢索性能上很難滿足需求。

那麼如何構建高效、方便、可擴展並可滿足需求的搜尋引擎呢?Ziliiz公司在2019年開源了一款面向非結構化數據近似檢索和分析的向量搜尋引擎。在本次的專場的講解中,Ziliiz數據工程師李晴將會從非結構化數據的分析出發,向大家全面解析向量相似搜尋引擎Milvus的框架以及基於Intel AVX-512的向量搜索優化,最後也會介紹到Milvus的應用案例。

專場內容

主題一

《基於TEE增強的聯邦學習與多方安全計算平臺解析》

提綱:

1、工業界中的數據隱私問題
2、Intel SGX軟體保護方案
3、Avatar平臺中的TEE聯邦學習與算法邏輯保護實現
4、Avatar安全計算平臺的應用案例

主題二

《開源向量相似搜尋引擎Milvus的框架與應用》

提綱:

1、如何分析非結構化數據
2、開源向量相似搜尋引擎Milvus的框架解析
3、基於Intel AVX-512 的向量搜索優化
4、Milvus的應用案例

講師介紹

陳立峰,富數科技首席科學家,約克大學博士後,師從中國金融數學第一人彭實戈院士;曾在加拿大Maple Ridge Capital公司擔任金融分析師;是科技部973重大項目「金融風險控制中的定量分析與計算」項目組的主要成員;現主持富數科技核心聯邦學習、多方安全計算算法研究與產品化、富數Avatar隱私保護計算平臺搭建等工作。

李晴,Zilliz數據工程師、Developer Advocate ,畢業於東北大學計算機科學與技術專業;擅長CV 算法與 Docker 部署;自加入 Zilliz 以來,致力於為 Milvus 開源項目探索各類計算機視覺方向的解決方案與教學工作,幫助了許多用戶實現應用場景落地。

直播信息

直播時間:12月8日19:00
直播地點:智東西公開課小程序

加入主講群

本次專場我們將建立主講群,並邀請講師加入。感興趣的朋友,可以添加智東西公開課小助手甜甜(ID:hitian20)進行免費報名,一起聽課和交流。

相關焦點

  • 從概念到技術,再到國際標準和開源社區,聯邦學習只用兩年時間
    這恐怕也是自 2017 年聯邦學習概念提出以來,聯邦學習研究人員首次在人工智慧國際頂會上如此密集的發聲,以微眾銀行為代表的諸多企業的參與也標誌著聯邦學習已經逐步從基礎研究走向落地應用,而「首屆聯邦學習國際研討會」的召開則標誌了聯邦學習國際社區的正式成立,聯邦學習進入了一個新的階段。聯邦學習為何成為備受產業界關注的熱點?
  • AI 影響因子 8 月份回顧:騰訊 AI Lab 再佔榜首
    此外,雷鋒網 AI 科技評論也整合了諸如與高校實驗室合作、學術會議贊助等企業活動,嘗試為讀者們提供一個全面的數據平臺。距離「AI 影響因子」上線已經五個月時間,4 月份至 7 月份我們相繼推出四篇「AI 影響因子」的相關盤點:AI 影響因子:4 月份都有哪些企業研究院在影響你?
  • 楊強:應對對抗攻擊、結合AutoML,是聯邦學習接下來的研究重點 |...
    8月9日下午,在「聯邦學習與大數據隱私」專場上,微眾銀行首席人工智慧官、香港科技大學楊強教授進行了題為「聯邦學習下的數據價值與模型安全」的演講。以下是楊強教授在大會的演講實錄,AI 科技評論進行了不修改原意的整理和編輯:今天非常高興跟大家在聯邦學習專場相見,也非常感謝CCF-GAIR、雷鋒網組織了這場會議。就像剛才主持人所說,聯邦學習現在在國內外已經變成「星星之火可以燎原」之勢,在學術界、工業界、政府層面都有很大的推動力和場景,這和我們在座同事們的努力也是分不開的。
  • 楊強:應對對抗攻擊、結合AutoML,是聯邦學習接下來的研究重點|CCF...
    8月9日下午,在「聯邦學習與大數據隱私」專場上,微眾銀行首席人工智慧官、香港科技大學楊強教授進行了題為「聯邦學習下的數據價值與模型安全」的演講。演講中,楊強教授介紹了聯邦學習的關鍵技術以及應用案例,並進一步介紹了最新開展的聯邦學習和遷移學習的結合研究以及接下來的重點研究方向。
  • 夏日專刊AI產品上新升級集錦,50餘項軟硬能力加速場景落地
    >>查看詳情ai.baidu.com/tech/nlp_apply/address飛槳 PaddlePaddle 開源深度學習平臺、零門檻AI 開發平臺 EasyDL、AI 學習與實訓社區 AI Studio 發布多項升級。
  • 聯邦學習+風控,會是信貸業務的N95嗎?
    「它的優勢在於數據安全及隱私保護。」微眾聯邦學習團隊給出了這樣的答案。「在建模過程中,雙方交換梯度值,類似於方向向量的概念,交換的是中間變量,不是原始數據。同時對這個中間變量還進行了同態加密,所以數據並不會出庫,保證數據源和應用方的數據安全。」
  • 為什麼說 CCF-GAIR 智能駕駛專場不容錯過?我們梳理了這些亮點 |...
    無論是全球自動駕駛投資的速度加快,還是以市場為主導的自動駕駛第二幕已經開啟,不可否認的是,自動駕駛的商業化已經提上了日程——這也是 CCF-GAIR 智能駕駛專場希望討論的議題。AI 如何改變城市交通與物流網路?智能駕駛技術將如何定義未來的汽車?自動駕駛將從哪些地方最先落地?
  • 攜手業內專家賦能AI時代--EpiK銘識協議發起開源知識運動
    EpiK邀請清華大學信息技術研究院副院長邢春曉、中國計算機學會知識圖譜SIG主席、著名知識圖譜專家王昊奮、著名數據及知識圖譜公司創始人及項目負責人王會珍等重量級嘉賓參與,該活動在人工智慧及大數據領域引起廣泛關注。此次研討會,由EpiK銘識協議發起,希望藉助區塊鏈去中心化的協作模式搭建一個共建共享共益的開放知識庫。
  • 斯坦福 CS224d 中英字幕版重磅上線
    該課程全面介紹了應用於NLP的深度學習尖端研究。在模型方面,介紹詞向量表示、基於窗口的神經網絡、時間遞歸神經網絡、長期短期記憶模型、結構遞歸神經網絡、卷積神經網絡以及一些涉及存儲器組件的最新模型。學生通過講座和編程作業,可以掌握用神經網絡解決實際問題的必備技巧。
  • WAIC2020企業AI架構專場成功舉辦,行業專家共話AI落地挑戰與未來
    隨著人工智慧技術的發展和成熟,越來越多的企業都希望擁抱人工智慧來開展業務創新,實現企業的智能化發展。如何構建一套可靠、有效且安全的人工智慧技術棧,便成為了充滿機遇與挑戰的事情。在7月11日上午,在WAIC 2020開發者日企業級AI架構專場中,多位來自工業、醫療、金融等不同領域的行業專家,共同探討了企業級AI在落地過程中的技術挑戰與難題。
  • CB Insights:2017全球AI企業100強(附下載) | 網際網路數據資訊網...
    Drive.aiDrive.ai 是一家軟體公司,致力於重新構築人與交通之間的根本關係。該公司使用複雜的深度學習算法提供全棧的自動駕駛解決方案,已經在加利福尼亞州測試自動駕駛車輛。40. Elitic, Inc.
  • 如何區分人工智慧、機器學習和深度學習?
    這裡X就是屬性集合,實際上就是一個向量;而Y則可能是一個值(此時對應分類問題), 可能是一個向量(此時對應序列標註問題)。判別模型常用於處理分類問題(比如鑑定垃圾郵件)、圖像識別等等。再說一說生成模型(Generative Model)。生成模型可以描述數據的生成過程。換句話說,已知了這個模型,我們就可以產生該模型描述的數據。
  • CCF-GAIR 2020 重磅來襲,這 15 場主題專場絕...
    今年,在新基建機遇下,CCF-GAIR 設立了 15 個主題專場,分別是 AI 前沿專場、機器人前沿專場、AI 晶片專場、智能駕駛專場、AIoT 專場、服務機器人專場、智慧城市新基建「專場」、企業服務專場、工業網際網路專場、AI 金融專場、視覺智能、視覺智能·城市物聯專場、醫療科技專場、AI +藝術專場、AI 源創專場。
  • 聯邦學習 OR 遷移學習?No,我們需要聯邦遷移學習
    機器之心分析師網絡作者:仵冀穎編輯:H4O在這篇文章中,作者通過 4 篇論文詳細介紹了聯邦學習中的聯邦遷移學習問題,並探討了向經典聯邦學習中引入遷移學習的目的和意義。海量訓練數據是現代機器學習算法、人工智慧技術在各個領域中應用獲得成功的重要條件。
  • 中科大劉淇:從自適應學習的角度理解AI+教育
    2020年8月29日,第18期「AI未來說·青年學術論壇」(「AI+X」領域專場)以「線上平臺直播+微信社群圖文直播」形式舉行。中科大劉淇帶來報告《從自適應學習的角度理解AI+教育》。劉淇,中國科學技術大學計算機學院、大數據學院特任教授,博士生導師,中科院青促會優秀會員,中國人工智慧學會機器學習專委會委員,中國計算機學會大數據專家委員會委員。
  • 京東數科首度公開聯邦學習戰略全布局,薄列峰詳解兩大算法突破
    就是在滿足數據隱私安全和監管要求的前提下,讓人工智慧系統更加高效準確地共同使用各自數據的機器學習框架。數據還可能分布在不同的國家,各國數據監管政策有所不同,也可以把分布在各國數據高效利用、訓練模型,不存在數據上的交換。兩個典型的聯邦學習算法,分別是橫向聯邦學習和縱向聯邦學習,橫軸表示特徵維度,豎軸表示用戶維度。橫向聯邦學習,看兩方的數據和標籤,用戶重合度非常低,特徵重合度比較大。
  • 富數科技安全計算首席專家卞陽:隱私計算江湖與聯邦學習的「上帝...
    ,以《隱私計算重構邊界,聯邦學習重新定義大數據》為題進行分享。信通院也在制定聯邦學習的標準,當中也有不少關於安全的內容,於是變成了你中有我、我中有你的狀態。「聯邦學習裡的安全怎麼做?」這是必然要討論的問題。之前很多專家已分享聯邦學習的算法原理,安全方面相對講得不多,我們這次會側重隱私計算方面來談。
  • 當傳統聯邦學習面臨異構性挑戰,不妨嘗試這些個性化聯邦學習算法
    一、Asynchronous Federated Optimization隨著邊緣設備 / 物聯網(如智慧型手機、可穿戴設備、傳感器以及智能家居 / 建築)的廣泛使用,這些設備在人們日常生活中所產生的大量數據催生了 「聯邦學習」 的方法。另一方面,對於人工智慧算法中所使用的的樣本數據隱私性的考慮,進一步提高了人們對聯邦學習的關注度。