成立兩年,他們用產品描繪出了基於第三代AI的基礎設施藍圖

2020-12-26 機器之心Pro

機器之心原創

機器之心編輯部

「第三代人工智慧」能幫助我們做什麼?瑞萊智慧 RealAI 用兩年的時間給出了一個答案。

「第一代知識驅動的 AI 利用知識、算法和算力 3 個要素構造 AI;第二代數據驅動的 AI 利用數據、算法與算力 3 個要素構造 AI。由於第一、二代 AI 只是從一個側面模擬人類的智能行為,因此存在各自的局限性,不可能觸及人類真正的智能。」清華大學人工智慧研究院院長、中國科學院院士張鈸等人在今年 9 月份的一篇專刊文章中這樣寫道。

在這篇文章中,他們還首次全面闡述了第三代人工智慧的理念,提出第三代人工智慧的發展路徑是融合第一代的知識驅動和第二代的數據驅動的人工智慧, 利用知識、數據、算法和算力 4 個要素, 建立新的可解釋和魯棒的 AI 理論與方法,發展安全、可信、可靠和可擴展的 AI 技術(詳細信息請參見:《清華張鈸院士專刊文章:邁向第三代人工智慧(全文收錄)》)。

其實,早在 2016 年,張鈸教授就提出了發展「第三代人工智慧」的理念。在他看來,雖然當前的 AI 已經取得了一些進展,但仍面臨魯棒性差、決策不透明等問題,需要把知識驅動與數據驅動結合起來解決問題。

2018 年,由張鈸、朱軍(清華大學人工智慧研究院基礎理論研究中心主任)擔任首席科學家的瑞萊智慧(RealAI)作為產學研技術公司從清華大學人工智慧研究院孵化成立。這家公司的願景是:以第三代人工智慧技術為依託,克服一般深度學習存在的諸多缺點,從根本上增強人工智慧的可靠性、可信性以及安全性。

兩年後的今天,在「2020 第三代人工智慧產業論壇暨瑞萊智慧 RealAI 戰略發布會」上,RealAI 第一次向外界展示了他們基於第三代人工智慧技術打造的 AI 原生基礎設施產品藍圖。

論壇上,瑞萊智慧 CEO 田天指出,當前 AI 基礎設施建設的重心集中在數據、算力平臺上,主要為 AI 提供基礎運算條件和生產力,打個比方,相當於是解決了 AI 的溫飽問題。數據和算力的快速增長作為「外部驅動力」的確帶動了 AI 技術在包括人臉識別、語音識別等領域的快速發展,驅動 AI 產業「第一增長曲線」的出現。

但隨著數據受場景複雜與隱私保護限制、算力增長緩慢等問題的出現,AI 產業的第一增長曲線開始放緩。在此情景下,我們亟需為 AI 產業打開「數據」和「算力」之外的全新維度,從增強算法底層能力出發,發展出AI「內生驅動力」。

不過想要加強AI內生驅動力,有幾道「關卡」需要我們去突破,包括更加安全可靠的決策(AI 決策邏輯和鏈路都不明確、易受攻擊)、數據隱私與安全(信息洩露、數據孤島)以及 AI 應用場景的管控(算法公平、社會倫理)。

「作為 AI 產業的建設者,我們從基礎設施的角度看待這一問題,在繼承自網際網路時代的數據平臺、算力平臺之外,需要建設 AI 原生基礎設施,從 AI 技術自身能力出發提供必備保障」,田天表示。

經過兩年的努力,田天等人已經給出了這套基礎設施的藍圖。

在算法可靠方面,他們研發了基於貝葉斯深度學習技術的可解釋 AI 建模平臺 RealBox。該平臺在 2019 年正式發布,目前已經在多家金融機構實際使用,並且通過了中國人工智慧產業發展聯盟的首批可信 AI 認證。在應用可控方面,他們推出的DeepReal深度偽造檢測工具,能夠高效精準地判斷視頻、圖片等內容素材是否是經過AI偽造生成的,避免相應輿情,DeepReal 入選了國家工信安全中心人工智慧優秀產品,基於其中的核心技術,RealAI 也獲得了 GeekPwn2020 年深度偽造檢測項目冠軍。

除此以外,活動現場還發布了兩款新品。

其中一款是針對數據安全的RealSecure,它是業內首個編譯級的隱私保護機器學習平臺,其核心模塊「隱私保護AI編譯器」能夠自動將普通機器學習算法程序轉換為分布式、隱私安全程序,使隱私安全的人工智慧商業應用門檻大幅降低。

另一款是針對算法可靠發布的RealSafe2.0,它是世界首個企業級AI安全平臺RealSafe的升級版,相當於是針對AI模型的殺毒軟體和防火牆。升級後的RealSafe提供針對目標識別等算法的安全攻防能力,同時增加了後門漏洞檢測等功能。

田天表示,「這一系列 AI 原生基礎設施可以打開 AI 能力的全新維度,激發 AI 的第二增長曲線,為 AI 賦能各行各業帶來全新市場機會。」

業內首個編譯級隱私保護機器學習平臺 RealSecure 亮相

在 AI 的發展過程中,數據是基礎生產力,用於解決 AI 的「溫飽問題」。但由於數據本身難以獲取、加工,還涉及行業機密、用戶隱私等問題,很多數據擁有者不願或不能將數據上傳至一個數據中心進行模型訓練,從而形成了一個個的「煙囪」或「孤島」。

針對這個問題,分布式隱私保護機器學習是一種新興的解決方案,它能使多方合作完成學習目標,但又避免各方傳輸原始數據,這並不是一個全新的概念,類似的術語還包括谷歌等機構提出的「聯邦學習」,實現「數據不出門,可用不可見」,但在實際商業應用中卻面臨三大痛點

第一是學術界工業界公認的隱私保護機器學習最主要的問題—性能差。隱私保護機器學習需要多方配合執行,多方需要以加密形式完成參數交換,加密帶來了高達百倍的性能損失。同時超參數設置等與既有機器學習生態存在差距,隱私保護機器學習的速度慢了近千倍。本地幾十秒的模型訓練,隱私保護下需要數小時。而特徵篩選、模型調參、模型驗證又需要幾十上百次重複建模流程,為了實現數據安全,極大的犧牲了建模速度。

第二是隱私保護機器學習難以大規模商業化落地的重要原因—難以兼容現有機器學習生態。不同於傳統機器學習,隱私保護機器學習是分布式系統、密碼學、人工智慧三個領域的結合。為了實現隱私保護的目標,各家機構要組織團隊學習分布式系統、學習密碼學;學習使用新算法、新框架,並在新平臺下執行程序。這也意味著,AI 團隊長期以來積累下的經驗和方法論在隱私保護機器學習領域無法直接運用,重建或改寫的投入與代價非常之大。

第三隱私保護最核心的問題是保障數據財產的安全,這也意味著,平臺自身的安全性應該是可被檢驗的。現有模式都是純黑盒運行,安全性檢驗完全依賴專家背書,但整個平臺代碼量巨大,專家逐行審計模式難以實現。而且實際生產環境中,是否真的按照審計時提供的代碼邏輯執行,也都難以保障。

隱私保護機器學習平臺 RealSecure 就是在以上需求下誕生的,它首創以底層數據流圖的視角揭示機器學習算法與對應分布式隱私保護機器學習算法的聯繫,通過算子組合將機器學習生態與隱私保護機器學習生態一脈打通,解決企業搭建隱私保護生態面臨著的性能差、易用性差、黑盒協議等諸多難題,實現兩大生態的一體化。

得益於底層編譯級的能力,RSC 具備三大優勢

性能強勁。藉助密碼學優化、AI 算法優化等改進實現,模型訓練相比某主流國產開源框架(最新版)性能提升約 40 倍,耗時從 4 小時 40 分鐘縮減至 6 分鐘。考慮到特徵工程與自動調參環境,隱私保護下完成全流程建模,總耗時實現從日級別到小時級別的飛躍。

無感應用。實現機器學習生態與隱私保護機器學習生態的「一脈相承」,僅需要少量改動,可以通過自動轉換完成機器學習算法平臺框架與隱私保護機器學習平臺框架的統一,數據科學家能夠以與機器學習建模相同的方式使用隱私保護機器學習,易用性大幅提升。

安全透明。真正的隱私保護學習應用應該是白盒可驗證的,所有底層執行的計算是可審計的,這樣才能保證隱私保護學習平臺的安全性。RealSecure 以數據流圖形式,將中間計算過程公開,實現計算過程的安全透明。

RealAI 表示,易用性與性能的顛覆性提升,也讓 RealSecure 成為更快更容易應用到商業環境的「企業級」隱私保護機器學習平臺。

在發布會現場,田天還闡明了他們開發這兩款產品的理念:「當在應用中碰到技術難題時,我們不是見一個解決一個,修修補補;而是發現一個問題就看到一類問題,並通過底層技術框架、平臺的突破,助力產業的升級。今天我們重點發布的兩款新品都是這一理念的典型代表,它們的產品定位、功能和價值都是獨一無二,RealAI 首創。

世界首款企業級 AI 安全平臺 RealSafe 迎來 2.0

在網絡安全時代,網絡攻擊的大規模滲透催生出一大批殺毒軟體。但隨著 AI 逐漸成為基礎設施的一部分,針對 AI 模型的「殺毒軟體」卻一直處於缺位狀態。

這種缺位存在巨大的安全隱患。數據顯示,去年就已經有超過 40% 的手機配備了人臉識別方案,但其中一些通過一副印有特殊紋理圖案的眼鏡就能輕鬆解鎖。

如果說手機影響的只是隱私和財產安全,那自動駕駛系統的安全漏洞則是真正的致命威脅。國際管理諮詢公司(Roland Berger)預測,2020 年全球自動駕駛車端系統的市場規模有望超過 1000 億美元。但與此同時,黑客只需要在標識牌上加上特定圖案就可以讓機器把限速標識識別為停止標識,導致致命事故的發生。

要徹底解決這些問題,我們需要理解深度神經網絡等 AI 算法是如何學習和工作的,但直到今天,我們仍對此知之甚少。因此,我們可能需要換一個思路。

對此,RealAI 給出的解決方案是:模型安全檢測 + 防禦。也就是說,我們可以先通過多種攻擊方法對模型的安全風險類別和高低進行檢測,然後提供多種方案提升模型的安全性。這就是他們今年年初推出的世界首款企業級 AI 安全平臺——RealSafe。

在安全檢測階段,RealSafe 會利用多種攻擊算法生成不同迭代次數、擾動大小的對抗樣本進行模擬攻擊,嘗試使其出錯,然後統計其出錯的概率和分布,輸出檢測報告。該平臺相當於一款「殺毒軟體」,整個檢測過程全界面化操作,用戶無需具備專業的模型安全算法知識和編程開發經驗。

在防禦階段,RealSafe 支持多種去除對抗噪聲的通用防禦方法,可實現對輸入數據的自動去噪處理,破壞攻擊者惡意添加的對抗噪聲。同時,RealSafe 也支持檢測輸入數據是否含有對抗樣本,這種防禦方式在模型和輸入數據之間構建了一道「防火牆」,將有攻擊意圖的數據擋在了模型之外。

今年 4 月份,RealAI 發布了 RealSafe 1.0,可用於提高人臉識別模型的安全性,提高應對對抗樣本攻擊(如上文中印有特殊紋理圖案的眼鏡)的能力。幾個月後的今天,RealSafe 實現了快速迭代,2.0 版本正式上線。與 RealSafe 1.0 相比,2.0 版本在支持防禦的攻擊類型、適用範圍等方面進行了擴展。

首先,在檢測抗對抗樣本攻擊的安全性基礎上,新版本增加了「模型後門攻擊」自動化檢測,可以針對模型每個類別搜索並還原後門觸發器的最終結果,並依據還原結果的離散程度判別模型是否被植入後門。此外,測試報告還可以展示出模型被植入後門的類別以及對應的後門所在區域。

「模型後門攻擊」是一種新興的針對機器學習模型的攻擊方式,攻擊者會在模型中埋藏後門,使得被感染的模型在一般情況下表現正常。但當後門觸發器被激活時,模型的輸出將變為攻擊者預先設置的惡意目標。由於模型在後門未被觸發之前表現正常,因此這種惡意的攻擊行為很難被發現。雖然目前來看這種攻擊方式在實際場景中還不太常見,但針對可能存在的攻擊對算法進行加固仍然具有重要意義。這也表現了 RealAI 在產品布局上的前瞻性。

其次,2.0 版的 RealSafe 將適用範圍擴展到了目標檢測、圖像分類等底層 AI 模型。前者的典型應用場景包括安防場景中的人體檢測、車輛、無人機檢測,以及自動駕駛場景中的人體檢測、車輛檢測等。後者的典型應用場景包括社交網絡與短視頻應用的色情、暴恐、侵權元素的識別,手機相冊的自動分類等。這些場景也是目前 AI 模型應用最廣泛、安全需求最迫切的領域。

在進行安全性檢測後,RealSafe 平臺還提供了多種功能幫助用戶提升 AI 模型安全性。以對抗樣本去噪為例,平臺將自動針對已被測的模型,量化出多種通用對抗樣本去噪方案對模型安全性的提升效果,便於用戶選擇最適合當前被測模型的防禦解決方案。

RealSafe 集成了多項國際領先的 AI 對抗攻防算法,榮獲多項世界 AI 安全大賽冠軍。與業界已有的一些人工智慧對抗技術工具包相比,RealSafe 還具有支持基於生成模型的對抗樣本攻防、支持黑盒檢測、零代碼易上手等優勢。

目前,RealSafe 已在工信部重大建設項目以及某電網公司落地應用。

RealAI 表示,未來,RealSafe 還將提供應對模型竊取、數據逆向還原等新型 AI 安全風險的解決方案。

底層技術與應用場景

為了打造基於第三代 AI 的基礎設施,RealAI 應用了多項技術,包括:

貝葉斯深度學習:將深度學習和貝葉斯方法的優勢有機結合,將數據和預測結果中天然存在的不確定性納入考慮,提升 AI 模型的泛化能力,從而實現可靠可解釋的 AI;

可解釋機器學習:保證在建模過程中,從關鍵特徵和決策相關依據等不同維度給出解釋,增進人們對 AI 結果的理解;

AI 安全對抗攻防:通過對抗的方式發現 AI 算法存在漏洞的機理,並通過對抗防禦技術指導魯棒 AI 算法和系統研發;

新一代知識圖譜:將領域知識引入到 AI 建模中,實現知識與數據的共同驅動;

隱私保護機器學習:解決 AI 場景下的數據流通問題,實現在明文數據不出庫的情況下,通過與密碼學和分布式系統結合的方式,支持 AI 模型的訓練和預測;同時保證 AI 對數據的用量和用途,控制權屬和收益。

……

這些技術的運用極大地提高了 AI 技術在現實場景中的可用性。RealAI的AI基礎設施產品已經用於解決金融風控場景中的數據有偏、資產配置效率低、基建場景中的數據缺失等問題。

為了進一步從研究、平臺、產業賦能三方面持續發力,加速安全、可信、可靠的產業智能化升級,RealAI 也與北京智源人工智慧研究院聯合成立安全人工智慧創新中心,助力人工智慧產業負責任發展。

AI 基礎設施的建設是一項長期任務,田天表示,RealAI 將「堅持長期主義,推動 AI 更高質量的服務於人類社會。」

相關焦點

  • 驅動AI產業「第二增長曲線」,清華系RealAI發布第三代AI產品
    本次會議上,瑞萊智慧RealAI旗下兩款第三代AI新品——隱私保護機器學習平臺RealSecure和人工智慧安全平臺RealSafe2.0 版本正式發布。此次新品發布,標誌著RealAI首次正式展示其基於「第三代人工智慧技術」手段所描畫的AI原生基礎設施藍圖,RealAI將不斷深耕人工智慧基礎設施建設,發展AI產業「第二增長曲線」,致力人工智慧成為新時代動力基礎。
  • 瑞萊智慧發布第三代AI新品,RealAI驅動AI產業「第二增長曲線」
    12月9日,由清華大學人工智慧研究院、北京智源人工智慧研究院、北京瑞萊智慧科技有限公司聯合主辦的「2020第三代人工智慧產業論壇暨瑞萊智慧RealAI戰略發布會」在北京召開。本次會議上,瑞萊智慧RealAI旗下兩款第三代AI新品——隱私保護機器學習平臺RealSecure和人工智慧安全平臺RealSafe2.0 版本正式發布。
  • 第三代人工智慧基礎設施背後,是一次技術應用的常識普及運動
    12月9日舉辦的「2020第三代人工智慧產業論壇」上,清華系AI公司瑞萊智慧RealAI發布了一系列AI基礎設施,就將更安全、可靠、可信及可拓展的第三代人工智慧作為核心,來推動企業智能化升級。與以往基於深度學習的數智化解決方案相比,有哪些不同?要回答這個問題,需要先來看看今天橫亙在企業與AI應用落地之間的困境。
  • 這家創企用AI化解安全難題
    二、用AI防火牆、編譯器解鎖AI安全難題瑞萊智慧RealAI孵化自清華人工智慧研究院,深耕安全、可靠、可信、可擴展的第三代人工智慧,已經推出涉及隱私保護、AI「防火牆」、深度偽造檢測工具等多類涉及AI安全的平臺產品。
  • 中科院院士張鈸:發展第三代AI技術,中美處在同一起跑線上
    清華人工智慧研究院院長、中國科學院院士張鈸以及他帶領的學生們給出的答案是:第三代人工智慧技術。近日,在北京舉行的「2020第三代人工智慧產業論壇暨瑞萊智慧RealAI戰略發布會」上,張鈸接受了澎湃新聞的採訪,他認為要解決現在人工智慧在落地應用中遇到的問題,就需要打破現有的理論,邁向第三代人工智慧。
  • 第三代AI突破的關鍵:相關人才基於不懈努力做出的創新
    第三代AI突破的關鍵:相關人才基於不懈努力做出的創新 學術頭條 發表於 2020-12-08 17:24:14 近年來,人工智慧(AI)依靠深度學習、計算機視覺、自然語言處理等技術突破與落地應用
  • OpenShift TV專訪先智數據:基於AI的主動管理在多雲環境如何實現...
    2020年12月16日,在OpenShift TV上,先智數據(ProphetStor)CEO,Eric Chen和產品副總裁Ming Sheu接受了紅帽高級首席產品營銷官,Mike Waite的採訪,暢談先智數據的發展願景與使命。先智數據長期致力於基於AI的主動管理來解決混合多雲環境中的複雜性並為客戶帶來創新價值。
  • 人們熟知的人工智慧AI到底是什麼東西?
    此次獲獎的成果顯示,華為雲通用人工智慧產mace11是ai創新應用載體,基於雲端,具有極強的多領域適用性和普惠性。我們注意到,機器人創新應用的精度等要求越來越高,其對計算能力、網絡連接及雲服務等要求的提升勢在必行。機器人創新應用的精度要求,尤其是深度學習方面的解決方案不斷湧現,使機器人本體系統需要同時支持不同層面的創新應用及創新算法。
  • 大眾集團描繪未來出行藍圖
    4月18日,上海車展前夕,大眾汽車集團發布了全新的合作創新的技術和前沿的產品,並展示集團未來在中國市場的戰略舉措,描繪出移動出行的未來藍圖。當晚,大眾汽車集團首款自動駕駛概念車Sedric亞洲首秀。
  • CTO王海峰談百度AI的2020:打造AI新型基礎設施、雲智一體加速產業...
    除了這些最直接的數字,《百度AI的2020》還全面展現了其在AI新興基礎設施、產業智能化、AI服務社會和人才培養等方方面面的進展和成果。AI新型基礎設施2020年,百度AI的四個剪影,描繪出AI進入工業化大生產,成為堅實的AI基礎設施。第一個剪影,百度大腦6.0勾勒的核心技術自主創新。
  • 英特爾新任CEO和總裁描繪產品藍圖及計算未來願景
    科再奇闡述了英特爾的願景,描繪了英特爾如何面向各個快速發展的細分市場,在明年及未來幾年不斷推出新產品的計劃,包括全新的更低功耗產品系列,以加快英特爾在超行動裝置領域的發展步伐。科再奇表示,英特爾不會忽視任何一個與計算有關的領域。「如今,創新和行業轉型正以前所未有的速度發生,這為英特爾充分發揮優勢創造了條件。憑藉行業領先的製造技術和架構設計,英特爾將進一步切入更低功耗計算設備領域。
  • 邁向第三代AI需突破「三關」 多方聯手讓AI更安全
    中新網北京12月11日電 (記者 張素)「第三代人工智慧(AI)」最初由中國科學院院士、清華大學人工智慧研究院院長張鈸提出。近日在2020第三代人工智慧產業論壇上,業內專家表示加強AI內生驅動力需突破「三關」。
  • ...酒泉市肅州區大力推進高標準農田建設——為河西走廊描繪沃野藍圖
    甘肅酒泉市肅州區大力推進高標準農田建設——為河西走廊描繪沃野藍圖姚明悅 本報記者 吳曉燕 魯明酒泉市肅州區粵港澳蔬菜種植基地。近年來,肅州區委、區政府把加快建設高標準農田,保障國家糧食安全作為推進質量興農、綠色興農的有力抓手,作為推進鄉村振興戰略的有效舉措,高站位謀劃部署,多層次聯動大力推進高標準農田建設,不僅使全區農田基礎設施條件得到了較大提升,還釋放了良好的經濟效益、生態效益和社會效益。
  • 描繪中阿合作美好藍圖
    描繪中阿合作美好藍圖 ——阿聯各界熱切期待習近平主席訪問  「阿聯特別珍視發展與中國的戰略夥伴關係」,阿聯文化與知識發展部顧問柴紹錦在接受本報記者採訪時表示,阿聯積極參與「一帶一路」建設,加入亞投行,與中國一起成立阿中共同投資基金,同中國合作建設「一帶一路」產能示範區。我們相信習主席此訪將進一步夯實雙方合作成果。
  • ...AI發布首個企業級隱私保護機器學習平臺與升級版AI模型殺毒軟體
    速途網12月9日訊(報導:喬志斌)今日,由清華大學人工智慧研究院、北京智源人工智慧研究院、北京瑞萊智慧科技有限公司聯合主辦的「2020第三代人工智慧產業論壇暨瑞萊智慧
  • 第三代哈弗H6「後臺」倍兒硬,顏值巨高
    在7月7日,哈弗品牌中的「國民神車」哈弗H6正式發布第三代產品,基於完全自主研發的整車平臺而生。據悉此平臺由長城汽車耗資百億打造,具備超前的智能化、超高的能效化、超強的安全防護、超凡的全球品質等眾多特點,頗有登峰造極之勢。那麼,擁有如此強硬「後臺」的第三代哈弗H6究竟有什麼變化呢?就讓我們先睹為快。
  • 有人說兒時的夢想是一幅水彩畫,描繪了未來的藍圖。...
    有人說兒時的夢想是一幅水彩畫,描繪了未來的藍圖。對於許多人來說,夢想和現實是兩條平行線,不朝著同一個方向,但有些人卻一直堅守著他們的夢想,直到實現並且變為一種信仰!作為遼寧&拜仁球迷,肇俊哲、楊鳴和穆勒就是這種信仰。東北經濟滯後,肇隊本可以像他兒時的隊友那樣選擇去其他球隊淘金,然而他沒有,寧願陪著遼足經歷降級、升級再降級,浮浮沉沉,起起落落,始終不離不棄!
  • 第三代AI技術來了,如何守護個人隱私?
    而基於第三代人工智慧的世界首款企業級AI安全平臺也已在工信部重大建設項目等領域落地應用。這次在由清華大學人工智慧研究院與北京瑞萊智慧科技有限公司等主辦的2020第三代人工智慧產業論壇上,中科院院士王小雲稱,目前人工智慧在新基建和信息通信等領域的應用正走向縱深。眼下,人工智慧也被應用於金融、電商、醫療、安防、教育等越來越多的領域。
  • 寧晉縣小劉村:紅色引領+綠色崛起 描繪鄉村振興新藍圖
    寧晉縣賈家口鎮小劉村堅持「旗幟鮮明抓黨建、抓好黨建促發展」工作思路,築牢紅色陣地,發展綠色產業,描繪出「紅色引領、綠色崛起」新藍圖,邁出鄉村振興堅實步伐。築牢「紅色陣地」鑄造堅強堡壘、凝聚黨心民心。
  • IC設計+第三代半導體 東莞松山湖「造芯」在路上
    2016年9月,中國第三代半導體產業南方基地在松山湖啟動,基地採取「1+3」的構成和運營模式,即平臺公司「南方半導體科技有限公司」+「中國南方第三代半導體技術聯合研究院」、「中國南方第三代半導體產業園」和「中國第三代半導體產業發展基金」,其中產業園以松山湖作為第三代半導體聯合技術核心區,整合周邊地區產業發展空間。