清華孵化、張鈸加盟的這家公司,現在把「第三代人工智慧」落地了

2020-12-16 騰訊網

魚羊 發自 凹非寺

量子位 報導 | 公眾號 QbitAI

一家清華孵化的公司,最近「口出狂言」了。

回顧2020的AI大事件,燒了微軟10000張GPU的GPT-3必定榜上有名。

這也讓人們不禁感嘆:這年頭,AI簡直就是「暴力美學」。

但就在行業內的大多數仍在大數據、大算力這個方向上狂奔的時候,這家公司另闢蹊徑找尋不一樣的AI落地之路:

AI落地,不是僅僅靠大數據、大算力就能解決的問題。

AI產業落地速度不及預期,是AI算法本身的問題。

是時候從AI自身底層能力增強出發,打開數據和算力之外的全新發展維度了。

還不只是說說而已,最近,在「2020第三代人工智慧產業論壇暨瑞萊智慧RealAI戰略發布會」上,他們還真就將清華實驗室裡最前沿的第三代人工智慧技術體系搬了出來,商用化落地了:

首個編譯級隱私保護機器學習平臺RealSecure,讓隱私保護學習從「雕版印刷」走向「活字印刷」

首個企業級人工智慧安全平臺RealSafe,相當於AI算法的「殺毒軟體」

還有可解釋機器學習建模平臺、拿下了世界冠軍的deepfake「殺手」……

張鈸院士還在親自給這家公司的產品路線定下了關鍵詞:發展安全、可信、可靠和可擴展的AI技術。

公司的名字,叫RealAI,孵化自清華人工智慧研究院。

所以,RealAI基於第三代人工智慧技術打造的產品,究竟有何不同?

AI發展的新維度,又具體指的是什麼?

一起來看個究竟。

RealSecure:首個編譯級隱私保護機器學習平臺

在AI技術越來越強調落地產業的當下,數據作為一種新型生產要素,是各行各業數位化、智能化轉型中繞不過去的基礎一環。

那麼,問題就來了:

現實的情況就是,在很多高價值商業場景,如金融、醫療、交通場景中,有價值的數據常常分散在不同的機構和用戶手中,形成了大大小小的數據孤島,明顯制約了AI能力的提升。

但想要數據出庫,打破數據孤島,卻又面臨著一個更為棘手的難題:隱私安全如何保障?

分布式隱私保護機器學習,就是為應對這一問題而生的一種新興解決方案,它能使多方合作完成學習目標,但又不需要各方傳輸原始數據,可以做到「數據可用不可見」。

這並不是一個全新的概念。事實上,早在2016年,谷歌就在這個技術方向上提出了聯邦學習的概念。但時至今日,相關技術的商業化應用仍然面臨著三大痛點:

1、性能差、速度慢

由於隱私保護機器學習需要多方配合執行,中間的通信就會造成很大的性能損失。

另外,多方需要以加密形式完成參數交換,加密會帶來高達百倍的性能損失。

同時,由於超參數設置等與現有的機器學習生態存在差距,隱私保護機器學習的速度慢了近千倍。本地只需花費幾十秒的模型訓練,在隱私保護下卻需要數小時;特徵篩選、調參、驗證又需要幾十上百次重複運行……

2、不兼容於現有機器學習生態,改動投入大

隱私保護機器學習不同於傳統機器學習,是分布式、密碼學、人工智慧三個領域的結合。

要想投入商用,各家機構需要組織團隊學習分布式、學習密碼學;學習使用新算法、新框架,並在新平臺下執行程序。

這相當於拋棄了長期以來人工智慧團隊積累下的經驗和方法論,重建隱私保護機器學習團隊,或堆人力將原有機器學習框架改寫成隱私保護機器學習框架。

投入與代價之大,正是隱私保護機器學習難以商業化落地的重要原因之一。

3、無法自證安全性

隱私保護最核心也最本質的問題是保障數據的安全,這就要求平臺自身的安全性也應該是可被檢驗的。

但當前的隱私保護機器學習模式是純黑盒的,安全性只能靠專家審計——由於平臺代碼量巨大,這對於商業化應用其實是不現實的。

且實際生產環境中,是否真的按照審計時提供的代碼邏輯執行,同樣會受到來自客戶的質疑。

而RealAI這次推出的隱私保護機器學習平臺RealSecure (RSC),就從底層技術創新出發,針對這三個問題來了個逐一擊破。

據RealAI介紹,RealSecure是業內首個編譯級隱私保護機器學習平臺,其研髮結合了人工智慧、密碼學、分布式系統三大領域的技術突破。其核心模塊隱私保護AI編譯器能夠自動將普通機器學習算法程序轉換為分布式的隱私安全程序。

密碼學+AI算法雙重優化,性能提升約40倍

藉助密碼學優化、AI算法優化等改進實現,RealSecure在性能上實現量級式飛躍。

在某實際風控場景中,RealSecure模型訓練相比某主流國產開源框架性能提升40倍,耗時從4小時40分鐘縮減至6分鐘。考慮到特徵工程與自動調參環境,隱私保護下完成全流程建模,總耗時實現從日級別到小時級別的飛躍。

繼承機器學習生態,實現「活字印刷」級隱私保護機器學習

而所謂的兼容主流機器學習生態,可以簡單理解為,通過RSC,已有的成熟機器學習算法無需改寫,只要調用函數,在AI編譯器裡重新編譯一遍,就能自動完成從普通機器學習算法到隱私保護機器學習算法的轉變。

這樣的功能基於算子層技術實現。

具體而言,就是將隱私保護機器學習算法公式表達向更細顆粒度解構,解構成「算子」,通過算子的靈活組合來適配機器學習算法公式,擺脫重複改寫的繁瑣工作。

RealAI CEO田天打了一個比方:

如果說此前將機器學習算法改寫成隱私保護機器學習算法的方式,是「雕版印刷」,RSC實現的就是「活字印刷」。「算子」就是活字印刷裡的一個個活字。

也就是說,RSC能完成現有機器學習算法平臺框架與隱私保護機器學習平臺框架的統一。

另外,RSC還對外提供了jupyter建模入口,讓數據科學家能夠以最熟悉的方式使用隱私保護機器學習,進一步提升了易用性。

安全透明,「所見即所信」

在安全性方面,RSC以首創數據流圖的形式,將所有中間計算過程、內部算子執行完全公開,底層執行的計算同樣是可審計的。

這就保證了兩點:

算法協議是安全的,所見即所信;

底層的執行與算法協議是一致的。

RealSafe:AI算法的「殺毒軟體」

數據隱私安全之外,針對算法的可靠性,RealAI這一次也全新升級了首個企業級人工智慧安全平臺RealSafe。

網絡安全時代,網絡攻擊的大規模滲透催生出殺毒軟體,來發現計算機潛在病毒威脅,提供一鍵系統優化、清理垃圾跟漏洞修復等功能。

而現在,越來越深入到人們日常生活中的AI算法們,也正在面臨類似的安全風險。

以人臉識別為例,去年,RealAI就通過一副印有特殊紋理圖案的對抗攻擊眼鏡,成功「刷臉」解鎖了他人的手機。

而量子位此前也曾報導過,有研究人員採用模型後門攻擊技術,僅用一條膠帶就把特斯拉忽悠瘸了,把35看成85,導致了異常加速。

是不是有些細思極恐了?

那麼,有沒有一個AI平臺,能一鍵檢測算法漏洞,並給出防護建議呢?

RealSafe做的,就是填補這麼一個空位,一方面能夠對AI模型的安全性進行全面檢測,另一方面能提供多種增強安全性的方案。

在模型安全性檢測方面,在全新升級之後,除了能針對對抗樣本攻擊,給出安全評分以及將檢測場景從人臉識別拓展到了目標檢測、圖像分類外,RealSafe 2.0還增加了模型後門檢測功能,能夠在不獲取模型結構及參數等具體信息的情況下,分辨出僅在特定輸入情況才會識別出錯平時表現正常的被植入後門的模型。

並且,整個檢測過程全界面化操作,用戶無需具備專業的模型安全算法知識和編程開發經驗。

而在模型安全性提升方面,RealSafe平臺提供包括對抗樣本去噪、對抗樣本檢測、對抗訓練在內的多種防禦解決方案,並可以自動化評估每種方案針對被測模型的安全性提升效果。

值得一提的是,受益於研發團隊豐富的AI對抗攻防經驗,RealSafe集成多項國際領先的AI對抗攻防算法,榮獲多項世界AI安全大賽冠軍,其中部分已開源成果作為代表性方法已被業內廣泛引用。

目前,RealSafe 已在工信部重大建設項目以及某電網公司落地應用。

「AI落地,不是僅靠大數據、大算力就能解決的問題」

事實上,從RealAI埋頭苦幹兩年,打造的一系列產品可以看出,這家從清華園裡走出來的公司,正在圍繞算法可靠、數據安全和應用可控三大方向,構建AI基礎設施能力。

而這,也正是張鈸院士今年以來反覆強調的第三代人工智慧之路。

在紀念《中國科學》創刊70周年的專刊中,張鈸院士作為通訊作者發表了文章《邁向第三代人工智慧》,指出是時候把第一代的知識驅動和第二代的數據驅動結合起來,通過利用知識、數據、算法和算力等4個要素,構造更強大的人工智慧。

而清華博士、RealAI CEO田天和他的團隊,則站在產業的角度,解讀了這種「另闢蹊徑」的必要性。

數據和算力,解決了AI的溫飽問題,作為「外部驅動力」,驅動了AI產業「第一增長曲線」的出現。

但隨著AI賦能傳統行業的逐步深入,這樣的增長模式瓶頸已然顯現。

田天指出,傳統行業由於場景複雜和隱私安全等因素,無法完全依賴行業大數據提供足夠信息,同時新一輪的算力躍進還未到來,這就導致AI在許多小樣本的高價值場景,如金融、工業、醫療等領域中,落地速度不如預期。

因此,想要進一步推進AI發展,在數據平臺和算力平臺之外,要從AI自身底層能力增強出發,打造AI原生基礎設施,發展出AI的「內生驅動力」,從而在相同的數據、算力條件下,更好地支撐AI賦能產業,打開AI產業化全新的市場空間。

而第三代人工智慧技術體系,包括貝葉斯深度學習、可解釋機器學習、AI安全對抗攻防、新一代知識圖譜、隱私保護機器學習等技術,恰恰為打造AI原生基礎設施提供了支撐。

也就是說,從產業化的需求來看,產業落地本身就是需要第三代人工智慧來開創新局面的。

那麼,RealAI會在這個過程中扮演一個什麼樣的角色呢?

田天給出的答案很「底層」:打造完整的AI原生基礎設施體系,使得所有場景不論大小、不論價值高低,均能在AI發展過程中受益。

而這,或許也就是RealAI與其他AI公司不同之處:通過與清華大學的緊密合作,能夠在技術上堅持長期主義,立志在工業界推動底層技術的變革。

田天說:

在應用中碰到技術難題時,我們不是見一個解決一個,修修補補,而是發現一個問題就看出一類問題,並通過底層技術框架、平臺的突破,助力產業的升級。

底層技術是我們最領先的一個優勢,未來會繼續保持下去。

— 完 —

相關焦點

  • 中科院院士張鈸:發展第三代AI技術,中美處在同一起跑線上
    算法黑箱、模型不安全易被幹擾,這些目前人工智慧領域裡存在的問題,都向研究者提出了一個問題:未來,我們該向如何發展人工智慧技術,從而使AI可以迎來二次曲線增長?清華人工智慧研究院院長、中國科學院院士張鈸以及他帶領的學生們給出的答案是:第三代人工智慧技術。
  • 清華張鈸、北大朱松純、南大周志華,他們都是……
    據公開資料,北京通用人工智慧研究院作為北京人工智慧科學發展的重大戰略部署,將聚焦人工智慧前沿技術,以全球創新的「小數據、大任務」為研究範式,以多學科高度融合、國際學術交流、培養中國新一代人工智慧青年科學家為宗旨,匯聚超千名人工智慧專業領域研究員、學者、專家,致力於將人工智慧大一統理論框架實踐落地,共同推動中國原創人工智慧的發展與創新,打造新一代通用人工智慧平臺。
  • 清華張鈸院士專刊文章:邁向第三代人工智慧
    機器之心轉載來源:清華大學人工智慧研究院作者:張鈸、朱軍、蘇航在這篇評述文章中,清華大學人工智慧研究院院長、中國科學院院士張鈸教授闡述了自己對於「第三代人工智慧」的看法。
  • 清華系AI公司發布首款人工智慧殺毒軟體
    在近日舉辦的2020第三代人工智慧產業論壇上,中國科學院院士、清華大學人工智慧研究院院長張鈸指出,現在很多人工智慧公司估值很高,但是營收很少,問題在於沒有解決算法和數據的不安全性,造成深入到更多高價值的場景速度較慢。「企業要做大做強,必須解決安全和魯棒(穩定強健)的問題。」
  • 人工智慧怎麼教?清華張鈸院士剛剛給我們講了一堂課
    機器之心報導參與:澤南、蛋醬今天上午,張鈸院士暢談了清華是怎樣辦人工智慧專業的。4 月 30 日,中國科學院院士、清華大學人工智慧研究院院長張鈸為分享了關於清華大學計算機系人工智慧專業建設的經驗與思考。在著名計算機科學排名「CS Ranking」中,清華大學的人工智慧學科在 2010 年至今排名僅次於 CMU,如果時間拉近到 2015 年至今範圍內,清華則排名第一。
  • 第三代人工智慧:「統計」還是「類腦」 —新聞—科學網
    張鈸的開場白獲得了現場聽眾的一片掌聲。 此前,在紀念《中國科學》創刊70周年的專刊中,張鈸曾撰寫以《邁向第三代人工智慧》為題的署名文章。在這篇文章中,張鈸指出,人工智慧在60多年的發展歷史中,一直存在兩個相互競爭的範式,即符號主義與連接主義。
  • 85歲中科院院士張鈸來南京「創業」,他要在這兒幹件大事
    儘管已85歲高齡,張鈸說起自己來南京創業的初衷和對未來的期許,思路格外清晰。他開玩笑說,自己一輩子只做了兩件事,一個是在清華大學讀書,一個是在清華教書。張鈸1953年考入清華大學電機專業,在清華念了5年書後留校工作,機緣巧合開始研究人工智慧領域。「在清華工作62年,從1978年開始一直在研究人工智慧技術,直到2018年退休。」
  • 第三代人工智慧來了!知識、數據、算法、算力缺一不可
    每經記者:張韻 每經編輯:魏官紅圖片來源:攝圖網當人工智慧走過技術爆發,進入落地應用、創造價值的新時期,AI賦能傳統行業的重要性日益凸顯。過去,AI科學家們常常被問及人工智慧可以為人們的生活帶來哪些改變,而現在,他們更多地在思考基於深度學習的人工智慧技術如何載入人類意識,實現可信AI。
  • 成立兩年,清華出身的他們用產品描繪出了基於第三代AI的基礎設施藍圖
    「第一代知識驅動的 AI 利用知識、算法和算力 3 個要素構造 AI;第二代數據驅動的 AI 利用數據、算法與算力 3 個要素構造 AI。由於第一、二代 AI 只是從一個側面模擬人類的智能行為,因此存在各自的局限性,不可能觸及人類真正的智能。」清華大學人工智慧研究院院長、中國科學院院士張鈸等人在今年 9 月份的一篇專刊文章中這樣寫道。
  • 張鈸院士回應任正非:解決卡脖子就要造新燈塔,照亮新航道
    這是清華大學人工智慧研究院院長、中國科學院院士張鈸教授,對任正非把基礎研究比喻為燈塔的回應。也是張鈸教授給當前人工智慧發展提出的新思路,因為新燈塔和新航道,正是他反覆強調的第三代人工智慧。在紀念《中國科學》創刊70周年的專刊中,張鈸教授以通信作者發出《邁向第三代人工智慧》文章,指出是時候把第一代的知識驅動和第二代的數據驅動結合起來,通過利用知識、數據、算法和算力等 4 個要素,構造更強大的人工智慧。
  • 第三代人工智慧基礎設施背後,是一次技術應用的常識普及運動
    12月9日舉辦的「2020第三代人工智慧產業論壇」上,清華系AI公司瑞萊智慧RealAI發布了一系列AI基礎設施,就將更安全、可靠、可信及可拓展的第三代人工智慧作為核心,來推動企業智能化升級。與以往基於深度學習的數智化解決方案相比,有哪些不同?要回答這個問題,需要先來看看今天橫亙在企業與AI應用落地之間的困境。
  • 張鈸院士:人工智慧的魅力就是它永遠在路上 | CCAI 2019
    清華大學人工智慧研究院院長、中國科學院院士張鈸上午進行演講,題目是「邁向第三代人工智慧的新徵程」。雷鋒網 AI 科技評論根據現場速記把演講內容整理如下。如果這些領域裡面的應用場景符合五個條件,大家大膽去做,絕對會超過人。根據現在計算機強大的力量,是可以做到這一點的。但是,這些應用裡面,也有大量不符合那五個條件的,大家必須下功夫,不能指望靠現在的第一代、第二代人工智慧去解決它。
  • 張鈸院士:人工智慧的魅力就是它永遠在路上|CCAI 2019
    人工智慧為百業賦能的過程,將會形成巨大的產業;「人工智慧科技服務產業」,就是利用人工智慧的發展成果,推動更廣泛的產業應用,實現人工智慧為百業賦能的價值。清華大學人工智慧研究院院長、中國科學院院士張鈸上午進行演講,題目是「邁向第三代人工智慧的新徵程」。雷鋒網(公眾號:雷鋒網) AI 科技評論根據現場速記把演講內容整理如下。
  • 清華系AI公司瑞萊智慧發布首個企業級隱私保護機器學習平臺
    原標題:清華系AI公司瑞萊智慧發布首個企業級隱私保護機器學習平臺
  • 成立兩年,他們用產品描繪出了基於第三代AI的基礎設施藍圖
    在這篇文章中,他們還首次全面闡述了第三代人工智慧的理念,提出第三代人工智慧的發展路徑是融合第一代的知識驅動和第二代的數據驅動的人工智慧, 利用知識、數據、算法和算力 4 個要素, 建立新的可解釋和魯棒的 AI 理論與方法,發展安全、可信、可靠和可擴展的 AI 技術(詳細信息請參見:《清華張鈸院士專刊文章:邁向第三代人工智慧(全文收錄)
  • 這家創企用AI化解安全難題
    如今飛速發展的人工智慧(AI)應用中,依賴海量數據、不具有確定性的深度學習算法仍是主旋律。在上周三的2020第三代人工智慧產業論壇上,清華大學人工智慧研究院院長、中國科學院院士張鈸教授的一番言辭發人深省。他提到全球前40個AI獨角獸的估值大約分布在70-500億區間,但銷量均基本不到估值的10%,也就是沒有找到市場,問題出在什麼地方?
  • 頂尖985院校的「人工智慧」對口院系和專業一覽表!附清華人工智慧攻略,請務必收藏!
    到現在,人工智慧進入大數據階段,浙大在計算機視覺領域已經建立了相當大的優勢。5、哈爾濱工業大學哈爾濱的可謂王牌工科院校,在全國工科高校實力排行榜中位居第二!僅次於清華!在全國高校學科評估中,哈工大的計算機科學與技術學科位列全國第4名,是國家重點一級學科,並進入ESI全球前1%的研究機構行列。
  • 瑞萊智慧發布第三代AI新品,RealAI驅動AI產業「第二增長曲線」
    12月9日,由清華大學人工智慧研究院、北京智源人工智慧研究院、北京瑞萊智慧科技有限公司聯合主辦的「2020第三代人工智慧產業論壇暨瑞萊智慧RealAI戰略發布會」在北京召開。清華大學人工智慧研究院院長、中科院院士張鈸,清華大學教授、中科院院士王小雲,清華大學教授、安全人工智慧創新中心主任朱軍、北京智源人工智慧研究院院長黃鐵軍,清華大學技術轉移研究院院長王燕、瑞萊智慧RealAI CEO田天等出席大會。
  • 張鈸院士:吃飽飯沒事幹了,才能去搞科學研究
    現在提出第三代人工智慧,非常明確地講,我們的第一代、第二代AI,都只是序幕,都還沒到正戲正劇。第三代人工智慧才是這個正劇,這個正劇之於中國,機會也很明顯。 第一,歷史上看,就信息革命而言,它從二戰前後開始,至今差不多有80年,我們有40多年沒有參與其中。
  • 清華系RealAI發布首個企業級隱私保護機器學習平臺與升級版AI模型...
    清華大學教授、中科院院士王小雲,清華大學人工智慧研究院院長、中科院院士張鈸,清華大學教授、安全人工智慧創新中心主任朱軍,北京智源人工智慧研究院院長黃鐵軍,清華大學技術轉移研究院院長王燕,瑞萊智慧RealAI CEO田天等出席大會。