清華孵化、張鈸加盟的這家公司,現在把「第三代人工智慧」落地了

2021-01-17 量子位
魚羊 發自 凹非寺
量子位 報導 | 公眾號 QbitAI

一家清華孵化的公司,最近「口出狂言」了。

回顧2020的AI大事件,燒了微軟10000張GPU的GPT-3必定榜上有名。

這也讓人們不禁感嘆:這年頭,AI簡直就是「暴力美學」。

但就在行業內的大多數仍在大數據、大算力這個方向上狂奔的時候,這家公司另闢蹊徑找尋不一樣的AI落地之路:

AI落地,不是僅僅靠大數據、大算力就能解決的問題。

AI產業落地速度不及預期,是AI算法本身的問題。

是時候從AI自身底層能力增強出發,打開數據和算力之外的全新發展維度了。

還不只是說說而已,最近,在「2020第三代人工智慧產業論壇暨瑞萊智慧RealAI戰略發布會」上,他們還真就將清華實驗室裡最前沿的第三代人工智慧技術體系搬了出來,商用化落地了:

還有可解釋機器學習建模平臺、拿下了世界冠軍的deepfake「殺手」……

張鈸院士還在親自給這家公司的產品路線定下了關鍵詞:發展安全、可信、可靠和可擴展的AI技術。

公司的名字,叫RealAI,孵化自清華人工智慧研究院。

所以,RealAI基於第三代人工智慧技術打造的產品,究竟有何不同?

AI發展的新維度,又具體指的是什麼?

一起來看個究竟。

RealSecure:首個編譯級隱私保護機器學習平臺

在AI技術越來越強調落地產業的當下,數據作為一種新型生產要素,是各行各業數位化、智能化轉型中繞不過去的基礎一環。

那麼,問題就來了:

現實的情況就是,在很多高價值商業場景,如金融、醫療、交通場景中,有價值的數據常常分散在不同的機構和用戶手中,形成了大大小小的數據孤島,明顯制約了AI能力的提升。

但想要數據出庫,打破數據孤島,卻又面臨著一個更為棘手的難題:隱私安全如何保障?

分布式隱私保護機器學習,就是為應對這一問題而生的一種新興解決方案,它能使多方合作完成學習目標,但又不需要各方傳輸原始數據,可以做到「數據可用不可見」。

這並不是一個全新的概念。事實上,早在2016年,谷歌就在這個技術方向上提出了聯邦學習的概念。但時至今日,相關技術的商業化應用仍然面臨著三大痛點:

1、性能差、速度慢

由於隱私保護機器學習需要多方配合執行,中間的通信就會造成很大的性能損失。

另外,多方需要以加密形式完成參數交換,加密會帶來高達百倍的性能損失。

同時,由於超參數設置等與現有的機器學習生態存在差距,隱私保護機器學習的速度慢了近千倍。本地只需花費幾十秒的模型訓練,在隱私保護下卻需要數小時;特徵篩選、調參、驗證又需要幾十上百次重複運行……

2、不兼容於現有機器學習生態,改動投入大

隱私保護機器學習不同於傳統機器學習,是分布式、密碼學、人工智慧三個領域的結合。

要想投入商用,各家機構需要組織團隊學習分布式、學習密碼學;學習使用新算法、新框架,並在新平臺下執行程序。

這相當於拋棄了長期以來人工智慧團隊積累下的經驗和方法論,重建隱私保護機器學習團隊,或堆人力將原有機器學習框架改寫成隱私保護機器學習框架。

投入與代價之大,正是隱私保護機器學習難以商業化落地的重要原因之一。

3、無法自證安全性

隱私保護最核心也最本質的問題是保障數據的安全,這就要求平臺自身的安全性也應該是可被檢驗的。

但當前的隱私保護機器學習模式是純黑盒的,安全性只能靠專家審計——由於平臺代碼量巨大,這對於商業化應用其實是不現實的。

且實際生產環境中,是否真的按照審計時提供的代碼邏輯執行,同樣會受到來自客戶的質疑。

而RealAI這次推出的隱私保護機器學習平臺RealSecure (RSC),就從底層技術創新出發,針對這三個問題來了個逐一擊破。

據RealAI介紹,RealSecure是業內首個編譯級隱私保護機器學習平臺,其研髮結合了人工智慧、密碼學、分布式系統三大領域的技術突破。其核心模塊隱私保護AI編譯器能夠自動將普通機器學習算法程序轉換為分布式的隱私安全程序。

密碼學+AI算法雙重優化,性能提升約40倍

藉助密碼學優化、AI算法優化等改進實現,RealSecure在性能上實現量級式飛躍。

在某實際風控場景中,RealSecure模型訓練相比某主流國產開源框架性能提升40倍,耗時從4小時40分鐘縮減至6分鐘。考慮到特徵工程與自動調參環境,隱私保護下完成全流程建模,總耗時實現從日級別到小時級別的飛躍。

繼承機器學習生態,實現「活字印刷」級隱私保護機器學習

而所謂的兼容主流機器學習生態,可以簡單理解為,通過RSC,已有的成熟機器學習算法無需改寫,只要調用函數,在AI編譯器裡重新編譯一遍,就能自動完成從普通機器學習算法到隱私保護機器學習算法的轉變。

這樣的功能基於算子層技術實現。

具體而言,就是將隱私保護機器學習算法公式表達向更細顆粒度解構,解構成「算子」,通過算子的靈活組合來適配機器學習算法公式,擺脫重複改寫的繁瑣工作。

RealAI CEO田天打了一個比方:

如果說此前將機器學習算法改寫成隱私保護機器學習算法的方式,是「雕版印刷」,RSC實現的就是「活字印刷」。「算子」就是活字印刷裡的一個個活字。

也就是說,RSC能完成現有機器學習算法平臺框架與隱私保護機器學習平臺框架的統一。

另外,RSC還對外提供了jupyter建模入口,讓數據科學家能夠以最熟悉的方式使用隱私保護機器學習,進一步提升了易用性。

安全透明,「所見即所信」

在安全性方面,RSC以首創數據流圖的形式,將所有中間計算過程、內部算子執行完全公開,底層執行的計算同樣是可審計的。

這就保證了兩點:

算法協議是安全的,所見即所信;

底層的執行與算法協議是一致的。

RealSafe:AI算法的「殺毒軟體」

數據隱私安全之外,針對算法的可靠性,RealAI這一次也全新升級了首個企業級人工智慧安全平臺RealSafe

網絡安全時代,網絡攻擊的大規模滲透催生出殺毒軟體,來發現計算機潛在病毒威脅,提供一鍵系統優化、清理垃圾跟漏洞修復等功能。

而現在,越來越深入到人們日常生活中的AI算法們,也正在面臨類似的安全風險。

以人臉識別為例,去年,RealAI就通過一副印有特殊紋理圖案的對抗攻擊眼鏡,成功「刷臉」解鎖了他人的手機。

而量子位此前也曾報導過,有研究人員採用模型後門攻擊技術,僅用一條膠帶就把特斯拉忽悠瘸了,把35看成85,導致了異常加速。

是不是有些細思極恐了?

那麼,有沒有一個AI平臺,能一鍵檢測算法漏洞,並給出防護建議呢?

RealSafe做的,就是填補這麼一個空位,一方面能夠對AI模型的安全性進行全面檢測,另一方面能提供多種增強安全性的方案。

在模型安全性檢測方面,在全新升級之後,除了能針對對抗樣本攻擊,給出安全評分以及將檢測場景從人臉識別拓展到了目標檢測、圖像分類外,RealSafe 2.0還增加了模型後門檢測功能,能夠在不獲取模型結構及參數等具體信息的情況下,分辨出僅在特定輸入情況才會識別出錯平時表現正常的被植入後門的模型。

並且,整個檢測過程全界面化操作,用戶無需具備專業的模型安全算法知識和編程開發經驗。

而在模型安全性提升方面,RealSafe平臺提供包括對抗樣本去噪、對抗樣本檢測、對抗訓練在內的多種防禦解決方案,並可以自動化評估每種方案針對被測模型的安全性提升效果。

值得一提的是,受益於研發團隊豐富的AI對抗攻防經驗,RealSafe集成多項國際領先的AI對抗攻防算法,榮獲多項世界AI安全大賽冠軍,其中部分已開源成果作為代表性方法已被業內廣泛引用。

目前,RealSafe 已在工信部重大建設項目以及某電網公司落地應用。

「AI落地,不是僅靠大數據、大算力就能解決的問題」

事實上,從RealAI埋頭苦幹兩年,打造的一系列產品可以看出,這家從清華園裡走出來的公司,正在圍繞算法可靠數據安全應用可控三大方向,構建AI基礎設施能力。

而這,也正是張鈸院士今年以來反覆強調的第三代人工智慧之路。

在紀念《中國科學》創刊70周年的專刊中,張鈸院士作為通訊作者發表了文章《邁向第三代人工智慧》,指出是時候把第一代的知識驅動和第二代的數據驅動結合起來,通過利用知識、數據、算法和算力等4個要素,構造更強大的人工智慧。

而清華博士、RealAI CEO田天和他的團隊,則站在產業的角度,解讀了這種「另闢蹊徑」的必要性。

數據和算力,解決了AI的溫飽問題,作為「外部驅動力」,驅動了AI產業「第一增長曲線」的出現。

但隨著AI賦能傳統行業的逐步深入,這樣的增長模式瓶頸已然顯現。

田天指出,傳統行業由於場景複雜和隱私安全等因素,無法完全依賴行業大數據提供足夠信息,同時新一輪的算力躍進還未到來,這就導致AI在許多小樣本的高價值場景,如金融、工業、醫療等領域中,落地速度不如預期。

因此,想要進一步推進AI發展,在數據平臺和算力平臺之外,要從AI自身底層能力增強出發,打造AI原生基礎設施,發展出AI的「內生驅動力」,從而在相同的數據、算力條件下,更好地支撐AI賦能產業,打開AI產業化全新的市場空間。

而第三代人工智慧技術體系,包括貝葉斯深度學習、可解釋機器學習、AI安全對抗攻防、新一代知識圖譜、隱私保護機器學習等技術,恰恰為打造AI原生基礎設施提供了支撐。

也就是說,從產業化的需求來看,產業落地本身就是需要第三代人工智慧來開創新局面的。

那麼,RealAI會在這個過程中扮演一個什麼樣的角色呢?

田天給出的答案很「底層」:打造完整的AI原生基礎設施體系,使得所有場景不論大小、不論價值高低,均能在AI發展過程中受益。

而這,或許也就是RealAI與其他AI公司不同之處:通過與清華大學的緊密合作,能夠在技術上堅持長期主義,立志在工業界推動底層技術的變革。

田天說:

在應用中碰到技術難題時,我們不是見一個解決一個,修修補補,而是發現一個問題就看出一類問題,並通過底層技術框架、平臺的突破,助力產業的升級。

底層技術是我們最領先的一個優勢,未來會繼續保持下去。

本文系網易新聞•網易號特色內容激勵計劃籤約帳號【量子位】原創內容,未經帳號授權,禁止隨意轉載。

12月16日,李開復博士、譚建榮院士、清華唐傑教授,以及來自小米美團百度華為愛奇藝小冰亞信浪潮容聯澎思地平線G7等知名AI大廠的大咖嘉賓將齊聚MEET2021大會,期待關注AI的朋友報名參會、共探新形勢下智能產業發展之路。

一鍵三連「分享」、「點讚」和「在看」

科技前沿進展日日相見~



相關焦點

  • 張鈸:AI從技術到應用,關鍵是零到一的創新
    張鈸院士認為,深度學習觸及天花板;人工智慧在語音識別、圖像識別、圍棋三個領域外,很難再獲得發展;擔心「機器人統治人類」,完全是遠慮,但腦機接口研究的潛在風險卻近在咫尺。所以發展人工智慧要慎重,同時也要有敢闖無人區的魄力,有了從0到1的突破,人工智慧才能迎來更大發展機遇。
  • 孵化公司賣給蘋果、百度,艾倫人工智慧研究所到底是啥
    3年間,AI2 Incubator孵化的企業逐漸落地,Kitt.ai和Xnor.ai就分別屬於其孵化出的第一批和第二批企業。智東西挖掘了艾倫人工智慧研究所孵化器項目的「前世今生」,通過解讀它的發展歷程、運作模式,來找到其孵化創企的秘訣。
  • 首次學生自發組織,亞洲大學聯盟14個國家和地區近200青年聚首清華共話「人工智慧新時代」
    楊斌代表清華歡迎來自亞洲大學聯盟各成員院校的研究生同學,並再次解讀了聯盟對亞洲高等教育界的交流與發展的重要意義。他指出,聯盟要讓師生多互動多合作多唱主角,而首屆論壇選擇人工智慧主題別有意義,不僅人工智慧技術本身,也包括其對社會和人類的未來的影響,越來越得到了亞洲乃至全球各國的重視。
  • 這家公司為了校招真是拼了:CEO現場freestyle滑板鞋,還請來機器狗...
    在《一站到底》俘獲一票迷弟迷妹的汪仔,來到清華依舊魅力不減。不只清華本校的學生奮勇發起挑戰,「隔壁學校」北大的高材生也奔上臺來比賽答題。「《三國演義》中,蔣幹在群英會上中了誰的計謀盜取了假書信?」「酷MA萌是哪個卡通形象的中文官方名?」「世界上第一個咖啡膠囊產品是由哪家公司推出的?」
  • 校友故事 | 給全球頂尖人工智慧初創企業插上騰飛翅膀的清華MBA...
    百度風投是中國科技巨頭百度旗下專注於人工智慧領域的風險投資公司。華薩曼說,如果沒有讀清華MBA的經歷,他不可能得到這份工作。作為中國科技巨頭百度旗下的風險投資基金——百度風投在美國業務的負責人,他的職責是尋找有望塑造未來的人工智慧初創企業。每天,他要聽取不同創業者的匯報,內容涵蓋從可以摺疊衣物的機器人到能夠理解人類基因組並根據每位病人具體需要開藥的人工智慧技術等。在2013年獲得清華MBA學位前,華薩曼一直生活在創業者的精神世界中。
  • AI發展自驅動,這家公司如何用AI成就人工智慧裡更智能的人工
    這顯然對不上軟體疊代更新的理念。再加上這些人員的培訓組織運營成本等等,一筆合格的數據採集業務的交付可能高達幾萬甚至數十萬元。這也是為什麼會有一種觀點表示,人工智慧不僅不會替代勞動力,反而會增加就業。在海外,率先察覺到由人工智慧所催生的新一片藍海——數據採集和數據標註,最早由Appen為代表,後來隨著MightyAI、Scale這樣的公司出現,逐漸走向穩定。
  • 向螞蟻學習,這家公司用人工智慧成功預測12個奧斯卡獎項
    向螞蟻學習,這家公司用人工智慧成功預測12個奧斯卡獎項 澎湃新聞記者 王心馨 2017-02-28 08:23 來源:澎湃新聞
  • 區情| 坐標上海「智」高點,孵化AI創新最高地
    從「出生」起,這家新型研發機構就肩負著兩個「使命」:匯聚頂尖人才,做突破性基礎研究。「把一個瓶子抓起來這件事,現在普通機器人都能做了,但要連續把一塊塊積木搭起來,難度卻很大,傳統算法目前還無法讓機器人做複雜邏輯推理。」吳翼希望通過算法讓機器人更智能,而不是按照人們事先預定好的程序運行。為實現這一目標,吳翼正在招兵買馬。
  • 不滿足於爆款遊戲,這家公司還想要打造中國的 ATLAS | 愛範兒
    不滿足於爆款遊戲,這家公司還想要打造中國的 ATLAS 你玩兒過別踩白塊嗎?(一系列反響不錯的移動應用,為獵豹積累了不少活躍用戶,尤其是海外市場)當然這家公司不僅僅滿足於打造爆款遊戲,昨天獵豹移動在北京舉辦了全球媒體開放日,在帶領媒體參觀了全新的辦公大樓之後,獵豹移動 CEO 傅盛宣布
  • 編程貓為鶴壁市人工智慧教育落地提供教學資源支持
    鶴壁市教體局副局長牛萬斌在啟動儀式上表示,淇濱區湘江中學、牟山小學等10所人工智慧實驗室的落地,會讓的成百上千的孩子走進人工智慧課堂,目睹編程教育的風採,體驗人工智慧教育的快樂。  淇濱區教體局局長徐延平指出,人工智慧教育示範區是推進淇濱教育高質量發展的重要舉措,是開展人工智慧課程進校園的一次積極探索,更是利用優質教育資源與國內人工智慧頂尖企業開展深度合作的有益嘗試。  會上,淇濱區副區長李偉、編程貓公立教育KA總監王芳對鶴壁市10所人工智慧示範學校授予「編程貓中國青少年下一代編程示範基地」榮譽牌。
  • 新基建浪潮下,百度將成為推動人工智慧落地重要力量
    來源:時刻頭條企業智慧財產權正在加速推動中國人工智慧新基建發展。近日,國家知識產權局智慧財產權發展研究中心發布了《新基建領域(人工智慧)智慧財產權發展狀況調查研究報告》(以下簡稱為報告),報告認為,以專利為核心的智慧財產權在人工智慧關鍵技術創新和產業應用中具有強烈的關聯性和控制力。以百度、華為等為代表的我國企業有效推動了人工智慧技術落地應用。
  • 甜甜圈網紅直播公司不懼行業洗牌,加盟業務逆勢發展
    甜甜圈網紅直播公司不懼行業洗牌,加盟業務逆勢發展 財訊網 | 2021-01-14 14:49:51 運營數個直播間,負責運營管理,將素人培養成直播,孵化成網紅……這樣的加盟商你想不想試試?自從直播行業興起以來,越來越多的投資人將目光投向了成就人氣網紅的直播間,可面對當前正在洗牌的直播行業,他們該如何選擇?
  • 獨家對話比特大陸AI掌舵人王俊:解讀AI晶片與智慧城市的落地經
    畢業於清華學堂計算機科學實驗班(姚班)後,王俊陸續在網易有道、谷歌、百度工作,積累了大量人工智慧經驗。王俊向我們分享了2016年時,他作為算法從業者的思考:「大家常常說『人工智慧=數據+算法+算力』。網際網路上的數據很多,這不用贅述;算法方面,幾乎每年各個機器學習領域的國際頂會都有新的算法成果出現;但算力方面,大家用到的基本還是以CPU和GPU為主,缺乏一個大的爆發。」
  • 左手百度右手富士康,這家公司要為你定製虛擬女友
    智東西 文 | 寓揚還記得老羅(羅永浩)在2016年的錘子發布會中特別感謝而又誤讀成「獨角獸」的公司嗎?沒錯,這家公司正是三角獸。也或許正應了老羅的話,隨著語音交互的爆發,這家專注語義理解的人工智慧創業公司也順風而上,迅猛發展。
  • 10大領航企業,50家明星公司
    現在,是時候公布最終結果了! 2018年11月5日,量子位正式開啟了年度評選。在過去2個月時間裡,共有超過200家企業與機構報名,參與評選。
  • 那些自己孵化雞苗自己養殖的人,現在過得怎麼樣了?
    通俗地來說,一元豬就是指單一品種的豬交配出來的後代,二元豬既是只兩個品種的豬交配出來的後代,而三元豬是指兩個品種的豬交配出來的後代(既二元豬)再與第三個品種的豬交配,其所產的後代就是三元豬。一元、二元和三元豬的生產性能,生活習性,體型體重等都有很大的不同。同樣的,家禽也一樣。不管是雞鴨還是鵝,也有一代,二代和三代的區別。