商湯原創AI訓練框架SenseParrots的成長之路

2020-12-22 啟點網絡科技

近些年,AI科技革命為世界和人們的生活帶來巨大改變,而這一輪AI浪潮爆發的核心就是深度學習。2014年,商湯科技自主研發了深度學習訓練框架SenseParrots,成為商湯發展原創AI技術的基石。

日前,在2019世界人工智慧大會上舉辦的WAIC開發者日活動上,商湯科技聯合創始人、香港中文大學-商湯科技聯合實驗室主任林達華,分享了《SenseParrots:AI計算平臺從技術到價值之路》的主題演講,講述了商湯如何走上自研訓練框架的道路,如何一步步地把它從一個技術框架發展為一個工業級的模型生產平臺,為商湯以AI技術賦能百業提供有力的支撐。

如下為林達華演講的重要部分節錄:

女士們,先生們,各位朋友,早上好。感謝機器之心提供了這麼好的機會,讓對深度學習框架有興趣的朋友在一起進行交流。我也非常榮幸能在這裡和大家做分享。

今天,我想和大家講一個故事,一個關於商湯原創的故事。在這個故事裡,我希望和大家分享,我們如何走上自研訓練框架的道路,如何一步步地把它從一個技術框架發展為一個工業級的模型生產平臺,為商湯以AI技術賦能百業提供有力的支撐。

增長的算力和應用場景促進AI成功

讓我們從身處的這個大時代講起吧。正如我們在這個大會上可以見到,這幾年AI科技革命已經給我們的世界、我們的生活帶來了巨大的改變。

這一輪AI浪潮的爆發,在我看來,不是單一要素的結果。它是深度學習算法、以GPU為代表的高性能算力、以及大數據的積累,歷史性地匯聚在一起而促成的。過去七八年深度學習波瀾壯闊的發展歷程中有幾次重要的標誌性事件:2012年AlexNet獲得了圖像識別的突破,並在當年ImageNet比賽奪冠;接下來,新的網絡結構層出不窮,從VGG到ResNet,圖像識別的準確率不斷被刷新;到了2017年,深度學習在自然語言處理也取得了重大突破;2019,從零開始訓練的AlphaGo Zero橫空出世。這些事件,一次接一次地點燃了人們對AI的熱情和憧憬。

當我們從一個大的時間尺度去觀察,我們會發現,這些成就的背後,不僅僅是算法模型的改進,它也蘊含著另外一個重要的趨勢,就是算力的指數增長。這幾年,新模型所需要的算力持續增長,從AlexNet到AlphaGo Zero,短短幾年,算力增長超過30萬倍。

從某種意義上說,這幾年AI的巨大成功,其實是指數增長的算力和有價值的應用場景發生連接的結果。而深度學習框架是這種連接背後最重要、最核心的技術支撐。

原創之路 異常艱辛

在這一輪AI科技浪潮中,商湯走到今天,成為一個領先的Al企業,核心在於兩個字:原創。現在,深度學習可以說是家喻戶曉,可是在七年前,這個名詞還沒有多少人知道。在2012年,整個CVPR接收的論文之中,只有兩篇和深度學習有關,都是來自於我們實驗室。2013年,ICCV有8篇深度學習相關的論文,6篇是來自我們。因此,我們在GTC 2016年被評為世界前十人工智慧先鋒實驗室之一,也是亞洲唯一入選的。我想這段小歷史很好地詮釋了商湯的原創精神。

在我們最初探索深度學習的時候,沒有TensorFlow,沒有PyTorch,甚至沒有GPU。我們需要手寫C++程序來完成整個計算過程,訓練一個模型需要一兩個月。正是在這樣的環境中,我們一步步開拓出深度學習的視覺應用之路;也正是因為經歷了這樣的艱辛,我們深切地認識到訓練框架的核心意義,可以說,訓練框架定義了算法研發的空間,框架的空間有多大,我們就能走多遠;框架的能力有多強,我們就能走多快。

因此,從商湯創建之初,我們就決定了要研發自己的訓練框架。這背後有三點考慮:第一,我們在研發過程中會有很多和社區不一樣的需求,我們需要及時提供技術支持;第二,當我們有了自研的框架,在算法和技術上有底氣選擇自己的發展道路,而不受制於開源框架提供的能力;第三,我們希望在研發訓練框架的過程中,不斷建立我們在基礎系統層面的核心技術積累,讓我們不僅在算法層面也在系統層面走在前列。

我們把這個訓練框架命名為SenseParrots,這個名字寄託了我們良好的祝願,聰明美麗,又能自由飛翔。

SenseParrots破繭化蝶

從2014年到現在,將近5年時間,SenseParrots和商湯共同成長。在2015年,我們幾乎和TensorFlow同時推出第一代SenseParrots在內部發布並投入使用,率先具備了多機多卡聯合訓練和多路徑執行等領先業界的特性。

三年之後,第二代SenseParrots發布,這一代它不但具有了一系列更加重要的、靈活的、高性能的特性,而且也逐漸成為了商湯賦能AI產業的戰略支撐。

第一代SenseParrots專注於靜態網絡多機多卡的優化。通過對計算調度、內存分配、數據IO、通信協同等聯合深入優化,它在2015年發布時已經在靜態卷積網絡訓練上展示了超越同時代開源框架的卓越性能。

通過極致的內存優化,SenseParrots可以在有限的顯存裡訓練超大型的網絡;通過通信和IO的優化,它實現了在64卡上接近線性的加速。

在這第一代SenseParrots上,我們訓練了一個1207層卷積神經網絡,這是已公開的最深的卷積神經網絡;我們還研發了PolyNet,打破了當時單網絡在ImageNet圖像識別上的性能記錄,並把這個記錄保持了將近一年。有了這些性能強勁的網絡支持,我們在ImageNet和ActivityNet等一系列比賽中取得多個冠軍。

商湯目前已經建立了完整的平臺技術棧,它從底而上分為四個層次。最底下是基礎系統,主要提供存儲、網絡、任務調度、集群管理等基礎的系統能力;在基礎系統之上,我們建立了SenseParrots。第二代的SenseParrots已經從一個單一的訓練系統,發展為一個具有全方位能力的AI模型生產體系。在這個體系裡面,我們發展了一系列包括從表達、編譯、調度、計算、通信、以及模型部署的一系列技術模塊。在SenseParrots的支持上,我們建立了算法工具鏈,裡面包含了商湯業務所需的各種基本算法組件;最上面一層,是各個垂直業務方向的應用平臺。

深度學習走出實驗室邁向產業落地

雖然我們取得了一些成績。但是,AI的發展可謂一日千裡。如果我們不能把握技術發展的脈絡,就會落後於時代。

當時間來到2015年,深度學習這個領域也開始發生了很多深刻的變化。最重要的一個變化是深度學習技術開始走出實驗室,邁向大規模的產業落地。在這個大趨勢下,技術層面也呈現了很多新的趨勢:

首先,編程模式從靜態網絡結構描述向動態計算過程轉變,這讓我們可以研究更靈活的算法,表達在工業級場景所需要的更複雜的邏輯。

第二,深度模型走出了實驗室機房,落地到了更多樣化的設備,比如手機、攝像頭、汽車和機器人。

第三,大家的注意力開始從在各大比賽中刷榜,逐漸轉到了更有價值的工作,在真正的產品中落地。我們不再不惜代價地追求大模型高精度,而是更多地關注性能和代價的平衡。這種新的追求催生了很多新的探索,比如像Mobile Net這樣專為移動端設計的網絡結構,又比如量化和模型壓縮。

第四,人們開始關注生產力的價值,讓AI去解決AI研發過程中的重複勞動。因此,各種自動化方法,比如自動設計網絡結構、自動設計損失函數等等開始成為新的熱點。

在這些繁花似錦的技術和應用創新背後,我們可以看到,AI的技術發展從單一的精度競賽,變成了多元的價值追求。這是任何一項技術從實驗室走向產業的必經之路。

AI產業化所帶來的新技術趨勢、更多元的追求,也給訓練平臺的未來發展提供了新的空間。

雖然在過去的幾年,主流的開源框架比如TensorFlow和PyTorch的生態逐漸成熟,但是它們更多是面向普及應用的,它們所提供的能力和AI產業化的需求依然存在著很大的距離。

我們的願景是讓AI賦能百業,就不可避免需要面對上面的這些問題。對於SenseParrots來說,這是挑戰,也是重要的機遇。

商湯經過近五年的發展,已經讓AI技術深入落地到十幾個行業,為數以百計的大型企業賦能。這種廣泛而深入的落地實踐,是AI計算平臺研發的豐沃土壤,也是我們的獨特優勢。紮根在商湯的業務土壤,我們能在第一線深切了解到AI產業化的主要挑戰和痛點,也走出了不同於主流開源框架的差異化道路。

我們的定位,是打造一個面向AI產業賦能的計算平臺。具體來說,我們的平臺有三個重要的研發目標:首先,全面支持業務範疇內的工業級應用,特別的是支持工業級模型,包括具有複雜邏輯的動態模型的大規模訓練;第二,針對我們的業務場景,進行極致優化,建立產品級的核心競爭力;第三,我們也關注研究員的生產力,全面提高研發和產品迭代的速度。

因此,在第二代SenseParrots研發過程中,我們超越了對個別性能指標的追求,以更加全局的角度審視我們的發展路徑,力求真正為AI產業賦能帶來價值。我們憧憬十年之後,在我們的世界裡AI將會無處不在,在這樣的世界裡,AI不會取代人類,它將在我們的生活,在我們的工作,在我們世界的方方面面,成為我們最可信賴的技術。我們正在朝著這樣的願景,朝著這樣的目標努力,也希望與在座的各位共勉。

謝謝大家。

相關焦點

  • 商湯科技發布SenseDrive DMS駕駛員監控系統 原創AI技術四大優勢為...
    該系統以原創領先的計算機視覺與深度學習技術,通過深度學習技術和嵌入式晶片優化技術結合,實現對駕駛員疲勞駕駛、駕駛分心、危險動作等駕駛員狀態的實時智能檢測與提醒,為駕乘安全保駕護航。安全是駕車出行的基礎,為更好地減少人為失誤導致的事故、保障人們的駕駛安全,商湯科技以原創AI技術賦能汽車行業,推出了SenseDrive DMS駕駛員監控系統,這一系統擁有功能齊備、響應速度快、識別準確率高、魯棒性好四大核心優勢。
  • 商湯首款原創機器人SenseRover X自動駕駛小車斬獲Red Dot Award
    同時,作為商湯首款原創機器人產品, SenseRover X代表了對行業賦能、搶佔AI機器人藍海的實力證明。模仿學習採用了商湯原創的網絡模型,車載攝像頭在實地環境中探查到圖像,後臺計算機可以自動將圖像回歸到直行、轉彎、避障、加速和減速等駕駛行為。而遷移學習則基於商湯機器人的仿真訓練平臺,在虛擬環境中訓練機器人,從而讓小車快速「舉一反三」、「觸類旁通」,將自己預先習得的駕駛策略,更加快速、準確地遷移到現實場景與駕駛任務中去。
  • 商湯原創AI技術再出海,AI Cloud在泰國落地開花
    商湯科技持續推動原創AI技術出海,用AI雲能力助力泰國地產行業創新。根據合作協議,商湯將為SKY ICT提供行業領先的AI Cloud雲技術,由此為Sansiri提供創新的「智慧樓宇」解決方案,幫助管理人員顯著提高其安全管理、停車管理、指揮調度中心等地產行業各個環節的運營效率,降低管理成本。此次合作,也是商湯科技深度布局和拓展東南亞市場的重要一步。
  • GitHub 標星 20000+,國產 AI 開源從算法開始突破|專訪商湯聯合...
    經過兩年的發展,OpenMMLab在GitHub上累計收穫了超過20000 Star,覆蓋10多個研究方向、100多種算法和700多種預訓練的模型,可提供開放的基礎技術支持、接口標準和算法框架,逐漸形成了完整的體系和組織架構。 然而在自主可控的號召下,作為底層的深度學習框架更受關注。
  • 商湯科技原創AI技術再出海,AI Cloud加持泰國地產行業發展
    此次合作的籤署,不僅充分詮釋了商湯科技將AI賦能傳統行業的發展理念,更加速了商湯科技AI雲平臺的國際化戰略布局,攜手合作夥伴全面推進多行業、多場景的智能化升級。安全、高效和舒適是地產行業發展的三大核心要素。
  • 像商湯科技這種AI企業關注的都是什麼
    為了揭開商湯科技的神秘面紗,2020年1月2日下午,未來企業家俱樂部一行學習參訪了商湯科技北京總部,商湯科技聯合創始人楊帆、華創資本合伙人熊偉銘和英諾天使基金合伙人&臻雲創投合伙人祝曉成進行了精彩的分享。 此篇內容根據楊帆的分享整理而成。(後面還有精彩問答喲) 第一部分:讀懂商湯 1、何為「商湯」?
  • 專訪丨殺入智慧醫療兩年後,商湯科技的醫療AI新戰事
    在落地城市治理、汽車、零售、教育、互動娛樂等多個行業後,醫療成了商湯要攻佔的下一個城池。 堅信「學術的東西,如果不能落地也沒什麼用」,商湯科技在發展的過程中一直強調「AI賦能百業」,即利用原創的底層算法平臺,將技術賦能給其他行業。在落地城市治理、汽車、零售、教育、互動娛樂等多個行業後,醫療成了商湯要攻佔的下一個城池。
  • 偏愛英文域名的商湯科技或將融資上市?
    前段時間,三位消息人士稱,商湯科技考慮在最新一輪融資後在科創板上市。預計此輪融資15億美元,融資後公司估值100億美元。不過,商湯科技對此表示「不予置評」。商湯科技成立於2014年,這是一家人工智慧領域的獨角獸公司,專注於計算機視覺和深度學習的原創技術研發。自成立以來,已融資超過10億美元。查詢發現,商湯科技啟用的官網域名SenseTime.com,註冊時間為2001年,其中SenseTime是「商湯科技」的外文名,契合了品牌名,對品牌宣傳、推廣有一定的推動作用。
  • AAAI 2020論文解讀:商湯科技提出新弱監督目標檢測框架
    現有的弱監督目標檢測方法大多數是基於多實例學習框架的,對於每個物體類別,基於多實例學習框架的方法傾向於學習圖像中該類中特徵最明顯的物體,並對於每張圖片選取得分最大的一個物體框進行訓練,其他被忽略的物體實例容易使學習網絡陷入局部最優,進而影響弱監督目標檢測的性能。
  • 商湯教育:AI樹人
    做AI基礎教育,短期內註定賠錢,但卻得到了商湯內部的高度支持,甚至「賠錢的業務做得很開心、很有激情」。因為在商湯,包括創始人湯曉鷗教授在內,很多人都還在高校任教,有著教書育人的情懷。正如商湯科技教育事業部總經理戴娟所說,「公司的氣質就像是一所學校。」
  • 商湯連發11款新品,把自己逼上「AI落地」極限
    在接入能力上,SenseGo支持感知設備(普通攝像頭、senseu廣告機、senseDLC)和邊緣AI設備(集群伺服器、SenseGo edgecube)。總體而言,商湯的智慧零售平臺是人貨場細粒化的數據驅動。
  • 賦能上海|商湯科技創始人湯曉鷗:沒有AI行業只有AI+
    商湯科技創始人、香港中文大學教授湯曉鷗在2018世界人工智慧大會主論壇上發言。澎湃新聞記者 趙昀 圖當天,以「人工智慧賦能新時代」為主題的2018世界人工智慧大會在上海開幕,於徐匯西岸舉行的大會主論壇集聚了全球人工智慧領域最具影響力的科學家和企業家,以及政府重要領導人,圍繞人工智慧領域的技術前沿、產業趨勢和熱點問題發表演講和進行高端對話。
  • 商湯科技趙峰:AI賦能企業構建「數位化轉型護城河」
    因此,數位化轉型已經成為價值企業快速成長必不可少的要素。但長時間以來,基於深度學習和神經網絡驅動的人工智慧技術,在企業數位化轉型過程中,還處於一個若即若離的狀態,參與感一向較弱。回顧人工智慧技術與企業之間的關係, 「2020《商學院》商業領袖峰會」上,商湯科技企業業務總經理趙峰將其分為四個階段:平行發展、風雲際會、交織融合、螺旋上升。
  • 深度學習框架 fast.ai 2.0 正式發布
    經歷了長久的等待之後,深度學習框架 fast.ai 2.0 版本終於正式發布了。fast.ai 課程,是為了踐行 Jeremy Howard 「讓深度學習不再酷」的承諾。這話的意思是也消除掉門檻,讓更多沒有高等數學和統計專業基礎的人,都有機會來了解和應用深度學習。關於這個事兒,我在《如何從零基礎學最前沿的 Python 深度學習?》一文中,給你介紹過。
  • 商湯組了「最強大腦」局,正兒八經解釋為啥搞起電競AI
    選手們的訓練,使用的是擴展版的近端策略優化(PPO)方法,這也是OpenAI現在默認的強化學習訓練方法。這些智能體的目標是最大化未來獎勵的指數衰減和。在訓練策略的過程中,OpenAI Five沒有用到人類遊戲數據,而是通過自我博弈。與 Dota2 類似的電競 AI ,還有國內的手遊《王者榮耀》——騰訊絕悟 AI。
  • 8比特數值也能訓練模型?商湯提出訓練加速新算法丨CVPR 2020
    雖然論文錄取難度逐年增大,但是商湯科技在CVPR的成績一直領先行業,今年的CVPR成績依舊斐然。 本文提出了用於加速卷積神經網絡訓練過程的INT8訓練技術,採用8比特數值訓練模型,可以極大地提升訓練速度,減少計算損耗,而且訓練精度幾乎無損,該論文也入選了CVPR 2020。
  • 2020商湯獎學金「拍了拍」優秀的你,申報通道正式開啟
    2020「商湯獎學金」申報正式開啟。 「商湯獎學金」是商湯科技面向國內一流高校拔尖人才設立的高額獎學金,旨在發掘、鼓勵和培養國內人工智慧領域最具潛質的本科生。(包括香港、上海、北京、深圳、成都、杭州、京都、東京、新加坡等各地辦公室),並繼續提供一對一專業導師全程培養、訓練集群支持、前沿實踐項目探索、頂會論文指導等全方位支持,助力學生在人工智慧前沿領域的研究和探索上一路騰飛!
  • 商湯:一家披著AI外衣的教育公司?
    這成了驅動商湯這臺「融資機器」的第一桶金。根據天眼查數據,此後 5 年,商湯共完成 10 輪融資。最瘋狂的 2018 年,投資人通過各種渠道擠進頭部 AI 公司,這一年,商湯完成 3 輪總計超 22 億美金的融資,這個數字甚至超過了一些上市公司的市值。這樣的瘋狂註定不會持續太久。
  • 商湯科技CEO徐立:AI是對商鞅方升和九章算術的傳承和創新
    錢江晚報·小時新聞記者 張雲山  8月31日,作為2019世界人工智慧大會(WAIC 2019)的戰略合作夥伴,商湯科技在上海世博中心舉辦「智煥新動能」人工智慧主題論壇。商湯科技聯合創始人、執行長徐立作了題為《人工智慧發展觀—傳承與創新》的演講。他通過算籌、杜虎符、商鞅方升等中國古代原創把現場觀眾帶回了兩千多年前的戰國時期,並與商湯的人工智慧計算平臺、人臉識別身份認證、AR測量等人工智慧技術相對照,進行了一場穿越千年的科技文化傳承與創新的探討。
  • AI+AR賦能遊戲新玩法 商湯科技「笑傲」ChinaJoy
    2019年8月2日,上海——2019第十七屆中國國際數碼互動娛樂展覽會(ChinaJoy)在上海正式開幕,全球領先的人工智慧平臺公司商湯科技攜手合作夥伴,共同展示了三款基於商湯SenseAR平臺開發的AR內容,其中包括商湯科技與完美世界基於3D國風武俠手遊《新笑傲江湖》合力打造的Avatar互動體驗演示、與騰訊合作的 AR探索手遊《一起來捉妖》手勢互動體驗演示,以及商湯自主開發的多人互動