GitHub 標星 20000+,國產 AI 開源從算法開始突破|專訪商湯聯合...

2020-12-22 AI科技大本營

作者 | 阿司匹林

責編 | 李雪敬

封圖 | CSDN 下載自視覺中國

作為已經有4000多名員工的AI獨角獸,商湯的一舉一動備受關注。

從2018年開始,奔著「開源、統一、可復現」的目標,商湯開始建設人工智慧算法的開源體系。當時,商湯聯合創始人林達華教授則主導發起了OpenMMLab項目,今年商湯將其升級為商湯的算法開放體系。

經過兩年的發展,OpenMMLab在GitHub上累計收穫了超過20000 Star,覆蓋10多個研究方向、100多種算法和700多種預訓練的模型,可提供開放的基礎技術支持、接口標準和算法框架,逐漸形成了完整的體系和組織架構。

然而在自主可控的號召下,作為底層的深度學習框架更受關注。

2020年初,曠視、華為等先後開源 MegEngine 和 MindSpore,商湯 SenseParrots 的下一步動向立即成為業界關注的焦點。

實際上,商湯從創立第一天開始就自主研發深度學習平臺 SenseParrots,經過這幾年連續三代的迭代,已經形成了非常完整的工業級的深度學習平臺。

然而為何商湯選擇先開源 OpenMMLab,而不是 SenseParrots,背後是出於什麼考慮?會有開源的規劃嗎?

8月,在蘇州舉行的全球人工智慧產品應用博覽會上,CSDN 與林達華教授一起聊了聊商湯的開源規劃,以及產學研結合的那些事。

開源框架如何才能發揮更大的價值

CSDN:為什麼選擇 OpenMMLab 作為切入點?SenseParrots 是否有開源的計劃呢?

林達華:商湯有底層的超算平臺,有自主研發的深度學習框架,也有上層的各種算法和應用平臺,這些是商湯自主研發和原創積累下來的技術體系。為了響應國家的號召和社會的期待,各個 AI 企業都開始有自己的開源戰略,商湯也有自己的思考,我們理解開源的一個最重要的目的就是要能夠為科研和產業服務的開放技術生態。

開源切入點的選擇非常關鍵。現在在深度學習框架領域,雖然已經有了不少開源框架,但是目前被廣泛應用的主要就是 PyTorch 和 TensorFlow,而且已經形成了非常巨大的生態。 不管是每年數以千計的論文,還有各個企業所積累的各種各樣的產品,它們背後的代碼都是基於這兩個框架。

人工智慧領域發展到現在,已經形成了一個豐富的體系。一個人工智慧應用的建立不僅依賴深度學習框架,還需要多層次的算法、工具、以及各種工程環境的支撐。因此,單純開放一個訓練框架,沒有生態的牽引與配合,是很難形成較大的影響力的,也很難給整個業界帶來很大的價值。

我們做開源,就是要真正建立一個有影響力的開源生態。我們選擇現在相對空白的領域——視覺深度學習領域的開放算法體系OpenMMLab。即使有 PyTorch、TensorFlow 這些底層的深度學習框架,開發者要建立起來一個完備的上層應用,依然需要大量的算法和工程開發工作,而這一塊的開源體系還是處在相對初級的階段,這也是為什麼 OpenMMLab 開源了一部分算法庫,比如 mmdetection 已經取得了巨大的影響力,OpenMMLab 旗下的其它開源項目的影響力也在持續增長。目前 OpenMMLab 體系在 GitHub 已經有超過20000顆星。

有了生態影響力之後,我們以此為切入點,就可以規劃下一步。未來我們會在合適的時機開放更底層的深度學習框架 SenseParrots,它提供了跟 PyTorch 等主要框架兼容的表達層,因此跟OpenMMLab的生態是連接在一起的。只要各種上層應用都是基於 OpenMMLab 來構建,那麼我們開源 SenseParrots 等基礎設施之後,開發者的遷移成本就會大幅降低,真正帶動生態發展。

這是商湯在開源策略上的思考,也是我們朝著真正建立一個有影響力的開源生態而努力的目標。

CSDN:OpenMMLab 的主要優勢在哪?

林達華:商湯在計算機視覺和深度學習領域有著非常深厚的技術積累。每一個算法的開發都是一個非常複雜的過程,除了大量的算法設計,還需要大量的工程實踐,裡面任何一個參數設計錯誤,就會導致精度達不到應有的水平。

比如,一個簡單的檢測算法,理解其原理其實不是很花時間,但真正要實現出來,並達到預期的結果, 即使是一個受過專門訓練的博士,也會花費大量時間。就像設計一架飛機,雖然基本的物理原理大家都懂,但是要設計出符合性能要求的飛機,需要很長時間的沉澱。

商湯在過去幾年裡沉澱了大量的設計細節和經驗,因此其他人在使用商湯開源的算法時,不需要把同樣的坑再踩一遍。對於企業和科研來說,具有非常巨大的價值。

CSDN:商湯開源的目的是什麼?OpenMMLab 有商業化的規劃嗎??

林達華:商湯開源的目的更多是構建人工智慧未來的產業生態。一旦建立起生態,整個行業發展起來,大家都會認識到商湯在這個過程中能夠提供平臺的能力,就會有越來越多的夥伴和企業願意跟商湯合作,把 AI 推到到更多的行業中。生態的構建給商湯所帶來的長遠的戰略利益是非常的巨大的。

超大模型會成為未來的AI基礎設施?

CSDN:CV 領域有哪些令人興奮的技術或者應用突破?

林達華:自然語言處理領域的 BERT、GPT 等引起了學術界和產業界巨大反響。現在的AI生產模式是遇到一個新的場景,就需要重新積累數據,收集數據,訓練一個新的模型,成本高昂。但是從長遠來說,我們也在一直在探索,在 CV 領域能不能有類似於 GPT 這種非常強有力的預訓練模型。

受到 NLP 領域的啟發,CV 領域已經開始有人在探索有沒有能夠適用於多項應用的預訓練模型,在不需要迭代或者非常短時間迭代的前提下,就能夠達到實用水平。

我們已經在探索一些新模型訓練的方式方法,經過短周期的迭代,就能夠滿足大量新型應用的性能要求。但是做這方面研究的機構不是很多,因為大模型的訓練花費需要非常大的算力支撐,訓練一次的花費也是非常高昂的。

商湯在建設大型的人工智慧計算平臺,一方面支撐產業賦能,另外一方面支撐技術的突破。我們實驗室在這方面已經取得了一些初步的成果,可能在下次的會議上,就會看到我們的進展。

此外,我們也在積極探索各種無監督、半監督、弱監督方法,以及通過把模型和各種環境因素結合在一起的方法,來降低對標註數據的依賴。在今年的 ECCV,我們的多篇論文就體現了我們在這個方向所取得的成果。

CSDN:模型越來越大越來越深,這是未來的必然的發展方向嗎?它會怎樣影響AI生態?

林達華:科研是一個非常多樣化的領域,隨著超大模型的湧現,如果他們的價值真正能夠在廣大的場景裡面得到驗證,會對未來的科研分工模式帶來新的變革。

整個科研鏈條在不同的階段都需要創新,在應用領域需要創新。當GPT出來之後,它只是一個基礎的模型,然而有很多人用非常創造性的方法來使用這個模型,所以應用層可以有很多創新。而有算力資源的人,也可以對這個模型做一些簡單的迭代,應用到某種比較新奇的領域。

我其實並不認為全社會和整個科研界都是需要訓練大模型。未來整個科研分工可能會有新的改變:少數有充足計算資源和工程能力的大型研究機構或者企業會在核心模型上進行競爭,並且把這些模型能力開放出來作為基礎設施,而更多的AI研究者或者從業者則會站在巨人的肩膀上在應用側進行多種形式的創新,解決產業和生活中的各種場景問題。

大牛回歸學術界,是好是壞?

CSDN:一些著名科學家開始從企業回歸學術界,是否意味著 AI 科研和工程落地之間存在巨大的鴻溝?商湯內部是如何考核科研的成績並做好平衡的?

林達華:隨著 AI 業務越做越深入,可能在 AI 發展的初期,算法研究員起到了非常大的推動作用,但是隨著各個行業AI技術的成熟,行業需求愈發突顯,包括商湯在內的企業,商業、產品、運營等人才的作用越來越重要,但是技術創新依然是最重要的源動力。

為了把 AI 推廣到更多的行業,需要在技術方面有新的突破。這時有一部分科學家看到這些問題的存在,但是在企業裡不一定可以花很長時間投入很多資源去做,對於這些更長期的更具探索性的研究,高校或者大型實驗室是可以發揮很大作用的。所以 AI 真正持續長時間的健康發展,一定需要產學研的有機結合。

要解決現在 AI 數據成本等方面的根本問題,需要核心技術的突破。如果一個科學家從未在企業裡待過,他看不到問題在哪裡。那些在企業界待過的科學家再回歸學術界,其實也能帶來一些對整個產業發展真正有價值新思考,引領學術跟產業的融合。

商湯對這種事情一直處理得非常好,我們和很多高校實驗室都有天然的聯繫,包括我在內的研究leader都在研究機構和高校裡扮演很重要的角色,這樣就能夠在帶動高校研究資源的同時,與企業的聯動也更加緊密。

如何在機器學習的框架裡實現隱私保護性能超越GPU、FPGA,華人學者提出軟體算法架構加速AI實時化馬斯克腦機接口、BrainOS相繼發布,不努力也能有出路了跑路後再刪庫?思科前員工離職後惡意刪庫,損失達 240 萬美元

相關焦點

  • Github累積1.6萬顆星,這家AI公司的開源項目有望讓程式設計師少加班
    OpenMMLab 是商湯科技開源的一個計算機視覺領域的 AI 算法框架。自 2018 年 10 月逐步開源以來,OpenMMLab 在軟體原始碼託管服務平臺 Github 上共累積了 1.6 萬個星。開發 OpenMMLab 對於商湯來說意味著什麼?商湯對於未來 OpenMMLab 又會有怎樣的發展計劃?
  • GitHub 標星 1.6w+項目 HelloGitHub,讓開發更簡單的開源啟蒙手冊!
    如果你恰好是一個編程新手,並糾結於該如何開始 GitHub 開源項目的學習與研究,這本手冊就恰恰能很好解決這一難題,它的最大亮點就在於 GitHub 入門。與很多開發新手類似的是,他與 GitHub 之間也是由起初的好奇與困惑、到了解再到之後開始上傳自己的項目,逐漸由小白成了可以熟練運用這一工具的能人。也正是因此,他將自己的摸索過程整理出來,希望能夠讓更多開發者通過 HelloGitHub 這一項目,更好的運用開源工具,提高自己的開發能力。
  • 挑戰目標跟蹤算法極限,商湯開源SiamRPN系列算法解讀
    商湯科技智能視頻團隊首次開源其目標跟蹤研究平臺 PySOT。PySOT 包含了商湯科技 SiamRPN 系列算法,以及剛被 CVPR2019 收錄為 Oral 的 SiamRPN++。此篇文章將解讀目標跟蹤最強算法 SiamRPN 系列。
  • 目標跟蹤最強算法開源:商湯SiamRPN系列解讀
    雷鋒網(公眾號:雷鋒網) AI 科技評論消息,日前,商湯科技智能視頻團隊首次開源其目標跟蹤研究平臺 PySOT。PySOT 包含了商湯科技 SiamRPN 系列算法,以及剛被 CVPR2019 收錄為 Oral 的 SiamRPN++。此篇文章將獨家解讀目標跟蹤最強算法 SiamRPN 系列。
  • 不到1000行代碼,GitHub 1400星,天才黑客開源深度學習框架tinygrad
    tinygrad 的代碼數量不到 1000 行,目前該項目獲得了 GitHub 1400 星。 在深度學習時代,谷歌、Facebook、百度等科技巨頭開源了多款框架來幫助開發者更輕鬆地學習、構建和訓練不同類型的神經網絡。而這些大公司也花費了很大的精力來維護 TensorFlow、PyTorch 這樣龐大的深度學習框架。
  • 最強目標跟蹤算法SiamRPN++開源了,商湯出品
    紅色是商湯最新算法SiamRPN++的表現,它中選了CVPR 2019的Oral。藍色是它的對手,來自ECCV 2018的優秀前輩UPDT。自古紅藍出CP。動作太快,看不出紅藍誰更強?有截圖啊:肉眼看去,商湯SiamRPN++更勝一籌,幾乎不受複雜場景的影響。不止如此,它已經在多個數據集上成為了State-of-the-Art。同時也成了商湯Siam家族的驕傲。
  • 2020,國產AI開源框架「亮劍」TensorFlow、PyTorch
    作者 | Just2016年,百度PaddlePaddle打響了國產AI框架開源的第一槍。但多年以後,當中國的AI開發者回首國內開源往事,也準會想起那個由清華、曠視、華為在僅僅七天時間內陸續宣布AI框架開源的那個2020年的3月末。
  • 挑戰TensorFlow、PyTorch,誰才是中國AI開源框架之星?
    作為AI時代的重要的生產工具,AI開源框架是開發者研發AI應用的重要基石,也是開發者們發展路上的相伴者。 不過,縱觀市場上的開源框架,TensorFlow、PyTorch基本兩分天下,從技術能力到生態建設可以滿足大部分企業在其中構建自己的AI應用。反觀國產AI開源框架,無論從市場影響力和使用規模來看,還難與前兩者抗衡。
  • 商湯原創AI訓練框架SenseParrots的成長之路
    日前,在2019世界人工智慧大會上舉辦的WAIC開發者日活動上,商湯科技聯合創始人、香港中文大學-商湯科技聯合實驗室主任林達華,分享了《SenseParrots:AI計算平臺從技術到價值之路》的主題演講,講述了商湯如何走上自研訓練框架的道路,如何一步步地把它從一個技術框架發展為一個工業級的模型生產平臺,為商湯以AI技術賦能百業提供有力的支撐
  • 商湯開源最大目標跟蹤庫PySOT,代碼已正式上線!
    商湯開源最大目標跟蹤庫PySOT:含SiamRPN++和SiamMask等算法,介紹了來自商湯科技的STVIR(SenseTime Video Intelligence Research team)開源的目標跟蹤庫:PySOT。當時PySOT並沒有上傳代碼,所以之前的文章僅介紹了新特性,但得到大家廣泛關注。
  • 基石小夥伴 | 商湯科技62篇論文入選CVPR 2019,多個競賽項目奪冠
    再次突破,商湯62篇論文入選CVPR 2019根據官網數據,商湯科技及聯合實驗室共有62篇論文被接收,其中口頭報告(Oral)論文就有18篇。相比2018 CVPR共44篇論文入選,增幅超40%。
  • 資源│機器學習、深度學習、算法工程師等 AI 相關崗位面試需要知識
    發布的課程:從零開始學深度學習'Deep Learning from the Foundations' https://www.fast.ai/2019/06/28/course-p2v3/CS230 斯坦福深度學習課程(2018 年秋)'CS230: Deep Learning | Autumn 2018' https://www.bilibili.com
  • 專訪丨殺入智慧醫療兩年後,商湯科技的醫療AI新戰事
    在落地城市治理、汽車、零售、教育、互動娛樂等多個行業後,醫療成了商湯要攻佔的下一個城池。 堅信「學術的東西,如果不能落地也沒什麼用」,商湯科技在發展的過程中一直強調「AI賦能百業」,即利用原創的底層算法平臺,將技術賦能給其他行業。在落地城市治理、汽車、零售、教育、互動娛樂等多個行業後,醫療成了商湯要攻佔的下一個城池。
  • 專訪商湯科技聯合創始人楊帆,AI+安防這條路應該如何走?
    日前,獵雲網採訪到商湯科技聯合創始人、副總裁楊帆,了解到商湯科技對AI+安防,以及AI賦能智慧城市的一些思考。智慧安防要打通閉環楊帆認為近年來,AI技術,特別是計算機視覺技術對於各行各業都有很大的價值體現,對於安防來說,這個價值尤為突顯。變現只是一個自然的結果,之所以技術能夠得以變現,核心是這個行業的剛性需求夠強、夠大。
  • Facebook開源多款AI工具,支持遊戲、翻譯
    、Caffe 等深度學習框架之外,此次開源的還包括 DensePose(可用於人體姿態估計)、Translate(可翻譯 48 種語言)、ELF(可通過遊戲來教機器推理)等諸多 Facebook 內部使用的庫和模型。
  • FedML.ai: 美國名校博士聯合眾高校與企業發布聯邦學習開源框架
    CVer 粉絲投稿,歡迎大家分享優質工作近日,美國南加州大學USC聯合MIT、Stanford、MSU、UW-Madison、UIUC以及騰訊、微眾銀行等眾多高校與公司聯合發布了FedML聯邦學習開源框架。
  • TensorFLow可應用於AndroidThings的物聯網GitHub發布開源指南|AI...
    詳情:http://www.infoq.com/cn/news/2017/02/android-things-dev-preview-2GitHub發布開源指南,指點新手如何參與開源項目對程式設計師而言,參與開源有著難以置信的回報,比如有一個自己的出色開源項目,在技術面試能增色很多,極大加分。所以,越來越多的人在參與到開源運動中來。
  • 2018 年度 GtiHub 開源項目 TOP 25:數據科學 & 機器學習
    如果你問怎麼學習的話,我可以給你一個暗示——開源項目!世界領先的科技公司通過在 GitHub 上發布其熱門算法的代碼,對項目進行開源。2018 年,在 Google 和 Facebook 等公司的帶領下,這類開源項目大幅增加。其中最好的那部分開源項目,寫代碼的研究者還提供了預訓練模型,從而讓你我這些人不必再浪費時間從頭開始創建高難度的模型。
  • GitHub標星2.6萬!Python算法新手入門大全
    幾個印度小哥,在GitHub上建了一個各種Python算法的新手入門大全,現在標星已經超過2.6萬。這個項目主要包括兩部分內容:一是各種算法的基本原理講解,二是各種算法的代碼實現。簡單介紹下。算法的基本原理講解部分,包括排序算法、搜索算法、插值算法、跳躍搜索算法、快速選擇算法、禁忌搜索算法、加密算法等。這部分內容,主要介紹各種不同算法的原理,其中不少介紹還給出了動態示意圖,以更初學者能夠更直觀的理解。
  • AI消除馬賽克,GitHub開源項目上線三天收穫近...
    項目地址:https://github.com/beurtschipper/DepixDepix 能夠從像素化圖像截圖中恢復原圖中包含的文字密碼。Depix 背後的算法像素化常使用線性方框濾波器實現。線性方框濾波器的實現很簡單,速度很快,可以並行處理多個 block。由於線性方框濾波器是一種確定性算法,對同樣的值執行像素化通常會產生同樣的像素化 block。使用同樣位置的 block 對相同文本執行像素化,會得到同樣的 block 值。