Github累積1.6萬顆星,這家AI公司的開源項目有望讓程式設計師少加班

2021-01-11 DeepTech深科技

OpenMMLab 是商湯科技開源的一個計算機視覺領域的 AI 算法框架。自 2018 年 10 月逐步開源以來,OpenMMLab 在軟體原始碼託管服務平臺 Github 上共累積了 1.6 萬個星。

開發 OpenMMLab 對於商湯來說意味著什麼?商湯對於未來 OpenMMLab 又會有怎樣的發展計劃?

為此,DeepTech 對商湯科技聯合創始人、香港中文大學信息工程系教授林達華進行了專訪。

圖 | 商湯科技聯合創始人、香港中文大學信息工程系教授(來源:香港中文大學)

OpenMMLab 不是一個算法,而是一個覆蓋了十多個研究的垂直領域,共包含 100 多種算法和 600 多種模型的算法框架, 這是 「迄今為止最完備的算法體系和框架」。目前,OpenMMLab 聚焦的方向包括:圖像分類、檢測、語義分割、動作識別、3D 點雲、圖像的超解析度、圖像的修補、圖像的編輯、人體關鍵點的檢測還有跟蹤。這些是整個計算機視覺領域最主要的方向,也是在實際運用中被最廣泛推動的一些方向。

林達華表示,完成一個人工智慧算法的開發是一個非常複雜的過程,從簡單的想法開始到最後的落地,有很多工程化方面的問題,要花費大量的實踐和工程資源。「有了 OpenMMLab,那麼全球 AI 方面做研發的時候,很多新的想法、創造性的想法、創新性的想法,就能夠基於這樣一個空間和結構順勢形成一個落地的技術,大大地加快整個研發的流程,這也是商湯這個開源體系對於整個 AI 產研界的一個貢獻 「。

而在這個過程中,OpenMMLab 也 「能夠逐漸形成一個非常好的開源生態,讓很多的想法都可以基於這樣一個基礎進行充分的交流」。比如 OpenMMLab 框架裡的 MMDetection, 參與開發的貢獻者多達 100 多位,但其中的商湯全職員工只有幾個人,大部分的其他貢獻者是很多社區和研究機構的同學。對於商湯來說,很多通過這種形式開發出來的算法對於推進人工智慧產業賦能有很大的意義,而對於開發者來說,他們從想法到實現的路徑也大大地縮短。

與行業內其它開源項目相比,林達華認為 OpenMMLab 的最大優勢在於成體系化,從而降低開發的成本。在深度學習時代,Facebook、Google 等公司開發的算法大多是某些垂直方向單點的開源,而 OpenMMLab 基本上覆蓋了計算機視覺領域的幾乎全部主要方向。和單點的算法開源項目相比,OpenMMLab 的整個架構是統一設計的,擁有很強的適用性。

此外,開發者在試圖實現一些學術論文裡面報告的算法的時候,往往達不到論文宣稱的高精度。這是因為,對於深度學習來說,在訓練的過程中有非常多的影響因素,要尋找到這個差別、實現報告水平的精度,往往一個算法要花幾個月的時間來調參。而 OpenMMLab 已經把所有不同算法包到這個代碼庫裡面來了,替外部使用者提前 「踩坑」,後者也就不需要再把這些彎路重走一遍了。

這樣一來,開發人員在開發自己的項目時,就無需重新搭建已經實現的其它算法。只需要實現自己的創新的部分,哪怕只有兩三個函數,再把它們直接接入到 OpenMMLab 的框架,和裡面的組件進行簡單的連接,就能形成一個完整的、能落地的項目。對於應用開發來說,這是非常簡便的。

「這個的話,商湯是第一個」,林達華說。

圖 | OpenMMLab 項目(來源:OpenMMLab,GitHub)

對於未來的發展方向,林達華希望他們的努力能夠逐漸培育出一個生態的體系,從單點單個方向的開源和單篇論文的開源,逐漸走向整個領域的開源。如果得以實現,將會極大降低業界產品和項目落地的難度,以及縮短科研的路徑。

計算機視覺已經處在了產業落地的時期,目前正在從某些重要領域的工業化,逐漸走向以智慧城市、智慧醫療為例的全社會的普及化。深度學習經過這幾年的發展,在工程上、技術上已經到了非常高的水平,但這個水平的獲得依賴巨大的算力和大量數據的獲取,這樣的依賴導致 AI 在任何一個場景的落地中都面臨著比較高的開發、算力和數據的代價。

OpenMMLab 在很大程度上就是解決算法設計的代價問題。林達華認為,人工智慧從技術到產業落地的過程中,會在落地和技術兩個層面面臨挑戰。

在落地層面,最大的挑戰在於要深入理解場景的需求和痛點。不深入這個行業的時候,可能會對這個行業有一些自己的想像,但是如果進去之後就會發現它其實是另外一番風景。

而在技術層面,同樣的算法在不同場景落地的時候也會演化出不同的版本,這會給技術積累產生很大的挑戰。

OpenMMLab 是通過統一架構的方式來解決這個問題的。統一的框架意味著在這個平臺上,大家都聚焦某種架構去做這些算法,雖然具體的部分可能是有不一樣的,但是有很多的部分是共享的。每一個部分在落地過程中都會改進,隨著時間的發展,整個體系各個部分都在持續成長,整個體系的技術能力也就可以每過一兩年都有一個巨大的提升。

在林達華看來,一個優秀的開源項目,應該獲得持久的生命力。一開始可能是一些同事或者研發的人員在開發,後來如果這個開源項目真真正正給到社區、行業、學術界以價值,就可以吸引到越來越多的貢獻者,參與到這個項目共同的創造裡面來。原先的參與者可能已經不再繼續維持這個項目了,但這個社區依然能夠推動項目的發展,保持一個正向的循環。

對於未來,商湯也希望可以逐漸從內容生態、算法生態的開放,延伸到更加基礎層面的設施。他們期待這樣一個開源開放生態的構建,可以在未來讓整個人工智慧領域的研發和落地都得到加速的發展。

相關焦點

  • 盤點:2017年GitHub上30個優秀的機器學習項目
    我們比較了過去一年近8,800個開源的機器學習項目,從中選擇了30個表現優秀的,分享給讀者。這是一份非常精彩的名單,它仔細挑選了2017年1月至12月之間發布的最佳開源機器學習庫、數據集和應用程式。我們綜合考慮項目的受歡迎程度,參與度和進展程度來評估項目質量。為了給讀者更直觀的感受,使用GitHub上的關注量(星星數量)來表示項目熱度。
  • 從噹噹看打造高星 GitHub 開源項目的經驗
    噹噹在 2015 年 9 月開始開源了內部使用的分布式作業調度框架——elastic-job,然後又於 2016 年 1 月 18 日開源了資料庫分庫分表中間件——sharding-jdbc。噹噹後端使用 Java 開發較多,所以這次做的開源項目也是基於 Java 開發者而非產品型。目的是讓 Java 程式設計師能夠順暢使用,對於非 Java 用戶可能未必友好。
  • 如何上傳項目到GitHub
    本文轉載自【微信公眾號:吾非同】,經微信公眾號授權轉載,如需轉載與原文作者聯繫 圖丨pixabaygithub作為開源的分布式版本管理系統,上面有眾多的優秀開源項目,也有豐富的學習資料,熟練使用github也是程式設計師的一項必備技能。
  • 推薦一些 GitHub 上值得前端學習的開源實戰項目,進階必看!
    相信不管你的需求是什麼,本項目都能幫助到你。項目作者還搭配了一些教程文章,很值得看!地址:https://github.com/PanJiaChen/vue-element-admin2. blog-vue-typescript此項目是基於 Vue 全家桶 + TypeScript + Element-UI 技術棧的簡潔時尚博客網站。
  • 如何在 Github 上發現優秀的開源項目?
    問到點子上了,GitHub 其中一個最重要的作用就是發現全世界最優秀的開源項目,你沒事的時候刷刷微博、知乎,人家沒事的時候刷刷 GitHub ,看看最近有哪些流行的項目,久而久之,這差距就越來越大,那麼如何發現優秀的開源項目呢?這篇文章我就來給大家介紹下。1.
  • 嚇一跳,阿里雲在GitHub上有400多個開源項目,應該是中國第一吧
    作為一個程式設計師,入行這麼多年來一直關注著開源的事情,今天心血來潮查了一下國內一些公司關於開源的信息,沒想到阿里和旗下的阿里雲讓我有點吃驚,排名第一不是百度、騰訊這些標榜自己是科技公司的巨頭,反而在GitHub全球貢獻排行榜上,阿里是唯一一家入圍GitHub 頂尖貢獻名單的中國公司。
  • 6月份Github上熱門的開源項目
    6月份GitHub上熱門的開源項目排行已經出爐啦,一起來看看上榜詳情吧!這個項目的代碼實現。5. vanillawebprojectshttps://github.com/bradtraversy/vanillawebprojectsStar 6589這是一個使用HTML5,CSS和JavaScript構建的20多 個小型項目的集合,一共包含20個項目,諸如電影訂票頁面,視頻播放器界面、匯率計算器、
  • 2018 年度 GtiHub 開源項目 TOP 25:數據科學 & 機器學習
    如果你問怎麼學習的話,我可以給你一個暗示——開源項目!世界領先的科技公司通過在 GitHub 上發布其熱門算法的代碼,對項目進行開源。2018 年,在 Google 和 Facebook 等公司的帶領下,這類開源項目大幅增加。其中最好的那部分開源項目,寫代碼的研究者還提供了預訓練模型,從而讓你我這些人不必再浪費時間從頭開始創建高難度的模型。
  • 從星際2深度學習環境到神經機器翻譯,上手機器學習這些開源項目必...
    另外,雷鋒網 AI 研習社在原文的基礎上補充了部分開源項目,為 AI 開發者提供更加詳細的 AI 項目和資源。機器學習是用數據來學習、概括、預測的研究。近幾年,隨著數據的開發、算法的改進以及硬體計算能力的提升,機器學習技術得以快速發展,不斷延伸至新的領域。
  • 救救程式設計師,管管996!Python之父力挺中國碼農,GitHub近23萬星
    自3月27日996.ICU話題誕生以來,目前GitHub Trending已產生相關4個同類項目,總計獲得近23萬的Star,其中996.ICU並一度衝向GitHub榜單,引發國內外的廣泛關注和熱議。可當程式設計師開始訴控996加班時,中國多款瀏覽器竟然匪夷所思地禁止訪問996.ICU的GitHub網址。
  • 萬物皆可內卷,開源社區GitHub都有人刷數據了
    事實上,「刷星」這事兒並不是只有小公司會做,去年韓國電信巨頭SKT就在GitHub上同步了自己的一個開源項目「metatron-discovery」,並且為其搞了一個營銷活動,即點star後截圖就可免費獲得星巴克或炸雞等商品禮券。儘管無論是此次曝光中這家做AI框架的公司,還是韓國的SKT,最終都迫於輿論壓力,很快取消了類似營銷意味很重的這類活動。
  • 安全專業人士最愛的 19 個 GitHub 開源項目
    GitHub上有許多開源項目可供安全專業人士選擇,而且每天都有新的項目出現。不妨將這些項目添加到你的工具庫,讓你工作起來更得心應手。
  • 2018年阿里巴巴關於Java重要開源項目匯總
    地址:https://github.com/justified/tedis12.開源 Java 診斷工具 ArthasArthas(阿爾薩斯)是阿里巴巴開源的 Java 診斷工具,深受開發者喜愛。Arthas 採用命令行交互模式,同時提供豐富的 Tab 自動補全功能,進一步方便進行問題的定位和診斷。
  • GitHub全面封殺YouTube-dl!這個7.2萬Star熱門開源項目,真的沒救了?
    最近,GitHub封殺了一個熱門開源項目—YouTube-dl相信很多程式設計師,或者經常使用YouTube網站的朋友,對它應該非常熟悉。該項目從上新至今收割了7.2萬顆Star,深受GitHub用戶青睞。既然如此,GitHub為何還要將其封殺?其原因是它觸動了美國唱片業協會-RIAA的利益。
  • 封殺兩年後,GitHub重向伊朗開發者打開大門
    2019年GitHub「斷供」伊始,抱怨聲連綿不斷長期以來,美國一直對包括伊朗在內的多個國家實施廣泛制裁,這些制裁禁止任何美國公司與被制裁國家的公民做生意。此外,這些制裁也適用於那些活動直接或間接涉及美國的非美國公司——其中也包括僅通過美國銀行或Visa等支付機制進行支付的公司。因此,這些制裁涉及範圍之廣,真的可想而知。
  • 2018 年最富含金量的 6 款開源機器學習項目
    不可否認這種變化有其弊端,然而我們要看到它積極的一面,隨著能夠迅速被商業轉化的研究增多,對整個行業產生了不可估量的積極影響,這在機器學習開源領域尤其明顯。最後,一起看看過去一年中 6 個最實用的機器學習項目。這些項目都已發布了代碼與數據集,方便個人和小團隊進行學習並創造價值,這些項目也許在理論上並不具有開創性,卻非常實用。
  • 程式設計師為教師妻子開發專屬應用;2020 最佳開源項目出爐;中國構建全...
    本周熱門項目  0、程式設計師為教師妻子開發應用:將 iPhone 變成文檔攝像頭  https://9to5mac.com/2021/01/06/iphone-document-camera-overviewer-zoom/  據 9to5Mac 報導,受疫情影響,老師和學生通過
  • 取代GitHub?工信部公布2020開源託管平臺項目結果
    日前,工業和信息化部技術發展司公布了「2020年開源託管平臺項目」的招標結果,工業和信息化部選擇Gitee來構建「面向中國的獨立,開放原始碼託管平臺」。據悉,該項目由深圳市奧思網絡科技有限公司(開源中國)牽頭,與國家工業信息安全發展研究中心、工業和信息化部電子第五研究所、中國電子技術標準化研究院、華為技術有限公司、奇安信科技集團股份有限公司、浪潮電子信息產業股份有限公司、蘇州稜鏡七彩信息科技有限公司、北京理工大學、西南科技大學共10家單位組成的聯合體中標該項目,聯合體將依託碼雲Gitee建設中國獨立的開源託管平臺。
  • 程式設計師除了去上班怎樣賺外快?
    一方面是因為掙的是美刀比較划算,像給WordPress寫支付+發送註冊碼這種大家一個周末就能做完的項目,也可以到200~300美刀;另一方面是在國外接單子比較隱蔽。 國內 shixian.com 的價格也很不錯,但是強烈建議大家不要在介紹中透漏實名和真實的公司部門信息,因為這實在太高調了。
  • GitHub 的 App 會開源嗎?
    開源是現在的一個大趨勢,雖然有很多軟體確實是不需要開源的,但作為全球最大的開源軟體平臺,自己的產品不應該開源麼?當今很多開源項目的開發都是在 GitHub 上或者通過 GitHub 進行的。對於這一開發者用來「吃飯」的工具,改善 GitHub App 的使用體驗能有效的改善開發者的工作效率和方式,所以如果該項目真的開源,一定會吸引很多開發者參與其中。