長期主義者曠視:開源人工智慧算法框架,能為中國帶來什麼?

2020-12-15 手機鳳凰網

新冠肺炎的影響是前所未有、空前巨大,但同時也帶來了一次前所未有、空前巨大的全社會轉型時刻。

以前很多業務都要去門店、銀行、學校、醫院……但是疫情之下,我們被迫快速適應了許多新的生活方式。

汪丁丁(著名經濟學家、北京大學國家發展研究院經濟學教授)教授說,人類社會必須找到經濟活動的新模式。

以前用不好手機軟體的父母,現在每天流暢的在生鮮電商上下單買菜;人們出門戴口罩成為習慣,進地鐵接受智能測溫也成為習慣;直播電商/線上辦公/線上辦學再臨風口,「媽媽守著李佳琦,孩子守著釘釘群」。

很多人都覺得,這些新功能/新服務像早就準備好了一樣,不像是應對疫情匆匆上馬的項目。

是的,你想的沒錯。其實我們國家已經持續建設多年5G、大數據、人工智慧、工業網際網路和物聯網五大類數字基礎設施。這次疫情,是將很多本來就很厲害的技術,加速進入到我們的生活中。

最近,發展這些數字基礎設施有了一個統一的名字——「新基建」。

一、「新基建」時代,提升「AI大腦」卻成了老大難

這場新基建聲勢浩大。

拋開電力、交通和新能源垂類的基建領域,最核心的就是萬物互聯的新一代信息技術:5G、大數據中心、人工智慧、工業網際網路和物聯網為代表的「新基建」,將在未來20年支撐經濟發展。

而且「新基建五兄弟」之間,聯繫是非常緊密的,你中有我,我中有你。

人工智慧是大腦,負責思考;大數據是大腦中儲存的知識,負責提供經驗;5G是神經網絡,負責高速傳達大腦指令;工業網際網路/物聯網是四肢,負責執行大腦的命令。

「新基建五兄弟」之間,是一個看起來特別完美的協作關係,只是人工智慧稍稍高出其他四兄弟,作為大腦起到統領整個「新基建」的作用。

此前我們也發文介紹過人工智慧在疫情期間成為了人類看不見的「盟友」,通過大數據的分析與智能的預測,加拿大的人工智慧監測平臺BlueDot在2019年12月31日就曾向人類發出警告。

在之後的全球抗疫戰之中 ,我們也看到了人工智慧不僅預測方面的能力,更多的是在公共場所的防控能力,還有在醫療診斷方面的能力和效率要遠超過人類。

人工智慧已經在潛移默化地改變著我們的生產、生活。除了在疫情期間的特殊作用,從長期來講,還有更多的行業和場景需要變革。不論是「新基建五兄弟」中的工業網際網路/物聯網,還是各種傳統產業,還是你手機中的人臉解鎖/AI美顏,都有賴於人工智慧為其提供大腦支持。

然而,這裡邊卻有一個「老大難」的問題:場景和新問題總是湧現,因此就需要算法不斷革新,場景對定製化算法的需求是無限的。然而算法的生產效率卻因數據、算法和算力的制約而無法破解。

算法的生產有賴於深度學習框架。但是深度學習研究的門檻較高,中國AI開發者面臨基礎薄弱、學習資源較少和開發工具不系統等問題。掌握深度學習和算法開發技術的中國企業也是屈指可數。

一來一去,人工智慧產業出現了嚴重的供需不平衡。

二、深度學習框架開源,曠視按下產業加速鍵

曠視科技,就是中國人工智慧產業中少之又少的精英玩家。2015年,馬雲在德國漢諾瓦首秀的支付寶刷臉支付,其背後的技術支撐就是曠視。

為了解決企業自身的業務拓展需求,曠視2014年開始自己構建了一套AI生產力平臺,叫做Brain++。包括深度學習框架(曠視天元MegEngine)、深度學習雲計算平臺(MegCompute)以及數據管理平臺(MegData)的能力,將算法、算力和數據能力集為一體。

為了解釋這三者的關係,曠視做了一個形象的類比。「我們把做算法比作炒菜的話,數據其實就像是食材,是炒菜的原材料;算法的裡面需要有個框架承載計算,就像炒菜的鍋一樣;大火還是小火,就是我們的算力大小。」

曠視很早就在思考AI產業供需不平衡的問題。供需問題的本質,是AI算法訓練的不可複製性。早期AI公司在服務客戶時,每個客戶的業務需求不同,對算法訓練的需求也就不同,每接觸一個新客戶,就要搭一套新框架。

還是拿廚房做類比,以前算法的開發模式像一個小作坊,它的特點是廚師需要自己清洗菜(數據清洗)、配菜(搭模型)、炒菜(訓模型)、調火候和口味(調參數)。通過這種小作坊模式,可能一個廚師(開發者)可能支持有限的客人的需求,費時又費力。

但以類似曠視這樣的「AI生產力平臺」為例,如何解決剛剛提到的問題呢?

在現代化、自動化的中央廚房裡工作的大廚(開發者),他將擁有標準化、流水線管理的配菜間(數據管理中心)和智能化的爐灶(計算平臺)和廚具(深度學習框架)等配套設施(開發環境),這樣,他不僅能大幅提高菜品的供應效率,還有了研發和創新的空間和時間。

但是,也不是所有企業都有能力建設自己的中央廚房(深度學習框架等AI基礎設施),因為研發成本非常高。當一家企業有自己的業務之後,如果建了一個AI研究院,這個企業可能賺不到錢。目前傳統產業無法快速融入AI的最重要的原因是深度學習和算法開發成本過高。

曠視Brain++「AI生產力平臺」通過過去6年的科研創新和業務創新、技術積累和產業實踐,已經具備了一套能夠批量生產算法的深度學習框架,在諸多智慧城市的落地中證明這個框架具備支持工業級研究院的規模化算法研發能力。

為了能夠讓更多傳統產業的開發者和高校師生能夠獲得這樣的AI生產力,曠視決定開源其AI生產力平臺Brain++的核心組件:深度學習框架天元(MegEngine)。

三、開源信心何在:開發者訓得好、訓得動、訓得快

開源的意義何在?很多人可能不知道。

過去幾年,美國企業扎堆開源(即開放,也就是任何人都可以得到軟體的原始碼),大部分人在各種開原始碼上進行技術開發,正因為有Linux這樣開源的自由作業系統,才有了安卓系統,也才有了國內小米、華為的崛起。

曠視為什麼有信心開源呢?

主要是在已經實現開源的深度學習框架中,曠視是唯一一家以AI為本業企業。開源之前,曠視有1400多名研發人員,全員使用曠視天元作為算法開發的引擎,截至目前,曠視的自研算法模型已經有上百種,部署的硬體中臺有數十款,覆蓋的行業也有10+個。

多年以來曠視都是通過天元去解決各種商業場景中的各種問題,可謂是身經百戰。

天元項目負責人兼曠視研究院高級技術總監田忠博說,這次開源的天元是一套訓練推理一體化、動靜態合一的工業級深度學習框架,採用訓練與推理在同一個框架、同一個體系內完整支持的設計,讓開發者真正體驗到「訓得好」、「訓得動」、「訓得快」。

而且在曠視經年累月的打磨下,一些研發過程中的痛點,也在天元中被很好的解決。

曠視首席科學家、研究院院長孫劍親切的將天元比做他們的「孩子」,他認為這個「孩子」的三大特色優點:

優點一,框架與算法的協同。當前計算平臺差異非常大,很難只設計一種網絡,能夠滿足所有的需求。曠視以天元框架成為中間橋梁,根據不同設備的計算特性,協同設計網絡結構和框架算子,從而獲得最好的性能。而ShuffleNet就是協同設計的成果,最近幾年的在端上運行非常高效的一個神經網絡的設計,效果優異。

優點二,高效訓練系統。在COCO物體檢測和識別挑戰賽上,曠視取得了2017年、2018年、2019三連冠的佳績。其中一個非常關鍵的優勢,就是曠視天元這樣一個訓得快的系統。從第一次從框架上引入Synced BN技術,它能支持非常大的Mini-Batch訓練,以至於曠視可以非常高速的訓練一個系統。

優點三,大規模能力。孫劍表示這與曠視數據大規模有關,並發布了最新版的Objects365V2版本。這是世界上最大或者更大的物體檢測數據集,這個數據集有365種常見物體,超過200萬張圖象,超過2800萬個人工標誌的框。

四、堅持長期主義,眼光要放50年那麼長

技術有點難懂?我們不妨來看看曠視的成績。

2017-2019年間,依託曠視Brain++大規模分布式訓練能力,以及業界領先的分布式計算技術訓練出的超大規模深度學習模型,曠視累計斬獲 27 項全球 AI 競賽冠軍。

同時,曠視還開發出大量部署於雲端、移動端、邊緣端全計算平臺的先進深度神經網絡,為曠視的個人物聯網、城市物聯網、供應鏈物聯網三大垂直場景提供了有力的支撐。

而疫情期間,曠視更是創造了10天上線AI測溫系統的「奇蹟速度」。曠視考慮到,公共場所人流量大,傳統手檢測溫速度慢,且測溫人員要和被測人員頻繁接觸。

所以曠視提出了「人體識別+人像識別+紅外/可見光雙傳感」的解決方案,能夠在各類公共場所等高密度人員流動場景下,實現大於3米的非接觸遠距離測溫。

要知道,測體溫場景中的AI算法需要做很多生理性的測試,從腋下的溫度測試到額溫中間的差異值,到底是不是可以通過黑體去調校……

尤其是在地鐵站、火車站,每個進站口、出站口每個通道日均通行2000人,大密度、高流動等外部物理世界對於算法的一些影響,都要考量進去。

然而春節期間,曠視通過Brain++高效的算法研發能力,用不到10天的時間完成了AI測溫系統的開發和上線,其中算法開發只用了不到兩天時間,搶在社會大規模復工之前上線了AI測溫系統。

曠視選擇將自己的「大腦」開放給整個中國AI產業使用。這樣一來,無論是高校研究人員,還是傳統企業技術人員,只要是有志於學習 AI、用 AI 改變世界的開發者,都可以更加簡單高效地用 AI 去創造,實現AI+產業降本增效釋放生產力。

另一方面,框架代碼開源意味著接受群眾檢驗的同時,也能夠激發出更多的技術貢獻者讓它變得更好用。

曠視研究院的牆上掛著一幅字:「持續創新拓展認知邊界,非凡科技成就產品價值。」 曠視首席科學家、曠視研究院院長孫劍表示,這是曠視研究院的使命。意思就是說做AI研究既要仰望星空,更要腳踏實地。

曠視內部還有個詞彙,叫做「長期主義」,這次開源的曠視顯然是將眼光放到了20-50年的長期角度,從行業基礎設施的角度,去思考企業、行業與國家社會的共同命運的戰略決策。同樣,新基建也是中央站在國家發展的更大視角,開展的「長期主義」戰略。

有了人人可用的深度學習框架,和AI生產力平臺這樣類似AI水電站級別的設施,未來,人工智慧才有可能像「自來水」一樣無處不在,且即開即用。各產業技術、產品、平臺的高度協同,才能更好發展行業,推動整個社會生產方式的改進和生產力的發展。

免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據。

相關焦點

  • 中國AI開源的新生力量!曠視「天元」深度學習框架全解讀
    中國AI開源陣營再添一軍!3月25日,曠視宣布正式開源工業級深度學習框架「天元(MegEngine)」,成為國內第一家開源AI框架的AI企業。而天元深度學習框架的誕生,不僅為曠視AI業務的開拓和成熟提供強有力的底層技術支持,其本身的開源,在豐富國內AI開源生態的同時,也為近年來全國火熱的新基建中AI領域的發展,提供了重要的創新力和生產動力。那麼,「天元」深度學習框架究竟是什麼?它的背後隱藏了哪些曠視的AI布局野心?
  • 剛剛,曠視重磅開源深度學習框架天元 MegEngine
    這次為了開源,曠視從 2019 年開始做了大量的準備工作,包括對框架增加新特性等針對性的全面升級。曠視副總裁謝憶楠表示,開源天元(MegEngine)主要有 2 個原因,內因是,曠視最開始做 Face++,從算法起家,並往行業性的解決方案深耕,現在開源框架本質上又回到了探索算法層面。
  • 曠視落子天元:深度學習框架開源,是成為偉大AI企業的第一步
    中國人工智慧獨角獸企業給出了他們的解釋:「簡單來講,算法的研發過程就像炒菜。在『美味算法』的研發中,數據就是各種各樣的食材,需要清洗,分類管理,是『炒制』算法的原材料;而算法的訓練和推理就像是烹製的過程,需要鍋具(深度學習框架)來承載;算力則是一灶猛火,火候到位才能燒得好菜。廚師的工作是什麼?
  • 從算法爬坡到 AI 基建,曠視「天元」開源背後的 AI 生產力破局
    但當企業經歷幾年的跑馬圈地,單純的算法之外,一家 AI 公司還需要什麼?巨頭與行業獨角獸們正在試圖回答這個問題。近日,計算機視覺領頭公司曠視正式宣布開源其深度學習框架 MegEngine,中文名「天元」(傳送門:MegEngine.org.cn)。
  • 曠視開源天元夯實AI基礎層 獲CSDN「AI開源貢獻獎」
    據了解,天元完全由曠視自主打造,在2014年正式完成上線,是一套訓練推理一體化、動靜態合一的工業級深度學習框架,從算法層面服務曠視內部全部開發者,支撐著企業在國際AI競賽與獎項評選中的優異表現,以及技術與業務的落地賦能。
  • 人工智慧的下一個十年,曠視看好三大技術趨勢
    如今曠視研究院不僅在深度學習基礎研究領域全面深耕,而且還在用場景定義算法的理念驅動下,不斷攻克在計算機視覺、視覺導航與控制、計算攝影學、大規模機器學習系統、機器人學等多個領域中,長期困擾學界和產業界的一系列重大難題,助力曠視在 AIoT 發展的道路上不斷壯大。
  • 曠視開源 落子天元:一圖讀懂曠視Brain++ · 天元開源發布會
    來源:格隆匯2020年3月25日下午2點,曠視科技於線上正式發布Brain++·「天元」深度學習開源框架。「Brain++」是由曠視自主研發的端到端人工智慧算法平臺,具備大規模算法研發能力。而天元(MegEngine)則是曠視Brain++最核心的組件,可幫助開發者用戶藉助編程接口,進行大規模深度學習模型訓練和部署,具備訓練推理一體化,動靜合一,兼容並包和靈活高效四個特點。下面讓我們通過一圖來了解曠視Brain++ · 天元開源發布會的基本情況。
  • 曠視開源 落子天元
    同時這套基礎設施的核心——深度學習框架「天元」也將全面開源,正式邀請全球開發者參與共建這套中國自研的生產力平臺核心部分。天元,意為棋盤核心,亦為萬物本源,曠視希望越來越多的開發者基於天元可以從 0 到 1 創造屬於自己的算法,在 AI 時代提供一套人人可用的生產力工具。曠視開源,落子天元。
  • 曠視天元深度學習框架全球首發!3個實習生寫下一行代碼
    【新智元導讀】剛剛,中國AI獨角獸曠視宣布開源其深度學習框架曠視天元(MegEngine),力圖為中國AI應用打造一個新基石。6年前3名實習生從第一行代碼寫起,艱難創業中在全球AI競賽斬獲27項冠軍,今日天元開源,敢與TensorFlow等全球主流深度學習框架爭雄。這個絕密武器又解決了開發者哪些痛點?
  • 這家企業是馬雲的驕傲 3月底將開源深度學習框架 據說很厲害
    曠視的這一舉動,有望為中國AI開發生態注入新活力。No.1 MegEngine 是一口「萬能鍋」AI因算法而點亮,萬物因技術而互聯。中國人工智慧獨角獸曠視,早在2014年就開始研發其深度學習框架MegEngine。
  • 落子「天元」瞄準新基建 曠視發力AI基礎設施建設
    3月25日,中國人工智慧領域頭部企業曠視舉行了一場線上發布會,正式推出新一代AI生產力平臺Brain++,並開源其核心組件——深度學習框架天元(MegEngine)。田忠博介紹,「天元的名字背後有很多寓意:首先,它是圍棋棋盤的正中心,我們將它命名為天元不僅是向AlphaGO致敬,也是想體現底層的框架是曠視技術戰略大圖核心;此外,在古數學中,天元是複雜方程的基礎,在古天文學中,天元指代北極星,是萬物本源和開始。我們希望天元不光是曠視成長的基石,也能夠作為中國人工智慧基礎設施的重要組成部分,促進AI在各個領域更好的應用和落地。」
  • 曠視推出AI生產力平臺Brain++,覆蓋AI全流程研發
    先進技術如何能真正帶動傳統產業發展,提高AI生產力的解在哪裡?一個產業的發展,離不開一套能用、好用的基礎設施,降低生產成本,提高生產效率,吸引更多人參與。作為全球最早用深度學習方法開展人工智慧商業化探索的科技企業,曠視成立於AI 開發工具匱乏的早期人工智慧時代,於是曠視靠自主研發,從0到1地解決了算法生產的問題。
  • 聚焦AI開源開放 2020中關村論壇曠視平行論壇即將上線
    在此背景下,曠視科技將於2020年中關村論壇期間舉辦「人工智慧開源開放與生產力促進平行論壇」,邀請十餘位來自海內外的專家學者和企業代表,共同探討如何通過技術共享,降低企業人工智慧應用門檻、推動人工智慧產業落地。
  • 國產開源這一年,好生熱鬧
    最開始的萌芽階段,開源的貢獻者主要以個人和大學為主。第二個階段是以非盈利組織為主,比如Apache基金會等。2005年之後,谷歌等網際網路企業紛紛發布開源軟體,最著名的是Android作業系統。近幾年,國內科技企業與人工智慧企業逐漸參與到開源中來,成為開源的新生力量。 人工智慧時代,開源是算法迭代與創新的主要驅動力。
  • 新基建浪潮下,中國需要什麼樣的開源天團?
    2020年國產的深度學習框架逐漸填補了空白,可人工智慧的「開源之戰」也愈演愈烈,早已上升為爭奪人工智慧話語權的較量。中國需要的不僅是越來越多的參與者,還需要在世界舞臺上拼刀法的撒手鐧。01 開源的自由與國界關於深度學習框架的價值,還要從算法開始說起。
  • AI人才供需比例失衡 曠視完善培養體系塑造頂級AI團隊
    數據顯示,預計2020年中國人工智慧產業規模將超過1500億元,帶動相關產業規模超過1萬億元。根據相關教育部門測算,我國AI人才缺口至少超500萬,國內的供求比例約為1∶10,供需比例嚴重失衡。作為中國人工智慧領軍企業,曠視就正致力於AI人才的培養與投入,以此推動人工智慧行業的發展,並在近日獲評「CV工程師理想企業Top5」。人工智慧人才隊伍的建設對於行業與企業發展來說至關重要。
  • 呼和浩特市政府、和林格爾新區與北京曠視科技有限公司籤署三方...
    據介紹,曠視科技創立於2011年,是一家人工智慧產品和解決方案公司。以深度學習為核心競爭力,曠視融合算法、算力和數據,打造出 「三位一體」的新一代AI生產力平臺曠視Brain++,並開源其核心——深度學習框架「天元」。
  • AI助力產業網際網路升級 曠視榮獲2020億邦產業網際網路千峰獎
    活動現場正式揭曉了"千峰獎"獲獎企業,其中,人工智慧企業曠視憑藉在產業網際網路領域的宏觀戰略與實踐成果,獲評"千億市值獎"。在曠視看來,人工智慧和產業結合的主要矛盾在於"場景多樣化、碎片化需求與算法生產力不足之間的矛盾",Brain++包括深度學習框架天元(MegEngine)、深度學習雲計算平臺(MegCompute)、數據管理平臺(MegData),協同優化數據、算法、算力,能夠幫助曠視實現規模化AI生產力,為人工智慧落地產業提供技術保障。
  • 醫療AI公司繞不開的選擇難題:開源框架與專用晶片
    今年4月底,英偉達也與倫敦國王學院共同宣布了Project MONAI的開源alpha版本。MONAI是AI Medical Open Network的縮寫。這個框架針對醫療保健研究人員的需求進行了優化,並且可以與PyTorch和Ignite等深度學習框架一起運行。這個框架推出之時,國內就有學者評價到,「為醫學影像研究者量身打造,是真正的良心之作。」
  • 曠視落子「天元」,如何殺出谷歌、Facebook包圍圈?
    你抬起手機的每一次面部解鎖,背後可能都離不開曠視的面部識別技術,但曠視遠不只是一家面部識別解決方案提供商。今天下午,AI 獨角獸曠視科技在線上直播中正式宣布開源旗下深度學習框架 MegEngine(天元)。