新冠肺炎的影響是前所未有、空前巨大,但同時也帶來了一次前所未有、空前巨大的全社會轉型時刻。
以前很多業務都要去門店、銀行、學校、醫院……但是疫情之下,我們被迫快速適應了許多新的生活方式。
汪丁丁(著名經濟學家、北京大學國家發展研究院經濟學教授)教授說,人類社會必須找到經濟活動的新模式。
以前用不好手機軟體的父母,現在每天流暢的在生鮮電商上下單買菜;人們出門戴口罩成為習慣,進地鐵接受智能測溫也成為習慣;直播電商/線上辦公/線上辦學再臨風口,「媽媽守著李佳琦,孩子守著釘釘群」。
很多人都覺得,這些新功能/新服務像早就準備好了一樣,不像是應對疫情匆匆上馬的項目。
是的,你想的沒錯。其實我們國家已經持續建設多年5G、大數據、人工智慧、工業網際網路和物聯網五大類數字基礎設施。這次疫情,是將很多本來就很厲害的技術,加速進入到我們的生活中。
最近,發展這些數字基礎設施有了一個統一的名字——「新基建」。
一、「新基建」時代,提升「AI大腦」卻成了老大難
這場新基建聲勢浩大。
拋開電力、交通和新能源垂類的基建領域,最核心的就是萬物互聯的新一代信息技術:5G、大數據中心、人工智慧、工業網際網路和物聯網為代表的「新基建」,將在未來20年支撐經濟發展。
而且「新基建五兄弟」之間,聯繫是非常緊密的,你中有我,我中有你。
人工智慧是大腦,負責思考;大數據是大腦中儲存的知識,負責提供經驗;5G是神經網絡,負責高速傳達大腦指令;工業網際網路/物聯網是四肢,負責執行大腦的命令。
「新基建五兄弟」之間,是一個看起來特別完美的協作關係,只是人工智慧稍稍高出其他四兄弟,作為大腦起到統領整個「新基建」的作用。
此前我們也發文介紹過人工智慧在疫情期間成為了人類看不見的「盟友」,通過大數據的分析與智能的預測,加拿大的人工智慧監測平臺BlueDot在2019年12月31日就曾向人類發出警告。
在之後的全球抗疫戰之中 ,我們也看到了人工智慧不僅預測方面的能力,更多的是在公共場所的防控能力,還有在醫療診斷方面的能力和效率要遠超過人類。
人工智慧已經在潛移默化地改變著我們的生產、生活。除了在疫情期間的特殊作用,從長期來講,還有更多的行業和場景需要變革。不論是「新基建五兄弟」中的工業網際網路/物聯網,還是各種傳統產業,還是你手機中的人臉解鎖/AI美顏,都有賴於人工智慧為其提供大腦支持。
然而,這裡邊卻有一個「老大難」的問題:場景和新問題總是湧現,因此就需要算法不斷革新,場景對定製化算法的需求是無限的。然而算法的生產效率卻因數據、算法和算力的制約而無法破解。
算法的生產有賴於深度學習框架。但是深度學習研究的門檻較高,中國AI開發者面臨基礎薄弱、學習資源較少和開發工具不系統等問題。掌握深度學習和算法開發技術的中國企業也是屈指可數。
一來一去,人工智慧產業出現了嚴重的供需不平衡。
二、深度學習框架開源,曠視按下產業加速鍵
曠視科技,就是中國人工智慧產業中少之又少的精英玩家。2015年,馬雲在德國漢諾瓦首秀的支付寶刷臉支付,其背後的技術支撐就是曠視。
為了解決企業自身的業務拓展需求,曠視2014年開始自己構建了一套AI生產力平臺,叫做Brain++。包括深度學習框架(曠視天元MegEngine)、深度學習雲計算平臺(MegCompute)以及數據管理平臺(MegData)的能力,將算法、算力和數據能力集為一體。
為了解釋這三者的關係,曠視做了一個形象的類比。「我們把做算法比作炒菜的話,數據其實就像是食材,是炒菜的原材料;算法的裡面需要有個框架承載計算,就像炒菜的鍋一樣;大火還是小火,就是我們的算力大小。」
曠視很早就在思考AI產業供需不平衡的問題。供需問題的本質,是AI算法訓練的不可複製性。早期AI公司在服務客戶時,每個客戶的業務需求不同,對算法訓練的需求也就不同,每接觸一個新客戶,就要搭一套新框架。
還是拿廚房做類比,以前算法的開發模式像一個小作坊,它的特點是廚師需要自己清洗菜(數據清洗)、配菜(搭模型)、炒菜(訓模型)、調火候和口味(調參數)。通過這種小作坊模式,可能一個廚師(開發者)可能支持有限的客人的需求,費時又費力。
但以類似曠視這樣的「AI生產力平臺」為例,如何解決剛剛提到的問題呢?
在現代化、自動化的中央廚房裡工作的大廚(開發者),他將擁有標準化、流水線管理的配菜間(數據管理中心)和智能化的爐灶(計算平臺)和廚具(深度學習框架)等配套設施(開發環境),這樣,他不僅能大幅提高菜品的供應效率,還有了研發和創新的空間和時間。
但是,也不是所有企業都有能力建設自己的中央廚房(深度學習框架等AI基礎設施),因為研發成本非常高。當一家企業有自己的業務之後,如果建了一個AI研究院,這個企業可能賺不到錢。目前傳統產業無法快速融入AI的最重要的原因是深度學習和算法開發成本過高。
曠視Brain++「AI生產力平臺」通過過去6年的科研創新和業務創新、技術積累和產業實踐,已經具備了一套能夠批量生產算法的深度學習框架,在諸多智慧城市的落地中證明這個框架具備支持工業級研究院的規模化算法研發能力。
為了能夠讓更多傳統產業的開發者和高校師生能夠獲得這樣的AI生產力,曠視決定開源其AI生產力平臺Brain++的核心組件:深度學習框架天元(MegEngine)。
三、開源信心何在:開發者訓得好、訓得動、訓得快
開源的意義何在?很多人可能不知道。
過去幾年,美國企業扎堆開源(即開放,也就是任何人都可以得到軟體的原始碼),大部分人在各種開原始碼上進行技術開發,正因為有Linux這樣開源的自由作業系統,才有了安卓系統,也才有了國內小米、華為的崛起。
曠視為什麼有信心開源呢?
主要是在已經實現開源的深度學習框架中,曠視是唯一一家以AI為本業企業。開源之前,曠視有1400多名研發人員,全員使用曠視天元作為算法開發的引擎,截至目前,曠視的自研算法模型已經有上百種,部署的硬體中臺有數十款,覆蓋的行業也有10+個。
多年以來曠視都是通過天元去解決各種商業場景中的各種問題,可謂是身經百戰。
天元項目負責人兼曠視研究院高級技術總監田忠博說,這次開源的天元是一套訓練推理一體化、動靜態合一的工業級深度學習框架,採用訓練與推理在同一個框架、同一個體系內完整支持的設計,讓開發者真正體驗到「訓得好」、「訓得動」、「訓得快」。
而且在曠視經年累月的打磨下,一些研發過程中的痛點,也在天元中被很好的解決。
曠視首席科學家、研究院院長孫劍親切的將天元比做他們的「孩子」,他認為這個「孩子」的三大特色優點:
優點一,框架與算法的協同。當前計算平臺差異非常大,很難只設計一種網絡,能夠滿足所有的需求。曠視以天元框架成為中間橋梁,根據不同設備的計算特性,協同設計網絡結構和框架算子,從而獲得最好的性能。而ShuffleNet就是協同設計的成果,最近幾年的在端上運行非常高效的一個神經網絡的設計,效果優異。
優點二,高效訓練系統。在COCO物體檢測和識別挑戰賽上,曠視取得了2017年、2018年、2019三連冠的佳績。其中一個非常關鍵的優勢,就是曠視天元這樣一個訓得快的系統。從第一次從框架上引入Synced BN技術,它能支持非常大的Mini-Batch訓練,以至於曠視可以非常高速的訓練一個系統。
優點三,大規模能力。孫劍表示這與曠視數據大規模有關,並發布了最新版的Objects365V2版本。這是世界上最大或者更大的物體檢測數據集,這個數據集有365種常見物體,超過200萬張圖象,超過2800萬個人工標誌的框。
四、堅持長期主義,眼光要放50年那麼長
技術有點難懂?我們不妨來看看曠視的成績。
2017-2019年間,依託曠視Brain++大規模分布式訓練能力,以及業界領先的分布式計算技術訓練出的超大規模深度學習模型,曠視累計斬獲 27 項全球 AI 競賽冠軍。
同時,曠視還開發出大量部署於雲端、移動端、邊緣端全計算平臺的先進深度神經網絡,為曠視的個人物聯網、城市物聯網、供應鏈物聯網三大垂直場景提供了有力的支撐。
而疫情期間,曠視更是創造了10天上線AI測溫系統的「奇蹟速度」。曠視考慮到,公共場所人流量大,傳統手檢測溫速度慢,且測溫人員要和被測人員頻繁接觸。
所以曠視提出了「人體識別+人像識別+紅外/可見光雙傳感」的解決方案,能夠在各類公共場所等高密度人員流動場景下,實現大於3米的非接觸遠距離測溫。
要知道,測體溫場景中的AI算法需要做很多生理性的測試,從腋下的溫度測試到額溫中間的差異值,到底是不是可以通過黑體去調校……
尤其是在地鐵站、火車站,每個進站口、出站口每個通道日均通行2000人,大密度、高流動等外部物理世界對於算法的一些影響,都要考量進去。
然而春節期間,曠視通過Brain++高效的算法研發能力,用不到10天的時間完成了AI測溫系統的開發和上線,其中算法開發只用了不到兩天時間,搶在社會大規模復工之前上線了AI測溫系統。
曠視選擇將自己的「大腦」開放給整個中國AI產業使用。這樣一來,無論是高校研究人員,還是傳統企業技術人員,只要是有志於學習 AI、用 AI 改變世界的開發者,都可以更加簡單高效地用 AI 去創造,實現AI+產業降本增效釋放生產力。
另一方面,框架代碼開源意味著接受群眾檢驗的同時,也能夠激發出更多的技術貢獻者讓它變得更好用。
曠視研究院的牆上掛著一幅字:「持續創新拓展認知邊界,非凡科技成就產品價值。」 曠視首席科學家、曠視研究院院長孫劍表示,這是曠視研究院的使命。意思就是說做AI研究既要仰望星空,更要腳踏實地。
曠視內部還有個詞彙,叫做「長期主義」,這次開源的曠視顯然是將眼光放到了20-50年的長期角度,從行業基礎設施的角度,去思考企業、行業與國家社會的共同命運的戰略決策。同樣,新基建也是中央站在國家發展的更大視角,開展的「長期主義」戰略。
有了人人可用的深度學習框架,和AI生產力平臺這樣類似AI水電站級別的設施,未來,人工智慧才有可能像「自來水」一樣無處不在,且即開即用。各產業技術、產品、平臺的高度協同,才能更好發展行業,推動整個社會生產方式的改進和生產力的發展。
免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據。