挺進雲端AI訓練&推理雙賽道!獨家對話燧原科技COO張亞林:揭秘超高...

2020-12-23 智東西

智東西(公眾號:zhidxcom)作者 | 國仁 心緣編輯 | 漠影

智東西12月21日報導,剛剛,燧原科技推出首款雲端推理計算卡「雲燧i10」及推理引擎「鑑算TopsInference」。

雲燧i10是單槽位標準卡,支持PCIe 4.0,FP32算力可達17.6TFLOPS,BF16/FP16算力可達70.4TFLOPS,最大功耗僅為150W,在主流AI模型中的性能表現均超過GPU競品。

落地鋪陳也基本就緒,雲燧i10目前已經獨立適配8款AI伺服器,將於明年第一季度上市。

這著實令人感到驚異,作為一家成立於2018年3月的AI晶片初創公司,燧原科技研發和落地的速度,實在是太快了。

成立18個月推出其首款雲端訓練產品 「雲燧T10」及軟體全棧「馭算」,今年9月宣布「雲燧T10」落地商用,如今首款雲端推理產品正式量產發布。

任何一個環節出問題,都不可能做到如此迅速,況且燧原科技最先選擇的雲端AI訓練晶片,還是AI晶片領域公認的最難的「山頭」。

截至當前,燧原科技成為國內唯一一家同時擁有雲端訓練+雲端推理完整解決方案的初創公司,也是騰訊連續三年投資的唯一一家AI晶片公司。

燧原究竟是如何做到的?通過與燧原科技創始人兼COO張亞林深入交流,我們試圖還原這家AI晶片創企超高效率背後的「內功」。

▲智東西總編張國仁(左)與燧原科技COO張亞林(右)

一、對標巨頭,速度制勝

燧原選擇了一條充滿未來,但也荊棘密布的路。

雲端訓練及推理晶片的道路前方,始終屹立著英偉達,這樣一座巍峨而難以逾越的高山。

「國外友商樹立了珠穆朗瑪峰,我們必須跑得比它更快,我們必須以更快的迭代速度、更快的客戶反饋來加速產品迭代,才能在市場中建立自己的競爭優勢。」張亞林說。

燧原團隊選擇切入的雲端AI晶片市場很廣闊,但如果不能快速抓住機會佔穩腳跟,未來市場再大,也只會是別人的囊中之物。因此研發和落地周期,都必須盡力縮短。

「在大公司有個「1+1」模型,晶片項目從立項到流片是一年,從流片到量產是一年。我們雲燧T10在2019年5月底流片,2020年6月量產,精確地執行了這一模式。」

在張亞林眼中保證超高執行力,是趨向於成熟公司的必經之路。奔著「基業常青」的目標,燧原從創業之初,就在規劃落實三個關鍵點。

首先是文化統一。文化是一個公司的根基所在,能從思想層面實現團隊的高度協同。燧原在1.0階段就開始打造燧原文化,如今已升級至2.0階段。

燧原的文化核心是「胸懷正道、開拓執行」。其中「胸懷」是指要客戶為先,共贏為本;「正道」是指忠於職責,勇於擔當;「開拓」是指始於創造,歸於價值;「執行」是指以終為始,以質為髓。

其次是行為模式統一。一個公司要做到規模化,必須有規範的制度流程。從成立之初,燧原就打造了環環相扣的管理機制,比如建立專門對項目進行監管的項目管理團隊(PMO)、使用統一的項目管理原則和管理語言,再比如對執行過程中如何做關鍵決策、追蹤熱點等制度進行規範化管理。張亞林認為,這是大公司能行之有效持續推動產品研發落地的根本。

第三是形成正循環。當企業推出產品,開始落地並逐漸規模化,就會得到更多資本青睞和業內認可,從而形成反哺企業的動力,這樣就形成正循環。而如果企業不是正循環,它的效率必然會受阻,出現走彎路的情況。「我們在整個過程中精準把握了正循環和產品迭代,所以才能做到這麼快。」

於是,在燧原1.0階段,剛成立18個月的燧原就推出了高性能雲端訓練產品,實現從0到1的破冰。

進入2020年,燧原非但沒有被疫情「黑天鵝」打亂陣腳,反而按計劃順利進入「從1到N」的燧原2.0階段,循序漸進地完成新融資、雲端訓練集群方案商用落地、雲端推理加速卡量產發布等重要節點。截至今日,燧原已累計融資13.4億元。

除了階段進化、團隊規模增長外,燧原的落地也更為多元。張亞林透露道,燧原目前針對網際網路、垂直行業譬如教育、金融等方向正在進行頭部客戶的規模化落地,「新基建」也正在快速鋪陳。

二、主流模型基準測試,表現超過GPU旗艦競品

技術理工出身,也可以充滿文藝情懷。

每個年末「壓軸」出場的燧原旗艦產品發布會,其主題意義都很有文藝範兒。

去年燧原雲端訓練計算卡雲燧T10發布時,張亞林將主題定為「芯火燎原」,希望雲燧T10能一直開拓廣袤的土地。

如今雲端推理計算卡雲燧i10發布,主題變成了「芯漢燦爛」,出自曹操《觀滄海》中的名句「星漢燦爛,若出其裡」。其中,「燦爛」寓意更多後續產品,以此寄予對雲燧i10在星空上持續閃耀的期待。

通過對雲端推理市場進行廣泛調研和用戶畫像,燧原針對性地進行了極致能效提升、多用戶虛擬化、工藝良率優化、散熱方案增強等全方位產品打造,並完全獨立重新設計了推理軟體全棧和板卡系統,使雲燧i10擁有出色的用戶價值特性。

從燧原公布的基準測試表現來看,雲燧i10可以說是不負所托。在主流的圖像識別、視頻增強、視頻處理、內容審核、推薦等主流模型中,實測性能表現均超過GPU旗艦競品。

這得益於雲燧i10的四個主要特徵:

1、高算力、高精度:150W單槽算力密度下,FP32算力可達17.6TFLOPS,BF16/FP16算力可達70.4TFLOPS,單精度算力可達GPU競品的兩倍以上;採用自主指令集,支持從FP32到INT8等多種精度;採用512GB/s高存儲帶寬和16GB本地存儲。

2、高能效、高可靠性:智能功耗管理(APC採用動態調頻調壓(DVFS)技術將功耗控制到接近但不超過最大值150W,從而最大限度發揮算力;根據負載加速應用性能,支持RAS、ECC;通過硬體架構設計、硬體模塊及軟體全棧的配合,實現溫度、電流、功耗等監測保護,可提供高能效比FP32算力和省電模式。

3、設備虛擬化(MID):最大可支持4個設備實例,具備計算與存儲資源的獨享性,多用戶間安全隔離;單顆晶片上可同時部署不同的業務與負載,實現多任務並行,有效提高利用率;支持KVM、Xen等系統虛擬化平臺;性能開銷不到物理機的3%。

4、易編程、生態開放:開放C++和Python編程接口,支持CNN及NLP典型模型,支持TensorFlow、PyTorch、ONNX等主流機器學習框架,並通過SDK提供深度定製。

目前雲燧i10已支持來自浪潮、Supermicro、新華三的8AI伺服器。雲端高算力密度推理伺服器半精度算力可達1.1PFLOPS,邊緣雲推理伺服器半精度算力可達280TFLOPS

當然,僅僅有高性能的硬體產品還不夠,要充分挖掘硬體算力,必然離不開完善的軟體工具。

三、從無到有,打造推理軟體全棧

在研發雲燧i10的同時,燧原從無到有地建立了一套對開發者友好的推理軟體全棧,提供不同層次的開發模式,以及針對客戶定製化算法模型的聯合開發與優化。

這一軟體全棧在應用層、框架層、SDK層和驅動層這四個層面進行布局。

自頂向下來看,應用層的Model Zoo中內置70多種主流模型,覆蓋計算機視覺、自然語言處理和語音識別以及其他主流AI算法。

在AI框架層,針對推理領域有很多自定義框架的特點,燧原打造了高性能神經網絡模型推理引擎「鑑算TopsInference」,能將標準化框架及客戶自定義框架中的模型轉化成馭算統一執行模型。

下一層是SDK層,當所有模型被標準化後,燧原提供的圖優化引擎「絡算TopsNeuro」將模型解析成各種圖結構。同時燧原還提供了包含各種分析調試及可視化工具的全套工具鏈「探算TopsKit」。

再往下是算子庫,「擎算TopsOperator」支持500多個算子和80多個原子,能通過提供原生彙編實現與優化,挖掘更高的算力利用率。

而用戶能不能自己定製算子、操作內部的推理棧,則需依靠TopsPrimo,它給用戶提供了標準化模型、框架之外的另一種選擇,即自行通過編程來優化操作。

最後在SDK層之下,是與硬體銜接的驅動層。

由此,燧原打造出訓練推理的整體解決方案。雲燧i10與雲燧T10以及「馭算TopsRider」軟體平臺搭配,可實現算法模型在數據中心訓推一體化的快速生產部署。

四、火力配置均勻,向著目標進發

張亞林告訴智東西,燧原的雲端訓練和推理產品路線圖已經規劃到三年以後,其團隊正精準地按照這一路線圖執行。

這種「精準」的執行力,源自燧原「使命必達」的精神底蘊。

以研發雲燧i10為例,朝向在2020年12月31日完成量產的目標,燧原從今年3月啟動在方案、架構和軟體開發上的技術優化,早期受疫情限制主要集中於內部的遠程開發,從5月起全面轉向系統集成開發和和測試。

得益於燧原從一開始就建立了遠程工作機制,早早搭建完善的內部集群環境,能支撐數百人的多團隊從多個地域並行開發。即便遭逢疫情,燧原的雲端訓練產品落地和雲端推理產品研發進度均未受到影響。

▲燧原雲端推理計算卡「雲燧i10」

為了提升能效比,燧原團隊決定在雲端推理計算卡上採用動態調頻調壓(DVFS)技術,始終在設定的條件內跑最高的電壓和頻率,這一技術對精確度的要求非常高。

頂著讓板卡實現30天全負荷工作不死機、不過熱的巨大壓力,從10月開始,量產團隊在燧原實驗室中連續一個月全負荷緊急攻關調試,每個人都背負著巨大的責任感,將工作任務嚴格控制到每一天,1個月後板卡順利通過抗壓測試。

除了系統量產團隊外,在產品研發方面,燧原還有其他三個主要團隊,分別是晶片團隊、軟體團隊以及客戶解決方案團隊。在燧原文化的驅動下,這四個團隊緊密協同,實現了燧原從項目伊始到整個大系統量產的高效執行力。

其中,研發人員是燧原團隊的主力軍,佔總員工人數的近90%。除了重視研發外,面向客戶服務的員工數量也在持續增長。

如今,燧原已建立了全建制的商務和研發部門,包括產品市場、商務銷售、客戶方案及供應鏈等部門,更好地為客戶提供服務。

張亞林認為,在企業初創階段,需要一些非常資深的人來把控產品和落地等方向,但隨著團隊逐步擴張,晶片公司就像一個火力配置均勻的集團軍,有各種兵種,包括做驗證的、做設計的、做架構設計的等等。

「我不認為一個公司全是「特種兵」」,張亞林特別提到,這不是有效的組織結構,當一個公司達到某一階段,就需要實現「火力均衡配置、各種兵種互相協同高效運作的組織」。

五、雲端AI推理晶片將呈現爆炸式增長

儘量CPU仍佔據最多的雲端推理市場,但張亞林認為,這是因為推理市場還未完全蓬勃發展起來,並不妨礙未來雲端AI推理晶片的成長。

此前因模型基礎量不夠大,很多推理還在做輕量化,加上端雲之間的延遲很大,導致網絡傳輸速度嚴重掣肘了雲端推理的應用。

而從近年數據來看,在中國雲端推理市場,AI處理器所佔份額從2017年的0%逐步攀升至2019年的1.5%。

尤其在今年,推理市場增速明顯。

首先是場景的發展,中國網際網路場景非常多樣化,在信息安全、語音、NLP、短視頻等方面有越來越多的推理需求,應用場景日趨豐富。

其次是網絡的發展,5G的興起打破了端雲之間的延遲限制,讓雲端多用戶並發性變得非常廣泛,將網絡延遲降到最低,這樣一來,雲端算力就變成了關鍵瓶頸。

因此,張亞林預計,隨著應用場景泛化以及5G的普及,AI處理器一定會在雲端推理市場呈現爆炸式增長。

六、商業成功是檢驗技術創新的唯一標準

什麼才算真正的技術創新?

前段時間,中國工程院院士吳漢明在題為《「中國芯」呼喚產業導向的技術支持》的演講中指出,商業成功是檢驗技術創新的唯一標準。

張亞林對此非常認同,當我們還在談論晶片架構創新,英偉達及其他雲端頭部公司已將著眼點放置於全系統的創新,而晶片只是其中很小的一部分。

「燧原的目的一直是算力普惠,這句話並不是空談。」張亞林說,燧原在軟體、硬體、系統、客戶定製化方案全面鋪開,通過打造高性價比的算力,真正為客戶創造價值。

在他看來,開拓型創新是有前提條件的,只有通過逐步了解市場,提高客戶黏性、構建生態到一定程度時,創新才是有說服力的。

要達到這個前提的根本,是通過不斷產品迭代,在算力性價比、客戶支持極致性上做文章,這樣才能積累起一定的客戶黏性。

「所以拋開市場價值、客戶黏性、生態壁壘去談創新,就是無本之木、無源之水。」張亞林說。

結語:不講故事,只講客戶價值

截至現在,燧原科技的雲端AI晶片生態已經覆蓋「邃思」通用人工智慧晶片、雲端訓練加速卡「雲燧T10」、雲端推理加速卡「雲燧i10」以及「馭算」軟體全棧平臺。

在張亞林看來,中國公司做數據中心是大趨勢,而中國數據中心的體量完全能容納更多的頭部玩家,市場也需要「百花齊放」,同時燧原將堅持通過高執行力和工程化為客戶提供價值。

「我們是一家以技術驅動,為客戶創造價值的公司。」他提到燧原已經走在商業化落地的路上,「明年公司願景是實現更大規模的商業落地,建立我們的產品生態和護城河,為客戶提供更多更完整的產品解決方案。」

在後續的產品迭代中,燧原計劃持續滿足客戶更多的需求。隨著生態打磨和業務泛化,燧原給自己定的目標是將客戶從其他產品遷移到燧原產品的時間壓縮在一周之內。

除了總部位於上海外,燧原科技已在北京和深圳設有研發中心。張亞林說,未來他們還希望能夠布局一些內地和沿海省市。

「人才在哪兒,研發中心就放在哪兒。」張亞林希望通過遠程管理和高效組織,未來燧原能夠吸納更多的人才。

相關焦點

  • 燧原科技張亞林:解構數據中心AI系統「全壘打」和「全維度」|GTIC...
    在峰會上午場,燧原科技創始人兼COO張亞林通過視頻的方式,發表了題為《軟硬系統協同——雲端AI晶片產品化關鍵》的主題演講。▲燧原科技創始人兼COO張亞林通過視頻的方式發表演講目前,燧原科技的雲端AI晶片生態已經覆蓋「邃思」通用人工智慧訓練晶片、「雲燧T10」人工智慧加速卡、GCU-LARE智能互聯技術以及「馭算」計算及編程平臺。
  • 雲端AI推理市場將迎來爆發 燧原科技發布首款推理產品
    繼去年底發布首款面向數據中心的AI訓練晶片「邃思」及加速卡「雲燧T10」後,燧原科技又發布了首款面向雲端的高性能推理卡。   疫情加快了數據中心建設步伐和AI應用的速度。「傳統數據中心和AI沒有直接關係,就是X86+GPU加一堆存儲和數據搬運,但現在數據中心越來越多引入AI加速平臺。
  • 燧原科技發布首款人工智慧推理產品 -- 「雲燧(R)i10」
    上海2020年12月21日 /美通社/ -- 燧原科技今日發布首款人工智慧推理產品 「雲燧®i10」。這是一款面向雲端數據中心的高性能推理卡。雲燧i10是單槽位標準卡,支持PCIe 4.0,FP32算力達到17.6TFLOPS,BF16/FP16算力70.4TFLOPS。
  • 燧原科技發布首款人工智慧推理產品
    人工智慧早已影響了人們工作生活的各個方面,人工智慧需要數據的支持,而大數據處理早已進入需要雲端支持的時代。因此面向雲端數據中心的人工智慧加速卡為數據處理提供了強大的算力。
  • 春華資本聯合領投國產AI晶片製造商燧原科技C輪融資
    春華資本旗下春華創投聯席負責人朱大鵬表示:「從宏觀面來看,強化科技力量已上升為國家戰略,增強產業鏈供應鏈自主可控能力是新時期的重要任務。從行業來看,受國際環境變化的影響和推動,中國晶片設計企業將從邊緣地帶逐步走向市場舞臺的中央。燧原科技率先實現國產AI訓練晶片的商業化落地,是重要的行業基礎設施供應商,在人工智慧的廣闊天地大有所為。春華將集合豐富的產業資源,助力燧原科技快速成長。」
  • 燧原科技進軍AI邊緣領域,攜手浪潮推出邊緣AI推理伺服器
    2020年12月23日,中國上海——燧原科技繼前日發布首款人工智慧推理產品 「雲燧i10」,又宣布攜手浪潮,共同推出基於雲燧i10的浪潮邊緣計算伺服器「NE5260M5」。標誌燧原科技業務向AI邊緣推理的拓展。該伺服器可根據客戶需求支持2-4張雲燧i10,為邊緣AI推理應用如自動駕駛、智慧交通、ETC識別、精密儀器預測性維護、AI工業質檢等場景提供強大算力支持。
  • 燧原科技上線PCIe Gen4 全互聯AI高算力訓練系統
    2020年10月26日,上海燧原科技正式推出搭載燧原科技雲燧T10的PCIe Gen4全互聯AI高算力訓練系統。該系統目前為國內第一套基於PCIe Gen4的全互聯AI高算力訓練系統,不僅使配備雲燧 T10的機內PCIe帶寬得以全面提升,同時結合燧原科技GCU-LARE技術可實現系統高性能互聯。
  • 上海交通大學-燧原科技 雲端AI加速系統聯合研發中心揭牌儀式舉辦
    2020年12月10日下午,上海交通大學和燧原科技聯合創辦的「雲端AI加速系統聯合研發中心」在上海交通大學閔行校區舉辦揭牌儀式。上海交通大學電子信息與電氣工程學院院長關新平、副院長薛廣濤、軟體學院院長臧斌宇及電院教授,燧原科技創始人兼CEO趙立東、產品工程高級總監鄧輝、市場總監陳超及團隊代表等共同出席。揭牌儀式由軟體學院副院長姚建國主持。
  • 燧原張亞林:解構數據中心晶片全壘打
    12月1日智東⻄現場報導,GTIC 2020 AI芯⽚創新峰會今⽇開幕,燧原科技創始⼈兼COO張亞林通過一段視頻,發表題為《軟硬系統協同——雲端AI芯⽚產品化關鍵》的演講。
  • 燧原科技完成C輪融資18億中信產業基金等三家領投
    燧原科技是國內首家同時擁有雲端訓練+雲端推理完整解決方案的初創公司,也是騰訊連續三年投資的唯一一家AI晶片公司,燧原科技業實現了在網際網路和金融行業的頭部客戶落地商用,2020年12月發布的雲燧i10已支持多款業界主流AI伺服器,正與頭部客戶展開業務合作。
  • 雲端AI推理需求將在2022年迎來爆發
    雲端AI推理需求將在2022年迎來爆發。繼去年底發布首款面向數據中心的AI訓練晶片「邃思」及加速卡「雲燧T10」後,燧原科技又發布了首款面向雲端的高性能推理卡。  疫情加快了數據中心建設步伐和AI應用的速度。
  • 浪潮攜手燧原科技推出超強邊緣AI推理伺服器
    北京2020年12月23日 /美通社/ -- 12月21日,浪潮邊緣計算伺服器NE5260M5宣布對燧原科技全新發布的人工智慧推理加速卡「雲燧i10」完成兼容適配與深度優化,可根據客戶需求支持2-4張雲燧i10,為邊緣AI推理應用如自動駕駛、智慧交通、ETC識別、精密儀器預測性維護、AI工業質檢等場景提供強大算力支持,最高性能可達每秒
  • 燧原科技完成C輪融資18億,中信產業基金、中金資本旗下基金、春華...
    專注人工智慧領域雲端算力平臺的燧原科技宣布完成C輪融資18億元人民幣,由中信產業基金、中金資本旗下基金、春華資本領投,騰訊、武嶽峰資本、紅點創投中國基金等多家新老股東跟投。 創立近三年,燧原科技完成了首款人工智慧高性能通用晶片「邃思」的研發和量產,同時面向數據中心相繼推出數款人工智慧算力加速產品,分別是針對雲端訓練場景的「雲燧T10」和「雲燧T11」,針對雲端推理場景的「雲燧i10」,以及與產品配套的「馭算」軟體平臺。燧原科技業已成為國內第一家同時擁有高性能雲端訓練和雲端推理產品的創業公司。
  • CadenceLIVE China用戶大會燧原科技 燧原將立足於數據中心發展
    打開APP CadenceLIVE China用戶大會燧原科技 燧原將立足於數據中心發展 燧原科技Enflame 發表於 2020-09-26 09:34:00
  • AI晶片「點燃」北京!GTIC 2020 AI晶片創新峰會大咖演講全乾貨
    全球EDA(電子設計自動化)巨頭Cadence,以及兩家知名半導體IP供應商Imagination、安謀中國在現場掀起AI晶片創新與落地的話題;全球FPGA晶片巨頭賽靈思、我國自動駕駛晶片明星創企黑芝麻智能與地平線也於峰會聚首,為大家分享創新經驗;我國AI晶片新銳玩家壁仞科技、燧原科技、比特大陸、光子算數、豪微科技、億智電子、知存科技在會上分享了落地心經;知名投資機構北極光創投
  • 國產AI晶片雲集,首批嘉賓揭曉!2020最強AI晶片峰會來了!
    目前,5位嘉賓已經先行確認參加此次峰會,分別是黑芝麻創始人兼CEO單記章、燧原科技創始人兼COO張亞林、寒武紀公司副總裁劉道福、比特大陸AI業務線CEO王俊和  下午的兩個版塊分別為「雲端AI晶片站上新基建風口」、「邊緣端AI晶片加速規模化落地」,將各自聚焦雲端AI晶片的新機遇,以及邊緣端AI晶片的落地探索。
  • 犀牛財經投融資:燧原科技獲18億元 安華金和獲2億元
    作者:芊芊燧原科技完成18億元C輪融資GPLP犀牛財經消息:燧原科技專注人工智慧領域雲端算力平臺,近日宣布完成18億元C輪融資,本輪融資由中信產業基金、中金資本旗下基金、春華資本領投,騰訊、武嶽峰資本、紅點創投中國基金等跟投。
  • 2020年中國AI晶片融資全景圖:京滬爭霸,四城搶人
    這些獨角獸各具特色:中科寒武紀先是憑落地華為手機聲名鵲起,去年集齊雲邊端產品線,又率先在科創板上市;地平線聚焦車規級AI晶片和AIoT邊緣AI晶片雙賽道,與奧迪、佛吉亞、理想、嬴徹等國內外知名車企合作;比特大陸是全球礦機老大、大陸第四大IC設計公司,已推出三款雲端AI晶片和一款終端AI晶片,去年還分拆出邊緣AI晶片公司晶視科技;深鑑科技被全球FPGA霸主賽靈思收購後
  • 聚焦AI開源開放 2020中關村論壇曠視平行論壇即將上線
    當下,人工智慧正成為新一輪科技革命和產業變革的核心驅動力,推動社會走向智能時代。人工智慧技術和底層基礎設施的開源開放能夠有效降低AI研發成本、提高研發效率,加速技術創新和AI應用落地。在此背景下,曠視科技將於2020年中關村論壇期間舉辦「人工智慧開源開放與生產力促進平行論壇」,邀請十餘位來自海內外的專家學者和企業代表,共同探討如何通過技術共享,降低企業人工智慧應用門檻、推動人工智慧產業落地。