近日,據媒體報導,阿里巴巴旗下研究機構達摩院三周年的成績單首次公布。
從公開信息可見,在 AI、量子計算、自動駕駛、晶片等多個領域斬獲 60 多項世界領先,並且已經發表了 1000 多篇國際頂會論文。其中 AI 相關技術已經廣泛應用在多個領域,包括醫療、工業、物流、教育、城市大腦、遙感等場景中。
而在人才方面,達摩院擁有 10 多位 IEEE Fellow 級別科學家;還成功孵化了兩家高科技企業——平頭哥半導體公司和小蠻驢智能科技有限公司。
與此同時,阿里巴巴已經先後發布超強 RISC-V 處理器玄鐵 910 、1 秒處理 7.8 萬張照片的超強 AI 推理晶片「含光 800」等多款晶片類產品,交出一份亮眼的答卷。
三年前,馬雲在雲棲大會上計劃三年內為達摩院投資 1000 億資金,並將其定義為「一所探索科技未知的研究院」,以人類願景為驅動力,開展基礎科學、創新性技術和應用技術研究。
從單純的「淘寶商城」到「向技術要生產力」,再到「以技術驅動商業」,阿里巴巴對數位化技術進行了怎樣思考?
阿里要將技術作為核心驅動力,達摩院在當中起了哪些作用?因何而起?
帶著這些問題,跟隨我們回到三年甚至更久之前,探索這座非典型研究院的前世今生。
達摩院三周年之際,夢回起點
作為阿里巴巴劍指基礎科研的武器,達摩院的成立源自阿里巴巴由來已久的技術執念。
早在 2008 年,馬雲就開始考慮阿里巴巴技術的獨立研發問題,當時已經希望建設一所技術研究院,並請來了時任微軟亞洲研究院常務副院長的王堅。只不過,受到當時整體技術環境和技術底蘊影響,技術研究院沒做起來,卻無心插柳地做成了阿里雲。
現在回頭看,阿里雲的成立似乎是為後來圓阿里巴巴技術夢鋪墊了一條更穩固、通暢的道路。隨著阿里雲的發展,阿里巴巴的自由技術也逐步增厚。以雲計算為起點,阿里巴巴技術逐步產生了向底層算力、眾泰算法、上層技術產品延伸的需求。整個阿里巴巴集團也完成了從早期的「業務驅動技術」到「技術驅動業務」的蝶變。
這種技術與業務之間的動態調整,似乎是一家大型網際網路企業正確的走向。
2014 年 9 月,阿里巴巴集團在紐約證券交易所上市。緊接著,阿里巴巴就在矽谷宣布成立新部門 iDST(institute of Data Science & Technologies)。
iDST,就是達摩院的前身。
在 iDST 期間,阿里巴巴吸納了一批頗具影響力的學者加盟,達摩院機器智能實驗室負責人金榕就是在這個時期加入的。
說來有趣,在那個時期加入的科學家可能沒有想到,進入阿里巴巴後,竟然要經歷一番不亞於「變形計 」的生活。
為了讓各位「阿里巴巴新人」們深度了解阿里巴巴當時的技術深度和業務,阿里巴巴集團讓這些科學家們打散到各個業務部門去了解「糧食是怎麼生產的」,為了尋找技術和業務結合的方式,這批學者們真實地經歷了從理論到顯示的落差。
這也是達摩院一所技術研究院為何會展現出如今這種前所未有的「接地氣」的原因。
2017 年雲棲大會上,馬雲正式宣布達摩院成立,並承諾在 3 年之內給達摩院投入 1000 億的資金用於科技研發。科研與業務,學術與商業化,這個特殊的組合,在阿里巴巴內部的化學反應終於走到了臨界點,阿里巴巴構築起經濟體技術大廈的四梁八柱,包括技術架構、技術路線、技術產品、技術理念和技術組織等等,阿里巴巴也從一家電商公司成功轉變為一家技術公司。
而馬雲在 2017 年雲棲大會上對達摩院提了三個要求:
「活得要比阿里巴巴長。」
「服務全世界至少 20 億人口。」
「必須面向未來,用科技解決未來的問題。」
達摩院的使命是「探索科技位置,以人類願景為驅動力,開展基礎科學和顛覆式技術創新研究。」基於這樣的原則和宗旨,達摩院打響了基礎科研和硬科技發展的一炮,使得市場企業的技術創新成為國家科技創新的重要組成部分。
阿里巴巴技術 20 年 8 大戰役
在阿里巴巴成立的前十年,先有業務命題,再有技術求解是主流的業務和技術的互動模式。技術作為業務的支持者,更像是一個幕後英雄,支撐起阿里巴巴的商業光芒,卻每一次都有種「功成身退」的意思。
但隨著兩者關係的發展,阿里巴巴逐漸意識到技術本身的價值,在數字經濟時代,數據中臺等技術工具的戰略價值將遠超過往的預期。技術,是能夠改變商業的。
可能很多人還不了解,阿里巴巴從一家國民級電商公司到中國第一集團的技術公司,到底經歷了什麼?
下面這份阿里巴巴技術長徵路上的「八大關鍵戰役」,每座城池都是戰略重鎮,每個勝場都以血淚做注,站在事後諸葛的立場回望,阿里巴巴的每一次選擇仿佛都存在一種必然性,技術的伏線隱藏於阿里巴巴發展的每個關鍵階段,向技術的長徵,是阿里必須要走的路。20 年間,無數個戲劇而痛苦的內部變革,都被它們一一連綴起來,而在網際網路時代的風雲變幻下,這些從無到有、日益強大的技術底座,成為了阿里經濟體最重要的護航力量。
看完這八段故事,你也許能夠窺見阿里技術演進的脈絡。
2.1 「寧波會議」
2007 年,當時市值約百億美元的阿里巴巴,正處於與高速成長期相伴的戰略迷茫期。
而就是在這一年,阿里巴巴首次「向技術要生產力」,也被稱為阿里登月計劃。
2007 年 9 月 28 日~30 日,寧波會議本想一改常規,找個能看海的場所開闊思路,卻陰差陽錯定錯了地方,最終走到一個連海在那頭都不知道的密閉會議室。高管們就在這個封閉的會議室裡埋頭討論著兩個主題:
「未來十年阿里到底要去往何處?該有什麼樣的戰略?」
兩天兩夜的爭吵過後,他們達成了共識:阿里巴巴要建設一個「開放、協同、繁榮的電子商務生態系統」,而技術,是這個生態系統的核心。
在寧波會議中,第一次提出了「阿里巴巴是一家數據公司」,要把流淌在各個業務部門的數據打通,讓信息流、資金流和物流形成統一的數據智能,向數據要生產力。決策層打算在一年內為登月計劃找個負責人,第二年,王堅加入阿里巴巴。
「登月」首先需要解決算力問題,這是當時的 IOE 模式做不到的。阿里巴巴自主研發雲計算的傳奇故事,在此埋下伏筆。
寧波會議之後 7 年,馬雲首次對外提出「DT(Data Technology)時代」概念。不論向前追溯還是向後循證,「數據」和「科技」二詞都是阿里巴巴技術轉型的核心線索。
2.2 「五彩石」
阿里巴巴成立的前一個十年,技術在這家公司的角色是業務的追隨者、支持者。「技術跟著業務跑」,五彩石項目是典型。
2008 年,天貓還叫淘寶商城,它和淘寶不是珠聯璧合的雙子星,而是兩座獨立「煙囪」,它們各有各的 IT 系統,數據和業務都不互通。淘寶業務快速增長,小煙囪眼看就要撐不起高流量、大並發的場景;淘寶商城流量不盡人意,但又無法從淘寶獲得分流。
做一個業務就建一套系統,這是傳統的企業 IT 模式,但並不適合新生的平臺經濟。2008 年 10 月啟動的五彩石項目,訴求直指「拆煙囪」。
工程師們從交易、支付、會員等業務中提取共性功能、打包成公共模塊,又把兩個平臺的數據沉澱到統一的池子,為此後數據智能的研發奠定基礎。再開發新業務,就可直接調用公共模塊和數據,大大提升開發效率。
這一動用 200 多號人員、耗時半年完成的項目,徹底打通了淘寶和淘寶商城,首次在架構層面引入中間件,開啟阿里巴巴技術的分布式時代。「中間件技術」具有後來的阿里中臺的影子,很快在技術圈內得到普及。
2.3 「去 IOE」
技術世界原本沒有「去 IOE」這個詞,阿里創造了它。
「IOE」指代的是 IT 系統的三樣標配:
• I(IBM,伺服器提供商,他們提供的伺服器俗稱「小型機」)
• O(Oracle,資料庫提供商,他們的軟體是「甲骨文商業資料庫」)
• E(EMC,存儲設備提供商,他們提供的是「集中式存儲」)。
當時的阿里和很多企業一樣,依賴 IOE 如依賴氧氣。2007 年一年,阿里付給 IOE 及戴爾等廠商的硬體費和維護費高達幾千萬美元。
IOE 不僅貴,而且不好用。阿里用戶激增,數據越來越多,每年早上 8:00 到 9:30 之間 CPU 使用率高達 98%。從未經受如此流量考驗的 IOE 系統,越來越無法滿足龐大的計算任務。
2008 年中旬,阿里巴巴提出了向網際網路架構轉型的戰略,通過自主研發和替代性方案重構自己的數據系統。這不是簡單的系統替換,而是要推動分布式架構取代集中式架構,前者就是今天的雲計算架構。
在 2008 年的一次內部會議上,阿里確定了雲計算戰略。這是眾多阿里技術人員的自我革命——阿里的資料庫團隊全亞洲最好,被稱為 Oracle 黃埔軍校,正是那群 Oracle 工程師,親手拆毀了自己安身立命的系統。
2013 年 5 月 17 日,阿里集團最後一臺 IBM 小型機在支付寶下線,宣告去 IOE 戰役終結。
2.4 「飛天」
阿里用來替代 IOE 的雲計算系統,在 2008 年 10 月 24 日得名「飛天」。
2009 年 9 月 10 日阿里巴巴十周年年會,阿里雲子公司成立,400 多人的團隊開啟了中國最早研發雲計算的裡程。一部朝向「技術無人區」的探險由此起筆。
2009 年早春,飛天第一行代碼在北京匯眾大廈 203 室誕生,從那以後,阿里雲的工程師換了至少五代,最早的核心團隊成員只剩 20%。自主研發註定是最艱辛的選擇,但曾任阿里雲總裁的胡曉明說:「拿來主義蓋不起高樓大廈,自主研發的雲才能走更遠。」
當時很多人還不知道雲計算為何物,超前的技術探索換來的是外部的質疑和內部成員的出走。關於「阿里雲要被撤掉」的傳聞直到 2013 年才徹底消失。那一年,飛天單一集群能力達到 5000 臺,成為全球第一家對外提供這一能力的公司,算力底座宣告落成。
今天,飛天能把遍布全球的數百萬臺伺服器連接成一臺超級計算機,單集群規模可達 1 萬臺,10 萬個進程達毫秒級響應,擁有十億級文件數、EB 級別存儲空間。飛天網絡遍布全球了 200 多個國家,總用戶數 230 多萬。
沒有飛天,阿里不會成為今天的阿里。正是從飛天開始,技術在阿里的功能角色發生突變,技術與業務的關係,從「技術服務業務」變為「技術就是業務」。
2.5 「iDST」
2014 年 9 月 19 日,阿里巴巴集團在紐交所公開上市,創下美國歷史上融資規模最大的 IPO 記錄。上市活動結束,阿里緊接著在矽谷宣布成立新的部門 iDST,數據科學與技術研究院(institute of Data Science&Technologies)。
iDST 的 D(Data)和T(Technology),也正是「DT時代」的 D 和 T。這個以數據科技研究為己任的機構,昭示了阿里巴巴長久以來的自我預言:成為一家數據驅動的公司。
阿里巴巴經濟體是座數據金山,但在過去數據的價值並沒有被挖掘出來,阿里自嘲是「坐在金山上啃饅頭」。變局始於 iDST。它吸引了世界上最懂數據的一群人來到阿里,尤其是人工智慧領域的一眾大牛。
然而神兵天降並沒帶來技術躍進的故事,學術研究與業務場景之間天然存在離心力,導致 iDST 「空轉」,並最終催生了阿里技術史上著名的下鄉運動。iDST 的人馬被分進螞蟻金服、淘系搜索和阿里雲三個部門,幫助建立螞蟻金服風控體系、淘系智能搜索推薦系統,升級了淘系和螞蟻的客服系統等等。
經此一役,技術與業務的對話體系終於被打通。2016 年 CTO 張建鋒重舉 iDST 大旗,已然重生的大牛們回到出發地。不久之後,阿里開始催熟那個懷揣已久的夢想:建立一所以技術驅動商業的研究院——iDST 的形與魂,都將被熔鑄進日後的阿里巴巴達摩院。
2.6「中臺戰略」
2015 年底,阿里巴巴集團宣布啟動中臺戰略,目標是構建符合 DT 時代的「大中臺、小前臺」的組織機制和業務機制。前臺作為一線業務,更敏捷、更快速地適應瞬息萬變的市場,中臺則集合整個集團的數字運營能力、產品技術能力,對業務前臺形成強力支撐。
關於中臺,有個廣為流傳的類比:美軍的作戰策略,二戰時以團為單位,越戰時以營為單位,到了中東戰爭則以幾個人的班排為一線作戰單位。敢把這麼小的單位放到前線,是因為美軍擁有強大的飛彈智慧系統,強大的中後臺能力可以支撐小團隊做出快速判斷。網際網路時代的商業策略也是一樣。
阿里巴巴將核心能力以數位化形式沉澱到業務和數據兩個中臺,「一切數據業務化,一切業務數據化」,以數位化資產構建企業核心競爭力。在中臺架構上,「數據石油」威力顯現,成功孵化釘釘、飛豬、口碑等創新業務,聚划算業務只用7個人花一個半月就開發了出來。外部企業需要幾十人幹半年的業務,在阿里內部靠幾個人做幾星期做就能完成。
通過阿里雲,阿里巴巴將支撐商業基礎設施的技術和架構「原子化」輸出,讓客戶企業快速複製中臺架構。2018 年阿里宣布組織架構調整,阿里雲升級為阿里雲智能,中臺能力與雲全面結合,繼續「技術創造新商業」的徵途。
2.7「達摩院」
阿里巴巴一直想要成立自己的研究院,技術長徵途中幾度試圖解鎖這項任務,但又幾度止步深思、調轉方向。它在等待一個對的時機。
2017 年 10 月,時機終於到來。阿里在當年的雲棲大會宣布成立達摩院,探索科技未知,以人類願景為驅動力開展基礎科學、創新性技術和應用技術。為此,阿里將在 3 年內對達摩院投資超過 1000 萬元。
馬雲對達摩院提出三個要求:活得要比阿里巴巴長;服務全世界至少 20 億人口;必須面向未來、用科技解決未來的問題。
達摩院與一般研究院最大的區別在於「解決社會問題導向」,它的宗旨是「Research for solving the problem with profit and fun(為解決問題研究並帶來利潤和快樂)」。
達摩院下設 4+X 個實驗室,即機器智能、數據計算、機器人、金融科技和X實驗室,現已建成完善的機器智能算法體系,涵蓋語音智能、語言技術、機器視覺、決策智能等技術方向,共在國際頂級學術會議發表近 400 篇論文,在國際頂級技術賽事上斬獲 40 餘項世界第一,取得一系列世界領先的技術突破。
達摩院的前身是 iDST,它保留了 iDST 的人才班底,也繼承了「技術驅動業務」的實踐路徑。回望來路,達摩院的成立與爆發其實是阿里技術體系發展的自然結果,是阿里技術價值觀和方法論沉澱的集中成果。
2.8「平頭哥」
「死生看淡、不服就幹」,平頭哥擁有阿里技術體系最朋克的出場。
這個以非洲蜜獾形象躍入公眾視野的公司,是 2018 年雲棲大會的焦點。阿里巴巴將當年 4 月收購的中天微系統有限公司和達摩院自研晶片業務整合成為獨立晶片公司,推進雲端一體化晶片布局。
阿里希望通過自研的強大技術平臺和生態系統整合能力,推動國產自主晶片的產業化落地。平頭哥不僅負責研發,還要擔負產業化推廣、構建生態等一系列任務,讓晶片成為阿里巴巴的一項戰略業務。
2019 年 7 月,平頭哥發布業界性能最強的 RISC-V 處理器玄鐵 910,並宣布普惠晶片計劃,全面開放玄鐵 910 的 IP Core;2019 年 8 月,平頭哥發布 SoC 晶片平臺「無劍」,面向AIoT時代提供一站式晶片設計服務;9 月,平頭哥又將推出全新雲端 AI 推理晶片,為人工智慧場景提供極致算力。
平頭哥致力於成為 AIoT 時代的晶片基礎設施提供者,平臺化的行業定位有著鮮明的母體經濟烙印。阿里進軍網際網路核心技術領域的決心不啻於一場無聲的誓師:技術將成為阿里巴巴面向未來的核心驅動力。
隨著過去十年阿里雲的大發展、達摩院的布局以及平頭哥的異軍突起,阿里巴巴在雲、AI、晶片等領域的技術實力已都位於業界前列。如果說過去二十年阿里的發展得益於科技革命帶來的技術紅利,那在未來二十年,阿里不僅要把技術作為核心驅動力,更要通過創新技術去為世界創造新的技術紅利。
達摩院,一座非典型的技術研究院
達摩院成立三年以來,搭建了比較完整和成熟的科學-技術-產品的研究體系,除了技術賽事和論文方面的成就,還成功孵化了平頭哥半導體公司和小蠻驢智能科技有限公司兩家高科技企業。
目前,達摩院專注在機器智能、數據計算、機器人、金融科技和X等研究方向,也即「4+X」研究領域,目前設有 14 個實驗室:
但要是說達摩院是一座技術研究院,那麼似乎還無法完全地概括了它。
如果達摩院是一個純粹研究技術的科研機構,那麼它最終只能依附於阿里巴巴其他的商業業務存活,而科研與商業業務的結合,理論與實際的碰撞,則又是一個巨大的考驗。
而這個問題的答案,在達摩院的技術布局和創新機制裡就能得到。
3.1 達摩院的技術布局
達摩院的技術布局由三個層次結合,從短期向長期突破,從長期緊緊包圍短期和中期:
長期:形成前沿技術有布局(如量子)
中期:核心技術能力突破(如AI)
短期:關鍵技術可應用(如資料庫)
對外,達摩院有著清晰堅定的規劃,且遵循這些布局和計劃穩定輸出技術成果,以技術驅動商業。
對內,達摩院針對不同層次技術也制定了不同的目標、考核周期和激勵機制,以人才驅動技術。
以其技術布局的「中期」層面而言,如今以達摩院機器智能實驗室為主導,阿里巴巴完成了完善的機器智能算法體系,斬獲一眾世界領先的技術成果。而在 AI 應用落地層面也逐漸變得長袖善舞,將 AI 的應用落地推廣到工業、物流、醫療、遙感、城市大腦等多個場景當中。
相信許多讀者對阿里 AI 已經不陌生了,在最新的數據中我們發現,阿里 AI 每天調用超過 1 萬億次,服務覆蓋全球 10 億人,日處理圖像高達 10 億張,視頻 120 萬小時、語音 55 萬小時及自然語言 5 千億句。
這樣的一份成績單,無疑是十分耀眼的。達摩院展現出的研究模式,是基礎研究與工程研發並行的發展,科研應用於商業中的突破。
3.2 達摩院的創新機制
在達摩院的模式裡,除了深耕,還得創新。
從目前達摩院的成績來看,至少有著三大明確且堅定的創新機制。
1)你的需求,我的導向
需求導向,是達摩院區別於一般研究院的最大特點。
達摩院始終相信,好的技術若不具備應用落地前景、無法切實解決現實問題,則依舊是虛無縹緲;好的技術需要脫虛向實,除了具備應用落地場景更應該切實解決現實問題,並以足夠低廉的成本惠普大眾。所以達摩院堅持以解決社會問題和市場需求為導向,從需求倒推技術研發和技術創新。
2)研發與應用雙循環
為了減少從研發到應用的中間環節,縮短科研成果轉化鏈條、提升科研成果轉化效率,達摩院制定了「研發-應用」雙向循環的研發模式。
「面向業務/市場需求設立研發項目,以研發驅動業務,幫助業務/市場提質增效;」
「以業務驗證研發成果,讓科研成果在業務和應用場景中快速落地、經受檢驗,並複製推廣。」
基於這個模式,達摩院還研發了達摩院城市大腦相關技術,不僅在車輛檢測、深度學習等技術領域取得多項世界第一,還快速在全球數十個城市落地應用。
3) 技術&業務,一個都不能弱
達摩院在組織設計方面也頗為嚴格,不僅要求達摩院實驗室的負責人技術、業務雙肩挑,以確保技術和業務的無縫銜接、雙輪驅動;另一方面,在業務和場景中發現問題、定義問題,基於問題開展前沿探索和技術創新;最後,還要將前沿技術快速應用化、產品化,沉澱形成可交付的產品/系統,通過業務系統完成技術驗證。
這樣的組織模式,既減少了從技術到應用的中間環節,又實現了市場需求到技術研發的直接反饋,避免無用研發、提升科研效率。
在這種組織模式下,達摩院存儲與資料庫實驗室研發出全球首個基於 MySQL 的全加密資料庫系統,進一步提升我國資料庫技術國際競爭力,為構建自主可控的新一代核心系統奠定了堅實的基礎。
阿里巴巴,今天已經變成一家技術公司。
這座非典型的技術研究院,可以活得比阿里巴巴長嗎?你怎麼看?
點擊「閱讀原文」,免費試看