原創:譚婧
顏偉鵬博士的名片上寫著:
京東集團副總裁、京東零售技術委員會主席、商業提升事業部總裁、技術與數據中心負責人。
少有人知,他2004年1月1日就加入谷歌,曾任谷歌中國高管。
少有人知,他還有一個身份:京東2020雙十一大促技術指揮官。
在我們今天的世界裡,很少有人會像戰爭中的軍人那樣直面生死,但是對於大型平臺電商來說,大促,就是生死。
古語道,兵馬未動糧草先行。大戰事,就有大補給。一位頭部品牌廠商、雙十一銷量達1.7億元的美式家具企業創始人曾對我說:「一年只幹兩件事,雙十一,和備戰雙十一」。
這個說法告訴我們,為了雙十一,小企業可以傾盡一切。而大電商平臺投入的資源,更是天文數字。
輪戰、補充兵源、武器損失……大戰,離不開消耗。理論上,誰也不想在生死之事上考慮如何省錢。
但是,善戰者反其道行之。
用顏偉鵬的話說,就是:「在企業發展到需要向技術傾斜資源的時候,不能大搞大水漫灌式IT投入。」
企業資源,全靠「組織」。可見,顏偉鵬對「組織」二字,有獨特的理解:
組織人力。 組織中臺。 組織紀律。組織未來。
一、組織人力
顏偉鵬說:「2020年是我第一次、第一年負責『618』和『雙11』大促。放眼長期,希望把大促備戰常態化。做到這一步,大促就不是個事兒,就不用費很大的勁兒。」
但是,京東現狀是,備戰壓力很大。目前的總體備戰投入:每年兩次大促,約花費40%人力,備戰周期4個月,總計一年1.6個月的全部研發人力投入。
顏偉鵬繼續說道:「有關大促戰備投入的數字,到2023年會被大幅優化。希望能變成:兩次大促備戰,只需2個月的人力投入時長,且只需投入10%的人力。做一下乘法,相當於人力只投入從1.6個月變為0.2個月的研發人力。」
他多次提到「只投入」。
「這樣,每年可以從備戰中節省出1.4個月的研發人力,可用於投入日常業務開發。」
《人月神話》是IT研發經久不衰的老故事,人月是衡量研發效率的事實工業標準。這筆帳,顏偉鵬已經算得很清楚。
註:人月神話The Mythical Man Month Essays on Software Engineering丨 Frederick Brooks
顏偉鵬用「備戰常態化」來降低大型戰事對大型企業人力資源的集中消耗。同樣是灌溉,一種是,短時間的中到暴雨,一種是,春風化雨,潤物細無聲。
站在全行業視角,顏偉鵬的目標,也是嚴苛的。
整個研發團隊努力的方向,是2020年之後的每年都能夠持續地降低單位訂單IT成本。
「單位訂單IT成本」的定義和計算方法頗為複雜。
顏偉鵬說:「想理解得簡單些,那就參考京東的物流業務,物流跟蹤的最重要的指標是單位訂單的物流成本,我這裡,是單位訂單的IT成本。」
高能物理學家凝視深淵,就是凝視每一個粒子。
技術指揮官凝視深淵,就是凝視每一分錢背後的IT消耗。
一場幾乎所有IT資源都參與的抗戰,數萬人,頭束紅帶,澎湃動員,高呼口號,日夜加班,為的就是——保障穩定。
雙十一,穩如泰山,幾十萬臺伺服器,穩如泰山。
京東研發團隊的資深架構師談道:
「2020年,通過對系統全方位、全鏈路的架構優化和更精細化的資源管理,大幅提高了伺服器使用率。比如,CPU利用率同比2019年增長了20.7%,機房之間的專線流量同比2019年雙十一下降了13%。節省了大量的IT資源成本。此外架構不合理,也不利於系統的穩定性,我們做的這些優化,一石二鳥,既穩定,又經濟。」
這件事情的本質,既是技術,又是高水平的組織。
組織,是一個動詞,也是一個名詞。
京東全集團有幾十個「一級研發部門」,整個研發部門各個團隊之間的節奏感是十分重要的。
這意味著無數次地協調,最終目的是步調一致,整齊劃一。
2020年,京東大幅加強了各個團隊的協調機制,「大促架構師委員會」應運而生。整個大促期間通過它協調集團各個研發團隊。
架構師是IT技術工種的頂層配置,是技術金字塔不倒的旗幟,他們的工作並不會因為大促結束而停止,他們在大促戰場上建立的互相信任會沉澱下來,促進各團隊日常的持續架構優化。
有詩云:「三軍受號令,千裡肅雷霆。」
二、組織中臺
很多人都知道「中臺」一詞,是大型網際網路企業技術實力的屠龍刀。但是,只有翻越IT、大數據、AI術語的牆,才能看見牆後的人,目睹屠龍刀的威力。
顏偉鵬說:「京東零售正在進行技術中臺、數據中臺和業務中臺的建設,令整個零售業務體系可共用一套技術服務,大幅提升研發效率,降低研發成本。」
「一套服務」說起來輕鬆,身後藏了一萬點暴擊。中臺「牽一髮動全身」,是一場戰略、業務、架構、流程、人員的變革,這些很難被外人看見。
多位京東數據科學家和算法工程師私下向我透露,自顏偉鵬擔任零售中臺「首席設計師」一職,中臺的細顆粒度優化與整改就一刻沒有停止。還據說,顏偉鵬一開始僅帶領幾十個人的團隊,後來迅速擴張為集團內部規模最大的算法工程師團隊,數量好幾百人。
算法工程師,是當今世上最昂貴的智力工種,智商最高的IT研發力量。
這些細節在雙十一前後僅有的兩次採訪中,我都沒有找到合適的機會和他確認。因為理解其複雜的組織理念,就非常的費事費力。
在我看來,整個京東零售的技術核心,總結成幾個中臺。
技術中臺,是跟業務邏輯無關的技術基礎設施。技術中臺往上是數據中臺,數據中臺把各種數據都整合到一起,用統一的口徑去看經營問題,提升經營效率、效果,比如讓運營人員做實時的數據分析等等。數據中臺把數據收集、集中起來,讓數據產生價值,就像集郵,集齊集全面,價值更大。
數據流入水池、湖泊、海洋,人人想用即可用,取之不盡用之不竭。不用等到要起航出海,才去造船。
數據中臺上面還有算法中臺支持多種算法,可以便捷地進行各種排列組合式的使用,工具齊全,不用等到要殺豬,把豬按翻在地了,才開始鑄鐵。
再往上是業務中臺,京東業務中臺必然包含了京東所有的業務邏輯。無論是根據用戶的行為、興趣、購物習慣、偏好,進行擇優推薦,還是用戶下單、加購、支付及後續一系列購物動作,甚至包括庫存、物流等供應鏈管理,均是業務中臺中的一個個模塊。
比如,商品交易能力,商品管理能力,商家管理能力等等,都由業務中臺提供支持。用戶中臺提供了用戶資產管理和用戶增長的能力。用戶增長是業務增長的主要抓手之一。
技術中臺是T-PaaS(technology)數據中臺是D-PaaS(data)業務中臺是B-PaaS(business)用戶中臺是C-PaaS(consumer)
這是BCD的意義,它們是整個中臺的底座。
一切「應用」枝繁葉茂、百花齊放的根基。一切「應用」皆由此地生長,滋潤。
顏偉鵬強調,用戶中臺會單獨拿出來,是因為對於整個生態太關鍵了。這裡「用戶」一詞在英文指的是consumer。比如,怎麼把一個跟某個品牌完全沒有關係的用戶,逐步變成對該品牌有興趣的用戶,最後變成該品牌的忠實用戶。
所以,用戶中臺有用戶引入、用戶運營、廣告監測、搜索推薦,以及用戶資產管理等能力。
用戶流失,怎麼再拉回來,工具和方法論都在用戶中臺上。
在這個中臺上面,再去打造各個業務形態,京東內部叫前臺業務。好比說京東商城APP是一個前臺,還有很多APP,一號會員店、京東健康、京喜、7FRESH生鮮超市……
這些前臺有各個埠對接中臺,現在有幾十個前臺,每個前臺都有很多個性化的需求,它們都是建立在統一的中臺之上。
中臺的職能,是讓前臺的業務可以快速敏捷的跑起來,我們希望能讓中臺技術成為前臺業務快速發展的核心競爭力。
京東零售技術,都跑在提供伺服器、存儲、網絡,和中間件的技術底座——京東智聯雲上。「三駕馬車」前臺、中臺、後臺變成了:前臺、BCD-PaaS+T-PaaS+智聯雲。
- 有了屠龍刀,怎麼操練呢?-「2020年,我們重點抓的是,全鏈路高保真極限壓測。」
這意味著京東平臺系統在備戰期間會模擬雙十一大促的真實流量及場景,從而發現大量潛在系統問題,將問題提前暴露出來,並隨之做好預案。
顏偉鵬說道:「壓測,一定要模擬用戶流量從京東健康,從京東商城、京喜衝進來,從頭到尾,全部模擬出,全部壓下來,這個過程,得把它叫軍演,更技術的方式叫壓測。壓測一定要高保真才行,如果不保真,壓出來之後大家覺得流量很大,系統服務貌似能扛得住。
但是,實際上,由於沒有把系統的薄弱環節給壓出來,到了大促當天,大概率會出大問題。」
京東研發團隊的資深架構師告訴我,京東的整個平臺聽「數據」指揮。
前期業務級別的數據和系統級別的數據,在系統內部有一個比較完整的數據檢測和分析管理平臺,在所有的大促決策、備戰的時候,一舉一動,都以數據為基礎。
把之前的經驗數據,業務上給的業務量的預估,再加上用戶行為等變化數據,結合起來,匯總起來,對大促零點高光時刻的用戶實際行為,做一個儘量貼近真實的仿真預判。
這比之前拿著總量去做預估要準了很多。
越逼近真實,越能練就強兵。參加過高考模擬考試的朋友,聽懂掌聲。
雙十一年年玩法翻新,玩法越新鮮,挑戰越大。
2020年有股超大預售量的暴風雨,暴風雨會產生一個洪峰。在幾分鐘內,巨高的流量。
時鐘撥回到前幾年,0點秒殺時就搶優惠券、搶少量商品。然而,2020年龐大的預售量意味著,預售商品集中付款。消費者點擊加購,商品到了購物車裡,這事沒完,消費者得拍下來才算結束。牽扯訂單後續環節越多,壓力越多。
這相當於第七套廣播體操原來只有三個動作,現在非讓你在同樣的時間裡做六個動作。
一百萬預售量,那你就把六個動作的廣播體操做一百萬遍,且在流量洪峰的時候。
有詩云:「函谷絕飛鳥,武關擁連營。」
三、組織紀律
科技企業的紀律和一般企業不同,因為僵化死板的紀律,是創新的死敵。創新者在複雜環境下,本就已面對尷尬窘境,如何破解紀律與創新的困局,給創新者喘息的機會?
顏偉鵬給出了下面的回答。
我們是有一些懲罰,但是核心還是希望大家不要犯錯,希望營造一個相對寬鬆的創新環境,允許犯錯。但是,如果同一個錯誤,犯了兩次,那我就會很憤怒,可能就會罰。要格外注意的是,技術畢竟很複雜,如果你是第一次犯這個錯,會儘量理解,所以,我們更多的是用一些好的機制和流程,推動整個架構的升級,改進錯誤,減少出錯機會。
好比這次「雙11」,我們也有一些系統出了不少問題,只是這些問題還好,因為我們系統是有容災的。我的要求是系統可以死,伺服器可以掛,內存、硬碟可以壞,網線可以斷,電源也可以被拔了……但是,業務不能受影響。
備戰要按照這個要求來做,這也是備戰常態化的一部分。
「雙11」我們發現了不少問題,雖然業務是照常運轉,但是這種情況我還是不希望發生,因為我們不可能有那麼多備份,如果兩個備份或者三個備份一起掛了,那我們就死定了。如果違反一些很明顯的規定,處罰是必要的。
我帶了一年的京東零售的研發,理念還是希望大家不要重複犯錯。重複犯錯,肯定罰。但是,還是要允許大家犯錯,不能每錯必罰。
今天的京東,非常龐大的業務體量,供應鏈管理能力達到了世界級水平,管理500多萬自營商品單品(SKU),2000多萬平米物流倉儲面積,庫存周轉天數低至34天。這背後需要強大而複雜的技術支持。
一個新的錯誤出現,要去挖掘更深層次的原因,而不是簡單粗暴的懲罰。
在指揮大促的時候,顏偉鵬喊出來:「大促,但凡出了問題都是我的問題,跟你們沒關係。」
戰士衝在硝煙戰場的最前線,指揮官衝在責任的最前線。
態度就像撒落在地上的鋼珠,顆顆有力,粒粒分明。
他說:「你把問題說出來了,要是解決不了,跟你沒關係,不是你的錯,是我顏偉鵬的錯,因為我沒有本事幫你想出好的解決方案,是我沒本事帶領團隊去想出好的解決方案,那是我的管理問題。」
此話一出,研發團隊的氛圍變化了,有了開放的氛圍,爭相著把問題說出來。
顏偉鵬說:「我非常看重這種做技術的氛圍。有些同事甚至一口氣把四五個嚴重問題都說出來了,每個都說得特別誠懇。問題說出來了,大家群策群力,一般都能找到好的解決方案。這樣,大促就穩了。」
自古真誠藏不住,唯有套路失人心。
四、組織未來
2020年雙十一過後,「泰山」項目浮出水面。「泰山」是什麼,「泰山」的目標是什麼?
希望備戰常態化,希望將備戰理念貫穿到每日的工作中,平日裡開展上線流程和自動化軍演,不斷暴露出系統的弱點。
「泰山」項目,將京東大促備戰的方法論,將備戰的工作重心,轉向日常管理。
顏偉鵬說:「『泰山』項目來自大促,從『618』 『雙11』演化而來,我希望備戰常態化,項目是2020年啟動的。希望從大促開始,把整個備戰理念貫穿到每天的工作。通過平時嚴格的上線流程和常態化的軍演,希望軍演越來越輕鬆,而不是等到大促前才來耗費大量人力搞軍演。」
用一句話就是:用大促的技術標準,拔高日常技術標準。
對於研發與技術團隊來說,京東軍演的號聲變了,從一年兩次,從大促前才能聽見,變成日常配樂,就像舞蹈時伴奏一樣,那些聽不見音樂的人,以為那些跳舞的人瘋了。
顏偉鵬的目標是:「我們預計到2023年,京東大促的單位訂單IT資源成本累計下降60%,或者說資源效率提升150%。」
古詩云:「拂劍照嚴霜,雕戈鬘胡纓。」
嚴苛,是顏偉鵬的關鍵詞,他給自己和團隊定了一個並不容易完成的目標。
註:京東辦公大樓內景
顏偉鵬曾對我說:
「我特別喜歡競爭。對我來說,如果沒有做好一個業務,是我沒有做好,並不是因為競爭者太強大了。良性競爭可以促進競爭各方共同強大,一個行業如果只有一個人做,這行業肯定不能做了,因為沒人看好。一定是大家都看好的行業,競爭才激烈,水漲船才高。之前我在谷歌做搜尋引擎,微軟的作業系統是很大的威脅,每次Windows發布新版本,谷歌擁有的默認搜尋引擎設置都可能丟失,要去死磕。死磕,互相競爭,但也互相促進。
所以,我每一天都思考——我的威脅在哪裡,什麼樣的行業變化會讓我的業務死掉,又是怎麼樣的死法?為了持續發展,為了保持競爭力,我該怎麼做?」
(完)
《親愛的數據》出品