作為一名技術人員,我們對滿天飛的「軟體定義xx」概念早已沒有新鮮感。但你可曾想到,當你享受通過某個電商渠道採購所需物品的便利時,背後很可能是「軟體定義價格」?這家電商就是1號店,這個會定價的系統,是其「智慧軟體」體系的一部分,蘊含了大數據的技術和人工智慧的思想。
1號店的「智慧軟體」能做哪些事情?它是如何煉成的?在今年的「TOP100全球軟體案例研究峰會」期間,CSDN記者獨家採訪了1號店首席技術官兼技術部副總裁韓軍,挖出了1號店在智慧軟體、大數據和人工智慧等領域的實踐經驗,供讀者參考。
智慧軟體=數據+商務規則+業務流程+算法
稍微了解韓軍的人都知道,他是1號店的1號員工、技術領軍人物,1號店在2008年從京東、噹噹的夾縫中起步發展到今天,他以技術推動商業變革的努力功不可沒。所以,雖然都是在說SDx(軟體定義一切),韓軍對這個概念的理解似乎比硬體/基礎軟體廠商要高出一個層次。廠商們只看到了通過軟體來重構IT基礎設施的趨勢和必要,韓軍則認為,軟體是(IT系統)和業務結合的載體,是一家商業公司運營的平臺。換言之,所有的商業都在軟體之中,技術人員不僅要懂技術,更要懂業務。
關於智慧軟體,韓軍是如此定義的:智慧軟體=數據+商務規則+業務流程+算法。
可以看到,這個智慧軟體的公式,實質上是將大數據應用於整個企業的商業流程。韓軍強調:數據是連接的數據,要具有統一的格式,首先需要一個統一的數據平臺。
1號店智慧軟體的成長軌跡
智慧軟體的概念是伴隨著1號店業務的發展逐漸形成的,它的萌芽早於大數據概念的流行。出於1號店對技術驅動商務的渴求,早在2011年初,1號店就著手改變數據倉庫分散的局面,籌劃構建Integrate Data Warehouse,這也成為1號店當前統一大數據平臺的前身。
此外,1號店還做了一個PIS價格智能系統,該系統不僅包括1號店商品的進價、銷售價格、銷量,也納入了同行網站所售商品的信息及其售價變化(全網72個競爭對手共1700多萬商品的價格變化),還有行業數據,藉助數據的處理,不僅能夠為1號店提供智能的價格推薦,還能高速1號店要向客戶推薦哪些商品——如果某些商品呈現出在同類網站暢銷的趨勢,那就推薦它們。需要注意,這裡看的是銷量曲線,而不是絕對數值,以此實現更快速的市場反應速度。
Gartner分析師聽到這樣的描述,驚呼這就是大數據的理念。這堅定了1號店進行智慧改革的決心和信心,進而在實踐中形成了前述的公式。數據是根本,不用多說。而針對銷售、推薦、價格等不同場景,還需要很多的不同算法來實現。價格的設置當然也是需要符合1號店的商業邏輯,同時,不同的價格在達到什麼程度,需要不同的人批示,不同的處理流程是不一樣的。比如MDP商品計劃系統,經過分析以後採取不同的策略,自營/商超/SBY不同的策略有不同的含義。當不同策略包括促銷、庫存的管理、網站運營都放在這個體系以後,會告訴你備多少貨,什麼時候備貨。
據韓軍介紹,PIS系統強大之處能夠隨著數據的變化實時、動態地推薦不同的價格,目前1號店80%的商品價格就是完全由這套系統來設置的,做到實時響應市場的變化,同時降低人工失誤;而另外的20%,採用的是系統推薦+人工審核的方式。這並不是價格戰,而是根據行情和用戶的接受程度給出最合理的價格推薦,實現1號店、供應商、用戶的多方共贏,也就是商業利益和用戶體驗的平衡。事實上,1號店的銷量和平均毛利都因為PIS獲得了20%的增長。
與PIS同行的,就是1號店的個性化推薦系統,推薦依據包括用戶偏好和商品暢銷程度,這也是目前電商網站的標配了,但實現的程度各有高下。1號店的個性化推薦包括首頁精準化、搜索精準化、廣告精準化、購物流程精準化等。以搜索精準化為例,平臺通過對用戶以往購物品牌、價位、品類、店鋪、地域等數據分析,為用戶展現出更加精確的搜索結果。韓軍表示,1號店的個性化推薦效果,目前佔到了公司整體營收的10%。
在這些系統中,1號店採用了Spark、Stream Computing等技術,靈活藉助開源的力量,但韓軍表示,1號店更多的是站在技術使用者的角度來考察各種技術,沒有必要,不會刻意去開發一套自己的SDK。
大數據的核心與難點
都說大數據的4V之中最重要的是價值,韓軍認為,價值就是要回歸到業務場景中來,並且要真正地應用起來,需要對數據進行嚴格的統一定義,建立完整的管理模型。所以,首先要有一個統一的大數據平臺,再通過數據應用平臺對其他系統或者對第三方進行服務。
對於實現大數據價值的難點,韓軍認為最難的是連接——這裡指的是雙向適時的互動連接,在獲取信息的也推送更多的信息,以獲得更好的互動。「當數據連接的時候,它產生的價值是最大的。當然這同時不能觸碰法律底線或者侵犯他人隱私。」他認為,1號店在這方面也還有很大的提升空間。
韓軍解釋說,再優秀的新聞網站、社交網站或者電商網站,其數據都只是一部分,連接在一起才能真正拼出完整的人形圖,如果沒有連接,誰都不敢說完全理解用戶,這是大數據目前最大的問題。連接成本如何做到最低,也是一個很大的問題,這包括一些技術上的因素,比如帶寬與數據吞吐量的矛盾。
日前成立的北京大數據交易服務平臺,證實了這種連接的需求。不過,大數據產業的發展,還需要有關部門能夠出臺數據分享框架或者法律文件來解決。
CTO的管理經驗
當系統複雜、團隊膨脹,如何做到敏捷開發是每一位CTO必做的功課。研發團隊從1個人建立起1000多號人的研發團隊,同時開發65個小項目,1號店的管理要如何進行?韓軍分享說,1號店開發了一個Trident智慧型大數據統一工作平臺,基於大數據進行處理,把所有跟開發相關的系統都整合起來,把CMIS、LDAP、SVN等都通過這個系統進行整合,將流程和最佳實踐系統化。所有不同的整合從業務開始,從有一個想法開始就進入這個體系,到最後上線,全部在一個閉環裡實現,業務方、產品經理、項目經理、開發負責人、開發和測試看到的數據是實時和統一的。
韓軍介紹,Trident包含了如下七大模塊:
系統也是自動化的,比如自動測試、自動上線。根據當前進度和歷史數據進行預測,對項目管理來講可以實時看到項目的進度和風險點在哪裡。系統自動分配需求和項目優先級,對開發人員的好處是馬上知道下一個任務是什麼,自己怎麼樣來安排。對業務來講,這個項目什麼時候到什麼階段,也可以一目了然。
系統還提供了內部千人千面的個性化試圖和決策報表,對於公司管理層關注的是重要產品和項目分析、IT資源預測和使用分析等等。對於業務部門關心的是需求受理進展和SLA、項目風險預警,對於一線技術人員關心的是日常工作分配、執行情況,風險和問題。
Trident對研發的優勢可以概括為三點:數據全面且透明,融入敏捷開發模式和最佳實踐,系統化的監控預警和資源優化算法。目前,該系統為1號店提高了30%的研發效率——在整合自動測試實現上線的自動化之前,這個數字還只是20%。
採用這套系統,1號店奉行用一年多時間摸索出來的Scrum敏捷開發模式,同時支持少部分更敏捷的看板模式,其他傳統的模式可能不太適合。韓軍還表示,未來會大力推廣看板,但一些不適合看板的團隊(如支付)也不會強推。看板的難點在於質量控制,1號店目前已經成立了一個看板的專家小組,對看板數據的問題進行分析總結,然後再去實施。
談到面臨的挑戰,韓軍表示,智能軟體的推動還是有一些阻力。現在很多具體的管理人員和開發人員對這個理解還是不夠深,同時1號店也還是一個學習的過程,但總體來說他還是非常樂觀。
人工智慧:智慧軟體的未來
人工智慧與大數據應用的結合已經相當緊密,以至於很多人戲稱不談人工智慧都不好意思談大數據,Google、微軟、IBM、百度、騰訊、京東等多家科技公司極力宣揚自己探索人工智慧領域的最新進展,當然,也有言論擔心一些科幻片的故事情節成為現實——人工智慧最後會造成機器統治人類的局面。韓軍看來不是人工智慧的狂熱粉絲, 當記者提到這四個字,他才接著說,PIS其實可看做是一個人工智慧,在構建的時候,很大程度上受到了IBM Watson的啟示。當然,完全人工智慧的系統和PIS區別很大,PIS重要的是利用人工智慧的思想來設計。機器學習技術在系統中的作用主要是反饋人工決策或者運營策略,更新系統規則。
韓軍解釋說,用算法來解決共性問題,要有智能的方法。未來的人工智慧就是很多算法的集合和很多算法的智能化。他認為,未來的系統是全自動化的系統,人工智慧是軟體的未來。
「我們不是去做一個人工智慧的系統,而是用這個思想來進行開發。還有數據、商業規則、業務流程、算法,使得系統越來越接近用戶的真實需求,在用戶採取行動之前,幫助用戶決策或者代替用戶決策。另外系統的反饋速度也可以接近用戶的需求。」