記者 | 婁曉晶編輯 | 文姝琪1
2020年9月16日,美國雲數據倉庫公司Snowflake在紐交所上市,這匹雲端獨角獸創造了史上規模最大的軟體業界募資案例,市值達到700億美元。聲稱已經54年沒有參與過新股發售的、並且鮮少認同科技股的巴菲特旗下的伯克希爾-哈撒韋公司也參與了這次IPO。
Snowflake成立於2012年,是一家為企業提供雲原生數據倉庫的企業。在Snowflake雲數據倉庫中,企業不僅可以存儲大規模的數據,還可通過機器學習算法等應用進行數據處理。
Snowflake營收的快速增長和上市後的股價表現對於中國的雲上企業服務軟體公司來說,意味著什麼?中國的百億美金雲上獨角獸在哪裡?
2020年11月中,企業級開源分布式資料庫廠商PingCAP宣布完成了2.7億美元D輪融資。從2015年創立到完成D輪融資,在融資之冬、企業服務之春裡完成新一輪融資的PingCAP在似乎可以部分還原「尋找中國Snowflake」的故事,中國的投資人正在展開對更多片「雪花們」的捕捉。
資料庫與開源文化
近年來,國內的網際網路和移動網際網路應用發展奇快,用戶量、交易量、數據量及其增量已經是世界第一。當用戶的數據量大到一定級別,比如當單表超過5000萬條或者1億條數據時,過去的資料庫和資料庫集群已經不能很好地支撐業務需求,有的甚至開始頻繁宕機,公司業務受到很大影響。
PingCAP創始人、CEO劉奇在京東擔任資深系統架構師時,就深刻感受到傳統資料庫性能的痛點,以及國內市場對新型資料庫的龐大需求。
劉奇開始思考,能不能設計一個工具,既可以保持像原來操作Oracle和MySQL一樣的易用性,讓用戶輕鬆上手,同時又能獲取一個彈性伸縮架構,創造一款NewSQL產品?
2013年,谷歌Spanner論文發布,2014年Raft論文發布。劉奇反覆研讀這幾篇論文,論文的理論為分布式資料庫NewSQL為創造工具解決傳統資料庫痛點提供了理論基礎。
劉奇與豌豆莢時期的兩位同事黃東旭、崔秋決定通過自己的技術去挑戰新時代的資料庫痛點,並用自己熱愛的開源Open Source方式解決這個巨型問題。
像矽谷公司大多都有個車庫故事一樣,許多北京海澱區的創業公司都有蟄伏居民區的起點。PingCAP的創業也是從西二旗一間小屋開始,只有一塊小白板、幾臺電腦和三、四個工程師就開始起步。最開始時,未來的分布式關係型資料庫TiDB只有算法概念,沒有完整的產品。劉奇和聯合創始人們寫了第一版,並在每周六上午10點在海澱區「專家國際公館」舉行技術沙龍。
劉奇還記得,第一次沙龍「Infra Meetup」只來了兩個外部參會人員,一位來自京東,另一位來自華為。後來,來參加沙龍的人陸續變多,起初的成員都成了社區貢獻代碼的活躍分子,TiDB產品也在工程師們對開源社區的數據貢獻與測試中不斷成形。
PingCAP由此創立了分布式關係型資料庫TiDB,輔助企業關鍵業務。作為開源分布式資料庫,TiDB彈性伸縮的架構具備雲原生的特性,可以輕鬆部署在任何公有雲、私有雲和混合雲之上,以降低用戶的總體擁有成本(TCO),提升資源利用率。
偶然的機會,雲啟資本董事總經理陳昱看到了PingCAP的項目商業計劃書。
PingCAP創造的TiDB讓陳昱回想起Google的分布式關係型資料庫Spanner和F1。在谷歌紐約辦公室工作時,昔日程式設計師陳昱的座位和Spanner的第三作者相隔不遠,二人經常分享產品的研發心得。曾有15年編程經驗的職業習慣促使陳昱花了一個下午把TiDB 的代碼核心看了一遍,就像當年做codereview一樣。
另外,華為和京東已經加入TiDB的開源社區也讓陳昱感到驚訝,作為一個年輕的開源系統,就能吸引到大體量公司的技術人員參與到開源社區中,其背後的研發槓桿潛力巨大。
陳昱輾轉通過前豌豆莢員工聯繫上了劉奇,只聊了5分鐘到10分鐘,時任雲啟資本副總裁的陳昱就確定這是一個值得去跟進的項目,「可能還是一個非常大型的項目」。
在很長一段時間內,中國的VC投資也會參考美國的趨勢,對標美國的公司。當時中國還沒有專門關注科技類公司的VC,雲啟在國內是較早專注技術類項目的基金。
陳昱注意到,美國的科技投資人已經開始關注大數據領域,判斷國內大數據領域也會跑出有潛力的公司。從遙遠的大賽道中跳回眼前,陳昱覺得PingCAP把穩定、靈活的資料庫變成大眾產品這件事,應該是一個百億美金市場。
劉奇在早期需要花費許多時間向投資方解釋資料庫、開源社區與潛在的商業模式。「我們融資的特點是快,因為懂的就懂了,不懂的可能短期內也沒法看懂。」這讓PingCAP的早期融資並不太順利。看懂了代碼的陳昱火速做了決定,隨後在A輪階段領投。
除了PingCAP,雲啟資本也通過早期領投和連續跟投ZILLIZ、Jina AI等項目,在該「數字基建」中的「Infra&開源」領域布局。
「Infra&開源」:基礎軟體的商業價值在哪裡?
數字基礎設施infra,指雲計算基礎設施、基礎層數據存儲與處理、雲原生代表技術,且這類公司和產品多以開發者為用戶,即做的是to D市場,開源是常見模式。
在開源社區裡,PingCAP產品的contributors、commits、stars等數據一直增長很快。開源模式之下,全球的優秀開發者都是PingCAP產品的貢獻者。截止到2020年10月,TiDB項目在GitHub上已總計獲得超過25000顆星,近1200位開原始碼貢獻者,步入全球知名的開源軟體廠商行列。
開源到底意味著什麼?在產品不斷迭代更新之外,PingCAP的開源社區文化凝聚了大批工程師。
2020年3月,PingCAP CTO黃東旭在TiDB 4.0 發布在即時,發起了一個邀請:他計劃約一波TiDB社區夥伴,在當周周五21:00至周日21:00的48小時之內,寫一本關於TiDB的技術書籍。
截止周日,共有102位來自社區的作者參與,共同完成了開源電子書《TiDB in Action》第一版,全過程在Zoom會議室中隨時溝通,並在B站公開直播。
工程師們積極參與的社區文化讓PingCAP實現了48小時之內寫本書的任務,而參與貢獻者獲得了「只有貢獻者才能」獲得的定製版T恤。
開源富有創造力,但是否具有商業能力?
「過去大家都會想,開源軟體所有人都拿得到,為什麼要付費?把開源產品原始碼改個名加上『企業級特性』賣給企業級用戶,就是成功的唯一路徑?」
在劉奇看來,其實底層的資料庫服務對當代創業公司就像「電力」一樣,使用者其實並不關心電廠修在哪兒,也不關心電廠用的是水電或者火電,只有使用的需求。而過往的資料庫卻需要企業投入人力物力,來自己「搭電廠」。
而PingCAP在開源社區中積累的技術能力就像搭建了一家先進的巨型電廠,從而可以為各類企業提供靈活、彈性的分布式資料庫管理方案,企業可以訂閱資料庫服務或者只調用服務,其他的都交給PingCAP來處理,商業化隨之即可完成。
在陳昱看來,開源文化協助技術派公司完成了D端的「營銷推廣」,不需要養大規模的銷售團隊,開源就是公司的營銷槓桿。
「在美國市場上,開源公司MongoDB和Elastic分別在2017年和2018年上市,市值分別超過150億和90億美金。一般SaaS類的上市企業在二級市場會有10倍的PS(市銷率),但是開源的項目市市銷率可以達到20倍以上。另外,即便是未上市的企業,估值表現也非常不錯,例如Databricks、Confluence、HashiCorp等,估值都超過50億美元。」陳昱說。
而在華創資本管理合伙人吳海燕看來,基礎軟體的變革是不可忽視的趨勢。華創資本從16年開始關注infra基礎設施領域,並列出了華創在軟體投資裡的「大綱」和關鍵詞。除了從2014年開始就在投資的 SaaS,她還認為,雲時代即將全面到來,IT基礎架構的底層變革、雲安全技術的興起講成為必然,這也將給創業公司提供大量機會。
2016年下半年,華創在與軟體社區的開發者們交流時,發現許多開發者都推薦了 PingCAP 團隊。2017年初,吳海燕拜訪了PingCAP團隊,CTO黃東旭把複雜的技術緣起、產品細節、應用場景簡明講完。資料庫作為網際網路的底層應用,這個領域有技術挑戰、商業挑戰,要從底層創新,是高難度的創作動作。
雖然公司還沒有一張商業化訂單,只有100多位社區客戶,但CEO劉奇對公司的估值很堅持,高過了吳海燕的預期。「我當時冷靜下來想,關係型資料庫在世界範圍內是一個每年500億美金的市場,其中有許多像Oracle一樣千億美金市值的公司,像PingCAP所做的在雲端重塑資料庫的事,可能是個百億美金級別甚至更大潛力的事業。」
吳海燕另外要考慮的問題是,一家中國公司能不能成為在國際上有競爭力的公司,完成這個百億美金的任務?與團隊接觸下來,吳海燕發現,對於上一代國產軟體公司來講,成為一家全球化的企業服務公司看起來可能是一個「不可能任務」。但是,在新一代公司裡,以最好的工程師人才加上世界頂級場景中鍛鍊的實踐能力,讓中國公司的機會變得更具可能性。
最終,吳海燕接受了超出預期的估值,華創在2017年領投了PingCAP的B輪融資,並在C輪繼續跟投。
迄今,PingCAP在世界範圍內已被多家企業用於線上生產環境,如Square(美國)、PayPay(日本)等。PingCAP 在2020年預計收入可達億級水平,其中海外市場與國內市場收入持平,海外市場收入可能首次略超過國內營收。
變革的時代
對於中國企業服務創業公司的片片snowflake(雪花)來說,它們面臨的到底是一個什麼樣的時代?
在此之前,企業服務領域SaaS應用端的創新不時湧現。過往在中國市場不被看好的開源以及數字基礎設施層的項目,成為不少科技賽道投資人的關注焦點。
圖片來源:華創資本
在吳海燕看來,對這一代基礎軟體創業者來說,當下是最好的時刻。
近年來,國內創新由網際網路、移動網際網路領域To C到To B的企業服務應用層接連興起,也會刺激應用層之下的底層發生創新,以反哺應用層的需求。而雲計算發展到一定程度,也在向下突破底層基礎設施的局限,基礎設施變革的轉折點已經到了。新一代的資料庫產品具有非常大的成長機會。
根據IDC發布的報告,到2024年,50%的大型中國企業將在容器、開源和雲原生應用開發方面依賴於第三方服務提供商。 而國內的網際網路行業鍛鍊了一大批大數據和雲計算的工程師,具有全世界最豐富的工程師人才。吳海燕認為,如果說行業也有天時地利人和,中國的雲基礎軟體行業正當其時。
在Infra基礎軟體領域,華創陸續早期布局了PingCAP、TigerGraph、才雲、雲杉等項目,覆蓋了分布式資料庫、圖資料庫、容器雲、SDN、智能運維、企業級身份管理等多個細分領域。
Fastdata極數數據顯示,自2017年來,企業服務領域領域融資總金額超一萬億元,底層技術創新的機會之窗擠滿了看風景的人。
2020年上半年融資趨勢圖(圖片來源:Fastdata極數)
然而在應用場景創新位於全球前列後,企業服務端的創業公司能走多遠?中國snowflake何時誕生?
在資料庫技術社區墨天輪的國產資料庫排行榜中,有PingCAP研發的TiDB,也有阿里體系下的OceanBase和PolarDB等國產資料庫開始佔領市場。
圖片來源:墨天輪國產資料庫排行榜10月數據
關係型資料庫之外,從新型的圖資料庫、到向量搜尋引擎、深度學習框架等領域,也湧現了一批中國的基礎軟體團隊。其中有數據處理公司Zilliz和Apache軟體基金會項目Apache Kylin核心團隊創建的AI增強數據倉庫公司Kyligence等等。
「PingCAP本輪融資對整個中國的基礎軟體來說是一個很大的鼓舞。首先,大家不會再有偏見,說中國做不出好的基礎軟體出來。其次,會激勵更多的創業者投身於這個領域,做的人越多,中國以後出現偉大的基礎軟體公司的概率就會越大。」陳昱說。
隨著行業獨角獸的誕生,中國基礎軟體迎來企業服務的發展浪潮,在世界範圍內最先進的應用場景下是否會誕生一批像Snowflake、甚至超越Snowflake的公司,只有時間會給予證明。