▍公司簡介:中國領先的大數據全棧解決方案廠商。
星環科技成立於2013年6月,創始人孫元浩曾負責英特爾Hadoop發行版研發及產品化工作,主要從事基於Hadoop分布式引擎和數據分析算法研究。公司致力於打造「雲計算+大數據+資料庫+人工智慧」的基礎平臺產品,已推出一站式大數據綜合平臺TDH、智能大數據云平臺TDC、智子人工智慧平臺Sophon和超融合一體機,涵蓋操作型資料庫、數據倉庫、數據集市、數據湖、實時計算、人工智慧等應用場景。
技術路線方面,公司基於Hadoop開源架構打造產品,後經不斷研發替換組件,實現核心技術自主可控。
商業模式方面,公司目前採用本地部署授權+訂閱和雲產品訂閱的方式。證監局備案信息顯示,2020年12月星環科技已籤署上市輔導協議,擬登陸科創板上市,騰訊為最大機構投資方,恒生電子持有3%股權。
▍行業分析:全球數倉市場穩定增長,中國市場增速高於全球水平。
根據IDC數據,2019年全球數據倉庫市場規模為168億美元,IDC預計2024年全球數據倉庫市場規模將達到297億美元,2019-2024年複合增速為12%。IDC預計2020年中國大數據市場規模將達到104.2億美元,較2019年同比增長16.0%,增速高於全球平均水平。
從細分市場來看,當前國內大數據市場軟體部分佔25%,對應市場規模為26億美元(約合169億元)。我們認為,隨著技術的成熟與融合、以及數據應用和更多場景的落地,軟體規模佔比將逐漸增加。
競爭格局方面,中國大數據領域廠商包括三類公司,分別是雲服務廠商:阿里雲、騰訊雲等,傳統ICT廠商:華為、浪潮信息、新華三等公司,純大數據企業:星環科技、Kyligence矽智信息、偶數科技、Hashdata等。星環在技術和客戶積累方面處於領先地位。
▍Hadoop大數據架構持續演進,與雲融合是未來方向。
Hadoop奠定現代大數據分析架構,且公司核心解決方案同樣基於Hadoop生態。Hadoop定義了最基礎的分布式大數據批處理體系,打破了傳統資料庫一體化的模式,將計算與存儲分離,並聚焦於解決海量數據的低成本存儲與規模化處理。Hadoop在面對上百PB數量級數據查詢分析時能夠極大地提升效率,同時通過使用廉價硬體集群搭建的分布式系統實現成本效益,相比於MPP架構可拓展性得到較大提升。
但Hadoop存在結構複雜、難以維護、易用性較低等問題。雲時代下,雲原生數倉提供近乎無限的延展性、高彈性、更低成本存儲和更高易用性,給Hadoop生態帶來巨大衝擊。然而,我們認為Hadoop架構與雲並不衝突,三大公有雲廠商早早擁抱了Hadoop架構,並在雲上推出相應發行版。Hadoop生態中Spark、Flink等新興組件目前仍是最佳解決方案,且對容器資源調度引擎Kubernetes支持越來越強。
因而,我們認為Hadoop與雲結合一定是未來的發展方向,Hadoop生態仍將展現持續的生命力。
▍公司分析:憑藉稀缺性、核心技術自主可控、本地部署+雲化並行、業務拓展至數據科學等優勢構建核心競爭力。
1) 若公司上市科創板後,將是目前A股二級市場唯一具有全棧大數據解決方案提供能力的廠商,具有稀缺性。競爭對手Kylingence、偶數科技、Hashdata均專注於提供數據倉庫產品,未涉及OLTP資料庫;明略科技專注於數據中臺建設,提供智慧城市等方案。且這四家公司均為一級市場標的,目前暫未公布上市計劃;
2)公司核心技術已實現自主可控,體現出強大的研發能力,符合國產替代的大背景。目前除雲容器編排技術仍使用Kubernetes外,公司已實現所有核心組件自主研發,產品性能強勁。在Gartner發布的2016版數據倉庫及數據管理解決方案市場魔力象限中,星環科技是唯一上榜的中國公司。2018年,公司的TDH產品成為全球首個通過TPC-DS的產品;
3)本地部署與雲化並行策略:分析公司標杆案例客戶結構,超過77.8%的客戶來源於金融、電信、政府等數據敏感型行業,預計短期不會上公有雲。同時,零售傳媒等其他行業上雲進程已加速。因此,公司採取本地部署與雲平臺方案同時推進策略;
4)5G時代數據量爆炸式增長、數據結構複雜度也不斷提升,而人工智慧與機器學習則對海量非結構化數據有巨大需求。公司推出人工智慧平臺Sophon,將業務從數據底層拓展至AI平臺層,協助客戶迅速完成從特徵工程、模型訓練再到模型推演的機器學習全生命周期工作。
▍海外對標:Cloudera、Teradata和Databricks。
Cloudera和Teradata均為美股大數據綜合方案提供商,發展歷史較長。Cloudera 是Hadoop生態的第一家商業化公司,從產品體系角度與公司具有較強可比性。此外,Databricks專注於數據湖、數據倉庫、湖倉一體和機器學習等大數據綜合解決方案,其核心產品Spark為分布式數據批處理引擎,已成功取代MapReduce成為目前Hadoop生態中應用最廣泛的計算引擎。Databricks預計今年上市,最新估值280億美元。而Cloudera和Teradata處於成熟期後的轉型時期,無法充分反映星環的高成長性。因此我們還選取雲原生數倉Snowflake、搜尋引擎公司Elastic N.V.和非關係型資料庫領導者MongoDB作為參考,給予星環科技2021E PS 20~25x的估值區間。
▍風險因素:
大數據領域國產化替代進程不及預期風險;疫情衝擊企業短期IT支出縮小、項目延遲交付風險;公司核心研發技術人員流失風險;市場客戶拓展不及預期風險;公司上市進展不及預期風險等。