熟悉《三體》的人,對「星環」這個詞應該不陌生。《死神永生》裡,載著程心離開太陽系,最終保存了地球文明的飛船,即名為「星環」。而打造這艘飛船的公司,名為「星環公司」。它聚集了全球最優秀的科學家,致力於打造最先進的太空技術。
《三體》的故事激發了多少人的科學夢,這其中就包括星環科技的創始人孫元浩。他將公司命名為「星環科技」,即希望聚集一批優秀的科研工作者,領航大數據與人工智慧基礎軟體新紀元。
正如小說中擁有黑科技的星環公司,在大數據與AI領域,星環科技一直走在最前沿:
2017年,星環科技被IDC評為中國大數據市場領導者;
2018年,星環科技成為12年來全球首個完成TPC-DS測試並通過官方審計的資料庫廠商;
2019年,星環科技登上央視九套紀錄片《大數據時代》,入選中國科創企業百強;
2020年,星環科技受邀參與鍾南山院士團隊疫情預測項目,以知識圖譜全力幫助疫情防控…
「大數據」、「AI」,一直是星環科技為外界認知的標籤。但「工具層」的技術性定位,常常讓大部分人對其核心業務產生困惑。
近日,億歐有幸採訪了星環科技研發總監楊一帆先生,試圖探究:星環科技的「工具層」定位,究竟給市場提供了什麼價值?其在AI等最前沿科技領域,又做了哪些探索?
「工具底座」打通「數據孤島」
作為雲計算三層架構之一,夾在中間的PaaS層常常是不那麼耀眼的存在。
基礎IaaS層,亞馬遜、微軟、阿里等名字早已耳熟能詳,應用SaaS層,Salesforce、Workday、Adobe等美股,被市場一波又一波熱捧。唯獨PaaS層,因既不夠「基礎」,又不夠貼近客戶,而難以被大眾認知。
但當我們細細盤點頭部雲廠商時,卻會發現,它們不約而同地部署了自己的PaaS平臺。
無論是SaaS起家的Salesforce,還是IaaS起家的亞馬遜、微軟,都在起勢不久後,往PaaS層延伸。
本質上,軟體是一門極好的生意。極少有產品能像軟體那般,以極低的成本、極快的速度向市場複製。正如矽谷著名的工程師Marc Andreessen所言,軟體正在吞噬世界。而其強大之根本,便在於高可用性。
SaaS的標準化特性與市場的多樣化需求,從根本上存在矛盾。如何以更低成本、更高效率的方式滿足需求,不至於淪為「軟體民工」,是困擾很多軟體廠商的難題。於是,聰明的人們發明了PaaS。通俗地說,它就像樂高那些通用的積木模塊,任何模型都少不了。
到了大數據與AI領域,這種具備工具屬性的PaaS軟體,其價值更得以彰顯。
星環科技研發總監楊一帆指出了這個領域的痛點問題:
「那些有心利用大數據做業務賦能的廠商,一頭牽著業務應用,一頭牽著海量數據,卻不知道如何將它們銜接」。
「每個部門『各自為政』,有自己的數據倉庫和知識牆。若是以部門為單位採購應用軟體,一是面臨重複建設,二是部門各自的經驗無法沉澱」 。
這便是很多企業正在面臨的「數據孤島」問題。而通用性的工具型產品,正是解決問題的鑰匙。「它能夠避免企業內很多1+1
他詳細地列舉了金融領域的應用實例。
如何挖掘系統性風險,是金融廠商的經典大難題。如果把這個大課題比喻成做菜的話,它往往需要拆分成幾個小步驟 :
第一步是如何處理數據原材料。這是一項「累活」,它需要我們做海量數據挖掘、提取、整合和清洗工作,為的是讓數據原材料更「乾淨」、「易用」;
有了原材料,接下來便該著手「烹飪」了,這是決定成品好壞的重中之重。
調料包怎麼配置,是各家的「獨家秘方」。同理,提供什麼樣的建模算法,是數據廠商的「獨家秘方」。正如食品企業總要宣傳他們的秘方是「百年匠心製造」一樣,數據廠商的核心算法,也要經過數年、數次的迭代和試錯,才能提煉出那些寶貴的共性經驗的「精華」。
有了它,所有在此基礎上的分析、推理、決策方能水到渠成。正如那些烹飪好的菜餚,只有色香味俱全,才能供人進一步品鑑。至此,「數據」和「業務」的隔閡終被消弭。
打造了寶馬車外殼,不代表就擁有了寶馬。做AI數據分析工具的廠商,也不會因為有一個看似好用的工具「外殼」,就能獲得市場認可。
「成就用戶是第一位的」,楊一帆強調。大數據出身是星環科技得天獨厚的優勢,在與大量數據原材料打交道的過程中,星環磨練了先進的大數據抽取、存儲與計算能力。「我們從起家起就和數據原材料打交道,一步一步方掌握了先進的領域知識」,楊一帆介紹說。
這種大數據功底,為星環科技進一步培養AI能力打造了牢固的根基。在此基礎上,星環科技在AI領域建立起種種優勢。
「星環是最早參與信通院知識圖譜技術標準制定的一批廠商,亦是最早通過標準測試的廠商之一」,楊一帆介紹道。
而縱觀市場,某些被攔在第一梯隊之外的廠商,不是敗在了大數據處理,就是敗在了AI能力上。沒有大數據處理能力只談AI,不可避免淪為花拳繡腿;而沒有AI只談大數據處理,不可避免淪落到 「有多少人工就有多少智能」的命運。
那麼,為什麼星環科技能突破這兩大能力障礙,躋身行業第一梯隊呢?
「智子」家族打造全方位智能
《三體》中,智子(Sophon)是三體人打造的最先進武器,其威力之大,足以幹擾地球科學技術發展。而星環智能的智子產品家族,便希望如智子一般,成為AI的「利器」,助力企業業務變革。
楊一帆向我們分別介紹了其Sophon Base 數據科學基礎平臺、Sophon KG知識圖譜、Sophon Edge邊緣計算平臺等產品系列,它們基本覆蓋了AI主流方向的各種應用場景。
相對中心化、大規模的數據處理場景,誕生了這些年大火的「風險控制」、「用戶畫像」、「精準營銷」等業務訴求。星環科技數據科學基礎平臺即服務於此,它基於分布式架構,為處理大規模數據、運行複雜模型提供良好的性能支撐。
在處理單個數據中心的技術基礎上,星環科技敏銳地挖掘了新的需求點,推出了酷炫的「聯邦雲」產品。「很多用戶數據,已經不止是存放在單一數據中心上了。因此,如何聯通多個數據中心,實現資源相互調用,是聯邦雲所要解決的難題」。
更進一步,如果多個組織由於隱私原因無法相互披露數據,但又想用到更多數據,以便建立更加準確的模型,則可用到星環科技的「聯邦學習」產品,打造資源、數據、模型三者聯邦。這可用於在確保隱私的前提下,打破數據孤島,獲取數據價值的前沿技術。
相對分散化、邊緣化的數據處理需求,則需要邊緣計算技術。
在工業監控、交通、安防等很多應用場景下,總是伴隨著大量攝像頭,其數據是高度分散化的。 「在人臉識別、物體檢測等場景,部署在邊緣端的數據傳送至雲端,是大部分技術已能達到的。但云端數據如何傳至邊緣端,卻是一大難點」,楊一帆說。
「雲邊一體化產品的初衷,就是解決雲端和邊緣端雙向交互的問題。這大大提高了系統靈活性,讓邊緣端亦變得可管理可操控。」星環科技的雲邊一體方案能將複雜模型運算下放至邊緣計算節點,實現邊緣自治。邊緣端可實現離線自主判斷,將高價值數據發送回雲端做進一步處理;技術人員可足不出戶,將雲端的模型推送至千裡之外的邊緣設備,實現雙向的智能交互。
疫情期間,星環科技的知識圖譜為追尋新冠病毒的「行兇軌跡」立下了汗馬功勞。利用圖譜工具,患者年齡、活動軌跡、接觸人群、患病治療等信息被一網打盡,讓工作人員快速、直觀地明了多條重要線索,例如,哪些是需要隔離的密切接觸者,哪裡是需要加強防護措施的相關區域。這些都可以通過強大易用的實體關聯查詢、圖計算等功能進行挖掘。
「『融合』是知識圖譜的最難關」,在談到知識圖譜時,楊一帆如是介紹。所謂融合,即將搜集整合而來的信息,做簡單篩選和處理。
舉例來說,在語義上,川普和川普是同一個人,而蘋果和蘋果公司則代指不同事物,這些都需要在「融合」這一步做辨別和處理。「很多條新聞都在描述同一件事,如何將它們歸齊到同一件事件裡,是技術難點」。
在打磨「融合」的技術上,星環科技的獨到經驗,便是「研發與前端業務的高度一體化」。不同於很多還停留在單純學術研究、論文發表的AI公司,星環科技高度重視研發和前端團隊的配合,「公司內部會設置目標對齊機制,保證以業務落地為第一要務」。
不懈努力下,星環科技知識圖譜已小有收穫。全球軟體領域最高標準的能力成熟度CMMI5級認證、服貿會示範案例等獎項,皆反映出市場對其高度認可。
在談到星環科技的未來展望時,楊一帆提到,SAS是星環科技十分值得學習的優秀「前輩」。「他們既有深厚的理論理解、行業理解,又有強勁的技術支撐」,「例如在醫療領域,SAS有著最為詳盡的文檔和最強大的技術,早已是行業的實施標準。他們這種深耕行業的鑽研精神,值得星環科技學習」。
定位於「工具」角色,立志於為大數據和AI鋪設底層技術能力,這註定不是一條容易被理解、容易快速見效的道路。星環科技在無數次不懈地迭代、試錯中,從未動搖與放棄。如今,這份堅持終於在金融、能源等領域率先開花結果。在安全可控的時代大背景下,以星環科技為首的一批AI廠商,正掀起一場數據行業的大變革。