5月20日,2020中國民辦教育科技峰會暨校管家520感恩答謝會以雲直播的形式開啟大幕。全國各地民辦教育專家、學者、萬人大校校長、合伙人及管理者在空中相聚,暢談民辦教育趨勢與發展,共話民辦教育科技創新之路。
校管家CTO宋偉帶著數據科學團隊新開發的產品——大數據決策系統在大會上亮相,向十萬圍觀的教育夥伴展示數據決策系統如何賦能教培機構精細化運營。
01 大數據發展必經的4個階段
宋偉是我國著名的大數據及人工智慧科研專家,擁有多項專利,2011年曾榮獲廣東省科學技術一等獎。加入校管家前,曾在華為工作9年,先後擔任華為中央軟體院、華為美研所的技術領頭人,是華為人工智慧及大數據技術早期的奠基者。
·
宋偉表示,大數據發展有4個必經階段:
1、 發生了什麼
初級階段。通過人工、系統記錄,積累數據,並加以處理、規整,還原企業的真實現狀。
2、 為什麼會發生
進階階段。通過對數據以便捷的方式,不同角度進行探查,分析現狀背後的的原因。
3、 預測什麼會發生
高級階段。預測是一件很難的事。難在哪裡?第一,企業要應用好大數據系統及背後的技術,這需要決策層的強力支持,以及技術團隊鍥而不捨的堅持和努力。第二、企業經營過程中產生的數據要充分完整的保存,行程數據層面的知識及事實沉澱。第三,需要企業在該行業的組織運作經驗、行業經驗、知識積累和技術積累,並形成有效的共振。
4、 做什麼決策
智能階段。依託對未來的預測,企業要做一些備案、安全措施、經營調整,這個門檻很高。因為做決策是需要依賴組織的。組織對大數據的理解透不透徹?組織有沒有勇氣去相信大數據系統?組織和系統之間的配合度怎麼樣?依據決策產生的後續行為是否能得到良好的閉環回饋?這些都有很大的挑戰
02 行業應用大數據現狀
宋偉感嘆道,大數據技術在我國已經歷經了十多年發展,但大部分企業,目前還停留在第一階段,即便有些企業已經應用了類似校管家這樣的信息化系統,積累了海量大數據,但這些資源是沉睡的,其效能遠遠沒有發揮出來,宋偉以自身在大數據領域的多年經驗,給大家還原行業內大數據的應用現狀。
1、 慢是常態
大部分企業是用一種很傳統的方式給用戶看數據,第一是很慢,比如說要查過去一個月的某個指標,數據能出來,但很慢,這種慢已經超過用戶的忍耐極,並漸漸的使用戶和系統之間形成了一種惡性關係。
2、用戶要看多角度數據時,時間成本高
系統裡的數據都是以單一形式存儲的,並且呈現形式單一。這導致用戶看數據的角度是相對固定的。用戶要查看當前沒有的數據維度,必須經過提需求、實現、交付的漫長過程。等數據到達客戶手上的時候,時效性大大折扣。這讓用戶消費數據的效果大打折扣,海量數據「沉睡」在海底。
「其實大數據的真諦就是讓以往在經營過程中沉澱下來、正在沉睡的數據真正產生價值,用於做決策支撐,用於預測將來要發生的事,用於總結可以傳承的規律經驗,並最終以智慧的方式提升機構的運作效能」宋偉這樣說道。
03 大數據決策系統:向預測階段過渡
宋偉介紹說,校管家發布的數據決策系統,處於第二階段和第三階段這之間。
1、數據展現快
大數據決策系統以秒級的性能展現數據。
宋偉表示,這是利用了一些高級技術。正常的資料庫,它的存儲方式是按行存,但是校管家數據科研團隊採用按列存的方式,第一,它壓縮率比較高(數據量很大的時,不壓縮的話,數據會膨脹,影響速度及存儲成本),第二,列可以無限寬,可以根據未來的不可知需求進行無損的維度增加。
2、多維度的數據匯聚及呈現
數據決策系統裡集成了上千維度及指標,用戶可以隨心所欲的進行組合。
3、展現形式更友好
系統集成了50多種圖表,篩選出數據後,可以任意切換多種圖表形式,餅圖、柱狀圖、線形圖、熱力圖……用戶能更直觀地、更輕鬆地讀懂數據。
4、形成行業通用模板
校管家成立十年來,合作了1萬多家大中型機構,在陪伴客戶成長期間,也吸取了他們的經驗,把行業內比較關心、常用的指標整理成了標準化的圖標及儀錶盤。即使用戶缺乏數據分析經驗,也可通過這些通用模板裡滿足大部分需求。
5、用戶自定義能力
在通用報表及儀錶盤無法滿足要求的情況下,用戶可在1分鐘能通過拖拽的形式創建自己的圖標及儀錶盤,並可分享給其他同事。以讓機構真正的隨心所欲進行數據消費。
04 多項技術成就數據決策系統
宋偉表示,用戶使用大數據的過程,類似於貨物進倉出倉。
第一步:倉儲管理
我們都知道,倉庫會匯聚不同源頭的貨物。當肉類、蔬菜等各種貨物進入倉庫後,需要在不同的溫度條件下保存。數據進倉也是這樣,需要分類。
第二步:數據清洗
數據進倉前是需要經過清洗。有的數據可能不是用戶想要的,有的數據不完備,需要補充,有的數據展現格式不統一,需要轉換並歸一。
第三步:以各種主題呈現給用戶
比如包含了財務的數據有哪些,相關的數據把它們組合在一起,不相關的數據給它們設立邊界,所以,這也保證了用戶可以自由地篩選各種維度,從不同的角度去看數據。
第四步:設立多種感知數據的方式
通過這一步的技術,用戶可選擇以某種方式來看數據,如圖表、儀錶盤等。同時,給用戶提供了更高階一種數據探索手段——SQL實驗室。SQL是一種探索數據的標準腳本語言,能更深入便捷的地探索數據倉庫裡已有的數據。
05 大數據系統的階段性目標
宋偉表示,目前校管家的數據科學團隊,正在落地流計算技術。比如網報場景,機構非常關注每時每刻的報名金額,該技術能幫助用戶以秒級為單位,實時展現機構網報的收入狀況,這和天貓雙11實時展現的數據大屏十分類似。同時,會通過數據挖掘及機器學習技術,進一步做預測方面的技術準備,讓大數據更好地為行業賦能。