CBC創業集醒 | 數據量爆棚難以負荷,Kyligence利用人工智慧打造新...

2020-12-04 寬帶資本

本期項目

Kyligence | 麒麟

大數據智能分析平臺

創始人韓卿表示,希望在整個大數據行業裡面,有一家專門做底層技術的創業公司能夠在行業內做些突破,做點不一樣的事情,這是Kyligence創立的初衷。

來源| 數字觀察

作者| 竇悅怡

成立Kyligence之前,韓卿曾任eBay全球分析基礎架構部大數據產品負責人、Actuate中國首席顧問等職。

同時,他也是首個來自國內的Apache軟體基金會頂級項目VP,首個來自中國的Apache頂級開源項目,Apache Kylin的創建者及項目委員會主席(PMC Chair),負責Kylin的戰略規劃、發展路線圖及產品設計等,並致力於發展 Apache Kylin 全球社區,構建生態系統及推廣等。

▲ Kyligence創始人韓卿

憑藉著在大數據、數據倉庫、商業智能、數據分析等領域擁有豐富的經驗,韓卿發現Kylin項目在商業領域的需求非常大,有著很多外部需求,這些需求遠遠超過他們當時團隊的工作職責。

另一方面,成功的開源項目背後都有一個好的創業公司,只有這樣才可以更健康地發展社區,更好地促進生態建設,讓更多客戶去使用開源項目。

我們希望在整個大數據行業裡面,有一家專門做底層技術的創業公司能夠在行業內做些突破,做點不一樣的事情。這些是我們創立Kyligence的初衷。

於是韓卿帶領Kylin核心團隊,於2016年3月在上海成立了Kyligence公司。Kyligence是一家專注大數據分析的創新型公司,可以為企業提供基於Apache Kylin的下一代企業級數據倉庫及商務智能大數據分析平臺和解決方案。

數據量爆棚的時代

傳統數據倉庫需要變革

韓卿告訴i黑馬&數字觀察,1990年前後,數據倉庫技術理論被提出,這個理論認為應該把企業各個分散的業務數據整合起來,構建一個統一的數據倉庫,為企業分析和應用分析提供一個統一的平臺,企業能夠在這個平臺上構建整個分析應用。

目前,這項技術已經變成了絕大部分行業客戶的基礎技術,像金融、運營商、零售等行業的業務分析都已經構建在這樣的基礎技術之上了。以金融行業為例,銀行要進行各種各樣的分析,尤其是風控分析,都需要建立在對不同業務模塊數據的統一分析之上。

不過,2006年後開始,雲計算的蓬勃發展,各個領域的企業都紛紛開始上雲,由此很多的數據不斷地大量湧現,這時候企業如果在雲上建一個分析倉庫,就要面臨各種挑戰。

首先,數據體量變得越來越大,呈現越來越多樣性和複雜性的特質。但傳統的數據倉庫與應用系統是分開的,用戶做分析做工程時,基本上是從每塊業務數據那裡直接把數據拿過來進行分析就行了。這樣操作的問題在於,要把這麼多不同的業務數據整合到一起是一個巨大的挑戰。

其次,存儲的成本和性能上,原有的數據倉庫技術已經不能滿足企業快速增長的業務需求。「傳統的建模方式,是需要通過漫長的數據轉換過程,把轉換後的數據放到數據倉庫裡,最後基於這樣的倉庫,企業還要建非常多的分析模型、報表、預測,通常這樣的項目要耗費大量人力,花費好幾個月的時間,甚至是用年來計算的。」

第三,雖然業界推出了依靠更加專業的數據科學家來解決問題的解決方案,但本質上還是在依賴大量的人工進行工作。如果沒有革新性的變化的話,人力是不會被解放出來的,那這個行業也不會發生根本性的改變。

「未來的數據分析也應該是融合的,不需要關心這個數據的來源,而將更多的精力放在關注數據所帶來的業務決策上,這就是Kyligence正在不斷優化和創新的融合、智能數據倉庫。」

▲ 15倍性能提升的同時節省50%空間

Kyligence做的事情是基於Apache Kylin,為企業客戶提供下一代企業級數據倉庫及商務智能大數據分析平臺和解決方案,從私有部署到雲計算平臺,都能使用戶在超大規模數據集上獲得極速的洞察能力,以釋放數據價值,驅動業務增長。

打造企業級大數據分析平臺

i黑馬&數字觀察了解到,Kyligence的核心產品是基於Apache Kylin的企業級智能大數據分析產品Kyligence Enterprise。這是一個基於Hadoop的企業級智能大數據分析平臺,可以為業務分析師、數據科學家和 IT 工程師提供融合的、智能的分析平臺。

簡單來說,Kyligence Enterprise採用融合架構,智能地將查詢路由至最適合的查詢引擎,同時滿足性能敏感的關鍵業務查詢和自由靈活的探索式分析,為企業用戶提供統一的大數據查詢入口。

▲ Kyligence Enterprise 架構

其次,平臺基於Hadoop架構,通過橫向擴展將數據處理能力提升至PB 級;通過預計算技術生成聚合結果,再結合先進的索引技術,相比其他解決方案,將查詢性能提升數十至數百倍。

第三,平臺引入了大量的機器學習技術,其專利的自動化建模技術可基於分析師的查詢行為和歷史,智能化地推薦數據模型,自動化地調優性能,加速關鍵業務分析場景。

在保持PB級數據集上亞秒級查詢響應速度的同時,平臺可以支持無需編程的智能化自助式建模,並與主流BI工具實現無縫集成。

同時,在開源Apache Kylin核心功能之外,對企業用戶所關注的實施效率、安全控制、性能優化、自助式敏捷BI、系統監控和管理等方面進行了全面創新和增強。

「2018年7月發布的最新版Kyligence Enterprise,相比較以往的版本更是實現了查詢提速15倍的同時節省50%存儲空間,而對比市場上的同類查詢產品,根據數據倉庫典型查詢場景測試中查詢的完成度與查詢的性能比較來看,都具有顯著優勢。」

▲ Kyligece Enterprise 核心優勢

這樣一來,平臺在數據量、性能、並發等方面進行了巨大突破,為企業級用戶提供快速搭建基於大數據的數據倉庫及商務智能分析平臺的能力,提升大數據效率。

而且,平臺支持多種部署模式,以適應不同的用戶場景,用戶可以根據具體需求選擇本地部署、雲端部署或是混合部署模式來適應企業 IT 架構,進一步使得其分析師能夠快速的訪問和分析海量數據,響應業務變化。

延伸雲端解決方案

助力企業平滑上雲

目前,企業上雲,意味著大量的交易記錄、日誌、文件等數據將直接在雲端產生並存儲。如何融合雲計算與大數據分析,充分發揮雲計算和大數據雙重引擎帶來的優勢,迅速發現海量數據中的業務價值並驅動商業決策,成為企業在新時代下決勝的關鍵。

同時,大數據在各行各業中取得了迅猛發展,湧現出了如Hadoop、Spark、Kylin等大量創新性技術。這些技術被大量企業廣泛應用於存儲和處理海量數據,分析和挖掘其中的價值,促進業務的發展。而這些創新技術無一例外地基於分布式計算架構,具備超高的可擴展性,將數據處理能力擴展至幾百TB甚至PB級。

不僅如此,雲計算所具備的無限擴展和按需的特性,為大數據應用提供源源不斷的計算和存儲資源,從而使大數據成為一個完美的雲計算應用。

因此,大數據分析上雲成為了企業IT雲戰略實施的重中之重,但云端環境的複雜性,如虛擬化、計算與存儲分離等特性,也讓企業大數據分析上雲面臨著諸多挑戰。

Kyligence從成立之初即在雲端進行相應布局,2017年底推出了KyligenceCloud產品。Kyligence Cloud是Kyligence公司基於雲端的大數據服務,為客戶將大數據分析平滑上雲提供解決方案,目前已支持全球超過6個雲平臺。

Kyligence Cloud主要聚焦在關注業務急速擴張的中大型企業。這類企業的特點在於絕大多數資源都投注在了業務上,對於大數據分析平臺的建設力度往往不足。

▲ Kyligence Cloud 架構

據悉,Kyligence Cloud以Kyligence Enterprise為核心,充分發揮其高性能、高並發優勢,同時利用雲計算帶來的低成本、高擴展、易運維等特點,大大提高企業大數據分析上雲的效率,並有效降低成本。

使用Kyligence Cloud,客戶可以在雲端快速構建可無限擴展的大數據集群,實現對PB級數據的交互式OLAP分析和關鍵業務查詢的亞秒級響應,助力業務分析師和數據科學家快速發現數據內在價值,驅動商業決策。

同時,Kyligence與微軟Azure、亞馬遜AWS、Google Cloud、阿里雲、華為雲等雲廠商深度合作,這樣用戶可以在公有雲上快速建立大數據分析集群,接入各種雲端數據源並進行建模分析,實現對PB級數據的交互式分析與關鍵業務查詢的亞秒級響應。

Kyligence Cloud通過與雲基礎設施的無縫整合,為用戶提供了端到端的解決方案。其核心的亞秒級查詢分析能力,大大加速了從數據到價值的發現進程,可更快地支持客戶將本地應用向雲端進行遷移,在現有的數據層之上提供SQL加速層,提供高性能及高並發的雲端數據分析服務能力。

Kyligence Cloud通過與各大雲廠商的基礎服務進行深度整合,幫助客戶在數據湖上快速構建 PB 級數據多維分析(OLAP)的能力,為數據分析師和業務用戶提供交互式的大數據分析與查詢服務,助力企業實現海量數據集上的亞秒級查詢響應。

聚焦行業頭部客戶

提供標準化產品

目前,Kyligence已經為金融,電信,零售,智能製造,能源等行業的企業提供下一代企業級智能數據倉庫及融合大數據分析平臺解決方案。招商銀行、上汽集團、太平洋保險、中國銀聯、OPPO、華為、中國移動等大型企業,都在使用其產品。

韓卿表示,Kyligence在選擇行業的時候,會思考這幾方面問題。

第一,這個行業是否足夠成熟,是否依賴於用數據驅動器業務發展。

「銀行就是符合這個標準,比如你申請一個信用卡或者一批貸款,如果沒有數據支撐,銀行是無法分析出貸款風險的。」

以某大型銀行為例,在大數據平臺建設之前,該銀行的數據大多存放在Greenplum、DB2等傳統關係型資料庫中,業務人員需要分析數據或提出新的報表需求時,通常都是由 IT 人員拿到需求之後現場開發,再將整理好的數據發送給業務部門。

由於數據存儲分散、再加上數據量越來越大,以及業務數據需求的臨時性和不確定性,這種方式的工作效率越來越低,業務獲取數據的周期越來越長,IT人員的工作量也越來越重。

在建設大數據平臺後,該銀行把其業務系統中產生的各種數據,通過集中處理之後統一存入到 Hadoop平臺,通過Kyligence Enterprise依據不同的業務創建不同主題的數據集市和立方體,將業模型發開放給業務分析人員。

然後,Kyligence Enterprise通過數據集市,將生硬的、技術化的表和欄位等轉換為業務人員能夠理解的業務指標和分析維度,使得業務分析人員能夠輕鬆通過各種前端BI工具如Tableau等對相關數據集市進行自助分析。

最後,依賴於Kyligence Enterprise在超大規模數據集上的高速SQL查詢能力,業務人員可以快速生成分析結果,進一步優化分析思路和業務決策。

該銀行客戶通過Kyligence Enterprise平臺,生成的數據集市模型提供自主分析能力,精簡了數據獲取的流程,降低了數據分析的技術門檻,一套模型可以實現主題內的多個維度分析,極大方便了業務用戶的自助服務,數據分析高度自由化,同時大大減輕IT的負擔。

第二,客戶意識。是否需要數位化轉型,這是企業的意識問題,如果企業到了一定的規模,希望通過數據來驅動業務轉型升級,這類型客戶的契合度、體量都是很好的。

「以某全球連鎖快餐的市場部門為例,他們在數字營銷的過程中,確實遇到了一些問題,比如數據口徑不一致、分析周期太長、不能進行探索式地進行數據分析等,在激烈的競爭中大大制約了市場部門的業務決策能力。

我們幫助他們在現有的數據平臺上,搭建了統一的大數據分析平臺,賦能市場部門的運營人員進行自助分析,極大地降低了分析的門檻。該系統為市場決策提供了更好更快的分析能力,受到了客戶高層的一致好評和讚賞,最後他們還為我們寫了一封感謝信。」

很多中大型企業需求充滿個性化、複雜化,服務商為了滿足他們的需求,經常會提供定製化的產品,久而久之變成了項目制,對服務自己來說,提高了成本,降低了效率,那麼Kyligence如何解決這樣的問題?

韓卿解釋道,Kyligence籤了很多中大型企業客戶,都是行業的頭部客戶,但都沒有為他們提供定製化的產品,目前為止,Kyligence只提供一個標準化的產品,這在中國的軟體公司中非常罕見。韓卿認為,數據倉庫是一個標準化的領域,只有提供標準化的產品,企業才能更聚焦於將產品和技術做好、做深、做紮實,在國際化的競爭中立於不敗之地。

同時,通過API接口及與上下遊廠商的合作,打造完善的生態系統,來一起滿足客戶的各種需求。這也為Kyligence打開國際市場奠定了基礎,目前Kyligence已經收穫了來自美國的付費客戶,這也充分證明了標準化產品戰略的價值。

相關焦點

  • 人工智慧領銜創業熱點 助力實現消費升級
    近年來,人工智慧早已處在當今時代資金的風口浪尖,各行各業紛紛通過探索人工智慧來實現企業的優化升級。6月16日在上海舉行的「InnoSpace 國際創業集訓營(2017春季)DemoDay」中,知寵、冪方科技、犀語科技、菜鮮食等11支創業團隊通過此平臺進行項目路演。
  • 「算法+有效數據」,匯醫慧影用人工智慧做智能診斷,獲數千萬元A輪...
    據了解,到2020年,我國的人工智慧市場規模將接近百億。而在醫療領域的應用關鍵體現在醫療與人工智慧結合的「算法+有效數據」,有效健康數據是人工智慧應用的基礎。一項調查表明,美國的醫學影像數據年增長率為63%,放射科醫生數量年增長率僅為2%。這一數據的增長同樣發生在中國,而面對中國的龐大的人口基數,醫生的數量將遠遠跟不上醫學影像數據的增長,而人工智慧的到來可以有效彌補缺口。
  • 「跨界組合」打造「智慧醫療」創業項目,有效降低腔內術手術水中毒...
    三湘都市報·新湖南客戶端10月14日訊(記者 劉鎮東 黃京 通訊員 楊莎莎)水中毒已成為腔內手術事故的重要原因,如何解決這個難題?昨日,在第五屆中國「網際網路+」大學生創新創業大賽總決賽中,該項目獲得銀獎。 談起「水中毒」,有著豐富臨床經驗的湖南省婦產科學教授、該項目技術指導之一徐大寶介紹,在應用腔內鏡的手術過程中,需配合使用膨宮液撐開腔內並「衝走」淤血和組織碎渣。「如果膨宮液大量被人體吸收,並在體內瀦留,超過了人體所能負荷的最大體液量,則可引起水中毒等併發症,嚴重時危及生命。」
  • 了解一下世界大廠Facebook是如何利用人工智慧的
    Facebook公司的做法是引入人工智慧工具,並成功地為相關領域的客戶提供服務。下面讓我們看看Facebook具體是怎麼做的。利用AI改造社交媒體這個世界上任何一個商業進化中的新崛起者都無法擺脫兩個身份:要麼是一個顛覆者,要麼是一個差異化者。人工智慧可以幫助企業兼有兩者。
  • 人工智慧工具將幫助我們充分利用空間生物學
    改變的是解決空間異質性的新工具的出現。SeqFISH(迭代螢光原位雜交)和MerFISH(單細胞轉錄成像技術)是在模型系統中繪製基因表達的新方法。10x Genomics(單細胞測序)和NanoString等多家公司現在正在普及空間轉錄組學,引入新技術和測試。他們正在開闢疾病病理學的研究。
  • 在人工智慧的角逐中,仿真數據是重要的平衡力量嗎?
    在這場科技巨頭企業的新型鬥爭中,較小的科技初創公司和非科技公司難以與之抗衡。但一切都隨合成數據的出現而改變。合成數據能使這一競賽變得公平嗎?在說明合成數據為什麼能成為遊戲規則改變者的原因之前,先解釋一下合成數據是什麼,還是很重要的。合成數據,亦或是仿真數據,顧名思義,是指由計算機生成的,而非從真實活動中抓取的數據。
  • 鋼鐵貓CEO孫樹祥主題發言:打造大數據新業態經濟體
    ,主題是「推動張家口大數據產業快速發展,打造『中國數壩』,助力北京冬奧會」。近年來張家口大力實施 " 大智移雲 " 引領計劃,深化大數據、雲計算創新應用,正在成為全國數據交互的重要樞紐;希望與各方一起按照黨的十九大精神,努力尋找更多互利共贏的契合點,在更深層次、更大範圍深化合作,催生新業態、鑄就新輝煌。
  • 國務院關於印發新一代人工智慧發展規劃的通知
    當前,我國國家安全和國際競爭形勢更加複雜,必須放眼全球,把人工智慧發展放在國家戰略層面系統布局、主動謀劃,牢牢把握人工智慧發展新階段國際競爭的戰略主動,打造競爭新優勢、開拓發展新空間,有效保障國家安全。人工智慧成為經濟發展的新引擎。
  • 雲葫蘆App——激活創業創新服務新引擎
    雲葫蘆智慧財產權傾力打造的新型創業創新服務載體——雲葫蘆App,猶如激活了創業創新服務的新引擎,讓雲葫蘆App成為了發明家與企業實現夢想的工具。這幾天,雲葫蘆app開發團隊正在與政府、高校、企業負責人、發明家緊密的溝通,精心的籌備發布新的軟體版本。
  • 圍繞AI和數據分析,微軟孵化器在班加羅爾選了13家創業公司
    最近上任班加羅爾微軟孵化器CEO的Bala Girisaballa在一次採訪中表示:「我們正處於新時代的風口浪尖,一切都離不開人工智慧。自動化已經過時,我們需要面對和處理的是成千上萬的數據……再過10年,我認為,人工智慧和數據分析將會是每一家公司的核心。」說起這批創業公司對AI和數據分析的關注時,Bala解釋說:「我不認為哪家公司可以在這一領域置身事外。
  • 人工智慧大數據進入心理學有什麼意義
    人工智慧除了在心理實驗方面有著無法取代的潛力,在其他方面也會大大拓展心理學的研究領域。隨著智能終端的不斷發展,移動數據的不斷提速,人工智慧不僅可以提供心理幹預的平臺,更有可能成為心理幹預的主力。科學的研究方法將心理學從哲學中分離開來,而人工智慧和大數據則可能將心理學更深刻地帶入生活。 心理學是研究人的行為和心理活動規律的科學,自人類出現,便有了對人類心理和行為的關注。
  • 從線下到線上,引爆數據分析新機遇
    而線上營銷則不同,在看重品牌效益、產品品質、營銷活動的同時,側重流暢性,1秒的延遲,可能導致更低的轉換率、更低的瀏覽量,更低的滿意度。 線下辦公到線上辦公:信息化的全面支撐 隨著大數據、雲計算、人工智慧、區塊鏈等科技的發展,大數據的應用持續深化,各行各業對數位化轉型有了更深刻的認識和更迫切的需求,傳統行業數位化轉型速度加快。
  • 聯合國攜手百度 用AI打造「鮮食代 零浪費」
    通過百度開源深度學習平臺PaddlePaddle為生鮮類食品精準預測進貨量和銷售量,利用AI賦能新零售行業,助力商家提升利潤率,減少食品浪費,讓消費者買到更新鮮的食品。 在剛剛落幕的烏鎮世界網際網路大會上,百度CEO李彥宏在人工智慧分論壇上分享了這個成功案例,並表示:「以往大眾感受到人工智慧對人生活的改變基本上是面對C端的,但是人工智慧也會大幅度的賦能B端,也就是改變製造端與供應端。」
  • 人工智慧訓練師探索之路
    人工智慧訓練師探索之路                ---打造居家創業新模式
  • 《科學大家》|物聯網,大數據,人工智慧,構建智能世界的技術金字塔
    通過有限的設備感知無限世界物聯網現在遇的一大困局是:很多時候大家發覺容易感知的信息難以傳輸,而易傳輸的信息難以感知。比如高精度視頻,這很容易感知,但是高清視頻耗傳輸帶寬太大,很多設備可能沒有能力將其傳回。另外還有些東西可能容易傳輸,比如說目標人物今天高興不高興,是什麼樣的語氣、心情,什麼感情,這很容易傳輸,信息量不大,但不容易感知。
  • 「蘑菇智能」利用人工智慧+大數據技術,提供全流程的智能投顧服務
    FOFGO.AI以開放式平臺架構為主體、天御雲大數據信息管理系統為基礎,對基金的投、管、退三大流程提供信息化、數據化、智能化管理服務,並且對金融機構的募集提供輔助推薦工具,為金融機構提供智能基金全流程解決方案。韋添譽介紹,一般來講智能投顧就是人工智慧+投資顧問的結合體,與傳統的投資顧問一樣,智能投顧承擔著投資者與金融產品的橋梁作用。
  • 早教市場規模有望突破千億元 兒歌點點「人工智慧+大數據」模式被...
    在這一點上,兒歌點點採用「人工智慧+大數據」相結合的形式,打造出全新的沉浸式啟蒙教育環境並取得了顯著的成果。據第三方數據顯示,憑藉其在兒歌早教領域的出色表現,兒歌點點日均用戶時長和MAU及同比均位居業內領先。孩子在啟蒙階段,家庭教育的權重很大。但不少家長由於時間和能力受限,家庭教育在一定程度上存在嚴重缺失的現象。
  • 貝葉斯網絡之父Judea Pearl:新因果科學與數據科學、人工智慧的思考
    作者 | Mr Bear、蔣寶尚編輯 | 叢末6月21日,圖靈獎得主、貝葉斯網絡之父 Judea Pearl 在第二屆北京智源大會上做了《新因果科學與數據科學、人工智慧的思考》的報告。簡單介紹完兩次數據科學革命,我介紹下這次演講的大綱,首先講一下什麼是因果科學,為什麼它需要新的邏輯和新的推理機制;然後介紹因果科學中新引擎的結構;再者,介紹一下因果推理的兩個基本原理,我把這兩個基本原理稱之為「double-helix」;最後給大家講講基於因果智能的七種工具,以及這七個工具是如何給科學帶來革命性變化。
  • 解密制約人工智慧發展的限制:數據標籤、可解釋性問題首當其衝
    當我們在新的領域部署機器學習和人工智慧算法時,可能會有更多的實例將這些潛在偏差問題納入數據集和算法中。這種偏差一般根深蒂固,因為識別它們並採取措施解決它們需要深入掌握數據科學技術,以及對現有社會力量(包括數據收集)的更深的元認識。總而言之,去偏差被證明是迄今為止最令人畏懼的障礙之一,當然也是最讓社會擔憂的障礙之一。
  • 飛馬旅攜手上海交大落地南通,打造滬通人才科技成果產業化新平臺
    這次合作是政府、高校、企業三方一次全新的嘗試,科創園全面匯聚「政校企」各方資源優勢,共同打造「高層次人才+前沿科技+創投資本」快速產業化的平臺和通道,構建「創新創業立體生態」服務體系。通過對專利資源、項目資源的數據篩選對接科研團隊和學生創業團隊,向南通推薦具備科技成果轉化的人才科技項目,並通過成立小微公司和初創公司的方式參加人才計劃評審,逐步培育孵化使其成長為規模公司。