這裡不再闡述商業智能的概念了,關於BI,就從過往的了解,搜索以及知乎的一些問答,大家困惑的點主要集中於大數據與BI的關係,BI的一些技術問題,以及BI行業和個人職業前景的發展。這裡歸納成8個問題點,每個問題都做了精心的解答,希望能給大家帶來幫助。
問題1:商業智能BI和大數據是什麼關係,如何選擇?
BI(BusinessIntelligence)即商業智能,它是一套完整的解決方案,用來將企業中現有的數據進行有效的整合,快速準確的提供報表並提出決策依據,幫助企業做出明智的業務經營決策。
大數據(Big Data)是指在可承受的時間範圍內用常規軟體工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力來適應海量、高增長率和多樣化的信息資產。
兩者是不一樣的概念,BI相對於大數據更傾向於決策,適合支持經營指標支撐類的問題,大數據則內涵更廣,傾向於刻畫個體,更多的在於個性化的決策。
現今,大型網際網路企業採用hadoop一類的大數據架構——數據倉庫——自己研發的報表、OLAP分析等,或者前端選用成熟的商業智能報表和BI分析軟體,像FineBI之類的大數據BI都能對接大數據平臺。傳統企業,小型的公司沒有那麼多的業務分析的需求,大多尋求excel、業務系統的簡單報表功能或者專業的報表工具來解決問題;一般中大型企業數據量大時會構建數據倉庫,用BI在前端分析展現。當然很多傳統企業針對特定業務(比如用戶畫像、風控分析)採用大數據技術。
整體來講,選擇大數據還是BI依據需求來定,大數據組件大多開源,需要大量的人力開發。BI大多商用,需要一定資金和一定時間的項目實施。
問題2:什麼是大數據BI?什麼是自助式BI?和傳統BI有何區別?
大數據BI
大數據BI有這樣幾類特性:能對接hadoop一類的大數據平臺,做數據分析;能處理大數據量(億級以上),響應速度快,比較考驗的是BI的數據處理計算性能和資料庫性能。
傳統BI &自助式BI
傳統BI重在於數據平臺搭建,提供報表服務,以IT為主導;自助式BI重在於數據分析,以業務分析為主導。兩者的數據處理流程相通。
傳統BI:通常指企業內部大而全的統一報表或分析平臺,代表性的老牌BI工具廠商如 IBM的cognos,Oracle的OBIEE,SAP的BO等均包含豐富的功能模塊,比較適合於打造一體化的大而全的統一平臺。傳統BI一般面向IT研發人員,他們多集中在企業的技術部門,傳統BI的打造方式基本如下:
自助BI:面向的是不具備IT背景的業務分析人員,與傳統BI相比更靈活且易於使用,而且一定程度上擺脫對IT部門的大幅度依賴。不同於以往「IT主導的報表模式」,轉而向「業務主導的自助分析模式」發展。自助BI通常的應用場景:
問題3:BI的多維數據模型和OLAP是什麼,實用價值在哪?
試想一下分析業務數據時場景,經常會從不同的角度來審視業務的衡量指標。例如分析銷售數據,可能會綜合時間周期、產品類別、分銷渠道、地理分布、客戶群類等多種因素來考量。這些分析角度雖然可以通過報表來反映,但每一個分析的角度生成一張報表,各個分析角度的不同組合又生成不同的報表,每嘗試分析一次,就得抽一次數,這會使得IT人員的工作量相當大。
而OLAP的作用就是儘可能將所有的維度條件及聚合值都準備好,供使用者在分析時可以按照任意維度來分析。
以BI的實際應用來講,拿到數據,可能需要下鑽到比較粗的粒度觀察數據,比如從日期時間維度、從地域品類維度來分析數據,對應到BI的操作上,就是拖拽維度、過濾排序、維度切換,鑽取等操作,cube或者數據倉庫就要響應這種操作,這就使用到了下鑽、切邊、切塊、轉軸等功能。
問題4:商業智能BI在數據分析工作中的作用,是必要的嗎?
在數據分析過程中,BI也算是一個工具,能自助取數,用於快速分析,製作分析報表。很多網際網路、零售、金融企業會有自己的數據分析團隊會專業的分析人員,使用的工具可能從SPSS、SAS、R、Python不等,這些工具能對準備好的數據做數理統計分析,取數的工作大多還是要交給IT人員去做。像目前的自助式BI因為上手很簡單,對於多維度的數據可以從各方面來展示,而且能及時生成數據報告,可在平臺上管理報表和分析表單。所以是否有必要,因需求而異。
問題5:BI如何選型,需要考慮哪些點?
BI工具可分為傳統型BI以及自助型BI。傳統型BI,國外以SAP BO、cognos、Oracle BIEE等為主;自助型BI,比如國外的Tableau、Qlikview,國內的FineBI、永洪bi等等。
站在產品的企業的角度,可以從領先能力、產品能力、服務能力以及價格能力去著手衡量。可通過海比研究給出的一套《BI選型指標體系》來判斷。
1、領先能力=行業地位+領先性
比如公司在行業中的低位、市場佔有率、公司在該領域的專注性以及技術的領先性。商業智能目前的市場格局不算大,可擴展到報表領域去衡量。
2、產品能力=公司產品線+核心產品功能+解決方案
一般來講,公司的產品線越完整,相關產品的整合能力越強,越好。但是,最重要的還是產品的功能是否實能解決企業最關注的的問題,是否能覆蓋更多行業,BI解決的是行業通用性的問題,解決能力越強,產品越優秀。
3、服務能力=服務專業能力+維護能力
BI的實施很考察人員的專業性,過去由於國外IT巨頭的稱霸,很多產品的項目都承包給第三方實施,造成服務脫節。現在很多湧現的國內軟體公司一般都會有專業的實施團隊,本地化服務很佔優勢,所以這一點不妨考慮本土產品。
4、價值能力=成功案例+性價比
選型前可看看同行業的企業夥伴們用的是什麼類的BI工具,使用情況如何。包括從功能費用、項目實施費用綜合考慮來看的性價比。
問題6:如何實施BI?
實施BI的前提,最重要的是基礎數據的統一。比如貨品信息,客戶信息,公司內部信息。缺少的數據雖然可以臨時補,但是隨著公司業務的擴展,這種數據化運營的方式需要不斷精細,數據管理的規範任務要落實到業務員的考察,如果得到領導的支持會更容易推動。有了這些齊全的數據,BI的實施才有保障。
然後是業務的統一。比如銷售模式,採購模式,結算方法,質量管理的統一。比如銷售模式不統一,有的分公司先結算後配送,有的公司先配送後結算,業務形式不統一,口徑不統一,就會造成數據的時間差。
其次是業務部署。每個公司的業務部署不同,有的是集中部署有的是分銷部署,如果BI是放在總部實施,需要將各地分散的數據統一起來,建立數據倉庫,保持基礎數據的統一,但其中,如何提高速度,如何優化配合方式,這點需要研究。
BI人才儲備是否足夠,需要業務人員和信息人員的積極配合,這個效果才能夠比較良好的推動,而且還能夠持續的發展。為了讓技術和業務人員更好地貼合,要將技術和業務有效結合,最大效率的把報表和BI系統的功能發揮出來。
對於上BI,還有其他考慮,比如價格預算,比如是否用開源,比如後續開發和維護,這裡做個統一的解釋。
明確業務需求:強烈的業務需求,明晰的業務目標,能否抓住核心是一個項目成敗的關鍵。
「產品+定製+服務」的建設思路:是否要選擇開源的產品?如果你有很強的開發能力,可以考慮。但建議專業的事情還是交給專業的工具來做,傳統企業不比網際網路企業,網際網路企業是以數據來驅動的,與傳統企業的模式不一樣,再說,後續維護也是成本啊。業務項目建設如果不藉助比較成熟的產品工具,從技術代碼進行創新式的開發,不經過迭代以及檢驗很難規避風險,很難形成一個成熟的產品。如果覺得國外BI產品「龐大」,完全可以選擇FineBI這一類輕量化的工具。
最後,就是認清技術力量的現狀,不妨建議敏捷開發、迭代開發和重構,注重技術和管理的配合。
問題7:做BI人的前景在哪裡?
剛入門BI這一領域的人,未來的職業發展可以走技術、走管理、走開發。
1、走技術方向:(按照技術路線進行劃分)
ETL,這塊是BI永恆的重點之一,需求也是一直持續,只是相對來說,ETL會比較枯燥。在這一塊,掌握一兩款順應潮流的大工具,擁有相應年限的工作經歷,行業性要求不太高,可以找到一個不錯的崗位。DS、INFA、SSIS這些都是蠻有需求的。
數據倉庫,主要指的數據倉庫設計,架構設計等,一般來說LEVEL會比較高,薪水待遇也還行,屬於偏高端人才了,一般都會要有5年、7年或更多年限的經驗,對行業性經驗要求比較高。
前端應用,SAP BO、COGNOS、BIEE等工具的熟練應用,可以做甲方內部顧問也可以做乙方項目顧問。從前端切入去接觸到更多業務和需求,對提高自己的業務水平有好處。
數據挖掘數據分析方面,這塊個人認為是最有前景的,數據分析師的需求一直在增加,但和BI的背景不是非常貼合,要學數據統計學知識,R、Python語言等,學的東西很多。
2、走管理路線
管團隊管某塊業務,做項目總監,而後上升到CIO之類的,偏向管理屬性,對人的溝通交流尤其是與高層交流的水平較高,比較IT在企業大多屬於業務支撐部門,很多事情很難推動,同時還要思考如何提升IT在企業的地位,這個你只要觀察自己的部門領導怎麼做的,慢慢摸索了。
3、走開發
第三方軟體開發公司了,比如SAP之類的公司(有點難度),或者國內帆軟、永洪等其他BI公司的軟體開發了,難度是要有一定的程序開發基礎,但是對業務的理解也能帶來一些幫助。再或者是去一些創業公司帶團隊做BI產品,現在做前端可視化分析的公司有很多,雖然不完全類同於BI,但有很多共通之處。
問題8:如何系統的學習BI知識?
這裡給出一個學習框架
1、學習資料庫知識, 掌握基礎技能SQL
2、技術選擇:數據倉庫 / ETL / 前端開發等等
3、 選擇技術工具:
數據倉庫-Oracle、SAP HANA、Hadoop都是主流;
ETL- informatica 、kettle;
自助式BI工具-Taleau、帆軟FineBI、Power BI
4、學習業務知識
5、實操數據分析工作