十年數據分析經驗,總結出這三類分析工具最好用

2020-12-11 數據分析不是個事兒

提及數據分析工具相信小夥伴們都不陌生,但是很多人都會有個疑惑?

數據分析工具這麼多,它們有什麼區別?哪個更好?哪個更強?我應該學習哪個?

雖然這個問題有點俗套,但是很重要,我也一直努力在追求這個終極問題的答案。如果大家在網上去搜索這方面相關的信息,你又很難看到一個公平的觀點。因為評價某一個工具的好壞評論者都可能站在不同的角度,帶上一些個人的感情色彩。

今天我們拋開這些個人色彩的東西,力求客觀地與大家淺談一下我個人對市面上幾款數據分析工具的看法,供大家參考。

我共選了三類工具:

ExcelBI工具R、Python等編程類語言下面我一一來介紹:

Excel

如果說BI工具是戰鬥機,R語言、Python是轟炸機,那麼Excel就是數據分析裡的航空母艦,表格製作、數據透視表、VBA等等功能強大,Excel的體系龐大到沒有任何一個分析工具能夠超過它,保證人們能夠按照需求進行分析。

當然也有人認為自己非常精通計算機程式語言,不屑於使用Excel這種工具,因為Excel不能處理大數據。但換個思維想想,我們在日常中用到的數據是否超過了大數據這個極限呢?在我看來,Excel屬於萬能型的選手,解決小數據當然最適合,加上插件也可以處理百萬級的數據。

總結一下,基於Excel的強大的功能和它的用戶規模,我的看法是,它是必備工具,你要是想學數據分析Excel絕對是首選,而且是必選!

BI工具

BI也就是商業智能,這是為了數據分析而生的,它誕生的起點就非常高,目標是把從業務數據到經營決策的時間縮短,如何利用數據來影響決策。

而我們看Excel的產品目標不是這樣的,Excel可以做很多事情,你用Excel可以畫一張課程表,做一份調查問卷,當作計算器來算數,甚至還可以用來畫畫,用VBA寫個小遊戲,這些其實都不是數據分析功能。

但是術業有專攻,BI是專攻數據分析的。

就拿現在市面上比較常見的powerBI、FineBI、tableau這些BI工具來說,你會發現它是完全按照數據分析的流程來設計的,先是數據處理、整理清洗,再到數據建模,最後數據可視化,展現圖表,用圖來講故事,發掘問題影響決策。

這些是數據分析的必經之路,同時這個流程裡面也存在著從業者的一些痛點:

比如清洗數據這種重複性、低附加值的工作,可以用BI工具簡單化;做數據透視分析,由於數據量很大,傳統Excel工具就很吃力,卡掉、死機;做圖形展現,用Excel可能會花費很多時間編輯圖表,包括顏色、字體的設定;這些痛點都是BI工具能夠給我們帶來改變和增值的地方。

那麼再來談談PowerBI、FineBI、Tableau等BI工具之間的對比:

1、Tableau:

Tableau的核心本質其實就是excel的數據透視表和數據透視圖,可以說它敏銳地發覺了Excel的這個數據透視特性,較早地切入了BI市場,把這個核心價值發揚光大了。

從發展歷史和當前的市場的反饋情況看,Tablueau在可視化方面更勝一籌。這個優勢我認為並不是圖表有多炫酷,而是它的設計、色彩、操作界面給人一種簡單,清新的感覺。這一點的確是像Tableau自己所宣傳的,投入了很多學術性精力研究人們喜歡什麼樣的圖表,怎樣在操作和視覺上給使用者帶來極致的體驗。

此外,Tableau也在日趨完善,比如加入數據清洗功能和更多智能分析功能。這也都是Tableau可預計的產品發展優勢。

2、Power BI

power bi勝在微軟的商業模式和產品的數據分析功能:

PowerBI之前是以Excel插件作為產品,受限於Excel本身這個航母,發展情況並不理想,於是從Excel的插件中剝離出來,獨立成一門派,脫胎換骨。但作為後來者,每個月都有迭代跟新,追趕速度非常快。

powerBI的商業模式是軟體免費,這樣你不用擔心盜版、破解版的問題,因為正版都是免費的,這一點相比Tableau的動輒幾千元的售價實在是很有誘惑力;另一方面是數據分析功能,就是PowerPivot,DAX語言,它可以讓我用類似Excel寫公式的方式,實現很多非常複雜的高級分析。

3、Fine BI

再說Fine BI,它的獨到之處就在於自助式BI更適合企業級用戶。

比如取數,業務人員一會一個需求,這裡數據不對、那裡報表格式不對,效率很低。像有些企業是沒有數據分析師這樣的崗位,FineBI的自助化就能夠實現在權限內自己取數分析,不再讓業務和IT互相扯皮。

傳統的BI方式可能會需要ETL架構師或者是數據建模師等,但是自助式BI所需要的就很少了,基本上是可以完成人工的解放,儘可能地去減少成本。

還有一個比較重要的點是,FineBI是通過拖拽欄位的方式,實現數據透視分析的,可以一鍵生成圖表,入門門檻比較低,對於數據分析新手來說,比powerBI和tableau要好學一點。

R語言和python

第三類工具,這是最難的回答的。雖然像Excel,Bi工具這些軟體的設計已經盡最大努力考慮到大部分數據分析的應用場景,但本質上他們都是定製化的,如果沒有設計某一項功能,或者開發某項功能的按鈕,很有可能你就不能完成你的工作。

對於這一點,程式語言就不一樣了,語言是非常強大非常靈活的,你可以隨心所欲地寫代碼執行你想要的東西。比如R和Python語言,作為數據科學家的必備工具,從職業高度上講,這絕對是高於Excel、BI工具的。

那麼有哪些應用場景,R、Python 可以做,而Excel和BI工具比較難實現呢?

1、專業的統計分析

以R語言來講,它最擅長的是統計型分析,比如求正態分布,利用算法歸類聚群,回歸分析等。這種分析就好比把數據當做一種實驗品,它能夠幫助我們回答的問題:

比如數據的分布情況,是正態分布、三角分布還是其他類型的分布?離散情況如何?是否在我們想要達到的統計可控範圍內呢?不同參數對結果的影響的量級是多少?以及假設性模擬分析,如果某一參數變化,會帶來多大的影響?

2、個體預測分析

比如我們想要預測一位消費者的行為,他會在我們的店裡停留多長時間,消費多少,或者通過一個人的淘寶消費記錄判斷他的個人信用情況,制定貸款額度;再或者根據你在網頁上的瀏覽記錄,推送不同的商品。這也是涉及到目前比較火的機器學習、人工智慧概念。

總結

以上的對比說明了幾個軟體的差別,我想總結的是,存在即合理。Excel\BI\程式語言,這些工具在應用上有交叉重疊的地方,也有互補的地方。對於重疊的地方,無論是哪種工具,只要你能利用它解決你遇到的問題,它就是最棒的。

選擇哪個工具,首先要了解你自己的工作,是否會用到我剛才提到的那些應用場景。或者想想你的從業方向,是朝著偏重數據的數據科學方向發展,還是偏業務的商業分析方向。

相關焦點

  • 關於數據分析工具的終極問題
    如果大家對它有疑惑,咱們可以在後面的交流中聊聊)現在就開始聊聊剛才說的三類工具吧。咱們先講講Excel,數據科學家在用,不懂數據的人也會用。它可以說是無人不知,無人不曉。比如介紹在PowerBI中如何做「合併查詢」或者「關聯」,這幾個詞第一次聽你可能不知道是什麼含義,但如果我說他們的功能比較像Vlookup,很多人就馬上明白意思了。交流經驗用Excel的方式來舉例,別人與你探討數據,發的文件可能大多也是Excel格式的。從這個角度來講,因為使用人群非常多,Excel可以說是已經成為了一種工具語言。
  • 數據分析的三大框架:底層技術、分析建模、工具選擇
    原來數據異常,並不是公司的問題,而是整個環境變了,而我們卻用了大量的時間精力分析自己的問題。所以我們要建立正常的標準,我們每次比較都是預期標準比較的,而不是和0比較,也不是和最好的情況比較。3.2 問題的全方位分析文獻綜述(俗稱百度,當然不僅僅包含百度)針對提出的問題,搜尋前人的分析,總結前人的經驗。常見的高質量數據源:知乎、知網、谷歌學術。
  • 學習數據分析,這些超好用的數據分析工具你必須知道!
    目前市場上有數千種工具能夠幫你節約時間和成本,帶你從全新的角度洞察你所在的行業。 以下介紹幾款超好用的數據分析工具,幫助你在數據分析的學習以及工作中能夠脫穎而出。
  • 20個最好的網站數據實時分析工具
    這是我們為大家提供的一篇關於介紹20個最好的網站數據實時分析工具的文章,接下來就讓我們一起來了解一下吧!1.Clicky與Google Analytics這種龐大的分析系統相比,Clicky相對比較簡易,它在控制面板上描供了一系列統計數據,包括最近三天的訪問量、最高的20個連結來源及最高20個關鍵字,雖說數據種類不多,但可直觀的反映出當前站點的訪問情況,而且UI也比較簡潔清新。
  • 物流規劃數據分析小工具
    我們將物流的數據分析過程工具化,使得數據分析的過程更加的高效、系統,輸出結果也更加可靠。
  • 常用的數據分析工具
    科學技術的發展帶動信息的不斷傳播,信息傳播過程中產生了大量的數據,這些數據對我們的生活產生了很大的影響,比如在某寶上購買產品,會比較店鋪的銷售量、好評等數據。除了這些直觀的數據之外,數據背後隱藏的秘密就需要分析所得。今天從定義、功能、應用領域介紹幾款常用的數據分析工具。
  • 數據分析的準備工作:從問題分析到數據清洗
    首先是對問題的分析:對問題的分析不是今天想要說的重點,但是為了框架的完整性,今天做一些簡單的介紹。關於對問題本身的分析,人類的知識體系在這方面沉澱了大量的智慧和經驗。在這類問題中我們要注意的是,我們並不是像求解第一類是什麼問題,要追求極高的準確率,我們追求的是在資源有限的情況下,我們如何把一件事情做到流暢,也就是60分到80分的樣子。也就是說在大多數的時候,我們求解的不是最優解,我們求解的僅僅是一個滿意解而已。 現實生活中我遇到遇到的本質性的三類問題,其他任何問題都可以轉化為這三類問題,或者轉化為這三類問題的組合。
  • 大數據分析工具採購指南
    換而言之,數據挖掘和預測分析時需要使用哪一種級別的專業知識才能理解目前能夠開發哪一些類別的模型及如何使用一個特定工具完成建模?經驗一般的數據分析師感興趣的是提供大量分析功能的供應商產品,而更專業的分析師和統計師則更偏好於那些能夠更深入分析特定分析模型的工具。集成與可訪問性。大數據分析應用通常依賴于越來越多的內部和外部數據源,其中包括結構化和非結構化數據。
  • 數據分析的理念、流程、方法、工具
    整體來看,運營數據分析的目標主要有三類——即「解決是什麼、為什麼、做什麼」的問題,具體的數據分析目標還要結合實際工作來定義:是什麼:如運營舉措的效果如何?產品優化的效果如何?用戶使用情況是怎樣的?用戶的體驗反饋如何?
  • 盒子數據是shopee數據分析工具比較好的選擇
    大家好,我是蘭波,經常有商家問我,怎麼才能把shopee店鋪做好,都認為自己沒經驗無從下手,實際上有這樣的感覺也是人之常情,經驗豐富的國內或者跨境商家在轉戰shopee的時候陣痛期的確是短一點,畢竟人家已經有個幾年的沉澱了,對於電商新手賣家來說,要趕超有基礎的商家,勢必得走一點捷徑,這條捷徑就是利用平臺數據來做出清晰準確的運營決策,在這個大數據時代各行各業都是如此,憑經驗判斷明天天氣怎麼樣肯定沒有天氣預報來得準確
  • 辦公必備的大數據分析利器,數據分析工具推薦
    說到數據分析,很多小夥伴可能第一時間聯想到複雜的算法,龐大的數據,甚至是讓人眼花繚亂的代碼。但實際上,運營做數據分析並不需要懂這些,關鍵是你對業務流程的理解,以及用數據解決問題的思維。本文將介紹在一些領域被高頻率使用,且不可缺少的大數據分析利器,使用尚可的數據分析工具。
  • 數據收集及數據分析工具介紹
    隨著數據分析在各個領域發揮越來越重要的作用,針對不同數據分析步驟的軟硬體工具也很快發展起來。下面我們介紹幾種重要的數據分析工具。各類傳感器數據可以通過很多方式進行採集。例如,製作調查問卷,隨機抽取人群樣本填寫問卷,得到人群樣本的反饋數據;人工觀察記錄也是過去常用的數據採集方式。
  • 拉勾網數據分析崗數據分析
    簡介:試著,做了一個拉勾網數據分析師職位的數據分析。其實,雖然很想做數據分析師,但是是跨行,心裡相當忐忑,做這個分析就相當於加深自己對數據分析這個行業的了解了。思路大致思路起始數據來源本來是想自己寫個爬蟲的,可是學了好久,還是不能融會貫通,總會出一些bug,只能繼續學習,爭取早日修成爬神功。又想著,總不能還沒開始,就結束了這次實驗。
  • 乾貨 :18個免費的探索性數據分析工具
    當我開始用R編程的時候,我很糾結。有時候不止一個人曾經這麼想過。因為我在這一生中從未編碼過。我的情況就像是一個從來沒學過遊泳的人在被強行踹進深海後用盡力氣讓自己不沉下去但是卻喝了好多口鹹鹹的海水。現在,當我回過頭看,我笑了。你知道為什麼嗎?因為,我本可以選擇不需要會編程就可以使用的數據分析工具並避免那些痛苦。數據挖掘是預測建模不可缺少的一部分。
  • 別人都在用數據分析軟體,你還在用excel做數據分析?
    之前聽朋友吐槽過,他們是上千人的企業,但做數據分析居然還是靠手動上傳數據,而且還是用的excel做的。但其實excel並不是企業做數據分析的好工具。數據分析是指用適當的統計分析方法對收集來的大量數據進行分析,提取有用信息和形成結論而對數據加以詳細研究和概括總結的過程。
  • 《企業經營數據分析》給傳統企業管理者的數據分析指南
    這不是一句笑談,而是從業這麼多年來所見、所聞、所實踐的數據項目各種死法的根本原因。一步錯,步步錯。沒有對數據正確的底層認知,投入的成百上千萬的轉型成本都是浪費。因此,手把手帶領管理者從基本功開始練,就是這本《企業經營數據分析》的初衷。
  • 數據分析實戰:數據分析的5大關鍵環節
    1、用戶這裡提到的用戶是指數據分析內容或者結果給誰看?這裡的目標用戶主要分三類:你自己、企業內部業務部門、外部客戶。這裡主要對後兩種進行解析。企業內部業務部門:這類用戶通常會通過制定不同策略提升企業某些指標的提升,可以是市場部門、運營部門或者是維繫部門。
  • 怎麼做數據分析?數據分析的這些環節你不得不知
    二、數據獲取在明確數據分析的目標後,就要根據目標獲取所需的數據,數據獲取主要分為三類:(1)通過基於前端頁面的數據採集工具,如億信ABI的數據採集功能;(2)在產品設計過程中,通過數據埋點的方式,需要數據時可以簡單地提出數據,這種方法的前提是未來的數據採集在產品規劃階段就已經提前準備好了
  • 諮詢顧問七大常用數據分析工具都打包給你了
    在當前乃至未來5年的職場中,將取代你的可能不是 AI ,而是比你「更懂」數據分析的同事。
  • 有了Excel,還用得著數據分析工具嗎?
    從而如今的大數據行業非常的火熱,相應的數據分析師是比較受歡迎的職業,那麼學會Excel是必不可少的,計算公式豐富,圖表功能豐富,統計分析一鍵搞定,簡單上手容易,這些都是Excel不可否認的有點,但是對於大量的數據,瘋狂的業務需求,用Excel略顯吃力,陷入了被動,大部分的時間被常規的工作佔用,談何更重要的事情。