超級菜鳥如何學數據分析?看大牛如何用最接地氣的語言為你指路?

2021-01-09 億信華辰軟體

數據本身是冰冷沒有溫度的,但是如果我們利用好它,通可視化圖表將數據直觀的表現出來,然後對其進行分析,就可以發現背後蘊藏的規律,並將付諸於後續的事情中去,從而對我們的行為有一定的指導意義。

但對於平常人來說,對於數據分析的概念似乎不太明晰,首先我們來看一下數據鏈圖,他用比較接地氣的語言來給我們解釋了數據分析是怎麼做的:

這裡我們選取其中的選菜、做菜、擺盤來詳細展開。

一、如何讓選菜更加高效?(數據源獲取)

關於數據源的獲取,是一個互相促進的過程,有時候可以是人們主觀的想要去搜集一些數據通過分析進而得出結論,另外一種方式可能是去瀏覽一些數據源的網站,這樣反向給自己一些靈感,這個方法在自己「想法枯竭」時還是很好用的。

推薦題主可以去一下這個問題裡去找找數據源,也許會給你一些啟發和選題方向:

1、常用數據公開網站

UCI:該網站目前維護了436個經典的機器學習、數據挖掘數據集,包含分類、聚類、回歸等問題下的多個數據集。

國家數據:數據來源中華人民共和國國家統計局,包含了我國經濟民生等多個方面的數據,並且在月度、季度、年度都有覆蓋,較為全面。

CEIC:涵蓋超過195個國家400多萬個時間序列的數據源,最完整的一套超過128個國家的經濟數據,能夠精確查找GDP、CPI、進口、出口、外資直接投資、零售、銷售以及國際利率等深度數據。

萬得:被譽為中國的Bloomberg,在金融業有著全面的數據覆蓋,金融數據的類目更新非常快,據說很受國內的商業分析者和投資人的親睞。

搜數網:已加載到搜數網站的統計資料達到7,874本,涵蓋1,761,009張統計表格和364,580,479個統計數據,匯集了中國資訊行自92年以來收集的44個行業所有統計和調查數據。

中國統計信息網:國家統計局的官方網站,匯集了全國各級政府各年度的國民經濟和社會發展統計信息,建立了以統計公報為主,統計年鑑、階段發展數據、統計分析、經濟新聞、主要統計指標排行等。

亞馬遜:來自亞馬遜的跨科學雲數據平臺,擁有免費且開源的資料庫,包含化學、生物、經濟等多個領域的數據集。

figshare:研究成果共享平臺,這裡向全世界開放免費的研究成果及科學數據。

github:一個非常全面的數據獲取渠道,包含各個細分領域的資料庫資源,自然科學和社會科學的覆蓋都很全面,適合做研究和數據分析的人員。

這樣一來,我們沒有用到什麼編程和複雜的操作也能高效的得到數據源。

二、研究菜譜讓做菜更加輕鬆(研究模型為自己所用)

分析模型類似於菜譜的功能,初學者可以跟進菜譜的指引也能做出一道大菜來。這裡介紹10個大數據分析模型,供大家思考和使用。

1、戰略分析模型:ROS\RMS矩陣

ROS/RMS(Return Of Sales/Relative MarketShare)矩陣也稱做銷售回報和相對市場份額矩陣,主要是用來分析企業的不同業務單元或產品的發展戰略。該分析模型定義,企業某個業務單元或產品在市場上的銷售額應該與其在市場中的相對份額成正比,並且該業務單元或產品的銷售額越高,該業務單元或產品為企業所提供的銷售回報就應該越高。

數據分析人員根據上圖,可了解企業的某種業務單元或產品的銷售額在由低向高不斷增加,其相對市場份額和銷售回報也在一個「通道」內由低向高不斷增加。如果該業務單元或產品的銷售額增加,而其對企業的銷售回報或相對市場份額降低,那麼企業就不應該在這個時候進入其他領域,應該著重改善這個業務單元或產品的經營狀況。

2、戰略價值分析模型:價值鏈模型

為了提升企業戰略,美國戰略管理學家Porter第一次提出價值鏈分析的方法。企業的競爭優勢來源於企業在設計、生產、營銷、交貨等過程及輔助過程中所進行的許多相互分離的活動,這些活動中的每一種都對企業的相對成本地位有所貢獻,並奠定了企業競爭優勢的基礎。價值鏈模型將一個企業的行為分解為戰略性相關的許多活動,企業正是通過比其競爭對手更廉價或更出色地開展這些重要的戰略活動來贏得競爭優勢的。

在數據分析中,價值鏈模型目的在於幫助企業分析公司運行的哪個環節可以提高客戶價值或降低生產成本。

3、地位分析:三四矩陣

三四矩陣是由波士頓諮詢集團提出的。這個模型用於分析一個成熟市場中企業的競爭地位。在一個穩定的競爭市場中,參與市場競爭的參與者一般分為三類,領先者、參與者、生存者。

領先者一般是指市場佔有率在15%以上,可以對市場變化產生重大影響的企業,如在價格、產量等方面;參與者一般是指市場佔有率介於5%~15%之間的企業,這些企業雖然不能對市場產生重大的影響,但是它們是市場競爭的有效參與者;生存者一般是局部細分市場填補者,這些企業的市場份額都非常低,通常小於5%。

這個模型印證了中國彩電業幾次降價後,各個企業的競爭態勢的變化。在長虹第一次降價後,企業的成本和產量都得到收益,使它迅速成為市場佔有率最大的企業,康佳和TCL則緊隨其後。經過幾次的降價後,企業已經不能再靠價格因素來擴大市場份額了,企業必須創造新的競爭優勢。

4、戰略規劃模型:GE矩陣

GE矩陣法又稱通用電器公司法、麥肯錫矩陣、九盒矩陣法、行業吸引力矩陣是美國通用電氣公司(GE)於70年代開發了新的投資組合分析方法。對企業進行業務選擇和定位具有重要的價值和意義。

數據分析師可通過該分析模型保證企業資源的合理配置,企業也可以嘗試按照發展中業務和已發展業務的混合,與現金產生和現金使用的內在一致性來平衡業務。

5、業務或投資組合:波士頓分析矩陣

波士頓矩陣又稱市場增長率-相對市場份額矩陣、波士頓諮詢集團法、四象限分析法、產品系列結構管理法等。在矩陣中,坐標軸的兩個變量分別是業務單元所在市場的增長程度和所佔據的市場份額。每個象限中的企業處於根本不同的現金流位置,並且應用不同的方式加以管理,這樣就引申出公司如何尋求其總體業務組合。

通過波士頓矩陣進行數據分析,有助於對各公司的業務組合投資組合提供一些解釋並能查企業各個業務單元的經營情況,如果同其他分析方法一起使用會產生非常有益的效果。

6、競爭戰略選擇:戰略鍾

「戰略鍾」是分析企業競爭戰略選擇的一種工具,這種模型為企業的管理人員和諮詢顧問提供了思考競爭戰略和取得競爭優勢的方法。

7、受衝擊戰略調整:SCP分析模型

SCP(structure、conduct、performance)模型,分析在行業或者企業受到表面衝擊時,可能的戰略調整及行為變化。

SCP模型從對特定行業結構、企業行為和經營結果三個角度來分析外部衝擊的影響。

外部衝擊:主要指企業外部經濟環境、政治、技術、文化變遷、消費習慣等因素的變化。行業結構:主要是指外部各種環境的變化對企業所在行業可能的影響,包括行業競爭的變化、產品需求的變化、細分市場的的變化、營銷模型的變化企業行為:主要是指企業針對外部衝擊和行業結構的變化所採取的措施,包括企業方面對相關業務單元的整合、業務的擴張與收縮、運營方式的轉變、管理的變革等以一系列行動。經營結果:主要是指在外部環境方面發生變化的情況下企業在經營利潤、產品成本、市場份額等方面的變化趨勢。

8、解析基本維度:ECIRM戰略模型

ECIRM模型的構成包括了五個核心要素:一是E,代表企業家要素;二是C,代表資本要素;三是I,代表產業要素;四是R,代表資源要素;五是M,代表管理要素。五項要素共同耦合成為一個以企業家精神和企業家能力為核心的公司戰略模型,構成從戰略上系統解析一家企業的五個基本維度。

產業型公司和資本型公司呈現「順時針」方向的成長路徑,而資源型公司和管理型公司則呈現「逆時針」方向的成長路徑。

9、外部環境採用戰略:SPACE矩陣

SPACE矩陣有四個象限分別表示企業採取的進取、保守、防禦和競爭四種戰略模式。這個矩陣的兩個數軸分別代表了企業的兩個內部因素——財務優勢(FS)和競爭優勢(CA);兩個外部因素——環境穩定性(ES)和產業優勢(IS)。這四個因素對於企業的總體戰略地位是最為重要的。

10、機會、優劣、挑戰:SWOT模型

「SWOT」是Strength、Weakness、Opportunity、Threat四個英文單詞的縮寫,這個模型主要是通過分析企業內部和外部存在的優勢和劣勢、機會和挑戰來概括企業內外部研究結果的一種方法。

S-優勢:比較分析企業在外部市場環境、內部經營方面相對於其他競爭對手的優勢;W-劣勢:比較分析企業在外部市場環境、內部經營方面相對於其他競爭對手的劣勢;O-機會:分析在目前的市場競爭態勢下企業存在的發展機會;T-挑戰:分析在目前的市場競爭態勢下企業存在的威脅和挑戰。

優劣勢分析主要是著眼於企業自身的實力及其與競爭對手的比較,而機會和威脅分析將注意力放在外部環境的變化及對企業的可能影響上。在分析時,應把所有的優勢集中在一起,然後用外部的力量來對這些因素進行評估。

三、如何讓擺盤更加高級?(可視化工具助力)

這一步是比較重要的一步,前面我說了對於題主而言前期不要太在意編程能力,因為市面上這種做數據可視化的工具有很多,只要可以利用好他們,同樣可以做出好看的可視化圖表,而且時間成本付出的相對較少。

1、億信華辰豌豆BI

個人版完全免費,可以終生使用,非常適合不懂技術的人員,但是別小瞧他是免費版,功能可是一定都沒有打折扣的。

支持基於列存儲的MPP架構的分布式資料庫進行敏捷分析,百億數據可達到秒級響應,可解決TB甚至PB級超大數據量敏捷分析的難題。

智能化建模,一鍵導入數據,自動識別維度和指標,構建數倉模型;根據拖拽的指標和維度,識別最優的展現形式,所有圖表無需任何設置即可聯動,也可自定義選擇部分圖表參與聯動和下鑽。

除了Excel、TXT之類的文件,還可接入各類資料庫,強大到跌破眼鏡

2、一站式數據分析平臺億信ABI

面向技術人員,有大數據量的處理分析,大屏需求等,產品融合了ETL數據處理、數據建模、數據可視化、數據分析、數據填報、移動應用,功能全面且實用,靈活組合滿足數據分析所有需求。

1、覆蓋基礎報表應用

複雜報表:支持各類報表應用,包含交叉報表、多級表頭的中國式複雜報表、簡歷表等,可滿足用戶各式各樣報表展現訴求。

圖表分析:系統內置數百種圖表組件,任意組合即可製作靈動直觀的數據看板,輔助領導決策。

數據鑽取:系統內置十餘種的鑽取方式,支持文本、報表、統計圖、地圖等各種數據元素上進行鑽取和切片,通過數據指標的層層下鑽,可幫助用戶快速定位問題。

2、多元的數據可視化

領導駕駛艙:系統內置數百種圖表組件,可直觀展示和監測企業運營情況,為企業高層提供一站式決策支持。

大屏可視化:ABI提供多個大屏模板,內置300+酷炫可視化組件,拖拽即可應用,同時具備較高的開放性,允許用戶自定義個性化業務大屏,創建你專屬的大屏可視化效果。

3D可視化:結合全景3D建模和數據分析引擎,可建設智慧城市,3D設備管理等,實現端到端的數據可視化。

GIS地圖應用:無縫對接多個GIS地圖平臺,可實現地理相關信息的綜合數據分析和展現。

說了這麼多還是需要勇敢的邁開第一步,數據分析沒有你想像的那麼高不可攀,千萬不要被自己臆想出來的東西嚇著了,多多看書,多多藉助工具去動手實踐才是最重要的,

相關焦點

  • 如何從模擬電路菜鳥變大牛 三位前輩如是說
    覺得學的雲裡霧裡的?覺得老師講的不好?覺得教材爛?好了,別找理由了,學不好應該是沒找到方法,分享3位前輩的經驗給你,看看前輩們都是怎麼成菜鳥變成大牛的。如果你的訴求是期末拿到高分而已,那麼您不用往下看了。出門往右電子科技書屋有歷年的考題和課件。平日裡該幹嘛幹嘛。拿星爺的臺詞說,妞照泡舞照跳。等到期末背一下就行啦。如果分數不說明問題。那麼怎樣才算學好模擬電路呢?問一下自己一個問題: 我學模擬電路可以做什麼?為了設計一個增益為5的放大器嗎?
  • 如何通過網絡數據的獲取,做出這些數據分析項目?
    作者 | AlfredWu 來源 | Alfred數據室 最近有很多人在問,我是如何收集網絡的數據,如何進行數據處理、數據分析以及可視化呈現的。也有人問的更具體,關於Python數據分析的一些問題。到底應該怎麼學?如何快速入門,以及技術和業務之間的瓶頸如何突破?
  • NLP應該如何學、如何教?史丹福大學大牛Dan Jurafsky教授專訪
    一個是這種模式迫使我以 8 分鐘為時間塊思考每個主題,並明確學習目標。這有助於解構我希望學生真正學到的東西。另一個好處是,我本需要對課堂內部分的主動學習花費心思:他們需要了解的概念性內容是什麼,以及如何讓他們在課堂上或團隊裡為學習到一些東西進行概念性思考,而在這方面翻轉課堂可以做的更好。
  • 英語學不好,也能做厲害的超級工程師大牛
    看了這個題目,大概沒有人會相信我談的是一個地地道道的美國工程師。當我們國內的年輕工程師從小學就開始的十多年,為英語耽誤了大量美好的時光的時候, 就有這麼一位超級工程師大牛,正宗的美國人,憑藉他的智慧和「玩」法,在測試測量行業獲得了令人矚目的成績。
  • 提高數據分析能力,你不得不看的33本書|推薦收藏
    讀者通過具體的例子學到的是思考問題的方式 —— 如何化繁為簡,如何用數學去解決工程問題,如何跳出固有思維不斷去思考創新。六、數據挖掘1.《數據挖掘導論(完整版)》推薦理由:本書全面介紹了數據挖掘,涵蓋了五個主題:數據、分類、關聯分析、聚類和異常檢測。除異常檢測外,每個主題都有兩章。前一章涵蓋基本概念、代表性算法和評估技術,而後一章討論高級概念和算法。
  • 如何從零開始掌握生物信息學分析(新手寶典)
    這就會導致研究人員在進行大數據研究的時候,不得不自己編寫一些程序來進行可重複和得到證實的信息處理。然而這些過程也需要小心處理,一不留意犯錯了,就有可能危及數據本身。近期The Scientist雜誌聯繫了幾位科學程式設計師,了解他們所使用的工具是什麼,如果是菜鳥需要進行哪些訓練等。
  • 從超級菜鳥變成Linux系統高手
    否則,你永遠都學不會Linux,Linux的強大穩定正在使用較少硬體資源,全部都是命令行走起!要少用儘量不用菜單按鈕操作,使用命令行工作,一旦你熟練使用將以更高效的方式工作,甩圖形化界面菜單操作幾條大街,哈哈。比較重要的、使用頻率較多的命令,按在系統在的作用給大家簡單做個介紹,以為我們更進一步學習理解Linux系統。
  • 新手如何快速入門數據分析?
    CDA數據分析研究院原創作品, 轉載需授權隨著網際網路迅猛發展,各大公司沉澱了很多的數據,如何找出藏在這些數據背後的規律,利用這些數據來給公司創造價值,作為一個新手面對這些問題的時候,你是不是考慮怎麼快速學習數據分析呢?
  • 蛋白組學/代謝組學如何快速從主流資料庫中獲取人/小鼠數據?
    隨著生物科技的迅速發展,每天都會有海量的生物學數據產生,如何有效的分析這些「生物學大數據」?生物信息學的應用變得尤為重要,在生物領域從基因測序,到基因編輯,再到基因療法的精準醫療,由生物科技引發的又一場變革正悄然而至。試問大家做好準備迎接它到來了嗎? 本次分享的主題為:如何快速獲取海量數據?
  • 蛋白組學/代謝組學如何快速從主流資料庫中獲取人/小鼠數據?
    隨著生物科技的迅速發展,每天都會有海量的生物學數據產生,如何有效的分析這些「生物學大數據」?生物信息學的應用變得尤為重要,在生物領域從基因測序,到基因編輯,再到基因療法的精準醫療,由生物科技引發的又一場變革正悄然而至。試問大家做好準備迎接它到來了嗎?本次分享的主題為:如何快速獲取海量數據?
  • 數據分析,用對圖表很重要
    在這種行業背景下,數據分析成為了一手利器,可以推動產品設計與運營環節,列舉幾個典型的場景:產品經理在規劃新版本時,如何制定相關的數據指標來驗證? 功能上線後,如何就採集到的數據,進行數據復盤,判斷新功能是否達到團隊預期? 如何通過數據了解產品目前的問題以及分析背後的原因? 運營人員在完成一個活動後,如何通過數據來評估本次活動的效果?
  • 思維篇|如何成為一個運營大牛(二):運營立方體
    或者是不知道自己應該繼續學什麼?再或者是接到了一個任務,卻不知道背後的運營策略動機是什麼?本篇的運營立方體思維,將慢慢為您解開這些疑惑:大家都知道,作為一家以盈利為基礎目標的商業型公司,構成其發展方向的三個最基本的重要條件: 產品、 客戶、 客單利潤 。
  • 技術大牛如何找到靠譜的創業想法?
    對於不少有志創業的技術大牛,技術能力並非瓶頸,怎麼找到靠譜的創業想法卻讓他們踩坑: 第一個坑:拿著錘子找釘子 在最能發揮自己技術優勢的領域創業是一個正常的邏輯,但這裡隱藏的坑是,一些技術大牛太過於重視技術,以技術而非用戶(客戶)為中心去開發產品,最後滿足的是一個沒有人買單的偽需求。
  • 深入淺出:如何從0開始學習大數據挖掘分析?
    如果鑽入複雜算法和技術開發,只能讓你走火入魔,越走越費勁,並且效果不大。在公司實際工作中,最好的大數據挖掘工程師一定是最熟悉和理解業務的人。對於大數據挖掘的學習心得,作者認為學習數據挖掘一定要結合實際業務背景、案例背景來學習,這樣才是以解決問題為導向的學習方法。
  • 最全從Python小白到大牛,要走的路這裡都有(一)
    從Python小白到大牛,要走的路這裡都有面向項目的學習是學習編碼的最佳方法。Python是當今最需求的語言,為了幫助您學習它,以下是一些您可以探索的最重要的Python項目:Python遊戲Python圖像編程CIFAR10在Python中使用TensorFlow開始看吧,和從開始到放棄說再見俗話說的好,沒吃過豬肉還沒見過豬跑?
  • 數據分析師如何晉升詳細資料分析
    有同學問:陳老師,滿網際網路都是「如何從0到1學數據分析」,可我想知道,如果再晉升的話,比如去到月薪3w,5w,需要什麼樣的知識與能力儲備? 這個話題,很容易變成高薪的數據分析師們的曬命貼。問題是,如果一個同學真的科班出身,985碩士、畢業進大公司、領導賞識、同事配合、每次跳槽都踩中風口,他也不需要問這種問題了。
  • 用數據說話:如何藉助影視節目來學習外語?
    這篇文章,原標題是A Data-Driven Approach to Learning Any Language by Watching TV and Movies,作者Frank Andrade結合編程和自然語言知識,從影視作品詞彙角度入手,結合數據分析出了最適合不同水平學習者語言學習的電影和電視作品,希望對你有用。
  • 【經驗分享】CAE工程師侃侃如何成為一個合格的有限元分析工程師
    擇日不如撞日,小編今天就為大家帶來有限元分析的學習經驗,其中有限元分析將特指結構分析。 練習題與工程分析的差別在於,在做練習題的時候,拿到手邊的已經是簡化好的模型了,結構已經簡化好了,分析類型已經設定,邊界條件和載荷條件已經確定,計算完成後,能夠看到和教材上一致的結果就算是完成了。在這個過程中,學習者只學到了軟體如何使用,這個過程,不用說大學生,高中生都可以完成。
  • 刺激戰場如何區分菜鳥和大神!
    但是不得不說,在刺激戰場這個遊戲中,段位在磚石以下是看不出來什麼的。其實,在四排的時候,我們會習慣性的查看隊友的段位,如果在磚石以上的話,就會信心大增,如果只是黃金鉑金的話,那麼這場8層是涼涼了。其實,段位只是個假象罷了,其實我們該如何區分隊友時菜鳥還是高手很簡單,只要看這些細節就知道了。
  • 大牛工程師教你如何玩轉示波器!
    大牛工程師教你如何玩轉示波器! 佚名 發表於 2014-12-25 09:36:38   本文作者是一位長期在一線使用示波器的有經驗的電源工程師。