數據本身是冰冷沒有溫度的,但是如果我們利用好它,通可視化圖表將數據直觀的表現出來,然後對其進行分析,就可以發現背後蘊藏的規律,並將付諸於後續的事情中去,從而對我們的行為有一定的指導意義。
但對於平常人來說,對於數據分析的概念似乎不太明晰,首先我們來看一下數據鏈圖,他用比較接地氣的語言來給我們解釋了數據分析是怎麼做的:
這裡我們選取其中的選菜、做菜、擺盤來詳細展開。
一、如何讓選菜更加高效?(數據源獲取)
關於數據源的獲取,是一個互相促進的過程,有時候可以是人們主觀的想要去搜集一些數據通過分析進而得出結論,另外一種方式可能是去瀏覽一些數據源的網站,這樣反向給自己一些靈感,這個方法在自己「想法枯竭」時還是很好用的。
推薦題主可以去一下這個問題裡去找找數據源,也許會給你一些啟發和選題方向:
1、常用數據公開網站
UCI:該網站目前維護了436個經典的機器學習、數據挖掘數據集,包含分類、聚類、回歸等問題下的多個數據集。
國家數據:數據來源中華人民共和國國家統計局,包含了我國經濟民生等多個方面的數據,並且在月度、季度、年度都有覆蓋,較為全面。
CEIC:涵蓋超過195個國家400多萬個時間序列的數據源,最完整的一套超過128個國家的經濟數據,能夠精確查找GDP、CPI、進口、出口、外資直接投資、零售、銷售以及國際利率等深度數據。
萬得:被譽為中國的Bloomberg,在金融業有著全面的數據覆蓋,金融數據的類目更新非常快,據說很受國內的商業分析者和投資人的親睞。
搜數網:已加載到搜數網站的統計資料達到7,874本,涵蓋1,761,009張統計表格和364,580,479個統計數據,匯集了中國資訊行自92年以來收集的44個行業所有統計和調查數據。
中國統計信息網:國家統計局的官方網站,匯集了全國各級政府各年度的國民經濟和社會發展統計信息,建立了以統計公報為主,統計年鑑、階段發展數據、統計分析、經濟新聞、主要統計指標排行等。
亞馬遜:來自亞馬遜的跨科學雲數據平臺,擁有免費且開源的資料庫,包含化學、生物、經濟等多個領域的數據集。
figshare:研究成果共享平臺,這裡向全世界開放免費的研究成果及科學數據。
github:一個非常全面的數據獲取渠道,包含各個細分領域的資料庫資源,自然科學和社會科學的覆蓋都很全面,適合做研究和數據分析的人員。
這樣一來,我們沒有用到什麼編程和複雜的操作也能高效的得到數據源。
二、研究菜譜讓做菜更加輕鬆(研究模型為自己所用)
分析模型類似於菜譜的功能,初學者可以跟進菜譜的指引也能做出一道大菜來。這裡介紹10個大數據分析模型,供大家思考和使用。
1、戰略分析模型:ROS\RMS矩陣
ROS/RMS(Return Of Sales/Relative MarketShare)矩陣也稱做銷售回報和相對市場份額矩陣,主要是用來分析企業的不同業務單元或產品的發展戰略。該分析模型定義,企業某個業務單元或產品在市場上的銷售額應該與其在市場中的相對份額成正比,並且該業務單元或產品的銷售額越高,該業務單元或產品為企業所提供的銷售回報就應該越高。
數據分析人員根據上圖,可了解企業的某種業務單元或產品的銷售額在由低向高不斷增加,其相對市場份額和銷售回報也在一個「通道」內由低向高不斷增加。如果該業務單元或產品的銷售額增加,而其對企業的銷售回報或相對市場份額降低,那麼企業就不應該在這個時候進入其他領域,應該著重改善這個業務單元或產品的經營狀況。
2、戰略價值分析模型:價值鏈模型
為了提升企業戰略,美國戰略管理學家Porter第一次提出價值鏈分析的方法。企業的競爭優勢來源於企業在設計、生產、營銷、交貨等過程及輔助過程中所進行的許多相互分離的活動,這些活動中的每一種都對企業的相對成本地位有所貢獻,並奠定了企業競爭優勢的基礎。價值鏈模型將一個企業的行為分解為戰略性相關的許多活動,企業正是通過比其競爭對手更廉價或更出色地開展這些重要的戰略活動來贏得競爭優勢的。
在數據分析中,價值鏈模型目的在於幫助企業分析公司運行的哪個環節可以提高客戶價值或降低生產成本。
3、地位分析:三四矩陣
三四矩陣是由波士頓諮詢集團提出的。這個模型用於分析一個成熟市場中企業的競爭地位。在一個穩定的競爭市場中,參與市場競爭的參與者一般分為三類,領先者、參與者、生存者。
領先者一般是指市場佔有率在15%以上,可以對市場變化產生重大影響的企業,如在價格、產量等方面;參與者一般是指市場佔有率介於5%~15%之間的企業,這些企業雖然不能對市場產生重大的影響,但是它們是市場競爭的有效參與者;生存者一般是局部細分市場填補者,這些企業的市場份額都非常低,通常小於5%。
這個模型印證了中國彩電業幾次降價後,各個企業的競爭態勢的變化。在長虹第一次降價後,企業的成本和產量都得到收益,使它迅速成為市場佔有率最大的企業,康佳和TCL則緊隨其後。經過幾次的降價後,企業已經不能再靠價格因素來擴大市場份額了,企業必須創造新的競爭優勢。
4、戰略規劃模型:GE矩陣
GE矩陣法又稱通用電器公司法、麥肯錫矩陣、九盒矩陣法、行業吸引力矩陣是美國通用電氣公司(GE)於70年代開發了新的投資組合分析方法。對企業進行業務選擇和定位具有重要的價值和意義。
數據分析師可通過該分析模型保證企業資源的合理配置,企業也可以嘗試按照發展中業務和已發展業務的混合,與現金產生和現金使用的內在一致性來平衡業務。
5、業務或投資組合:波士頓分析矩陣
波士頓矩陣又稱市場增長率-相對市場份額矩陣、波士頓諮詢集團法、四象限分析法、產品系列結構管理法等。在矩陣中,坐標軸的兩個變量分別是業務單元所在市場的增長程度和所佔據的市場份額。每個象限中的企業處於根本不同的現金流位置,並且應用不同的方式加以管理,這樣就引申出公司如何尋求其總體業務組合。
通過波士頓矩陣進行數據分析,有助於對各公司的業務組合投資組合提供一些解釋並能查企業各個業務單元的經營情況,如果同其他分析方法一起使用會產生非常有益的效果。
6、競爭戰略選擇:戰略鍾
「戰略鍾」是分析企業競爭戰略選擇的一種工具,這種模型為企業的管理人員和諮詢顧問提供了思考競爭戰略和取得競爭優勢的方法。
7、受衝擊戰略調整:SCP分析模型
SCP(structure、conduct、performance)模型,分析在行業或者企業受到表面衝擊時,可能的戰略調整及行為變化。
SCP模型從對特定行業結構、企業行為和經營結果三個角度來分析外部衝擊的影響。
外部衝擊:主要指企業外部經濟環境、政治、技術、文化變遷、消費習慣等因素的變化。行業結構:主要是指外部各種環境的變化對企業所在行業可能的影響,包括行業競爭的變化、產品需求的變化、細分市場的的變化、營銷模型的變化企業行為:主要是指企業針對外部衝擊和行業結構的變化所採取的措施,包括企業方面對相關業務單元的整合、業務的擴張與收縮、運營方式的轉變、管理的變革等以一系列行動。經營結果:主要是指在外部環境方面發生變化的情況下企業在經營利潤、產品成本、市場份額等方面的變化趨勢。
8、解析基本維度:ECIRM戰略模型
ECIRM模型的構成包括了五個核心要素:一是E,代表企業家要素;二是C,代表資本要素;三是I,代表產業要素;四是R,代表資源要素;五是M,代表管理要素。五項要素共同耦合成為一個以企業家精神和企業家能力為核心的公司戰略模型,構成從戰略上系統解析一家企業的五個基本維度。
產業型公司和資本型公司呈現「順時針」方向的成長路徑,而資源型公司和管理型公司則呈現「逆時針」方向的成長路徑。
9、外部環境採用戰略:SPACE矩陣
SPACE矩陣有四個象限分別表示企業採取的進取、保守、防禦和競爭四種戰略模式。這個矩陣的兩個數軸分別代表了企業的兩個內部因素——財務優勢(FS)和競爭優勢(CA);兩個外部因素——環境穩定性(ES)和產業優勢(IS)。這四個因素對於企業的總體戰略地位是最為重要的。
10、機會、優劣、挑戰:SWOT模型
「SWOT」是Strength、Weakness、Opportunity、Threat四個英文單詞的縮寫,這個模型主要是通過分析企業內部和外部存在的優勢和劣勢、機會和挑戰來概括企業內外部研究結果的一種方法。
S-優勢:比較分析企業在外部市場環境、內部經營方面相對於其他競爭對手的優勢;W-劣勢:比較分析企業在外部市場環境、內部經營方面相對於其他競爭對手的劣勢;O-機會:分析在目前的市場競爭態勢下企業存在的發展機會;T-挑戰:分析在目前的市場競爭態勢下企業存在的威脅和挑戰。
優劣勢分析主要是著眼於企業自身的實力及其與競爭對手的比較,而機會和威脅分析將注意力放在外部環境的變化及對企業的可能影響上。在分析時,應把所有的優勢集中在一起,然後用外部的力量來對這些因素進行評估。
三、如何讓擺盤更加高級?(可視化工具助力)
這一步是比較重要的一步,前面我說了對於題主而言前期不要太在意編程能力,因為市面上這種做數據可視化的工具有很多,只要可以利用好他們,同樣可以做出好看的可視化圖表,而且時間成本付出的相對較少。
1、億信華辰豌豆BI
個人版完全免費,可以終生使用,非常適合不懂技術的人員,但是別小瞧他是免費版,功能可是一定都沒有打折扣的。
支持基於列存儲的MPP架構的分布式資料庫進行敏捷分析,百億數據可達到秒級響應,可解決TB甚至PB級超大數據量敏捷分析的難題。
智能化建模,一鍵導入數據,自動識別維度和指標,構建數倉模型;根據拖拽的指標和維度,識別最優的展現形式,所有圖表無需任何設置即可聯動,也可自定義選擇部分圖表參與聯動和下鑽。
除了Excel、TXT之類的文件,還可接入各類資料庫,強大到跌破眼鏡
2、一站式數據分析平臺億信ABI
面向技術人員,有大數據量的處理分析,大屏需求等,產品融合了ETL數據處理、數據建模、數據可視化、數據分析、數據填報、移動應用,功能全面且實用,靈活組合滿足數據分析所有需求。
1、覆蓋基礎報表應用
複雜報表:支持各類報表應用,包含交叉報表、多級表頭的中國式複雜報表、簡歷表等,可滿足用戶各式各樣報表展現訴求。
圖表分析:系統內置數百種圖表組件,任意組合即可製作靈動直觀的數據看板,輔助領導決策。
數據鑽取:系統內置十餘種的鑽取方式,支持文本、報表、統計圖、地圖等各種數據元素上進行鑽取和切片,通過數據指標的層層下鑽,可幫助用戶快速定位問題。
2、多元的數據可視化
領導駕駛艙:系統內置數百種圖表組件,可直觀展示和監測企業運營情況,為企業高層提供一站式決策支持。
大屏可視化:ABI提供多個大屏模板,內置300+酷炫可視化組件,拖拽即可應用,同時具備較高的開放性,允許用戶自定義個性化業務大屏,創建你專屬的大屏可視化效果。
3D可視化:結合全景3D建模和數據分析引擎,可建設智慧城市,3D設備管理等,實現端到端的數據可視化。
GIS地圖應用:無縫對接多個GIS地圖平臺,可實現地理相關信息的綜合數據分析和展現。
說了這麼多還是需要勇敢的邁開第一步,數據分析沒有你想像的那麼高不可攀,千萬不要被自己臆想出來的東西嚇著了,多多看書,多多藉助工具去動手實踐才是最重要的,