「大學四年就這麼結束了,要步入社會了才開始有危機感,想想競爭對手要不是各種名校畢業,要不就是各種獎項加身,在網上海投簡歷都石沉大海,完全不知道自己能做啥」
如果你依然迷茫,依然不知道自己喜歡什麼工作的情況下,有沒有什麼技能是所有崗位通用,能夠幫你在求職中先人一步的呢?
那麼這個技能就是:數據分析
如果你還在校園,提前掌握數據分析能力,能讓你在今後的求職中更有底氣;
如果你正在求職,學習數據分析,能大大提高自己的求職競爭力;
如果你已經工作,數據分析更是你急需學習的技能,提高效率、升職加薪就靠它啦。
隨著未來每個人與數據打交道的機會跟頻率越來越多,數據分析能力成為工作中的核心競爭力之一!
掌握基本的數據分析能力已經成為剛需!
提到數據分析,很多同學第一反應就是:數據分析要數學很好吧,學習數據分析要掌握什麼數學基礎才可以呢?
如果說數據分析需要什麼數學基礎,那統計學應該是涉及最多的了,但不需要非常深入,因為大多數數據分析用到的無非是統計量、數據分布等基礎知識。
知識點匯總
集中趨勢
集中趨勢分析主要靠平均數、中數、眾數等統計指標來表示數據的集中趨勢。例如被試的平均成績多少?是正偏分布還是負偏分布?
分散性與變異性的度量
離中趨勢分析主要靠全距、四分差、平均差、方差(協方差:用來度量兩個隨機變量關係的統計量)、標準差等統計指標來研究數據的離中趨勢。例如,我們想知道兩個教學班的語文成績中,哪個班級內的成績分布更分散,就可以用兩個班級的四分差或百分點來比較。
概率論基礎、獨立事件、條件概率、全概率公式以及貝葉斯定律
數據分布
數據分布主要靠幾何分布、泊松分布、二項分布來研究數據的分布趨勢。例如,目標數據段整體分布是發散的還是集中的?集中在哪個頻率段?中位數集中在哪個區間段?佔80%的數據集中在什麼數據區間段?看分布的目的就是了解業務數據是否穩定,以及數據的集中度。
正態分布
正態數據類型按照屬性可以分為連續型數據和離散型數據。
連續型數據屬於可以不斷細分的數據,如:長度,寬度,高度,密度,溫度等。
離散型數據不可被細分,主要來表達客觀事物的屬性,如:個數,屬性,比率等。
不論是連續型數據還是離散型數據,都能使用數據的分布來表達。數據分布屬於概率統計範疇,也是數據相關知識的基礎。只有對各種數據分布有一定理解,才能選取合適的分析方法和工具,對數據做出合理的分析。分布主要是離散數據與連續數據
統計抽樣
統計抽樣涉及到如何設計樣本、點量估計、比例抽樣分析。當對海量數據進行數據分析,查看數據分布情況的時候比較困難。就需要對樣本進行抽樣,通過抽樣樣本分布情況來反映總體樣本的分布情況。
置信區間
主要是置信區間計算與誤差範圍計算,以前上學的時候經常會考試,考完試以後老愛去估分,一般人估分不太可能直接估一個具體的數,肯定都是估一個大概的數,啥叫大概的數呢?就是比如高考分數預計 600 左右,這個左右其實就是一個區間,還有平常很多食品包裝袋上會寫 ±0.5 KG,表示啥意思呢?就是要麼多給了你 0.5 KG,要麼少給了你 0.5 KG。我們把這種用一個範圍來對一個事情進行估計的方式稱為區間估計,得出來的區間就是置信區間。
假設檢驗
假設檢驗的基本思想,可以理解為帶有概率性質的反證法。在總體分布未知或已知分布但有部分參數未知時,為了推斷總體的某些未知特性,提出關於總體的假設。我們根據樣本提供的信息,計算適當的統計量,對所提的假設做出接受或拒絕的決策。假設檢驗就是做決策的過程。
唯心鴨z_zhizuobiao
需要注意的是,數據就是數據,問題還是要通過具體的業務措施去解決,數據分析只是告訴你,出問題的地方在哪裡,要從哪些方面去改善,你需要由此方向去得出問題解決方案。
都說統計學是數據分析的基石,描述統計學就是用幾個關鍵的數據來描述數據集的整體情況。從而通過數字深層次的了解的一個行業的真實狀況,做到心中有數,及時調整,分析預判。以上為學習數據分析需要具備的統計學基礎,如有補充歡迎留言。
各平臺同名「職坐標在線」