想學統計學需要掌握哪些知識?

2021-03-02 大數據科學

我認為首先要明確的是學統計幹什麼,如果有明確的作用,比如時間序列,市場調研這些,那麼推薦書籍各不一樣,統計終究只是一個工具,在實際運用中的偏重和變化還是蠻大的,如果不是有特別的目的,只是想要了解統計的話建議從理論基礎看起,再看一些實際操作的書會比較好。

基礎書籍,我看前面各位大師都推薦的差不多了,就不詳細寫了,就簡單寫一下我理解的基礎書籍涉及的方面:

第一個是《統計學基礎》,建議這個先看,至少能大致了解統計是什麼東西。只看過人大版的,私底下覺得邏輯還是有點問題,大神勿噴,也許是我腦子笨。不過作為入門還是不錯的。

接下來就是《概率論與數理統計》,這是所有數學學科中最霸氣的一門,沒有之一。

然後是《多元統計》《時間序列》,基本上到這裡統計大致的框架已經有了。
其他的《非參數統計》、《貝葉斯統計》等等看自己需要。

另外這裡推薦一本非主流的書,高級調查分析師考試中的《預測與決策》教材,這是我最喜歡的一本統計相關的教材,沒有之一。但是貌似現在要買到比較難,如果有哪位知友知道哪裡有買,那麼求共享,我也只有一個列印的版

操作書籍,好吧,我知道這4個字比較糙,大家將就看。

如果要涉及開源軟體,建議R,知乎上面關於學習R的數據推薦太多,不重複了,自己搜一下就行了。

就說一下SPSS,這裡推薦第一個是中文版的SPSS操作手冊,這個絕對是寶典,另外可以參考一本實際案例的書,哪本都行,關鍵是要跟著案例自己去操作分析。

通俗書籍,最後推薦一點統計的通俗書籍,理論畢竟看起來太煩,通俗的讀物可以幫助更多的理解,像《統計陷阱》,《深入淺出XXX》,這些都適合入門的看一下。另外如果有明確的目的,最好看一下統計學之前分析的方法,比如如果你做市場分析方面的話,可以去了解下消費者行為學,市場營銷理論,這樣才能了解統計在學科上的意義。

還是強烈推薦先把理論搞清楚,見過直接上軟體搞統計的,解釋數據一塌糊塗,連回歸做的是因變量的期望都不知道。
前期需要:微積分
統計學知識較深,用的地方非常廣,還是希望說一下您想做什麼用。
是在工程上用?還是在臨床試驗上用?還是基因組排序上用?處理金融資產實現無風險套利時用?亦或是在法律統計上用?
無論怎樣,數理方面一定要過關,不論是t統計量、卡方統計量、F統計量,一定要知道它的式子是個什麼形式,這樣才好說明意義,也才好進行篩選與對比,可以找《概率論與數理統計》這本書看一看
能做統計的軟體太多了,SAS、R、S-PLUS、SPSS、Eviews、Matlab,都可以以後學的統計知識得看你想拿它做什麼用,軟體也要根據你不同的用處來選擇,等你修改好問題後,我會再來具體說明的。

忽視對象和目標而談方法,的確是耍流氓。統計學太寬、太雜,而且正處在蓬勃發展之中,任何一個細小的領域都能耗盡人的一生。況且統計學這東西,用的很廣,越來越多的文科生都想用用統計來支持自己的結論。文科生、工科生、經管類學生、數學系學生有不同的目標,自然方法不一樣。

不過,如果只是想要粗略地了解統計學的大概的話,還是有一些很好讀的書的。比如《女士品茶》、Rao的《統計與真理》,這些可以了解(只是了解)統計的思想、哲學和歷史。國內吳喜之《從數據到結論》、Freedman的《統計學》都寫的很不錯,有一些很好的案例,對統計的一些概念也會有一些理解。

感覺統計就跟醫學差不多,對付小感冒這種病,只要自己買藥,按照說明書服用,就ok了;如果只是像做個回歸,看看相關係數這種,現在已經有很成熟的方法和軟體,像exel和spss。遇到複雜一點的問題還是請教專業人士吧,即使你能夠用一些方法得出結果,對結果的解釋也是很大的一個問題,大病還是得到醫院治。當然我並不是說統計很難,無法自學成功。統計並不難,只是無法速成,只是統計自身的特殊情況(對於特定情況下的模型選擇、結果解釋,即使在專業人士之間也會有爭議)使得統計有很大的靈活性,只有對統計了解地夠多,才能夠應付多變的情況,得到最符合預期且合理的結果。

一句話,想得多,讀得少。想了解直接就去看,缺啥補啥唄。

給你推薦幾本統計學的經典圖書,《深入淺出統計學》、《漫畫統計學》、《女士品茶》、《愛上統計學》、《統計陷阱》,都很不錯的。

專注潛水二十年,頭一次被邀請,照這趨勢看,不用多久,我就會升職加薪,當上總經理,出任CEO,迎娶白富美,走上人生巔峰。想想還有點小激動呢~

.

呃,萬萬沒想到,醒來後還是那個王大錘。

OK,回到正題,題主的這個問題啊,就像是在一個項目中一樣,真正的用戶(通常情況下我們可以稱為「優秀」的用戶,原因在下面解釋)對自身的需求從來是不明確的,而優秀的產品經理呢,就是儘可能地明確用戶的需要,然後與項目經理溝通,再交給項目成員(幹活的苦力)實施完成。

說到這兒,有過喜當爹或者喜當媽經驗的同學們就會有經驗了。沒錯,想想吧,突然你家小寶貝兒哭了,哭得聲嘶力竭,驚天動地。。。

怎麼了?

不舒服了?餓了?渴了?痛了?冷了?熱了?害怕了?

對了,這裡我們要補充一個背景設定,小寶貝兒不到1歲,還不能通過語言溝通。

這個時候怎麼辦呢?

年輕的爸爸媽媽們開始討論了,這是怎麼回事兒,怎麼突然哭了呢?

爸爸:是不是不舒服?(提出原假設H0)

媽媽:廢話!你要是舒服了會哭嗎?(根據長期的觀測值與經驗判斷,舒服並哭的出現概率極低,近似為0,接受原假設,==>孩子不舒服)

爸爸:那怎麼就哭了呢?上午剛哭了一次,好不容易才哄好。(判斷事件發生頻率是否符合常態,判斷是否是異常值,檢查基礎數據的準確性,是否存在觀察誤差)

媽媽:你不耐煩了是不是?天天給你做飯,昨天吃了今天就別吃!(在絕對值上下波動,符合正態分布,基礎數據的準確性沒有問題)

爸爸:說到吃飯,寶寶是不是餓了啊?(由經驗判別,寶寶餓了==>哭泣,提出假設:寶寶餓了)

媽媽:不可能,才餵了奶不到半個小時

(在這裡我們假設正常情況下寶寶每3個小時喝一次奶,左右波動0.5小時,那麼可以知道:

設X為寶寶喝奶的時間,假設服從正態分布,有X~N(μ,0.5^2),樣本容量n=1,樣本均值X1=0.5,提出的假設為:HO:μ=3;H1:μ≠3

設顯著性水平α為0.05,所以臨界值 1.96,原假設H0的否定域為V1={|Z|≥1.96}

檢驗統計量Z=(0.5-3)/(0.5/根號下1)=-5

因為|-5|=5》1.96,落在否定域內,所以要否定原假設,表明寶寶這次的表現不符合標準的3個小時會餓的情況,所以寶寶不是因為餓了才哭的……)

爸爸:那,是被蚊子咬了嗎?

媽媽:大冬天的,哪來的蚊子?(p(冬天|蚊子)=0,不可能事件)

…………………………………………

經過無數輪討論,呃~這時我們的寶寶聲音已經哭啞了……

媽媽得到了最終結論:寶寶尿床了!

於是爸爸吩咐保姆,快給孩子換尿布,洗床單

保姆:順利完成任務

爸爸檢查保姆的任務完成情況,並製作工作周報上交給媽媽

媽媽觀察寶寶的狀態,覺得還可以,給了爸爸一筆錢

爸爸給保姆發工資

——整個事件得到了完美的解決——

幸好跑題還不是太遠,還是可以扯回來的

其實在以上事件中,套用了一個比較簡單的項目流程模型:寶寶扮演了用戶的角色,提出了需求;媽媽則是產品經理,把控了整個項目的方面,並負責了用戶與項目經理及項目成員的溝通協調;爸爸是項目經理,提出解決方案,交由組員實施;保姆就是實施的組員。

所以為什麼說不明確自身需求的用戶是「優秀」的用戶呢?通常意義下,更有利於產品經理的發揮,也就是方便忽悠錢。。。去年在電力集團做SAP實施,最直觀的感覺就是,只要能忽悠住了用戶,實施顧問們肆無忌憚圈錢的感覺真棒!

那麼在整個項目的決策與實施中,我們套用了一些統計學上的概念來解釋日常的概念,是因為統計學最初是基於生活中的基本現象而產生的,比如山頂洞人一天可以採集多少漿果?賭場裡連續出老千不被打斷兩條腿可能嗎?晴川打敗所有競爭者晉升為老佛爺而不被幹掉的概率是多少?……

所以平常在和別人交流時,偶爾會有這種的感覺,就是通過有過系統學習統計學的背景的人,他們的思維方式會與其他背景的人存在差異,通常前者會試圖通過邏輯性與概率來證明觀點或思考。

也就是說,其實統計學的思維,在自覺不自覺之間就融入到了個人的生活中,剛畢業後去找工作,面試官一聽說是統計學畢業,總會問一句你的專業對這份職業的優勢是什麼?曾經統計過我們這一級同學對這類問題的回答,大多數都回答「統計是工具,是一種思維方式,需要和其他的知識或領域結合……巴啦巴啦」(當然這也是由於我們這一級的傢伙,80多個人,有50多人選修了第二專業,為了側面烘託自己的優勢也會這麼去說).

所以扯了這些,其實只是想告訴題主,統計學的學習,需要先把這門知識,化為日常生活中的一點一滴,不要把統計學只落在紙面或試卷上的冰冷文字,它是有命的,在生活中習以為常的事情,背後都有各種有趣的統計知識。

雖然不清楚題主希望從事的方向(應用統計/理論統計……)

不過對於入門來講,需要事前掌握的知識不需要多麼的特殊,有一定的數理知識基礎,學習了高等數學,就基本上相當於解決了前置技能,所需要的不過是找到合適的教材與合適的老師,加上認真學習,並嘗試在生活中應用就可以。

推薦閱讀的幾本書:和樓上的幾位會有重合的部分。(存在重合、圖片就不一一展現了)

《女士品茶——20世紀統計學怎樣變革了科學》,很有趣的統計學發展史;

《統計陷阱》數字是怎樣欺騙了你

《深入淺出統計學》《深入淺出數據分析》深入淺出系列出品,必屬精品

《統計與真理----怎樣運用偶然性》

《統計學的世界》《愛上統計學》有些概念性的知識,可以強化掌握

《漫畫統計學》系列

《社會心理學》戴維·邁爾斯 第8版--這本書作為心理學的教材,超經典。畢業前曾認真讀了一遍,可以看到心理學與統計學的結合

以上書籍為課外閱讀,至於正式學習的教材麼~本科時基本上全使用的是人大版的教材,黃皮封面的那些,說實話,即枯燥又無味,印象最深的是人大版的《抽樣技術》,有很多印刷錯誤,以致上課時親愛的teacher會先花十分鐘,在黑板中把本章節中錯漏的地方通知大家修改過來~(PS:teacher是本校數理統計方向數一數二的大牛)後來偶然間接觸了一些國外的教材,驚為天人。學習教材參見肖玄與李少洋,尚可的推薦即可

以上,為熬夜敲出,純屬個人畢業後混跡軟體實施行業與電商數據分析行業的小小感悟,看看就好,不必太當真。

相關焦點

  • 數據分析必掌握的統計學知識
    統計學是數據分析的基石。學了統計學,你會發現很多時候的分析並不靠譜。比如很多人都喜歡用平均數去分析一個事物的結果,但是這往往是粗糙的,不準確的。如果學了統計學,那麼我們就能以更多更科學的角度看待數據。
  • 統計學知識大梳理(終極篇)
    學好統計學,讓你成為高富帥,迎娶白富美,走上人生巔峰,不是不可能,但可能性只有0.00001%。從統計學的角度,這是小概率事件。但是學好統計學的現實好處多多,我就隨便舉幾個例子給大家聽聽。學會看問題,懂得數字的意義。新聞報導上,各種各樣的數字隨處可見,如果你不想被各種數字矇騙,最好學點統計學。
  • 搞大數據,Java 工程師需要掌握哪些知識?
    題目是一名叫「截然不同」的同學私信我的一個問題,原話是,「搞大數據,java 需要掌握哪些技術點?」,我稍微調整了一下。必須得承認一點,我本人沒有搞過大數據,所在這方面的經驗為零。但同學既然問了,咱就不能假裝不知道啊,雖然真的是不知道。但要變強,就必須無所畏懼,迎難而上,對吧?
  • 想自學一點統計學,看哪些入門書籍比較好?
    關於統計學方面,以下推薦適用於對統計學或數據科學感興趣的朋友們,無論基礎如何。如果是打算入門,格局要站的高一些,要從如何認識問題(現實問題轉化為統計模型)和解決問題(統計結論到解決方案)的角度去思考。吳喜之老師的書都很不錯,一定要先看這些書了解統計學的全貌: 《統計學:從數據到結論》,從這一本開始,書很好看,輕鬆有趣,必看。
  • 社會統計學,讓我想對2019說句MLGB!
    (希望純潔的你並沒有理解錯我的意思~)提及社會統計學,大家都不陌生,作為量化研究必不可少的一項技能之一,很多人可能都會有過這樣的體會:在學校上了無數次的統計課程,學了一大堆的理論知識,計算公式也背了一大堆,可一旦接觸實際數據,卻總是感覺無從下手~我們為什麼學不會統計學?
  • 做淘寶美工設計師需要掌握哪些專業的知識?零基礎怎麼學好?
    本文由:「學設計上兔課網」原創,圖片素材來自網絡,僅供學習分享 做淘寶美工設計師需要掌握哪些專業的知識?零基礎怎麼學好?很多學習淘寶美工設計的新人,往往學習了好一段時間,都不見什麼成效。
  • 統計學入門路線推薦
    確實,我們平時做生信分析,免不了要用到這個檢驗,那個降維的,這後面都是統計學的知識。今天正好是個周末,我就簡單談一下自己推薦的學習路徑。由於我也不是數學出身,因此我只能以我實際分析數據時遇到的問題以及自己的學習路徑為大家提供參考,如果有哪些地方不對,還請各位多多批評指正!
  • 零基礎學統計學,還能同時學Excel、SPSS和R
    A: 只會機械的軟體操作,不懂背後的統計學原理。B: 統計學理論和實踐脫節,除了應付考試,不懂實際應用。C: 沒有統計學基礎,卻正在(或需要)使用高級統計分析方法。D: 做數據分析工作的人,卻沒有系統的學習過統計學。如果你至少中了上述選項中的一條,那麼這篇文章推薦的課程就是為你量身定做!
  • 作為一個合格的外貿人需要掌握哪些知識和技能?
    但當我們真的進入這個行業的時候,才發現這個行業是要學會很多東西才能駕馭的,外貿人是一個全能型的人才行業,需要掌握各種各樣的技能和知識。 1.首先要掌握語言 作為外貿人,在漢語的基礎上,最需要掌握的外貿語言是英語,如果開始做外貿了,你還要自學英語,那你就在基礎上比別人慢了一步,當然,如果你在英語的基礎上還能掌握一些小語種語言,不需要多精通,能夠簡單的交流一下也是一個不錯的技能。 2.
  • 掌握這五大統計學知識,讓你笑傲數據科學界
    只有掌握了這些,你才有可能成為真正的王者!圖片來源:unsplash.com/@oliverschwendener從定義來看,數據科學實際上指的是從數據中獲取信息的過程。數據科學旨在解釋所有數據在現實世界中的意義,而不僅僅局限於數字層面。
  • 零基礎學平面設計需要學哪些知識?
    零基礎學平面設計需要學哪些知識?平面設計的職能範疇很廣,工作類型也很多。隨著設計行業的發展。當然不是,只要掌握了正確的方法,勤加複習也是很容易學會的。下面小編為大家簡單介紹下:零基礎學平面設計需要學哪些知識?
  • 要成為一個合格的外貿人需要掌握哪些知識和技能?
    但當我們真的進入這個行業的時候,才發現這個行業是要學會很多東西才能駕馭的,外貿人是一個全能型的人才行業,需要掌握各種各樣的技能和知識。1.掌握外貿的基本知識做外貿肯定是要把基本的外貿知識了解清楚的吧,報價的時候fob、cif總要知道什麼意思的吧?發貨方式什麼的是需要了解的吧?付款方式總是要了解的吧?這些外貿的基礎知識,國際貿易的流程和規定的知識必須要過硬,不然遇上不好的客戶容易吃虧,遇上好的客戶也容易鬧矛盾。4.
  • 現代生物學所需要的現代統計學
    annotationFile)pasillaSampleAnno然後根據分組,構建好比較信息,使用DESeq2包如下所示代碼即可差異分析 :library("dplyr")pasillaSampleAnno = mutate(pasillaSampleAnno,condition
  • 想從事數據分析師行業,應該學習哪些技能?
    從技術上講,數據分析需要具備數學、統計學、實體法和一點黑客知識。如果您想成為一名數據分析師,或者某個業務中的高級數據分析師,從技術上講,您需要了解成為數據分析師的路徑。有6個步驟:一、數據分析師的學習路徑有哪些——統計,數據,機器學習關於數學知識,大學課堂上會學到一部分,如果是數學科學類的專業會學到更深刻。如果你需要補習,可汗學院和麻省理工學院都有開放式課程。
  • 統計學與大數據具有哪些聯繫
    首先,統計學是大數據的三大基礎學科之一,所以統計學與大數據之間的關係還是非常密切的,但是這也導致一部分人產生了一定的誤解,認為大數據就是統計學,統計學就是大數據。實際上,雖然在大數據時代背景下,統計學的知識體系產生了一定程度的調整,但是統計學本身的理念與大數據還是具有一定區別的,統計學注重的是方式方法,而大數據則更關注於整個數據價值化的過程,大數據不僅需要統計學知識,還需要具備數學知識和計算機知識。從另一個角度來說,統計學為大數據進行數據價值化奠定了一定的基礎。
  • 想要學給電腦裝作業系統需要掌握哪些必備知識呢?基礎知識很重要!
    學習電腦裝系統到底需要掌握哪些必要的知識點呢?最重要的是到底從哪一步開始學習裝系統呢?給電腦裝系統需要尋找一個【活動分區盤符】,我們一般稱之為:系統盤,系統盤的引導格式一般為:MBR或GUID類型。 這個問題困惑了很多電腦小白,其實給電腦裝系統是需要一個【媒介】物,生活中我們一般拿U盤來作為裝系統的媒介,因為U盤價格低廉且穩定性不錯,U盤需要製作成U啟動,製作好U啟動後,U盤就具有PE功能了,那裝系統的一些列畫面也就有了。那U盤啟動工具是怎麼製作的呢?
  • 學長學姐有話說 | 在汕大統計學專業學習是一種什麼樣的體驗?
    @燁雄師兄我覺得統計學是一門很有發展前景的學科,因為現在的我們都活在一個數據時代,而如何有效合理地利用它們則是一門學問。統計學的理論在這方面就起到了很大的作用。而且在學習統計學相關知識之前我們必須掌握好基礎的數學理論,這也讓統計學的學生們具有更強的能力去學習不同領域的知識。
  • 統計學:大數據時代的新寵!
    相近專業介紹應用統計學本專業培養具有良好職業道德,具備系統的統計學知識、了解統計學理論、掌握統計學的基本思想和方法,具有利用計算機軟體分析數據的能力,能在經濟、管理、生物、醫藥、金融、保險、工業、農業、林業、商業、信息技術、教育、衛生、醫藥、氣象、水利、環境和減災等相關領域工作的高素質
  • 就業篇丨統計學類:開啟數字人生新篇章
    知識是數學與現實的融合,比如某一理想的統計情景下所得出的結論,如果應用於現實會得出怎樣的結論;實踐是軟體的靈活應用,在熟練掌握常見統計軟體之外,還需要有快速自學新軟體的能力,要能趕上軟體的更新迭代速度。在美國,統計學專業屬於熱門專業之一,尤其是統計學的碩士和博士。
  • 想學點現代統計學?這有兩本最好的書,而且是免費的
    編者按:隨著計算技術的發展,統計學也有了長足的進步。應用現代技術的統計學是什麼樣的呢?Quartz發表了一篇文章介紹了兩本絕佳的學習指南。文章中表示,如果你想要學習現代統計學,這兩本書是最好的教材。文章由36氪編譯。數據統計在計算機出現之前就已經存在了。但如果反過來的話,情況就大不一樣了。