我認為首先要明確的是學統計幹什麼,如果有明確的作用,比如時間序列,市場調研這些,那麼推薦書籍各不一樣,統計終究只是一個工具,在實際運用中的偏重和變化還是蠻大的,如果不是有特別的目的,只是想要了解統計的話建議從理論基礎看起,再看一些實際操作的書會比較好。
基礎書籍,我看前面各位大師都推薦的差不多了,就不詳細寫了,就簡單寫一下我理解的基礎書籍涉及的方面:
第一個是《統計學基礎》,建議這個先看,至少能大致了解統計是什麼東西。只看過人大版的,私底下覺得邏輯還是有點問題,大神勿噴,也許是我腦子笨。不過作為入門還是不錯的。
接下來就是《概率論與數理統計》,這是所有數學學科中最霸氣的一門,沒有之一。
然後是《多元統計》《時間序列》,基本上到這裡統計大致的框架已經有了。
其他的《非參數統計》、《貝葉斯統計》等等看自己需要。
另外這裡推薦一本非主流的書,高級調查分析師考試中的《預測與決策》教材,這是我最喜歡的一本統計相關的教材,沒有之一。但是貌似現在要買到比較難,如果有哪位知友知道哪裡有買,那麼求共享,我也只有一個列印的版
操作書籍,好吧,我知道這4個字比較糙,大家將就看。
如果要涉及開源軟體,建議R,知乎上面關於學習R的數據推薦太多,不重複了,自己搜一下就行了。
就說一下SPSS,這裡推薦第一個是中文版的SPSS操作手冊,這個絕對是寶典,另外可以參考一本實際案例的書,哪本都行,關鍵是要跟著案例自己去操作分析。
通俗書籍,最後推薦一點統計的通俗書籍,理論畢竟看起來太煩,通俗的讀物可以幫助更多的理解,像《統計陷阱》,《深入淺出XXX》,這些都適合入門的看一下。另外如果有明確的目的,最好看一下統計學之前分析的方法,比如如果你做市場分析方面的話,可以去了解下消費者行為學,市場營銷理論,這樣才能了解統計在學科上的意義。
還是強烈推薦先把理論搞清楚,見過直接上軟體搞統計的,解釋數據一塌糊塗,連回歸做的是因變量的期望都不知道。
前期需要:微積分
統計學知識較深,用的地方非常廣,還是希望說一下您想做什麼用。
是在工程上用?還是在臨床試驗上用?還是基因組排序上用?處理金融資產實現無風險套利時用?亦或是在法律統計上用?
無論怎樣,數理方面一定要過關,不論是t統計量、卡方統計量、F統計量,一定要知道它的式子是個什麼形式,這樣才好說明意義,也才好進行篩選與對比,可以找《概率論與數理統計》這本書看一看
能做統計的軟體太多了,SAS、R、S-PLUS、SPSS、Eviews、Matlab,都可以以後學的統計知識得看你想拿它做什麼用,軟體也要根據你不同的用處來選擇,等你修改好問題後,我會再來具體說明的。
忽視對象和目標而談方法,的確是耍流氓。統計學太寬、太雜,而且正處在蓬勃發展之中,任何一個細小的領域都能耗盡人的一生。況且統計學這東西,用的很廣,越來越多的文科生都想用用統計來支持自己的結論。文科生、工科生、經管類學生、數學系學生有不同的目標,自然方法不一樣。
不過,如果只是想要粗略地了解統計學的大概的話,還是有一些很好讀的書的。比如《女士品茶》、Rao的《統計與真理》,這些可以了解(只是了解)統計的思想、哲學和歷史。國內吳喜之《從數據到結論》、Freedman的《統計學》都寫的很不錯,有一些很好的案例,對統計的一些概念也會有一些理解。
感覺統計就跟醫學差不多,對付小感冒這種病,只要自己買藥,按照說明書服用,就ok了;如果只是像做個回歸,看看相關係數這種,現在已經有很成熟的方法和軟體,像exel和spss。遇到複雜一點的問題還是請教專業人士吧,即使你能夠用一些方法得出結果,對結果的解釋也是很大的一個問題,大病還是得到醫院治。當然我並不是說統計很難,無法自學成功。統計並不難,只是無法速成,只是統計自身的特殊情況(對於特定情況下的模型選擇、結果解釋,即使在專業人士之間也會有爭議)使得統計有很大的靈活性,只有對統計了解地夠多,才能夠應付多變的情況,得到最符合預期且合理的結果。
一句話,想得多,讀得少。想了解直接就去看,缺啥補啥唄。
給你推薦幾本統計學的經典圖書,《深入淺出統計學》、《漫畫統計學》、《女士品茶》、《愛上統計學》、《統計陷阱》,都很不錯的。
專注潛水二十年,頭一次被邀請,照這趨勢看,不用多久,我就會升職加薪,當上總經理,出任CEO,迎娶白富美,走上人生巔峰。想想還有點小激動呢~
.
呃,萬萬沒想到,醒來後還是那個王大錘。
OK,回到正題,題主的這個問題啊,就像是在一個項目中一樣,真正的用戶(通常情況下我們可以稱為「優秀」的用戶,原因在下面解釋)對自身的需求從來是不明確的,而優秀的產品經理呢,就是儘可能地明確用戶的需要,然後與項目經理溝通,再交給項目成員(幹活的苦力)實施完成。
說到這兒,有過喜當爹或者喜當媽經驗的同學們就會有經驗了。沒錯,想想吧,突然你家小寶貝兒哭了,哭得聲嘶力竭,驚天動地。。。
怎麼了?
不舒服了?餓了?渴了?痛了?冷了?熱了?害怕了?
對了,這裡我們要補充一個背景設定,小寶貝兒不到1歲,還不能通過語言溝通。
這個時候怎麼辦呢?
年輕的爸爸媽媽們開始討論了,這是怎麼回事兒,怎麼突然哭了呢?
爸爸:是不是不舒服?(提出原假設H0)
媽媽:廢話!你要是舒服了會哭嗎?(根據長期的觀測值與經驗判斷,舒服並哭的出現概率極低,近似為0,接受原假設,==>孩子不舒服)
爸爸:那怎麼就哭了呢?上午剛哭了一次,好不容易才哄好。(判斷事件發生頻率是否符合常態,判斷是否是異常值,檢查基礎數據的準確性,是否存在觀察誤差)
媽媽:你不耐煩了是不是?天天給你做飯,昨天吃了今天就別吃!(在絕對值上下波動,符合正態分布,基礎數據的準確性沒有問題)
爸爸:說到吃飯,寶寶是不是餓了啊?(由經驗判別,寶寶餓了==>哭泣,提出假設:寶寶餓了)
媽媽:不可能,才餵了奶不到半個小時
(在這裡我們假設正常情況下寶寶每3個小時喝一次奶,左右波動0.5小時,那麼可以知道:
設X為寶寶喝奶的時間,假設服從正態分布,有X~N(μ,0.5^2),樣本容量n=1,樣本均值X1=0.5,提出的假設為:HO:μ=3;H1:μ≠3
設顯著性水平α為0.05,所以臨界值 1.96,原假設H0的否定域為V1={|Z|≥1.96}
檢驗統計量Z=(0.5-3)/(0.5/根號下1)=-5
因為|-5|=5》1.96,落在否定域內,所以要否定原假設,表明寶寶這次的表現不符合標準的3個小時會餓的情況,所以寶寶不是因為餓了才哭的……)
爸爸:那,是被蚊子咬了嗎?
媽媽:大冬天的,哪來的蚊子?(p(冬天|蚊子)=0,不可能事件)
…………………………………………
經過無數輪討論,呃~這時我們的寶寶聲音已經哭啞了……
媽媽得到了最終結論:寶寶尿床了!
於是爸爸吩咐保姆,快給孩子換尿布,洗床單
保姆:順利完成任務
爸爸檢查保姆的任務完成情況,並製作工作周報上交給媽媽
媽媽觀察寶寶的狀態,覺得還可以,給了爸爸一筆錢
爸爸給保姆發工資
——整個事件得到了完美的解決——
幸好跑題還不是太遠,還是可以扯回來的
其實在以上事件中,套用了一個比較簡單的項目流程模型:寶寶扮演了用戶的角色,提出了需求;媽媽則是產品經理,把控了整個項目的方面,並負責了用戶與項目經理及項目成員的溝通協調;爸爸是項目經理,提出解決方案,交由組員實施;保姆就是實施的組員。
所以為什麼說不明確自身需求的用戶是「優秀」的用戶呢?通常意義下,更有利於產品經理的發揮,也就是方便忽悠錢。。。去年在電力集團做SAP實施,最直觀的感覺就是,只要能忽悠住了用戶,實施顧問們肆無忌憚圈錢的感覺真棒!
那麼在整個項目的決策與實施中,我們套用了一些統計學上的概念來解釋日常的概念,是因為統計學最初是基於生活中的基本現象而產生的,比如山頂洞人一天可以採集多少漿果?賭場裡連續出老千不被打斷兩條腿可能嗎?晴川打敗所有競爭者晉升為老佛爺而不被幹掉的概率是多少?……
所以平常在和別人交流時,偶爾會有這種的感覺,就是通過有過系統學習統計學的背景的人,他們的思維方式會與其他背景的人存在差異,通常前者會試圖通過邏輯性與概率來證明觀點或思考。
也就是說,其實統計學的思維,在自覺不自覺之間就融入到了個人的生活中,剛畢業後去找工作,面試官一聽說是統計學畢業,總會問一句你的專業對這份職業的優勢是什麼?曾經統計過我們這一級同學對這類問題的回答,大多數都回答「統計是工具,是一種思維方式,需要和其他的知識或領域結合……巴啦巴啦」(當然這也是由於我們這一級的傢伙,80多個人,有50多人選修了第二專業,為了側面烘託自己的優勢也會這麼去說).
所以扯了這些,其實只是想告訴題主,統計學的學習,需要先把這門知識,化為日常生活中的一點一滴,不要把統計學只落在紙面或試卷上的冰冷文字,它是有命的,在生活中習以為常的事情,背後都有各種有趣的統計知識。
雖然不清楚題主希望從事的方向(應用統計/理論統計……)
不過對於入門來講,需要事前掌握的知識不需要多麼的特殊,有一定的數理知識基礎,學習了高等數學,就基本上相當於解決了前置技能,所需要的不過是找到合適的教材與合適的老師,加上認真學習,並嘗試在生活中應用就可以。
推薦閱讀的幾本書:和樓上的幾位會有重合的部分。(存在重合、圖片就不一一展現了)
《女士品茶——20世紀統計學怎樣變革了科學》,很有趣的統計學發展史;
《統計陷阱》數字是怎樣欺騙了你
《深入淺出統計學》《深入淺出數據分析》深入淺出系列出品,必屬精品
《統計與真理----怎樣運用偶然性》
《統計學的世界》《愛上統計學》有些概念性的知識,可以強化掌握
《漫畫統計學》系列
《社會心理學》戴維·邁爾斯 第8版--這本書作為心理學的教材,超經典。畢業前曾認真讀了一遍,可以看到心理學與統計學的結合
以上書籍為課外閱讀,至於正式學習的教材麼~本科時基本上全使用的是人大版的教材,黃皮封面的那些,說實話,即枯燥又無味,印象最深的是人大版的《抽樣技術》,有很多印刷錯誤,以致上課時親愛的teacher會先花十分鐘,在黑板中把本章節中錯漏的地方通知大家修改過來~(PS:teacher是本校數理統計方向數一數二的大牛)後來偶然間接觸了一些國外的教材,驚為天人。學習教材參見肖玄與李少洋,尚可的推薦即可
以上,為熬夜敲出,純屬個人畢業後混跡軟體實施行業與電商數據分析行業的小小感悟,看看就好,不必太當真。