數據科學家:21世紀「最性感的職業」! 大數據時代的來臨,統計學變得越來越火,不管是機器學習, 人工智慧,還是大數據分析,基本功都是統計學。Google, Facebook,Amazon等國際巨頭,國內蓬勃發展的網際網路企業,對於數據分析師(Data Scientist)的需求都十分火熱。15萬美元左右的年薪,可以說是妥妥的年薪百萬了,出國讀個統計學的學位,需要知道一些什麼信息呢,本文將為你一一揭曉。
什麼是統計學?
按照維基百科的定義:統計學是應用數學的一個分支,主要通過利用概率論建立數學模型,收集所觀察系統的數據,進行量化的分析、總結,並進而進行推斷和預測,為相關決策提供依據。可以說,統計學的核心技能在於對數據信息的應用,因此跟其他學科都有不同程度的交叉。
按國內的專業劃分來說,統計學包括:應用統計學、經濟統 計學、生物統計、生物信息、醫學統計(衛生統計)、金融統計、數理統計等方向。因此統計學專業的畢業生,現在已經遍布各行各業:電子商務,移動網際網路,信息服務,共享經濟,金融,醫療保健......
留學海外的統計學畢業生,有的在網際網路公司做 Data Scientist,有的在對衝基金做 Quantitative Trader,年薪都在15萬美元左右。可以說出國讀一個統計學的學位,是實實在在的鍍金了。這篇統計學 (Statistics) 申請全攻略,由博世留學為你獨家呈現。名校 PhD大牛,業界海龜大神,為你權威解讀統計學申請的方方面面。統計學的黃金時代已經來臨,國際化人才的需求越來越旺盛,你準備好了嗎。
統計學/數據科學
傳統的統計學主要在於信息的搜集和數據分析的應用。 商業調查公司就需要專業的統計人員來設計問卷,收集數據,分析數據,作出研究報告。 隨著大數據時代的到來,每天產生的數據都是成千上萬TB,數據結構也更加複雜化。如何從繁雜的數據中獲得有用的信息,從而產生價值,是現代統計學所關注的問題,這一領域也被稱為數據科學(Data Science)。
很多大學紛紛把統計系更名為數據科學系,比如南開大學就在2018年6月成立了統計與數據科學學院,耶魯大學也在2017年把 Department of Statistics 更名為 Department of Statistics and Data Science。 數據科學可以說是:統計學+計算機科學+應用領域專業知識 (Domain Knowledge)。
因此現代統計學的培養計劃除了學習基本的統計和數學知識,還會要求對資料庫,數據結構,計算方法,甚至並行計算系統 (MapReduce,Hadoop) 等有深入的理解。 數據科學家的工作可以概括為:為商業問題提供分析和研究的框架;應用統計模型(比如數據挖掘,機器學習,數據挖掘)對數據進行分析;結合數據分析結果,對具體的商業問題給出建議;開發和維護數據分析系統。比如常見的電商平臺都會有「猜你喜歡」的推薦機制,這就是數據科學的分支——推薦系統 (Recommendation System) 的具體應用。
統計學專業方向:本科/碩士
數理統計,或者說理論統計 (Mathematical Statistics),主要學習和研究統計學和概率論的理論知識。側重的是統計理論知識的培養,一般讀這種理論學位的會繼續修讀碩士,或者PhD。對口就業方向包括高校和研究機構等。
生物統計 (Biostatistics),一般隸屬於公共衛生學院 (School of Public Health),也有的隸屬於藥學院(School of Medicine)。 主要學習的是統計在生物醫藥和公共衛生領域的應用,包括生物信息學,流行病學,遺傳統計學等領域。 對口的就業方向是藥企和醫院。
工業統計 (Industrial Statistics或者 Industrial Engineering),側重於工業領域的可靠性理論,過程控制與質量控制,最優化,實驗設計等等。著名的6-sigma理論就其中之一,就業範圍一般是製造業研發崗位,比如汽車製造廠商。
金融統計 (Financial Statistics), 主要學習資產定價,風險管理,保險精算,量化交易等。 隨著自動化交易和高頻交易的逐漸發展,統計在金融領域的應用越來越多。就業主要集中於證券和對衝基金,負責交易策略的研究與風險管理。
除此之外還有大數據統計,Big Data Statistics。 即統計在各個領域的應用,比如電子商務,供應鏈,體育,甚至博彩,就業前景也十分不錯。
統計學專業方向:PhD
Theory方向既有經典的統計問題,也有為大數據時代打基礎的理論研究。 傳統的領域包括 Probability Inequality, Asymptotics, Density Estimation, Nonparametrics 等。比較新的領域有 High Dimensional Statistics, Network and Graph Models, Functional Estimation等等。比如High Dimensional Statistics,中文叫高維統計,主要研究大維數據的模型選擇,高維方差矩陣估計等,是很多機器學習算法的理論基礎。Network and Graph Models 是很多人工智慧算法的基礎,現已廣泛應用於計算機視覺,社交網絡分析,知識圖譜等領域。
Applied方向包括統計模型和計算方法的改進,以及在具體領域的應用。主 要側重於解決實際中的問題的方法,比如 Nonparametric Bayes, Statistical Learning, Data Mining等。 統計學對於每一個數據類型,都會有一種對應的解決方法,比如生物醫學數 據就有 Longitudinal Data Analysis和Survival Analysis, 地理數據就有 Spatial Analysis, 金融數據就有 Time Series Analysis......
Springer Series in Statistics 這個系列的書,目前已經有差不多200本,每一本都可以說是一個統計的領域。
冷知識:2009年,法航447航班失事,搜尋兩年無果之後,法航調查組找了統計學家求助,最終通過Bayes理論的數據 分析,縮小了搜救範圍,最終找到飛機殘骸。其中的統計方法發表在2014年的Statistical Science期刊上,題為 《Search for the Wreckage of Air France Flight AF 447》。
院校速覽:美國
就統計學科而言,美國處於絕對的世界領先地位。學界公認的世界第一是史丹福大學(Stanford),系裡大牛雲集。統計學領域最高榮譽:COPSS總統獎,有5位得主在Stanford,包括華人統計學家王永雄、黎子良,小波分析領域的大牛人Johnstone、Donoho,以及 LASSO 的發明者 Tibshirani。除此之外還有 Tibshirani 的老師 Efron 坐鎮,Empirical Likelihood領域的大神 Art Owen,等等。Stanford位於加州,跟業界的聯繫也很緊密,可以說從 Stanford 統計系出來,不管是去業界還是學術圈,都是光環加身般的存在。其他的傳統強校都有很牛的統計系,比如UC Berkley,Harvard,Chicago等,而且這些學校也有獨立的生物統計系,實力都很強。除此之外,還有很多很有特色的統計系。
比如傳統的計算機牛校: 卡耐基梅隆大學 (CMU),不但與機器學習和人工智慧聯繫緊密,把統計的應用更是延伸到了宇宙學、法醫鑑定、網絡安全、體育等看似很不相干的領域。 當然,排名不高的學校也不代表實力不佳,只可能是系比較小。比如普林斯頓大學 (Princeton) 就沒有統計系,只有運籌與金融工程系,但是僅憑華人統計學家範劍青一個人,就抵得上其他學校半個統計系了。賓夕法尼亞大學的統計系設在大名鼎鼎的沃頓商學院,研究實力超群,更有COPSS獎得主蔡天文 (Tony Cai) 坐鎮,排名12位實屬委屈。
類似的排名還有很多,但實際上,對申請者而言沒有很大的參考價值。 比如US News的專業排名,是依據業內人士打分出來的,其排名依據對學術因素依賴比較大,其他主觀性的感受考慮比較少:如地理位置、師生比等。 學術水平不是一個學校的全部,學習也不是生活的全部。除了學術水平,地理位置、學校聲譽、師生比、畢業生就業、等等,每一個都很重要。
院校速覽:英國
英國是現代統計學的發源地,1834年就成立了皇家統計學會,數理統計學的奠基人R. A. Fisher (1890-1962)就是英國人。
從學科實力上來說,2014年的 Research Excellence Framework 的結果是英國統計學專業最權威的排名。劍橋大學雖然沒有獨立的統計系,但是有數學系的強大陣容加持,以及2018年 COPSS 獎得主 Richard Samworth,實力超群。英國的倫敦 大學學院 (UCL) 統計系也是獨具一格,在統計與人工智慧結合方面非常強,谷歌的 DeepMind 創始人就畢業於 UCL。除此之外,英國老牌名校 Oxford,以及Warwick、Bristol 都有比較大的統計系。
比如牛津大學除了有紮實的理論研究團隊,還有 Computational Statistics & Machine Learning (OxCSML) 和 Oxford Protein Informatics Group (OPIG) 兩個交叉學科研究組。華威大學的統計系研究方向十分完備,除了傳統的統計與概率理論,還有包括數據科學、 金融工程、精算、科學計算、決策科學、行為科學等交叉學科的研究。 雖然現代統計學的發展中心在美國,英國的統計學科在大數據、非參數貝葉斯統計、生態環境統計等領域獨領風騷。比如2015 年由劍橋大學、愛丁堡大學、牛津大學、UCL以及華威大學成立的 Alan Turning Institute,是世界上人工智慧研究領域的頂尖機構。牛津大學的 Mathematical Ecology Research Group,以及聖安德魯斯大學的 Centre for Research into Ecological and Environmental Modelling 也都是生態統計領域的領軍者。
院校速覽:其他
除了英國美國等主流留學國家以外,歐洲以及亞太地區也有很多不錯的選擇。
香港地區:香港中文大學和香港大學有獨立的統計系,開設統計學的本科、碩士和博士課程。而香港科技大學、香港城市大學以及香港浸會大學都沒有統計學的本科項目,碩士以上的項目只能選擇數學系、商學院、或者系統工程與工程管理系的相關課程。
新加坡:新加坡國立大學和新加坡管理大學都有獨立的統計學系,涵蓋本碩博所有層次的課程。
歐洲其他國家:瑞士的蘇黎世理工大學、洛桑理工大學、伯爾尼大學,德國的慕尼黑大學、格廷根大學、圖賓根大學,比利時的天主教魯汶大學等歐洲學校,都是不錯的選擇,而且學費非常便宜(一年幾百歐元,甚至免費)。
加拿大:幾乎所有的綜合型大學都有獨立的統計系,比如英屬哥倫比亞大學、麥吉爾大學、多倫多大學等,而且加拿大的統計碩士項目只要錄取了就是全獎,也是很受歡迎的留學目的地。
但是申請者很難從排名上找到有價值的信息,即使是QS世界排名,也只提供「統計與運籌學」的專業排名,與真正的「統計學」排名相差甚大。如果非要對一個學校的統計學研究水平做出一個判斷, 可以從院系的專職教授規模,以及頂級學術期刊的發表來評價。比如四大統計學權威期刊:Annals of Statistics,Journal of American Statistical Association,Journal of Royal Statistical Society: Series B。
選校建議:不要依賴排名來選校
專業排名給你的只是一個列表,沒有專業人士為你指點迷津,很難看出個所以然。
比如約翰霍普金斯大學 (JHU) 的生物統計一直號稱全美第一,但是該校所在的巴爾的摩市,治安了解一下?(當然,我們並不是說JHU不值得去)
某留學平臺說: 「校園內基本隨處可見安全保障部的巡邏車,令人十分安心。走夜路的話經常可以碰到巡邏的保安。學校周圍的治安也很不錯。該校所在位置屬於大型城市,該區域的毒品/槍枝犯罪率(每千人)為0.59。」 細思極恐。為什麼走夜路就要巡邏車,為什麼只有學校周圍治安不錯? 每千人0.59的比例還不高?
地理位置,它很大程度上決定了留學生的生活質量,以及發展線路。每個月1000美元的生活費在德州或許生活奔小康,但是在紐約或者波士頓,可能房租都不夠付。德國等歐洲國家,雖然學費便宜,甚至免費,但是還要學習第二外語,能不能融入當地生活,考驗就更大了。在加州或者溫哥華這樣的城市,想吃中餐可以說走就走,但是如果困在美國中部的大農村,在華人寥寥無幾的北歐,那種異國他鄉的鄉愁就只能冷暖自知了。除此之外,地理位置跟畢業發展息息相關。在加州讀大學你能感受到矽谷的創業激情,在紐約讀大學你能感受到華爾街的金融氣息。當然在北美大農村讀書,也是一種沉下心學習的氛圍。但是,每一個選擇都決定了一種生活方式,一定要三思而後行。
所以選校沒有最好的,只有最適合自己未來發展的,讓自己覺得最舒服的。
課程設置:Master of Statistics
傳統的Master of Statistics是偏重於數理統計的項目,比如 Yale 和 Chicago,比較強調數學背景和統計理論,以及編程能力。當然課程也 比較難,比如Yale的課程基本上就是 faculty 們的研究興趣,包括數理統計理論,概率論,隨機過程,大樣本理論,信息理論,機器學習,數據分析,統計計算,圖模型等。走這種 track的一般繼續讀PhD的比例比較高,去financial service 和其他研究機構做analyst的也不少。
課程設置:Master of Applied Statistics
偏professional的統計學 master 一般時間比較短,比如卡耐基梅隆大學(CMU)的 Master's of Statistical Practice,Cornell 的 Master of Professional Studies 等。課程上來說側重於 applied data analysis 和比較實用的 modeling,以及一些 consulting project。一般這些名校出來的 master 就業都還不錯,有 Data Analyst,Data Scientist, Financial Analyst等頭銜,而且薪水也都很高。 其他 Master of applied statistics的 track 就百花齊放了,比如Purdue 的computational finance track,Rutgers 的 Financial Statistics & Risk Management,Duke 統計系與經濟系合辦的 MS in Statistics & Economic Modeling , UIUC 的 MS in Statistics: Analytics Concentration,NYU Steinhart 商學院的 MS in Applied Statistics for Social Science Research,Stanford 新開的 MS in Statistics: Data Science 等。
數據科學碩士:課程設置
以 Stanford 大學的 Master of Data Science 為例。其課程設置涵蓋了數學、最優化、並行計算、統計模型、以及應用統計,是兩年制的項目。
Requirement 1裡的課程需要選4門課,主要涉及線性代數的數值方法、離散數學與算法、概率分析與隨機算法等,而 Requirement 2裡的課程也需要修讀4門,包括軟體開發、並行計算、分布式計算、多核計算系統等。Requirement 3主要是統計模型,需要選擇2門課程,例如統計推斷、回歸方法與方差分析、數據挖掘與統計建模等。Requirement 4主要是統計方法的應用,範圍非常廣泛,包括計算生物、統計藥學、機器學習、社交網絡分析、商業智能、計算圖論、海量數據挖掘、 地理統計、神經圖像處理等等,需要選讀3門課程。
傳統統計學碩士:課程設置
UIUC 統計碩士課程設置 UIUC 的 Master of Statistics是傳統的數理統計碩士,屬於比較簡單的項目,包含8-9門課,外加1門統計實踐的課程,一年半左右可以畢業,而應用統計只是必修和選修的劃分不同。
必修課要選4門:第一門是統計與 概率,如果以前學過的可以 waive, 但是難度比國內的「概率論與數理統計」要大。第二門是應用回歸分析與設計,不算太理論的課程。第三門是從五選一,包括方差分析、 抽樣與分類數據分析、時間序列分析、統計前沿話題、機器學習基礎。 第四門課是數理統計,對數學的要求比較高。 碩士項目要修讀5門選修課。
對於想進一步讀PhD的同學,可以多選 一些理論的課程,例如統計機器學習、大樣本理論、概率與測度、信息理論、隨機過程等等。
對於畢業之後想去業界的同學,或者對應用統計更感興趣的同學,可以選的範圍有:圖像分析,生物信息學、方差結構與因子模型、多層線性模型、高階數據分析、壽險精算模型等。 統計實踐課是要求修讀一門統計諮詢的課程,或者完成一段統計相關的實習,因此 UIUC 這個項目的就業也非常不錯。UIUC的統計碩士項目比較靈活,碩士生申請本校 PhD 不需要申請費,成功率也比較高。除了側重數理統計的 Master of Statistics 這種傳統項目,還有 Applied 和 Analytics 兩個 Track。區別在於沒有那麼多理論統計的必修課,對統計計算 (Computing) 和 Analytics 的要求更多。
生物統計碩士:課程設置
探索疾病的基因根源、如何降低健康保健成本和保障患者的生活質量、如何預測流行病的傳染路徑 和風險因素等等,都是生物統計領域所關心的問題,因此生物統計人才的需求也越來越旺盛。
以杜克大學的生物統計碩士為例,雖然Biostatistics的項目都隸屬於公共衛生學院或者藥學院,其 培養計劃和傳統的統計碩士項目區別並不大。其核心課程都是統計理論知識的培養,編程能力的訓 練,以及生物醫學領域數據分析的實踐。生物統計碩士側重培養的是運用統計知識和計算軟體分析 數據的能力,生物醫藥領域研究的背景知識,以及與臨床研究和業界學界溝通的能力。 從課程難度上來說,生物統計的理論要求不是很高,課程也偏向實踐應用。因此對申請者的數理背 景要求更低,不管是生物醫學、人文社科、工科或者理科背景的學生都可以申請。根據官方文件的介紹,這個項目理想化的學生人群是:
對生物、藥學以及相關利於感興趣
有一定程度的數學背景
有志於從事生物醫學相關方向的領域
願意挑戰自己,為公共衛生事業而奮鬥!
美國PhD:課程設置
美國的PhD體制,一般都是5年的項目。也就是說,前兩年需要上課, 相當於修讀一個 master 學位,培養 計劃與碩士項目大同小異。 香港、新加坡、加拿大等國也都是 美國式的PhD培養體系。在這種制度下,只要有本科學位就可以直接申請 PhD,而且即使你有碩士學位,也還是需要修兩年的課。 兩年的碩士課程讀完之後,一般會有一個考試 (Qualification Exam),通過了的話就不需要再上課了,開始進入研究階段,這時候身份也不是 PhD student了,而叫做 PhD Candidate。
英國/歐洲PhD:課程設置
英國和歐洲的PhD一般是3-4年的項目,上課的硬性規定不多,主要是做研究。比如英國的PhD,是否需要修課完全由導師決定,可以在自己學校選課,也可以去其他大學上課,比如全英的PhD一起上課的項目包括:Academy for PhD Training in Statistics (APTS),以及倫敦周邊大學的London Taught Course Centre (LTCC),可以說自由度很大了。特別是北歐國家的PhD項目,比如瑞士,讀博士就是籤了合同的工作,不存在沒有薪水(獎學金)的情況,一般是3年,做完規定的研究項目就畢業。
申請碩士之硬性要求:數學背景+編程能力
正處在風口上的統計學,留學申請的難度越來越大。不僅有數學物理的同學想轉行做統計學,就連傳統的社科類專業,比如經濟學、政治學、 新聞學、社會學的人都有申請統計項目的。 一般來說statistics的master比較強調申請者的數學背景,比如數學分析,線性代數,數理統計等課程的成績。同時,編程能力(R,MATLAB, C++,SAS,Python)等也是很看重的一方面,相比之下GPA比GRE託福等Standard Score重要得多。
再者,美國統計系華人faculty比例相當大,一般來說國內的老師也跟北美統計的學術圈有緊密的聯繫,能拿到靠譜的推薦信為申請結果提升不少。除了推薦信,項目經歷和研究經歷,如果能在文書材料中適當地展示出申請者的學術潛力,對數據分析的sense,對申請結果會有出其不意的效果。
申請碩士之軟實力:背景提升+套辭
美國統計學的申請中,套辭的作用不是十分顯著。 如果本科期間有去美國交流的機會,可以多修課彌補國內課程設置的短板,刷高GPA,還有機會拿到內推,對申請結果是很大的提升。但是如果申請歐洲國家,或者澳洲的學校,套磁作用就有決定性影響了。只要是研究型的項目(PhD/Mphil),導師都有決定要不要你的權利,甚至說你的獎學金很可能就是從導師自己的科研經費裡來的。總的來說,不管是申請碩士還是PhD,有合適的海外交流機會的話更是不要錯過。 如果有參加美國數學建模比賽、Kaggle平臺上的比賽、以及商業公司舉辦的大數據分析比賽的經歷,也會讓申請者增色不少。
申請PhD:學校背景很重要
北美統計學PhD裡中國學生的比例也相當高,而且負責招生的教授很多也是華人,他們對中國學校的情況非常了解,對名校背景非常看重。
每個學期的Summer都是教授們回國內開會,講課,拿funding的季節,同時也會直接去清北復交科大等學校去找系主任要人。因此非名校背景的申請者非常吃虧。因為統計學理論性比較強,名校背景往往意味著更紮實的基礎知識。如果不是名校背景的同學,GPA保持在3.5以上,也可以取得不錯的申請結果。一般來說,申請碩士的GPA不能低於3.2, 申請PhD不能低於3.5,再低就很難彌補了。
相對來說GRE的成績差不多就行,比如Verbal 150+,Quantitative 170,aw 3.5,但是託福成績的好壞就往往會影響到拿Teaching Assistant(獎學金)的機會。一般來說託福要考到100+,口語22+,才不會成為你的短板。先申請一個碩士作為後續申請PhD的跳板,是非名校背景的申請者常用的策略。一般選擇偏數理統計的Master of Statistics,當然如果數學背景不夠的話,就只能考慮偏Applied的項目或者交叉學科的項目了。
申請PhD:提前規劃比什麼都重要
學校背景+推薦信+數學背景+編程能力+科研活動經歷+GPA+託福/雅思/GRE……
每一項都是壓在申請者頭上的大山,沒有合理的規劃,很可能最後手忙腳亂,申請結果也不理想。除了每一項都沒有短板的的人,否則一定要提前規劃。 當然,每個人的背景都不同:有的現在還在大二大三,有的已經在開始準備申請了,有的是跨專業申請,要如何規劃才能最大程度地利用好自己的時間,出奇制勝?我們相信博世留學的留學諮詢服務會助你一臂之力,為你挖掘閃光點,規劃好寶貴的大學時光,儘可能地不走彎路,提升申請結果。
申請碩士/PhD:時間規劃
大一大二是最寶貴的大學時光,很大程度上決定了你留學申請的硬體:GPA。對於統計學申請者來說,最好的規劃是儘量在大一大二保持均分85左右,特別是統計學的專業課,有精力和機會的話,還應當多修讀一些數學課和計算機課程。
如果是要去美國留學,大三就要開始準備託福和GRE了。特別是GRE考試要求的詞彙量非常大,需要一個比較長的準備周期。 如果是去美國之外的國家留學,也要準備託福或者雅思的考試了。同時大三又是專業課最多的時候,時間規劃非常重要。
大三暑假也是很重要的時間點,這是準備留學申請的衝刺階段了。 如果語言成績考試分數不夠,要抓緊時間刷分。同時根據自我發展的規劃,定好自己的意向學校,對照各項留學申請的要求,查漏補缺。 比如科研經歷缺乏,比賽經歷空白,或者還沒有跟系裡的老師深 接觸過,推薦人還沒確定......
大四一開始,申請季就來了,有的學校12月中旬就截止了。聯繫推薦人,準備文書材料(PS+CV),填寫網申,英語成績送分,準備套磁,郵寄書面材料,準備面試,辦理籤證,行前準備......如果沒有充分的準備,你將手忙腳亂。
就業前景
統計學屬於一個STEM (Science, Technology, Engineering and Mathematics) 專業,在美國找工作有籤證和政策上的福利。以卡耐基梅隆大學(CMU) 的統計實踐碩士 (Master of Statistical Practice) 為例,我們可以了解一下應用統計的碩士的就業形勢。該項目屬於偏職業化的碩士項目,課程難度不大,申請成功率也比較高,中國學生大概10人左右。從就業結果來看,33個畢業生有就 業記錄的有31個,平均起薪8萬美元,工作頭銜包括數據科學家、應用統計學家、研究助理、技術分析師、推薦系統工程師等。就業的公司包括亞馬遜和Facebook等網際網路巨頭,大數據產業相關的初創公司,JP Morgan等國際投行,今日頭條的母公司字節跳動,以及一些管理諮詢類的公司。
留學諮詢並不僅僅是幫你選學校+做文書+填網申+等申請結果。每個人的大學都是四年, 如何合理的規劃才是最終的贏家。 聯繫博世留學,統計大神為你定製申請規劃方案,走好留學申請的第一步。在有限的準備時間裡,最大程度地提升你的申請結果,讓你不走彎路。