隨著雲時代的來臨,大數據(Big data)也吸引了越來越多的關注。現如今人們使用手機的頻率越來越高,越來越多的設備接入了網際網路,它們大量收集客戶的使用模式和產品性能數據。不管是產品的開發和運營效率,還是智能分析和用戶體驗,大數據的使用無處不在,可以幫助公司輕鬆處理各種業務。簡而言之,在大多數情況下,大數據處理就是從收集原始數據開始,對數據集進行分析,以發掘有價值的信息,並且進行有效利用。
而統計學就是大數據分析的兩種主要方式之一,主要應用在分析領域。雖然統計學本身的理念與大數據還是具有一定區別的,但從另一個角度來說,統計學知識卻又是進行大數據分析的理論基礎。現在有越來越的學生對數據分析感興趣,市場的需求量也很大,因此我們今天就來聊一聊統計學專業主要的學習內容是什麼,與數學或精算專業又有什麼不同?
什麼是統計
統計學是應用數學的一個領域,它在很大程度上依賴於計算機。統計學專業主要學習如何收集、分析和解釋數據,培養學生使用數據來解決現實世界的問題。選擇這個專業的學生可能會對某些領域的職業發展感興趣,比如政府、銀行或金融。通過學習如何收集和分解複雜的信息,可以幫助統計專業的學生為公共政策、商業決策等做出貢獻。
比如說最近備受關注的美國總統選舉問題,在結果出來之前就有非常多人針對「誰將贏得下一屆總統選舉」作出預測。那麼為了找到答案,你可以問每一個註冊的選民他們打算給誰投票。但是全美國有那麼多的選民,是不可能對每一個人進行直接詢問的。
而這就是統計數據發揮作用的時候了。我們可以進行民意調查,通過選擇合理的樣本群裡(即只詢問一小部分註冊選民),利用統計學知識對結果做出預測。雖然利用一小群人的答案做出一個涉及全國數百萬人的預測結果一定會有偏差,然而只要選取樣本的過程合理,摒除大部分的幹擾因素,這個偏差可以降到最低。
除此之外,統計學的理論核心被廣泛應用於人類學、天文學、生物學、商學、化學、計算機科學、經濟學、教育、工程、環境科學、流行病學、金融、政府、歷史、法律、語言學、醫學、物理學、心理學、社會學等領域。《紐約時報》(New York Times)的一篇文章指出,對統計學家的需求正日益增長,文章的標題是:「對於今天的畢業生,就一個詞:統計學」。
統計專業需要學習哪些科目?
美國統計協會(American Statistical Association)表示,統計學的學生應該了解微積分、線性代數和概率,以及它們與統計學的聯繫和關聯。以加州大學伯克利分校的統計專業為例,要想進入統計專業學習,還需要先完成以下先修課程:
MATH 1A&1B CALCULUS 微積分1&2
該課程研究函數的微分(Differentiation)、積分(Integration)以及有關概念和應用的數學分支。它是數學的一個基礎學科,內容主要包括極限、微分學、積分學及其應用。微分學包括求導數的運算,是一套關於變化率的理論。它使得函數、速度、加速度和曲線的斜率等均可用一套通用的符號進行討論。積分學,包括求積分的運算,為定義和計算面積、體積等提供一套通用的方法。
MATH 53 Multivariable Calculus 多變量微積分
該課程主要講解參數方程和極坐標,二維歐幾裡得空間和三維歐幾裡得空間中的向量,偏導數,多重積分,向量微積分,格林、高斯和斯託克斯等數學定理。
MATH 54 Linear Algebra and Differential Equations 線性代數與微分方程
該課程講解了基本線性代數,矩陣運算,和行列式。同時介紹了向量空間,內積空間,特徵值和特徵向量,正交對稱矩陣;以及線性二階微分方程,常係數的一階方程組,傅立葉級數等內容。
在保證總GPA超過3.2,並且順利完成以上四門課程的情況下,學生才可以進入統計專業進行專業課程的學習。其中包括了3門必修課和三門選修課。其中3門必修課為:
STAT 133 Concepts in Computing with Data 數據計算的概念
本課程介紹了密集計算的應用統計學,主題包括:資料庫的組織和使用,可視化和圖形,統計學習和數據挖掘,模型驗證程序,以及結果的展示。
STAT 134 Concepts of Probability 概率的概念
該課程涉及概率論的介紹,強調了統計概念和應用。包含的內容有條件期望,獨立性,大數定律;離散隨機變量和連續隨機變量;中心極限定理。而備選的主題有泊松過程,馬爾可夫鏈,以及特徵函數。
STAT 135 Concepts of Statistics 統計的概念
這門課為統計理論與方法的綜合概論課程。主題包括描述統計、最大似然估計、非參數方法、最優性介紹、擬合優度檢驗、方差分析、bootstrap和計算機密集方法以及最小二乘估計。此外,實驗課涉及內容為計算機的數據分析在科學和工程方面的應用。
在必修課之外,統計專業的同年學們還需要在以下課程當中選擇3門作為選修課程,具體的選擇則可參照每位同學自己的興趣方向。
課程方向
通過伯克利大學統計專業的這些課程的介紹可以看出,學習統計確實需要比較牢固的數學基礎。伯克利大學的課程設置更貼近通識性統計學方向,比較適合還沒有明確方向並且未來有可能往不同領域發展的同學。除此之外,也有一些院校的統計專業設置有更加細緻的分類。以哈佛大學為例,他們的統計專業有四個學習方向:
1. General Track通識性方向
該方向是最靈活的,為統計理論、方法和應用提供了原理和技術的基礎。這個基礎可以應用到很多領域。
2. Data Science Track 數據科學方向
數據科學探索統計學與計算機科學的邊界。課程涉及這些領域的混合方向,應用領域包括預測、推薦系統和海量數據集分析等。
3. Bioinformatics and Computational Biology (BCB) Track 生物信息學與計算生物學方向
該方向融合了生物學、統計學和計算機,為研究基因和蛋白質序列等生物數據提供模型和工具。這在一定程度上是由於最近生物科學中數據的規模和複雜性的激增,這要求發展新的統計方法和模型,例如基因和蛋白質基序搜索模型、系統發育重建模型和基因表達分析模型。
4. Quantitative Finance Track 定量金融方向
定量金融方向為從事金融和精算工作的同學提供了堅實的基礎。具體的主題包括金融/保險建模中出現的隨機模型的統計推斷,以及在複雜金融/保險工具的定價、對衝和風險評估中成為標準的計算技術。
不論是選擇哪一個方向,統計專業的就業前景在目前來說都是非常不錯的。根據美國勞工局的預測,在2024年,熟練掌握統計數據方法的專業人士在職場上會變得更加有競爭力。無論是有關信息處理的商務決策,健康醫療,還是政治政策的決定,都離不開統計學,而例如社交媒體等的有關「大數據」的行業也需要統計專業人才。
如果是對統計理論知識感興趣並且計劃升學讀研究生的同學,曾老師建議可以選擇數學相關課程更多的理科學士項目( Bachelor of Science);而對統計學知識的實際應用更感興趣的學生,則可以考慮選擇文科學士項目(Bachelor of Arts)。
根據U.S. News最佳大學排名,目前有超過160所院校提供統計學本科學位課程,因此對該專業感興趣的同學們可以有很多的選擇。如果你是一個對數學很擅長的人,並且想將自己的技能應用到實際領域,那麼統計學可能是比較適合你的專業。如果你對統計學感興趣,但更願意關注在其他領域,那麼可以看看你的學校是否提供輔修課程來幫助你培養技能。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺「網易號」用戶上傳並發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.