一、前言
AI以及機器學習入門,初學者遇到的問題非常多,但最大的問題就是:
資料太多!!!看不完!!!不知道如何取捨!!!人的精力有限!!!
我曾經寫了一篇初學者入門的文章:《機器學習簡易入門-附推薦學習資料》,這篇文章給初學者指明了學習的方向,受到廣大初學者好評。
在此基礎上,結合本站已經發過的文章,以及自己的學習過程,整理出一個AI的入門路線,並整合到一個github倉庫,所有代碼和數據集都提供了下載方式。
本路線適合本科、碩士以及剛接觸機器學習的博士。
根據這個github倉庫學完以後,就基本入門了。
入門以後,遇到問題能上網搜索解決了,也知道接下來應該學什麼。
二、學習路線的github
該倉庫擁有者黃海廣,致力於幫助機器學習初學者入門,幫助學習者更好地成長。倉庫主要內容由黃海廣原創,另一部分由其他公益組織創作。
倉庫連結:
https://github.com/fengdu78/Data-Science-Notes
你不是一個人在戰鬥!
三、倉庫目錄及概述
0.math
數學基礎
1.python-basic
python基礎
2.numpy
numpy基礎
3.pandas
pandas基礎
4.scipy
scipy基礎
5.data-visualization
數據可視化基礎
6.scikit-learn
scikit-learn基礎
7.machine-learning
機器學習入門
8.deep-learning
深度學習入門
9.feature-engineering
特徵工程入門
四、學習路線說明
這個目錄其實是一個學習路線:
0——>1——>2——>3——>4——>5——>6——>7——>8——>9
1-5是個整體,6和7的順序可以交換也可以同時學習,8屬於選學部分(深度學習),9放在最後學習。
五、學習路線和內容
第一部分,數學基礎學習:
目錄名稱:0.math
數學基礎:數學基礎內容太多,很容易把人勸退,其實先把高等數學、概率論與數理統計和線性代數這三門課學熟了,大部分機器學習問題是能解決的。數學基礎部分我放了三個資料。
第一個是當時考研和考博士複習的。數學基礎,我把機器學習的部分,提煉出來。
第二、三個是今年剛翻譯的CS229的線性代數和概率論,這部分是斯坦福所有人工智慧有關的課程的數學基礎複習材料,非常實用。
這部分內容曾經有文章介紹(查看文章)
第二部分,python學習
目錄名稱:1.python-basic
python基礎:這裡有個代碼練習:兩天入門python
目錄名稱: 2.numpy
numpy基礎:這裡有2個代碼練習
一、適合初學者快速入門的Numpy實戰全集二、Numpy練習題100題-提高你的數據分析技能目錄名稱: 3.pandas
pandas基礎:這裡有3個代碼練習
目錄名稱: 4.scipy
目錄名稱: 5.data-visualization
數據可視化基礎:這裡有2個代碼練習
一、matplotlib學習之基本使用二、數據可視化的利器-Seaborn簡易入門第三部分,機器學習基礎
目錄名稱:6.scikit-learn
scikit-learn基礎:PyParis 2018: Machine learning using scikit-learn的代碼翻譯(截圖如下:)
圖:代碼截圖
目錄名稱:7.machine-learning
機器學習入門,推薦4份教程,著重推薦1、2部分。
一、史丹福大學2014(吳恩達)機器學習教程中文筆記及資源
內容介紹(點擊查看文章)
二、李航《統計學習方法》的代碼實現
內容介紹(點擊查看文章)
三、周志華老師的《機器學習》的解答--南瓜書PumpkinBook
內容介紹(點擊查看文章)
四、臺大林軒田《機器學習基石》系列課程教材的習題解答
內容介紹(點擊查看文章)
目錄名稱:8.deep-learning
深度學習入門,推薦3份教程
目錄名稱:9.feature-engineering
特徵工程入門,這個是項目實戰部分。
總結
本文提供了適合初學者入門AI的路線及資料下載,以上內容都整合到一個倉庫:
倉庫連結:
https://github.com/fengdu78/Data-Science-Notes
備註:github下載太慢的話,關注我的公眾號:「機器學習初學者」,回復「學習路線」即可下載本倉庫的鏡像文件,整個倉庫壓縮成一個iso。