我的深度學習入門路線

2021-03-01 AI有道

1. 前言

說實話,紅色石頭也是一個美劇迷,特別是一些燒腦的美劇,更是一追再追。前段時間,《西部世界》第二季也完結了。

紅色石頭一鼓作氣,看完之後,大呼過癮,深深地被其中栩栩如生的人工智慧機器人所吸引。不禁感嘆:現實世界真的會出現這樣厲害的人工智慧嗎?

這雖然是一個看似遙遠的事情,但也真的不好說沒有可能!縱觀這幾年,深度學習發展非常迅速,發展勢頭一直高歌猛進。

無論是 AlphaGo 最終以 4 :1 戰勝李世石,還是蘋果 Siri、谷歌翻譯、自動駕駛,等等。

深度學習無不在影響著我們的日常生活和行為方式。因此,可以毫不誇張地說,我們有理由相信《西部世界》中的人工智慧有望成為現實,說不定哪一天,你的同事就是一個超級人工智慧機器人!

深度學習,以深而複雜的神經網絡模型為基礎,更能挖掘海量數據深層蘊藏的數據規律,具備強大的學習能力。

可以毫不誇張地說,深度學習徹底改變了傳統機器學習算法的解決問題方式。下面,我用一張圖來做比較。

上圖中的 4 條曲線,從下往上分別為傳統機器學習算法、規模較小的神經網絡、規模中等的神經網絡、規模較大的神經網絡。

從每條曲線的趨勢可以看出,當數據量較少的時候,傳統機器學習模型的表現是不錯的,與神經網絡模型差別不大。

但隨著數據量越來越大,傳統機器學習模型的性能表現開始增長緩慢,似乎到達了瓶頸。

而神經網絡模型的性能仍然表現出較快的上升趨勢,且規模越大,性能提升越明顯。

這主要是因為深度學習模型網絡結構更加複雜,更能從大數據中提取有效的特徵,準確性較高。

所以,近些年來,深度學習在處理大數據和建立複雜準確的學習模型方面,有著非常不錯的表現。

在機器視覺、圖像處理方面,深度學習可以說是帶來了革命性的變化。例如,在全球知名的圖像識別競賽 ILSVRC 中,深度學習模型,尤其是各種 CNN 模型在錯誤率方面,不斷刷新紀錄,相比之前傳統機器學習算法,性能提升有質的飛躍。

從 2010 年開始,ILSVRC 有人開始使用 CNN 模型。轉折點是 2012 年, AlexNet 的出現,直接將錯誤率降低了近 10 個百分點。這是之前所有機器學習模型無法做到的。

2015 年,包含 152 層神經元的 ResNet 模型,竟然將錯誤率降低至 3.57%,這甚至比人類肉眼識別的準確率還高!

除了在圖像識別方面,深度學習在機器翻譯領域也取得了飛躍式的發展。基於 RNN 的機器翻譯最典型的代表就是谷歌翻譯,讓機器能夠在深度學習中不斷完善答案,給用戶最想要的信息。

說白了就是更智慧、更精準了。直接改善了之前逐詞直譯的效果,而是升級為以整個句子為單位進行翻譯。從性能上來說,谷歌翻譯整合神經網絡,翻譯質量已經接近人工筆譯。

不止這些,深度學習在諸如自動駕駛、推薦系統、人臉識別等領域都取得了重大進展。

近些年來,深度學習發展太快了,正在慢慢改變著我們的生活方式。深度學習技術日新月異,對相關人才的需求也越來越大。

所有的網際網路公司,例如 Google、 微軟、百度、騰訊等巨頭,無不在布局人工智慧技術和市場。各大公司也迅速開展了人工智慧人才爭奪戰。

百度、騰訊、阿里巴巴、京東等網際網路巨頭甚至都在美國矽谷不惜高薪挖掘人工智慧人才。現在北京、上海等地,深度學習算法崗位,年薪 3、40w 都十分正常!

不僅如次,人工智慧連續兩年都被寫入政府工作報告中,可見國家對人工智慧是相當重視的。

就在今年,我國第一本面向中學生的人工智慧教材——《人工智慧基礎(高中版)》正式發布,人工智慧相關課程已經進入高中課堂。

面對這樣的人工智慧趨勢和浪潮,為了不被新技術淘汰,為了獲得更好的工作機會和薪資收入,實現人生價值,我們更應該深入了解深度學習,利用深度學習解決實際問題,成為一名優秀的深度學習專家。

2. 如何進行深度學習?

深度學習,是機器學習的一個重要分支和延伸,是包含多隱層的神經網絡結構。

深度學習通過組合低層特徵形成更加抽象的高層表示屬性類別或特徵,從而學習到數據本身最關鍵的特徵。

簡單來說,深度學習的核心結構是神經網絡,深入了解神經網絡,是我們掌握深度學習本質的關鍵因素。

下面是紅色石頭總結的深度學習入門路線圖:

2.1 程式語言與開發工具

深度學習首選 Python,Python 已經成為深度學習主導性的程式語言。而且,現在許多主流的深度學習框架。

例如 PyTorch、TensorFlow 也都是基於 Python 的。Anaconda 作為 Python 的一個集成管理工具,它把 Python 相關數據計算與分析科學包都集成在了一起,省去了各個安裝的麻煩,非常方便。

而且,Anaconda 自帶了 Jupyter Notebook,Jupyter Notebook 是一個非常強大的工具,允許使用者為數據分析、教育、文件等任何你可以想到的內容創建漂亮的交互式文檔,已迅速成為數據分析、機器學習、深度學習的必備工具。

2.2 夯實深度學習理論基礎

有人說深度學習就像一個黑匣子,完全不知道內部發生了什麼。也有人說深度學習不需要數學理論,只要會調參數就行了。其實,這兩種說法都有失偏頗。掌握基本的深度學習理論非常重要。

例如神經網絡的正向傳播過程,激活函數的選擇與比較,反向傳播參數優化的過程,等等。

只有對神經網絡模型結構和推導過程有清晰的認識才能更好地建立模型優化直覺,構建性能良好的神經網絡模型。而不是做只會使用框架和庫,知其然不知其所以然的「調包俠」。

2.3 積累豐富的實戰

俗話說:紙上得來終覺淺,覺知此事要躬行!理論與模型的建立都是為了更好地實踐,為了解決實際問題。深度學習也是這樣,掌握每個理論知識後,更重要的是將理論用於實踐。

例如,使用深度學習模型解決圖像識別、語音識別等,或者參加 kaggle。通過實戰,更能加深自己的理解,幫助自己更加熟練地掌握深度學習應用技巧。

2.4 靈活使用深度學習框架

使用深度學習框架,俗話說靈活地使用「輪子」,方便我們構建更大、更複雜的深度學習模型,能幫助我們更快地構建模型來解決實際問題。

當然,這一步,個人覺得還是要建立在具備紮實的深度學習理論基礎上。常用的深度學習框架有 TensorFlow、PyTorch、Keras 等。

簡單來說, TensorFlow 適合工業應用構建大型項目,PyTorch 適合學術研究構建小型項目。

個人推薦使用 PyTorch,原因很簡單,因為簡單易懂。而且,它還彌補了 Tensorflow 靜態構圖的致命弱點。PyTorch 是可以構建動態計算圖。

也就是說你可以隨時改變神經網絡的結構,而不影響其計算過程。而 Tensorflow 這種靜態圖模塊,一旦搭建好了神經網絡, 你想修改結構也不行。

3. 紅色石頭的學習路線

知道紅色石頭的讀者可能清楚,我比較注重深度學習理論與實踐的結合,主張使用通俗、白話的的語言來講解機器學習、深度學習知識點。這個世界沒有學不會的知識,只缺少正確的入門途徑!

為了幫助大家更好地入門深度學習,我梳理了以下知識點網絡:

重點來了,為了更加詳細地對深度學習進行理論解析,講解實戰經驗。紅色石頭已經在 CSDN 的 GitChat 達人課上發布了《深度學習從入門到 Python 實戰》課程,將會帶大家詳細梳理深度學習知識體系。下面是關於本達人課的介紹。

課程內容:

第一部分(第01-04課),主要介紹一些深度學習的預備知識。對深度學習進行簡要概述,列舉重要的 Python 基礎知識,手把手教你搭建本課程需要的開發環境,使用 Anaconda 平臺,重點介紹 Jupyter Notebook 的使用以及知名的深度學習框架 PyTorch。

第二部分(第05-14課),主要介紹神經網絡的基礎,以最簡單的兩層神經網絡入手,詳細推導正向傳播與反向梯度的算法理論。

然後,從簡單網絡推導至深度網絡,並重點介紹神經網絡優化算法及構建神經網絡模型的實用建議。每一部分都會使用 Python 構建神經網絡模型來解決實際問題。

第三部分(第15-18課),主要介紹卷積神經網絡 CNN 和循環神經網絡 RNN,重點剖析兩種模型的數學原理和推導過程。

最後,利用越來越火的深度學習框架 PyTorch 分別構建 CNN 和 RNN 模型,解決實際問題。

課程特色:

內容深入淺出、理論推導詳細。

理論結合實踐,在代碼實踐中鞏固知識。

知識體系完善,深度學習知識點各個擊破。

本課程將針對深度學習的複雜性和難點進行講解和分析,主要體現在神經網絡模型的數學推導、神經網絡模型的優化,以及如何構建一個優秀的深度學習模型解決實際問題。希望通過課程內容的學習,大家可以掃清學習過程中的障礙,再上新臺階。

訂閱福利:

原價 39.99,GitChat 新用戶購買立享五折優惠。

訂購本課程可獲得專屬海報,分享專屬海報每成功邀請一位好友購買,即可獲得 25% 的返現獎勵,多邀多得,上不封頂,立即提現。

提現流程:請在 GitChat 服務號中點擊「我-我的邀請-提現」進行提現。


感興趣的請掃碼試讀

相關焦點

  • Java工程師入門深度學習(三):輕鬆上手Deep Java Library_科技...
    DJL(Deep Java Library )是亞馬遜在2019年宣布推出的開源Java深度學習開發包,它是在現有深度學習框架基礎上使用原生Java概念構建的開發庫。它為開發者提供了深度學習的最新創新和使用前沿硬體的能力,例如GPU、MKL等。簡單的API抽象並簡化了開發深度學習模型所涉及的複雜性,使得DJL更易於學習和應用。
  • 深度學習和機器學習的線性代數入門
    本文目錄引言機器學習ML和深度學習NN中的線性代數矩陣向量矩陣乘法轉置矩陣逆矩陣正交矩陣對角矩陣正規方程的轉置矩陣和逆矩陣線性方程向量範數L1範數/Manhattan範數L2範數/神經元是深度學習的基本單位,該結構完全基於數學概念,即輸入和權重的乘積和。至於Sigmoid,ReLU等等激活函數也依賴於數學原理。
  • 「修煉開始」一文帶你入門深度學習
    深度學習深度學習(Deep Learning)是近年來發展十分迅速的研究領域,並且在人 工智能的很多子領域都取得了巨大的成功。從根源來講,深度學習是機器學習的一個分支。深度學習主要由上圖所示的幾個部分組成,想學一個深度學習算法的原理,就看它是什麼樣的網絡結構,Loss 是怎麼計算的,預處理和後處理都是怎麼做的。權重初始化和學習率調整策略、優化算法、深度學習框架就那麼多,並且也不是所有都要掌握,比如深度學習框架,Pytorch 玩的溜,就能應付大多數場景。
  • 想深入學習佔星,有哪些必讀的入門書籍
    本文的目的是為那些喜歡嚴肅佔星但覺得沒有辦法深入學習的人提供一些學習佔星的指導。基於以上目的,我將盡力為熱愛佔星的初學者解答問題。由於個人學習的局限性,歡迎大家真誠地討論和批評,共同提高。對於這類朋友,我真誠建議大家找一位可靠的佔星專業人士做一次全面系統的會診。因為你很容易對自己或他人產生基於某一種論斷的偏見。一旦這種偏見建立起來,很容易引起誤解,進而對你的生活產生不好的影響。我希望所有的學習佔星的同學努力學習和思考(非常重要!!!),提高自己的理解能力,運用佔星的知識指導自己的生活。
  • 如此多的深度學習框架,為什麼我選擇PyTorch?
    尤其是近兩年,Google、Facebook、Microsoft等巨頭都圍繞深度學習重點投資了一系列新興項目,他們也一直在支持一些開源的深度學習框架。目前研究人員正在使用的深度學習框架不盡相同,有 TensorFlow 、Caffe、Theano、Keras等,常見的深度學習框架如圖2所示。
  • 如何系統學習葫蘆絲?從入門到中級的學習順序
    這種求學的態度我非常讚嘆,但正如盲人慾登梯上九層樓,眼盲者根本就看不見樓與樓梯。如果沒有「明眼人」引領,可能連樓與樓梯都摸不到,就別說登樓之事了!九層樓內之境界,就更別提了!我也並非是「明眼人」,只是很幸運能在入門時就跟隨恩師曲佤哈文老師學習,成為一個專注於從事葫蘆絲教學十年的普通老師,跟大家分享一些自己學習路上的經驗,若能讓大家少走彎路,已樂甚至哉了。
  • 深度強化學習的人工智慧在遊戲中的運用:遊戲AI入門及AI優化指南
    文/淚的天堂前言:現如今,所有電子遊戲都離不開AI的運用,對於遊戲策劃而言AI是什麼,AI又是如何運作,可以說是面試時的加分項,本文在這裡不探討理論的AI(採用深度強化學習的智能AI,如騰訊AI Lab、網易伏羲AI等),旨在分享現遊戲領域廣泛運用的AI,給新人策劃針對遊戲
  • 紫微鬥數入門探秘學習
    新手、零基礎、剛剛入門的小白可以學習基礎不牢靠的可以學習基礎不全面的應該學習想搞明白鬥數的更可以學習>想學習天盤的也可以通過贈送材料學習實現此次奉送的內容和價值,只此一處,別無他家本次學習旨在幫助大家了解和增強紫微鬥數基礎,亦為弘揚周易國學文化,固本著教學和傳揚為上的原則,採取「教材學習、課程聽取、疑問解答、反覆聽課」的方式,為大家築起國學和鬥數的學習之路和興趣之路,更為大家解答學習中的疑難問題,讓大家真實、客觀、全面地掌握周易紫微鬥數知識
  • 江浙滬經典入門級徒步路線,千年歷史古道,特適合周末兩日遊!
    在江浙滬的徒步愛好者心中,「徽杭古道」算是一個經典的、入門的徒步路線,雖然難度不高,但依然有眾多骨灰級愛好者,三番五次前來徒步,就因為它的風景真的很美,且很有人文情懷!大概路線時間安排如下:周六上午出發,下午抵達臨安進山,徒步夜宿徽杭古道,周日繼續徒步,下午抵達績溪,傍晚坐客車或高鐵回杭。
  • 一個超乾貨的3D視覺學習社區
    我想請問一下在單目三維重建過程中,對投影儀的標定,一般用什麼來評價所用方法對投影儀標定精度的有效性? ……姿態估計篇目前做物體6D姿態估計的網絡中,有沒有應用深度補全來提升精度以及提升遮擋下的識別效果的呢?如何自己製作6D位姿估計的深度學習的數據集?
  • PaddlePaddle開發者福利 深度學習環境一鍵部署+零基礎入門指導書
    由河北科技大學許雲峰老師團隊打造和分享,線下深度學習實驗環境鏡像(PaddlePaddle Fluid 1.1.0版+Python3.5)+零基礎入門實驗手冊,12月12日正式發布。該平臺提供了完善的深度學習入門所需資源,降低了深度學習起步門檻。平臺介紹:1.
  • 零基礎學習日語如何入門
    零基礎學習日語如何入門?日語入門初始,最先接觸到的就是五十音圖,五十音圖就是日語的「字母」。 日語的字母叫做假名,每個假名代表一個音節。假名有兩種書寫方式,即平假名和片假名,平假名用於一般書寫,片假名則用於表示外來語和特殊詞彙等。
  • 吉他入門零基礎,學習掃弦
    今天主要給大家講一下掃弦(很多人私信我讓我先講解一下)掃弦,是吉他彈奏中最常見的方式之一,哪怕你是初學者,也可以用相對簡單一點的節奏型,把好聽的調調掃出來,我們很多新朋友在學習的時候看到譜子上連續的上下箭頭。
  • 日語入門學習請踏踏實實走好這六步
    對於沒有接觸過日語的小白來說,如何日語入門就顯得非常困難了!為什麼說日語入門學習難,主要在於日語本身的特點:民族性、地域性及約定俗成性!其實,日語入門學習踏踏實實走好這六步就夠了給大家介紹一下。
  • 斯坦福CS224n追劇計劃【大結局】:NLP和深度學習的未來
    簡介Stanford CS224n追劇計劃是由夕小瑤的賣萌屋發起的開源開放NLP入門項目
  • 乾貨分享&創意盛宴WAVESUMMIT+2020深度學習開發者峰會等你來!
    由深度學習技術及應用國家工程實驗室與百度聯合主辦的WAVE SUMMIT+2020深度學習開發者峰會將於12月20日在北京舉行。目前峰會官網已正式上線,可以通過官網報名參會或觀看直播。WAVE SUMMIT是中國深度學習開發者每年兩次的技術盛會,WAVE SUMMIT+ 2020是今年的第二場。
  • 從黑馬程式設計師課程大綱了解Java入門到大數據該如何學習
    首先我們看一張比較清晰的學習路線:我們看到圖片內容,心裡能清楚一個大概的學習路線。首先來看前面三個階段的內容是為了大家可以獨立完成B/S結構的網站開發,具備在實際環境下面的項目部署能力。前面幾個階段哦我們看到,基本都是Java的學習。
  • 了解網球入門細節精華,正確入門快速學習網球技能
    一直以來,網球在大眾的心目中都是一項比較難的運動項目,因此如果想要學習網球,必須要提前制定精準的計劃,了解各種細節精華。第一,網球初學者要先明確自己的定位,這個要根據你的身體素質以及各方麵條件來確定自己的網球學習計劃,如果之前沒有什麼運動基礎,身體素質也不夠好的話,那麼網球的入門時間就要更長一些,一開始的進步可能不夠明顯,但是只要耐心訓練,就一定能獲得進步。第二,引拍。很多情況下,如果打球用不上力,就很有可能是因為引拍動作做的不夠到位,我們要練習好整個引拍的動作過程。
  • 機器學習漫遊指南 最完整的入門書單(外文版)
    在雷鋒網所篩選的學習資源中,這堪稱是迄今為止最全面、最完整、權威性比較高的一份 ML 書單,涵蓋了最值得學習者、從業者、開發者認真研讀的精品書目。這份指南適合多樣背景的讀者:從想要了解機器學習的普通人,到入門新手,再到高階開發者和學術研究人員。因此,雷鋒網對其進行編譯整理,特來與大家分享。
  • NumPy 完整學習路線和精華 PDF 下載
    是時候把我寫過的最好的作品呈現給你了,在接下來這幾天我會陸續發送出來。一本20+頁的精品PDF,全部個人原創,21 個Pandas 使用小技巧:我原創的 Pandas 數據分析 21 個使用小技巧2.  過去原創的 10 個 Python 可視化圖,源碼全部開放下載:我原創的 10 個 Python 可視化作品,今天源碼全部開放下載!3.