李沐大神深度學習課程第一篇重磅推出:機器學習簡介

2021-01-16 軟體定義世界(SDX)
不久之前,吳恩達推出了自己的深度學習在線課,收穫了十分熱烈的反響,該課程也已引入中國方便國內開發者學習。9 月 4 日,MXNet 的創始人之一的李沐在線上推出了自己的「從 0 動手學深度學習」中文免費課程。

李沐說:「在我們準備這個的時候,Andrew Ng 也開設了深度學習課程。從課程單上看非常好,講得特別細。而且 Andrew 講東西一向特別清楚,所以這個課程必然是精品。 但我們做的跟 Andrew 的主要有幾個區別:

我們不僅介紹深度學習模型,而且提供簡單易懂的代碼實現。我們不是通過幻燈片來講解,而是通過解讀代碼,實際動手調參數和跑實驗來學習。

我們使用中文。不管是教材,直播,還是論壇。(雖然在美國呆了 5~6 年了,事實上我仍然對一邊聽懂各式口音的英文一邊理解內容很費力。)

Andrew 課目前免費版只能看視頻,而我們不僅僅直播教學,而且提供練習題,提供大家交流的論壇,並鼓勵大家在 github 上參與到課程的改進中來。希望能與大家有更近距離的交互。

從大出發點上我們跟 Andrew 一致,希望能夠幫助小夥伴們快速掌握深度學習。這一次技術上的創新可能會持續輻射技術圈數年,希望小夥伴們能更快更好的參與到這一次熱潮來。」

本文由李沐本人授權,InfoQ 整理髮布。

本書作者跟廣大程式設計師一樣,在開始寫作前需要去來一杯咖啡。我們跳進車準備出發,Alex 掏出他的安卓喊一聲「OK Google」喚醒語言助手,Mu 操著他的中式英語命令到「去藍瓶咖啡店」。手機這時馬上顯示出識別的命令,並且知道我們需要導航。接著它調出地圖應用並給出數條路線方案,每條方案邊上會有預估的到達時間並自動選擇最快的線路。

好吧,這是一個虛構的例子,因為我們一般在辦公室喝自己的手磨咖啡。但這個例子展示了在短短幾秒鐘裡,我們跟數個機器學習模型進行了交互。

如果你從來沒有使用過機器學習,你會想,這個不就是編程嗎?或者,到底機器學習是什麼?首先,我們確實是使用程式語言來實現機器學習模型,我們跟計算機其他領域一樣,使用同樣的程式語言和硬體。但不是每個程序都用了機器學習。對於第二個問題,精確定義機器學習就像定義什麼是數學一樣難,但我們試圖在這章提供一些直觀的解釋。

課程地址:

http://zh.gluon.ai/introduction.html

點擊【閱讀原文】可跳轉至課程頁面



我們日常交互的大部分電腦程式可以使用最基本的命令來實現。當你把一個商品加進購物車時,你觸發了電商的電子商務程序來把一個商品 ID 和你的用戶 ID 插入到一個叫做購物車的資料庫表格中。你可以在沒有見到任何真正客戶前來用最基本的程序指令來實現這個功能。如果你發現你可以這麼做,那麼你就不應該使用機器學習。

對於機器學習科學家來說,幸運的是大部分應用沒有那麼容易。回到前面那個例子,想像下如何寫一個程序來回應喚醒詞例如「Okay, Google」,「Siri」,和「Alexa」。如果你在一個只有你和代碼編輯器的房間裡寫這個程序,你該怎麼辦?你可能會想像下面的程序

if input_command == 'Okey, Google': run_voice_assistant()

但實際上你能拿到的只是麥克風裡採集到的原始語音信號,可能是每秒 44,000 個樣本點。那麼需要些什麼樣的規則才能把這些樣本點轉成一個字符串呢?或者簡單點,判斷這些信號裡是不是就是說了喚醒詞。

如果你被這個問題困住了,不用擔心。這就是我們為什麼要機器學習。

雖然我們不知道怎麼告訴機器去把語音信號轉成對應的字符串,但我們自己可以。我們可以收集一個巨大的 數據集 裡包含了大量語音信號,以及每個語音型號是不是對應我們要的喚醒詞。在機器學習裡,我們不直接設計一個系統去辨別喚醒詞,而是寫一個靈活的程序,它的行為可以根據在讀取數據集的時候改變。所以我們不是去直接寫一個喚醒詞辨別器,而是一個程序,當提供一個巨大的有標註的數據集的時候它能辨別喚醒詞。你可以認為這種方式是 利用數據編程。換言之,我們需要用數據訓練機器學習模型,其過程通常如下:

初始化一個幾乎什麼也不能做的模型.

抓一些有標註的數據集(例如音頻段落及其是否為喚醒詞的標註);

修改模型使得它在抓取的數據集上能夠更準確執行任務(例如使得它在判斷這些抓取的音頻段落是否為喚醒詞上判斷更準確);

重複以上步驟 2 和 3,直到模型看起來不錯。



機器學習背後的核心思想是,設計程序使得它可以在執行的時候提升它在某任務上的能力,而不是有著固定行為的程序。機器學習包括多種問題的定義,提供很多不同的算法,能解決不同領域的各種問題。我們之前講到的是一個講 監督學習 應用到語言識別的例子。

正因為機器學習提供多種工具可以利用數據來解決簡單規則不能或者難以解決的問題,它被廣泛應用在了搜尋引擎、無人駕駛、機器翻譯、醫療診斷、垃圾郵件過濾、玩遊戲、人臉識別、數據匹配、信用評級和給圖片加濾鏡等任務中。

雖然這些問題各式各樣,但他們有著共同的模式從而可以被機器學習模型解決。最常見的描述這些問題的方法是通過數學,但不像其他機器學習和神經網絡的書那樣,我們會主要關注真實數據和代碼。下面我們來看點數據和代碼。



這個例子靈感來自 Joel Grus 的一次 應聘面試. 面試官讓他寫個程序來玩 Fizz Buzz. 這是一個小孩子遊戲。玩家從 1 數到 100,如果數字被 3 整除,那麼喊』fizz』,如果被 5 整除就喊』buzz』,如果兩個都滿足就喊』fizzbuzz』,不然就直接說數字。這個遊戲玩起來就像是:

1 2 fizz 4 buzz fizz 7 8 fizz buzz 11 fizz 13 14 fizzbuzz 16 …

傳統的實現是這樣的:

1 2 fizz 4 buzz fizz 7 8 fizz buzz 11 fizz 13 14 fizzbuzz 16 17 fizz 19 buzz fizz 22 23 fizz buzz 26 fizz 28 29 fizzbuzz 31 32 fizz 34 buzz fizz 37 38 fizz buzz 41 fizz 43 44 fizzbuzz 46 47 fizz 49 buzz fizz 52 53 fizz buzz 56 fizz 58 59 fizzbuzz 61 62 fizz 64 buzz fizz 67 68 fizz buzz 71 fizz 73 74 fizzbuzz 76 77 fizz 79 buzz fizz 82 83 fizz buzz 86 fizz 88 89 fizzbuzz 91 92 fizz 94 buzz fizz 97 98 fizz buzz

對於經驗豐富的程式設計師來說這個太不夠一顆賽艇了。所以 Joel 嘗試用機器學習來實現這個。為了讓程序能學,他需要準備下面這個數據集:

數據 X [1, 2, 3, 4, ...] 和標註 Y ['fizz', 'buzz', 'fizzbuzz', identity]

訓練數據,也就是系統輸入輸出的實例。例如 [(2, 2), (6, fizz), (15, fizzbuzz), (23, 23), (40, buzz)]

從輸入數據中抽取的特徵,例如 x -> [(x % 3), (x % 5), (x % 15)]

有了這些,Jeol 利用 TensorFlow 寫了一個分類器。對於不按常理出牌的 Jeol,面試官一臉黑線。而且這個分類器不是總是對的。

顯然,用原子彈殺雞了。為什麼不直接寫幾行簡單而且保證結果正確的 Python 代碼呢?當然,這裡有很多一個簡單 Python 腳本不能分類的例子,即使簡單的 3 歲小孩解決起來毫無壓力。

喵 vs 汪

幸運的是,這個正是機器學習的用武之地。我們通過提供大量的含有貓和狗的圖片來編程一個貓狗檢測器,一般來說它就是一個函數,它會輸出一個大的正數如果圖片裡面是貓,一個大的負數如果是狗,如果不確信就輸出一個 0 附近的。當然,這是機器學習能做的最簡單例子。



成功的機器學習有四個要素:數據、轉換數據的模型、衡量模型好壞的損失函數和一個調整模型權重來最小化損失函數的算法。

模型。通常數據和我們最終想要的相差很遠,例如我們想知道照片中的人是不是在高興,所以我們需要把一千萬像素變成一個高興度的概率值。通常我們需要在數據上應用數個非線性函數(例如神經網絡)

損失函數。我們需要對比模型的輸出和真實值之間的誤差。損失函數幫助我們決定 2017 年底亞馬遜股票會不會價值 1500 美元。取決於我們想短線還是長線,這個函數可以很不一樣。

訓練。通常一個模型裡面有很多參數。我們通過最小化損失函數來學這些參數。不幸的是,即使我們做得很好也不能保證在新的沒見過的數據上我們可以仍然做很好。

訓練誤差。這是模型在評估用來訓練模型的數據集上的誤差。這個類似於考試前我們在模擬試卷上拿到的分數。有一定的指向性,但不一定保證真實考試分數。

測試誤差。這是模型在沒見過的新數據上的誤差,可能會跟訓練誤差不很一樣(統計上叫過擬合)。這個類似於考前模考次次拿高分,但實際考起來卻失誤了。(筆者之一曾經做 GRE 真題時次次拿高分,高興之下背了一遍紅寶書就真上陣考試了,結果最終拿了一個剛剛夠用的低分。後來意識到這是因為紅寶書裡包含了大量的真題。)

下面我們詳細討論一些不同的機器學習應用。



監督學習描述的任務是,當給定輸入 x,如何通過在有標註輸入和輸出的數據上訓練模型而能夠預測輸出 y。從統計角度來說,監督學習主要關注如何估計條件概率 P(y|x)。在實際情景中,監督學習最為常用。例如,給定一位患者的 CT 圖像,預測該患者是否得癌症;給定英文句子,預測出它的正確中文翻譯;給定本月公司財報數據,預測下個月該公司股票價格。



回歸分析也許是監督學習裡最簡單的一類任務。在該項任務裡,輸入是任意離散或連續的、單一或多個的變量,而輸出是連續的數值。例如我們可以把本月公司財報數據抽取出若干特徵,如營收總額、支出總額以及是否有負面報導,利用回歸分析預測下個月該公司股票價格。

如果我們把模型預測的輸出值和真實的輸出值之間的差別定義為殘差,常見的回歸分析的損失函數包括訓練數據的殘差的平方和或者絕對值的和。機器學習的任務是找到一組模型參數使得損失函數最小化。我們會在之後的章節裡詳細介紹回歸分析。



值得一提的是,回歸分析所關注的預測往往可以解答輸出為 連續數值 的問題。當預測的輸出是 離散的 類別時,這個監督學習任務就叫做分類。分類在我們日常生活中很常見。例如我們可以把本月公司財報數據抽取出若干特徵,如營收總額、支出總額以及是否有負面報導,利用分類預測下個月該公司的 CEO 是否會離職。在計算機視覺領域,把一張圖片識別成眾多物品類別中的某一類,例如貓、狗等。

動物的分類

給定一個實例被抽取出的若干特徵作為輸入,我們的分類模型可以輸出實例為各個類別的概率,並將概率最大的類別作為分類的結果。



事實上,有一些看似分類的問題在實際中卻難以歸於分類。例如,把下面這張圖無論分類成貓還是狗看上去都有些問題。

正如你所見,上圖裡既有貓又有狗。其實還沒完呢,裡面還有草啊、輪胎啊、石頭啊等等。與其將上圖僅僅分類為其中一類,倒不如把這張圖裡面我們所關心的類別都標註出來。比如,給定一張圖片,我們希望知道裡面是否有貓、是否有狗、是否有草等。給定一個輸入,輸出不定量的類別,這個就叫做標註任務。

這類任務有時候也叫做多標籤分類。想像一下,人們可能會把多個標籤同時標註在自己的某篇技術類博客文章上,例如「機器學習」、「科技」、「程式語言」、「雲計算」、「安全與隱私」和「AWS」。這裡面的標籤其實有時候相互關聯,比如「雲計算」和「安全與隱私」。當一篇文章可能被標註的數量很大時,人力標註就顯得很吃力。這就需要使用機器學習了。



搜索與排序關注的問題更多的是如何把一堆對象排序。例如在信息檢索領域,我們常常關注如何把一堆文檔按照與檢索條目的相關性排序。在網際網路時代,由於搜尋引擎的流行,我們更加關注如何對網頁進行排序。網際網路時代早期有一個著名的網頁排序算法叫做 PageRank。該算法的排序結果並不取決於特定的用戶檢索條目。這些排序結果可以更好地為所包含檢索條目的網頁進行排序。



推薦系統與搜索排序關係緊密,並廣泛應用於購物網站、搜尋引擎、新聞門戶網站等等。推薦系統的主要目標是把用戶可能感興趣的東西推薦給用戶。推薦算法用到的信息多種多樣,例如用戶的自我描述、對過往推薦的反應、社交網絡、喜好等等。下圖展示了亞馬遜網站對筆者之一有關深度學習類書籍的推薦結果。

搜尋引擎的搜索條目自動補全系統也是個好例子。它可根據用戶輸入的前幾個字符把用戶可能搜索的條目實時推薦自動補全。在筆者之一的某項工作裡,如果系統發現用戶剛剛開啟了體育類的手機應用,當用戶在搜索框拼出」real」時,搜索條目自動補全系統會把」real madrid」(皇家馬德裡,足球球隊)推薦在比通常更頻繁被檢索的」real estate」(房地產)更靠前的位置,而不是總像下圖中這樣。



序列學習也是一類近來備受關注的機器學習問題。在這類問題中,輸入和輸出不僅限於固定的數量。這類模型通常可以處理任意長度的輸入序列,或者輸出任意長度的序列。當輸入和輸出都是不定長的序列時,我們也把這類模型叫做 seq2seq,例如語言翻譯模型和語音轉錄文本模型。以下列舉了一些常見的序列學習案例。



一個常見語法分析的例子是,給定一個本文序列,如何找出其中的命名實體,例如人物姓名、城市名稱等。以下是一個這樣的例子。其中 Tom、Washington 和 Sally 都是命名實體。

Tom wants to have dinner in Washington with Sally.

E - - - - - E - E



在語音識別的問題裡,輸入序列通常都是麥克風的聲音,而輸出是對通過麥克風所說的話的文本轉錄。這類問題通常有一個難點,例如聲音通常都在特定的採樣率採樣,因為聲音和文本之間不存在一一對應。換言之,語音識別是一類序列轉換問題。這裡的輸出往往比輸入短很多。

----D----e--e--ep- L----ea--r----ning--



這是語音識別問題的逆問題。這裡的輸入是一個文本序列,而輸出才是聲音序列。因此,這類問題的輸出比輸入長。



機器翻譯的目標是把一段話從一種語言翻譯成另一種語言。目前,機器翻譯時常會翻譯出令人啼笑皆非的結果。主要來說,機器翻譯的複雜程度非常高。同一個詞在兩種不同語言下的對應有時候是多對多。另外,符合語法或者語言習慣的語序調整也另問題更加複雜。



上述的機器學習問題和應用場景都是基於監督學習的。與監督學習不同,非監督學習不需要訓練數據被標識。以圖片分析為例,對監督學習來說,訓練數據裡的圖片需要被標識為狗、貓或者別的動物,如此一來,一個分類模型被訓練後就能把一張新圖片識別為某種動物。而對非監督學習而言,例如聚類學習,可以把一堆無標識的圖片自動聚合成若干類,其中每類分別對應一種動物。以下我們簡要介紹一些常見的非監督學習任務。

聚類 問題通常研究如何把一堆數據點分成若干類,從而使得同類數據點相似而非同類數據點不似。根據實際問題,我們需要定義相似性。

子空間估計 問題通常研究如何將原始數據向量在更低維度下表示。理想情況下,子空間的表示要具有代表性從而才能與原始數據接近。一個常用方法叫做主成分分析。

表徵學習 希望在歐幾裡得空間中找到原始對象的表示方式,從而能在歐幾裡得空間裡表示出原始對象的符號性質。例如我們希望找到城市的向量表示,從而使得我們可以進行這樣的向量運算:羅馬 - 義大利 + 法國 = 巴黎。

生成對抗網絡 是最近一個很火的領域。這裡描述數據的生成過程,並檢查真實與生成的數據是否統計上相似。

機器學習是一個龐大的領域。我們在此無法也無需介紹有關它的全部。

轉自:大數據雜談讀BD最佳實踐案例,贏DT未來!

18各行業,106個中國大數據應用最佳實踐案例:

(1)《贏在大數據:中國大數據發展藍皮書》;

(2)《贏在大數據:金融/電信/媒體/醫療/旅遊/數據市場行業大數據應用典型案例》;

(3)《贏在大數據:營銷/房地產/汽車/交通/體育/環境行業大數據應用典型案例》;

(4)《贏在大數據:政府/工業/農業/安全/教育/人才行業大數據應用典型案例》。

京東網購買連結:

https://item.jd.com/12160064.html

當當網購買連結:

http://product.dangdang.com/25103534.html


掃描下方二維碼,可直接進入京東購書:

推薦文章


微信ID:SDx-SoftwareDefinedx

軟體定義世界, 數據驅動未來;

❷ 大數據思想的策源地、產業變革的指南針、創業者和VC的橋梁、政府和企業家的智庫、從業者的加油站;

❸個人微信號:sdxtime,

郵箱:sdxtime@126.com;

=>> 長按右側二維碼關注。

底部新增導航菜單,下載200多個精彩PPT,持續更新中!

相關焦點

  • 議題大全|AI Conference 2019北京站重磅回歸!|機器學習|深度學習|...
    Rich Ott (The Data Incubator)DeepLearning with PyTorch(使用PyTorch進行深度學習)PyTorch是一個用於Python的機器學習庫,允許用戶以極大的靈活性構建深度神經網絡。其易於使用的API和GPU的無縫使用使其成為深度學習的熱門工具。本課程將介紹PyTorch工作流程並演示如何使用它。
  • 威斯康辛大學《機器學習導論》2020秋季課程完結,課件、視頻資源已...
    Sebastian Raschka 是威斯康星大學麥迪遜分校的統計學助理教授,致力於機器學習和深度學習研究。對想要學習這門課程的學生,Sebastian Raschka 教授的建議是:你至少要熟悉基本編程知識並完成了編程入門課程。
  • 從ACM班、百度到亞馬遜,深度學習大牛李沐的開掛人生
    作為一經推出便大受追捧的 MXNet 深度學習框架的主要貢獻者之一,李沐功不可沒。值得注意的是,這個由 DMLC(Distributed Machine Learning Community)打造的深度學習框架,創建者都是中國人,以陳天奇、李沐、解浚源等為代表。現在,包括 AWS 在內的很多企業都將 MXNet 作為主流支持框架。
  • 免費的谷歌機器學習速成課,了解一下?
    谷歌今天上線了人工智慧學習網站Learn with Google AI,網站設有一門名為機器學習速成班(Machine Learning Crash Course ,簡稱MLCC)的免費課程。用他們自己的話來形容,這個課程節奏緊湊、內容實用。而且,這個課程將面向所有人開放,不僅全程完美支持中文,還一分錢都不要!
  • 深度學習和機器學習的線性代數入門
    機器學習和深度學習建立在數學原理和概念之上,因此AI學習者需要了解基本數學原理。神經元是深度學習的基本單位,該結構完全基於數學概念,即輸入和權重的乘積和。至於Sigmoid,ReLU等等激活函數也依賴於數學原理。
  • 李沐深度學習經典英文版更新:伯克利大學教材《動手學深度學習》
    與吳恩達的深度學習課程相比 在知乎中,李沐老師表達了與吳恩達的深度學習課程相比的區別: 我們不僅介紹深度學習模型,而且提供簡單易懂的代碼實現。我們不是通過幻燈片來講解,而是通過解讀代碼,實際動手調參數和跑實驗來學習。
  • 資料| Yann Lecun 紐約大學《深度學習(PyTorch)》課程(2020)PPT
    推薦一門由深度學習泰鬥,Yann LeCun主講的深度學習基礎課程,紐約大學2020深度學習新課《深度學習(pytorch)》。本課程涉及深度學習和表示學習的最新技術,重點是有監督和無監督的深度學習、嵌入方法、度量學習、卷積網和遞歸網,並應用於計算機視覺、自然語言理解和語音識別。期望學生最好有一定的數據科學和機器學習基礎知識。課件下載地址:https://www.yanxishe.com/resourceDetail/1390?
  • 一書吃透機器學習!《機器學習基礎》來了,教材PDF、PPT可下載
    銅靈 發自 凹非寺量子位 出品 | 公眾號 QbitAI不出家門,也能學習到國外高校的研究生機器學習課程了。今天,一本名為Foundations of Machine Learning(《機器學習基礎》)的課在Reddit上熱度飆升至300,裡面可謂內容豐富。不僅有500多頁的課程PDF可以下載,並且還有13章的PPT也可以獲取。有Reddit網友評論,這部教材足夠紮實、內容足夠基礎,學機器學習理論,熟讀這本書就足夠了。
  • 周志華推薦 | 李沐《動手學深度學習》中文版上線!(免費贈書)
    新智元報導 編輯:金磊【新智元導讀】李沐大神《動手學深度學習》中文版發布了!與當前其它深度學習教科書相比,本教科書更加注重交互式的學習體驗。新智元值此之際,與人民郵電出版社合作開展免費贈書活動!深度學習在短短幾年之內便讓世界大吃一驚。
  • 陳天奇|機器學習科研的十年
    MSRA回來之後,在實驗室薛老師的建議下,我選擇了一個現在看來正確而又錯誤的方向 -- 深度學習。那是AlexNet出現之前兩年,深度學習的主流熱點是非監督學習和限制玻爾茲曼機。沒有導師的指導,沒有工具,當時我靠著實驗室的兩塊顯卡和自己寫的CUDA代碼開始了死磕深度學習的兩年半。實驗室的學長問我,你準備要幹啥,我說:「我要用卷積RBM去提升ImageNet的分類效率。」
  • 重磅| ICML 2017最佳論文公布!機器學習的可解釋性成熱點
    在前線雷鋒網AI科技評論的兩位編輯(張馳和劉芳平)第一時間為大家帶來獲獎論文的報導。本屆ICML最佳論文的主題是,利用影響函數理解黑箱預測。機器學習中的一個關鍵問題就是,系統為何做出某種預測?我們不僅需要表現優異的模型,更需要可解釋的模型。理解了模型如何做出決策,也就能進一步改善它。
  • 斯坦福CS224n《基於深度學習的NLP》課程更新,C.Manning主講
    新智元報導 來源:Stanford編輯:大明【新智元導讀】史丹福大學官方公布cs224n課程《基於深度學習的自然語言處理》詳細安排,主講人為史丹福大學人工智慧實驗室主任,著名計算機科學家Christopher Manning教授,1月份課程閱讀材料已公布。本課程自2017 年起開設,2017年該課程視頻已公開放出。
  • 深度觀察 | Cadence 總裁 Anirudh Devgan:用機器學習破解晶片設計...
    深度觀察 | Cadence 總裁 Anirudh Devgan:用機器學習破解晶片設計桎梏
  • 美圖秀秀推出人工智慧手繪特效 深度學習「一秒轉手繪」
    美圖秀秀推出人工智慧手繪特效 深度學習「一秒轉手繪」 利用人工智慧處理圖片,其實資深影像APP玩家們並不陌生,2016年夏天,Prisma推出了讓普通圖片具有名畫般藝術氣息的濾鏡效果,瞬間紅遍全球
  • AI工作者的福音:AWS推出機器學習四大擴圈舉措
    在人工智慧領域,機器學習是人工智慧領域中核心研究領域之一,據統計大約有89%的人工智慧專利與機器學習有關。而作為機器學習領域中的翹楚,亞馬遜已經利用機器學習有20多年的時間,超過10萬名客戶正在使用亞馬遜雲服務(AWS的)機器學習服務,很多客戶已經將機器學習用於其核心業務,在去年一年AWS就新增了250多項機器學習功能。
  • 內蒙古大數據課程學習_博雅環球教育誠信服務
    內蒙古大數據課程學習,博雅環球教育誠信服務,業務涵蓋網際網路行業高薪高端就業培訓,專、本科學歷教育取證培訓,行業資格認證培訓,航空服務人才定向培訓,大學生就業創業扶持等多項領域。內蒙古大數據課程學習, 0的一次重大更新,匯總並收集了大數據學科一年以來15個零基礎班級的授課信息、學習信息、就業信息。
  • 2018年6個最佳的免費在線人工智慧課程!
    在這篇文章中,將簡要介紹一些今天可用的最好的免費軟體。通過Google AI學習https://ai.google/education/#?modal_active=none這個新推出的資源是Google計劃擴大公眾對AI的理解的一部分內容。
  • Python機器學習的迷你課程(14天教學)
    Python是應用機器學習發展最快的平臺之一。在這個迷你課程,你將發現你如何可以開始,建立準確的模型和自信地完成預測建模機器學習項目使用Python在14天。讓我們開始吧。誰適合這個迷你課程?懂一點機器學習的開發人員。這意味著你知道機器學習的基礎知識,比如交叉驗證、一些算法和偏方差權衡。這並不意味著你是一個機器學習博士,只是你知道地標或者知道去哪裡查找它們。這個迷你課程既不是關於Python的教科書,也不是關於機器學習的教科書。
  • 2017年裡,哪十篇 arXiv 機器學習論文在 Twitter 上最熱門?
    Twitter 上有個帳號 StatMLPapers 會每天摘錄20篇左右機器學習相關論文分別發推,2017年一年共發送了五千多條論文推特。我們找出了其中點讚最多的10條論文推特,給大家看看是哪10篇論文在twitter上得到了最多的關注。
  • 亞馬遜AI主任科學家李沐:機器學習簡介
    在而大多數的深度學習中,學習(learning) 就是指在訓練過程(training period) 中更新模型的行為(通過調整參數)。這時候,機器學習就該上場了。機器學習最簡要素針對識別喚醒語的任務,我們將語音片段和標註(label)放在一起組成數據集。接著我們訓練一個機器學習模型,給定一段語音,預測它的標註。這種給定樣例預測標註的方式,僅僅是機器學習的一種,稱為監督學習。深度學習包含很多不同的方法,我們會在後面的章節討論。