一本100頁的機器學習書籍近日大受好評

2021-01-11 電子發燒友
一本100頁的機器學習書籍近日大受好評

李倩 發表於 2018-11-20 09:27:37

這是一本只有100頁,任何只要有基礎數學知識的人都能看懂的機器學習書籍。本書將涵蓋非監督學習和監督學習、包括神經網絡,以及計算機科學、數學和統計學中最重要的一些機器學習問題。

一本100頁的機器學習書籍近日大受好評。

書名The Hundred-Page Machine Learning Book,作者Andriy Burkov是Gartner的機器學習團隊leader,人工智慧專業PhD,有近20年各種計算項目的工作經驗。

作者表示,他的目標是寫一本任何有基礎數學知識的人都能看懂的機器學習書籍。

這本書的前5章已經在該書的配套網站上公開。這本書將涵蓋非監督學習和監督學習,包括神經網絡,以及計算機科學、數學和統計學中最重要的一些ML問題,並通過例子提供直觀的解釋。代碼和數據也將在網站上公開。

作者相信一本書應該「先讀後買」,不僅可以免費下載已公開的章節,你也可以在這裡訂閱即將出版的章節:

http://themlbook.com/wiki/doku.php

已發布章節:

第1章:簡介

第一部分:監督學習

第2章:符號和定義

第3章:基本算法

第4章:剖析學習算法

第5章:基本實踐

以下是試讀:第3章:基本算法

試讀:第3章:基本算法

在本章中,我們描述了五種算法,這些算法不僅是最著名的,而且要麼自身非常有效,要麼被用作最有效的學習算法的構建塊。

3.1 線性回歸

線性回歸是一種常用的回歸學習算法,它學習的模型是輸入示例特徵的線性組合。

問題陳述

我們有一個標記示例的集合,其中N是集合的大小,是示例i = 1的D維特徵向量,是一個實值目標(也是一個實數。

我們想要建立一個模型作為示例x的特徵的線性組合:

其中w是參數的D維向量,b*是實數,wx是點積。符號表示模型f由兩個值參數化:w和b。

圖1:一維示例的線性回歸。

3.2 邏輯回歸

首先要說的是邏輯回歸不是回歸,而是一個分類學習算法。這個名稱來自統計學,因為邏輯回歸的數學公式與線性回歸的數學公式相似。

我們將在二元分類的情況下解釋邏輯回歸。但它也可以擴展到多元分類。

問題陳述

在邏輯回歸中,我們仍然希望將這樣的特徵的線性組合是從負無窮大到正無窮大的函數,而只有兩個可能的值。

在沒有計算機的年代,科學家們不得不手工進行計算,他們非常想找到一個線性分類模型。他們發現如果將負標籤定義為0,將正標籤定義為1,就只需要找到一個codomain為(0,1)的簡單連續函數。在這種情況下,如果模型為輸入x返回的值更接近於0,那麼我們為x分配負標籤,否則,該示例將被標記為正。具有這種屬性的一個函數是標準邏輯函數(也稱為sigmoid函數):

如圖3所示。

圖3:標準邏輯函數

3.3 決策樹學習

決策樹是一個可用於做決策的非循環圖。在圖的每個分支節點中,檢查特徵向量的特定特徵j。如果特徵的值低於特定的閾值,則遵循左分支,否則,遵循右分支。當到達葉節點時,決定該示例所屬的類。

問題陳述

我們有一組帶標籤的示例;標籤屬於集合{0,1}。我們想要構建一個決策樹,允許我們在給定特徵向量的情況下預測示例的類。

圖4:決策樹構建算法的圖示。

3.4 支持向量機

關於SVM,有兩個重要問題需要回答:

如果數據中存在噪聲,並且沒有超平面可以將正例和負例完美分開,該怎麼辦?

如果數據不能使用平面分離,但可以用高階多項式分離呢?

圖5:線性不可分的情況。左:存在噪音。右:固有的非線性。

如圖5中描述的兩種情況。在左邊的示例中,如果沒有噪聲(異常值或帶有錯誤標籤的示例),數據可以用直線分隔。在正確的情況下,決策邊界是一個圓,而不是一條直線。

3.5 k-Nearest Neighbors

k-Nearest Neighbors(kNN)是一種非參數學習算法。與其他在構建模型後丟棄訓練數據的學習算法相反,kNN將所有訓練示例保存在內存中。一旦出現了一個新的、以前沒見過的示例,kNN算法會在D維空間中找到k個最接近的例子並返回多數標籤(在分類的情況下)或平均標籤(在回歸的情況下)。

兩點的接近程度由距離函數給出。例如,上面看到的Euclidean distance在實踐中經常使用。距離函數的另一個常用選擇是負餘弦相似性。餘弦相似度的定義如下:

打開APP閱讀更多精彩內容

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容圖片侵權或者其他問題,請聯繫本站作侵刪。 侵權投訴

相關焦點

  • 機器學習最佳統計書籍推薦
    幾乎每一個機器學習項目中都離不開統計方法。所以需要基礎的統計相關基礎知識和方法對機器學習和AI必不可少。我們說AI不是神話,AI是數學算法,說明紮實數學基礎是做AI的必須,而統計學知識尤其是如此。這意味著重要的是要牢固掌握統計學主要發現的基礎和相關統計方法的工作知識。
  • 涵蓋邏輯回歸、貝葉斯等算法,一本關於ML在線免費書籍,值得一讀
    機器之心報導編輯:陳萍、杜偉一本關於機器學習的免費在線書籍,涉及多種算法完整推論,歡迎查收。提到機器學習領域的書籍資源,大家比較熟悉的有周志華老師的《機器學習》(西瓜書)、李宏毅老師的「寶可夢課程」等等。此外不同學習階段的學生也能夠找到適合自身的機器學習基礎和進階書籍資源。周志華西瓜書。
  • 10本機器學習和數據科學的必讀書籍推薦
    雷鋒網按:Matthew Mayo 是知名數據科學網站 KDnuggets 的副主編,同時也是一位資深的數據科學家、深度學習技術愛好者,在機器學習和數據科學領域具有豐富的科研和從業經驗。近日,他在 KDnuggets 上推薦了一份機器學習和數據科學相關的免費必讀書單,雷鋒網特來與大家分享。
  • 417頁《機器學習中的數學》免費開放下載!| 好書分享
    作者 | 陳大鑫近些年來,機器學習領域取得了巨大的發展
  • 95後哈佛小哥撰寫《從零開始的機器學習》,入門必備,書籍資源已開放
    機器之心報導作者:蛋醬、小舟機器學習怎麼入門最簡單?今年剛剛從哈佛大學統計專業畢業的 Danny Friedman 寫了一本「轉專業學生專用教材」,無基礎也可輕鬆入門,資源現已全部開放。
  • 95後哈佛小哥撰寫從零開始的機器學習入門必備,書籍資源已開放
    機器之心報導作者:蛋醬、小舟機器學習怎麼入門最簡單?今年剛剛從哈佛大學統計專業畢業的 Danny Friedman 寫了一本「轉專業學生專用教材」,無基礎也可輕鬆入門,資源現已全部開放。說起機器學習入門書,大概有成百上千種選擇。這些書籍大多是由具備豐富研究經驗的學者撰寫的,涵蓋各種主題。俗話說「開卷有益」,但對於轉專業的初學者來說,這本新書或許更適合入門:近日,一位畢業於哈佛大學的小哥根據自己的機器學習入門經歷,撰寫了一本《從零開始的機器學習》。
  • 資料| 1800頁33章數學方法精要筆記 —深入數學建模, 機器學習和...
    from=leiphonecolumn_res07091 書籍介紹  · · · · · ·在信息爆炸的當今,大到企業巨頭的經營方向, 小到和日常生活相關的人工駕駛等領域,數學建模和人工智慧都對信息數據的收集、處理、解釋以及做出決策將起到至關重要的作用。負責開發模型和算法的一線科學家和工程師, 都需要有堅實的數學基礎。
  • 這本開放書籍幫你掃清通往ML的數學絆腳石
    機器之心編輯參與:思源數學是機器學習的基礎。史丹福大學教授 Stephen Boyd 聯合加州大學洛杉磯分校的 Lieven Vandenberghe 教授出版了一本基礎數學書籍,從向量到最小二乘法,分三部分進行講解並配以輔助資料。
  • 資料| 機器學習中的數學
    以下書籍介紹來自豆瓣內容簡介 · · · · · ·《機器學習中的數學》是一本系統介紹機器學習中涉及的數學知識的入門圖書,本書從機器學習中的數學入門開始,以展示數學的友好性為原則,講述了機器學習中的一些常見的數學知識
  • 這些電影電視劇在國外,也是廣受好評!
    這些電影電視劇在國外,也是廣受好評!近年來好劇不斷,不止我們愛看,歪果小夥伴也愛看,平時大家為學外語瘋狂看外國電影電視劇,歪果仁為學漢語看中國的電影電視劇,熱情也絲毫不減。《三生》在這個網站口碑不俗,居然排第一名,而且都是五星好評。琅琊榜類型:歷史、劇情《琅琊榜》是根據海宴同名小說改編的大型古裝傳奇電視劇,由白玉蘭獎最佳導演孔笙、李雪合力執導,著名演員胡歌、劉濤、王凱、黃維德、陳龍、靳東、高鑫等聯袂主演。NirvanainFire就是火中涅槃的意思,嗯,蘇童鞋所遭受的火寒之毒,所走的復仇平冤之路,歪果仁也很認真體會嘛!
  • 《時間簡史》:來自科學界的一本暢銷書
    英國劍橋大學著名物理學家,現代最偉大的物理學家之一,20世紀享有國際盛譽的偉人之一——霍金,近日辭世。人們在高度讚揚他的巨大的科學成就,銘記他為人類作出的傑出的貢獻,讚美他的堅忍不拔的生命勇氣,盛讚他的「科學鬥士」精神的同時,無不提及他的在科學界影響深遠的科學巨著《時間簡史》。
  • 書中記錄特殊書籍和符號,可能並不屬於地球!
    在歷史也有很多書籍,裡面記錄的內容根本無從找起。我國的《山海經》就是其中一本。在西方還有一本神秘莫測的書籍,截止到目前為止,沒有人看懂裡面寫了什麼,奇怪的符號和插圖,讓人一頭霧水,它就是伏尼契手稿。同《山海經》一樣,來源和歷史無從追究,這本一共230多頁的書籍,裡面記錄的方式可能並不是地球文字,這究竟是怎麼回事呢?
  • 推薦書籍《銀河光之家族》
    這是一部難得一見的,也是一本星星人類/新人類/所有人類必備的轉變指導手冊及揚升工具書。書中不僅揭露宇宙及地球真相,並教導有別於傳統的心靈知識。伊斯塔.安塔瑞斯的書包含了極其豐富的宇宙知識,這些知識令人非常吃驚,但有很強的邏輯性和連貫性,不是現在任何教科書所能涉及到的。其所帶來的是真正意識上的轉變,能幫助更多的人從中覺醒。
  • 最熱門的深度學習框架TensorFlow入門必備書籍
    今天就和大家推薦一本TensorFlow入門書籍之《Tensorflow:實戰Google深度學習框架》在了解這本書之前,不妨先來了解一下什麼是TensorFlow,TensorFlow 是谷歌的第二代機器學習系統, 是一個採用數據流圖,用於數值計算的開源軟體庫
  • 假期書店少兒書籍遭損壞 家長抱怨如二手市場(圖)
    周小雲 攝  中新網鄭州2月20日電 (記者 周小雲)時值寒假,在河南鄭州,不少的「小書蟲」趁假期湧進各大書店扎堆「蹭」書看。隨人流量的增加,書店圖書亂放、損壞的現象亦隨之攀升,不少少兒讀物受到「攻擊」。此舉不免令不少家長怨言連連,「陪孩子逛書店買書猶如進二手市場,真掃興」、「眼看著一堆財富,就變成垃圾了。」  「我剛才還看到一本被損壞的圖書。」
  • 萬萬沒想到是一本政治哲學書籍
    整個系列叫14歲讀懂社會,日本常見的口袋書籍。可是這……門檻才不是14歲啊啊啊……完全四十歲也不一定看得晚了吧?好吧,咆哮結束,先給大家看看原版短評,再精選幾段書中原文,體會本書的魅力。評:真真切切一本政治學科普。給你白話講「國家機器」的運行邏輯,深入淺出很不容易。讓我想起兩個場景:場景1:我是射擊類遊戲的夕陽紅玩家我總是不能很好地玩射擊遊戲。打打殭屍都會輸。但有時候我會想,平時倡導和平的自己,在射擊遊戲裡也會殺紅雙眼。
  • 各高校2019圖書館大數據出爐,下個學霸就是你
    近日,全國各地高校相繼公布了2019年度的圖書館大數據報告,哪所大學的學生們最愛看書呢?他們在看什麼書呢?今天給大家匯總了全國多所高校公布的圖書館數據,一起來看看大學生們都愛看哪些書吧!而在眾多作者中,最受讀者喜愛的的作者是東野圭吾,接著是武俠小說作者金庸老先生,第三是當年明月。
  • 經典書《機器學習:概率視角》習題解答(中文),附1098頁pdf下載
    新智元報導 來源:專知 編輯:SF 【新智元導讀】自2012年發行以來就奉為經典機器學習書目
  • 很好很全面的《機器學習速查手冊》,公式、圖表都有,135頁pdf附下載!
    機器
  • 推薦| 九本不容錯過的深度學習和神經網絡書籍
    選自aioptify機器之心編譯參與:微胖、李亞洲、蔣思源針對 30 多本深度學習和神經網絡書籍,我們(AI Optify 數據團隊)使用不同指標(比如,在線評價、打分、所涉主題、作者影響力、出版年份、社交媒體是否提及等)訓練機器學習算法,為每本書打分、排名。讀者可能會喜歡我們的推薦,因為這份榜單基於數據並且客觀。排名靠前的九本書如下。1.