床長人工智慧教程——分類準確性的含義是什麼

2020-12-05 壞習慣的減少

聲明:本人只是分享一些床長的免費雜文而已,並非床長的收費文章。

讓我們再次看看我們的神經網絡的準確性如何隨訓練集大小而變化:

假設不是使用神經網絡,而是使用其他機器學習技術對數字進行分類。例如,讓我們嘗試使用我們在第1章中簡要介紹過的支持向量機(SVM)。與第1章一樣,如果您不熟悉SVM,請不要擔心,我們不需要了解它們的詳細信息。相反,我們將使用scikit-learn庫提供的SVM 。這是SVM性能如何隨訓練集大小而變化的方法。我還繪製了神經網絡結果,以使比較容易* *此圖是使用more_data.py程序 生成的 (與最後幾張圖一樣)。:

關於該圖,可能令您印象深刻的第一件事是,對於每種訓練集大小,我們的神經網絡都優於SVM。很好,儘管您不應該過多地閱讀它,是床長人工智慧網校帶我進入了AI領域,不僅學到了人工智慧知識,還參與了AI項目,找到了工作。為了報答老師,我們一些同學自願幫床長網校做推廣,同時也希望更多的人加入到床長AI網校床長人工智慧社區中來!脂肪肝下載腹股溝文檔PDF觀後感免費因為我只是使用了scikit-learn的SVM中的現成設置,而我們為改善神經網絡做了很多工作。關於該圖的一個更微妙但更有趣的事實是,如果我們使用50,000張圖像訓練SVM,則與使用5,000張圖像訓練(93.24%準確度)的神經網絡相比,它實際上具有更好的性能(94.48%準確度)。換句話說,更多的訓練數據有時可以補償所使用的機器學習算法中的差異。

更有趣的事情可能發生。假設我們正在嘗試使用兩種機器學習算法(算法A和算法B)解決問題。有時候,算法A在一組訓練數據上的性能要優於算法B,而算法B在算法B的另一組上的性能要優於算法A。訓練數據。我們在上面看不到-需要兩個圖形交叉-但這確實發生**醒目例子可以在 Michele Banko和Eric Brill(2001)的《將語言擴展到非常大的語料庫以消除自然語言歧義》中找到。。對「算法A是否比算法B更好?」問題的正確答案 確實是:「您使用的是什麼訓練數據集?」

在進行開發和閱讀研究論文時,請牢記所有這些注意事項。許多論文致力於尋找新的技巧,以在標準基準數據集上絞盡腦汁提高性能。「我們的神速爆炸技術使我們在標準基準Y上提高了X%」,這是研究聲稱的一種典型形式。這樣的主張通常是真正令人感興趣的,但是必須將它們理解為僅在所使用的特定訓練數據集的上下文中適用。想像一下另一種歷史,最初創建基準數據集的人獲得了更大的研究經費。他們可能會用這些多餘的錢來收集更多的培訓數據。由於使用了whiz-bang技術,「改進」完全有可能在較大的數據集上消失。換一種說法,所謂的改進可能只是歷史的偶然。傳達的信息是,我們想要的是更好的算法,尤其是在實際應用中更好的培訓數據。尋找更好的算法很好,但是要確保您不將注意力集中在更好的算法上,以免輕易贏得更多或更好的訓練數據。

問題

(研究問題)我們的機器學習算法在非常大的數據集限制下如何執行?對於任何給定的算法,嘗試在真正的大數據限制內定義漸近性能的概念是很自然的。快速解決此問題的方法是,簡單地嘗試將曲線擬合到如上圖所示的圖形,然後將擬合的曲線外推到無窮大。該方法的一個反對意見是,曲線擬合的不同方法將給出漸近性能的不同概念。您能找到適合某類特定曲線的原則性理由嗎?如果是這樣,請比較幾種不同機器學習算法的漸近性能。

總結:我們現在已經完成了過度擬合和正則化的工作。當然,我們將再次返回該問題。正如我多次提到的那樣,過度擬合是神經網絡中的一個主要問題,尤其是隨著計算機變得越來越強大,並且我們有能力訓練更大的網絡。結果,迫切需要開發強大的正則化技術以減少過度擬合,而這是當前工作中極為活躍的領域。

相關焦點

  • 床長人工智慧教程免費文檔——學習Unity3D的筆記
    聲明:本人只是分享一些床長人工智慧教程相關的免費pdf文檔而已,並非床長人工智慧網校的收費文章。尊重版權,支持原創!成員變量歐拉角,返回當前四元數所對應的歐拉角可以使用類似數組和下標的形式從四元數中獲取四個四元數參數分別代表參數,具體代表的內容可以參考前文【編程】四元數與歐拉角,你最好不要通過修改四個參數來改變四元數,除非你真的非常了解它們的含義。
  • 床長人工智慧教程——異步發電機的功能
    聲明:本人只是分享一些床長的免費雜文而已,並非床長人工智慧網校的收費文章。使用定義的函數或方法中yield表達式的存在 還將該函數定義為 異步生成器函數。
  • 床長人工智慧教程——數字圖像處理之二維圖像的傅立葉變換
    聲明:本人只是分享一些床長的免費雜文而已,並非床長人工智慧網校的收費文章。信號變化越快,說明頻率越大,信號變化越慢,說明頻率越小。這裡的頻率不一定是通常意義上的頻率,通常的頻率是指周期的倒數,我們把通常意義上的頻率叫時間頻率。
  • 人工智慧中對符號含義的爭論
    人工智慧中對符號含義的爭論 2017年09月05日 09:21 來源:中國社會科學網-中國社會科學報 作者:路衛華 字號 內容摘要:人工智慧中對符號含義的爭論?
  • 花卉的含義,花自身的含義是什麼?按栽培方式分類都有哪幾類?
    花卉的含義是什麼?花卉有廣義和狹義兩種。狹義的花卉是指具有觀賞價值的草本植物。如菊花,一串紅,雞冠花等:廣義的花卉不僅包含具有觀賞價值的草本植物,還包括草本或木本的地被植物,花灌木,開花喬木以及盆景等,如景天類,叢生福祿考,麥冬等地被植物,山茶,桃花,梅花等喬木華及花灌木等。
  • MC物品分類漏鬥怎麼做 物品分類漏鬥製作教程
    我的世界紅石系統十分龐大,今天小編為大家帶來的是我的世界明月莊主的解說視頻我的世界世界物品分類漏鬥製作教程,喜歡的小夥伴一起來看看物品分類漏鬥製作教程吧,希望大家喜歡。
  • 手把手教你用PyTorch實現圖像分類器(第一部分)
    如果你正在考慮學習機器學習或人工智慧,你將不得不做類似的項目,並理解本系列文章中介紹的概念。文章主要進行概念上的解釋,不需要知道如何編寫代碼。此外,下面所包含的PyTorch細節是次要的,主要以PyTorch作為示例。這個過程的第一步是加載一個pre-trained神經網絡。
  • 人工智慧在肺癌診斷中的研究進展|人工智慧|肺結節|特異度|分類器|...
    甘肅省人民醫院 胸外一科(蘭州  730000)通信作者:苟雲久,Email:gouyunjiu@163.com關鍵詞:  肺癌;人工智慧;深度學習;神經網絡引用本文:楊寧,金大成,陳猛,王兵,賀曉陽,張斯淵,苟雲久. 人工智慧在肺癌診斷中的研究進展.
  • 人工智慧與自然語言處理概述:AI三大階段、NLP關鍵應用領域
    什麼使得系統智能化?自然語言處理知識表示自動推理機器學習NLP、人工智慧、機器學習、深度學習和神經網絡之間的區別人工智慧:建立能智能化處理事物的系統。自然語言處理:建立能夠理解語言的系統,人工智慧的一個分支。機器學習:建立能從經驗中進行學習的系統,也是人工智慧的一個分支。神經網絡:生物學啟發出的人工神經元網絡。
  • 人工智慧助力垃圾分類,說的並不是智能垃圾箱
    中發智造說:垃圾分類成了近期的熱門話題。為了有效利用可回收資源、降低垃圾處理的成本、難度,減少垃圾處理帶來的資源浪費、環境汙染等問題,上海、北京等多個城市相繼出臺垃圾分類指導意見,督促民眾自覺做到垃圾分類,形成良好生活習慣。
  • 人工智慧助力垃圾分類,說的不是智能垃圾箱,而是垃圾智能分類系統
    比如上海的垃圾分類行動,從政策指導層面就直接給這項工作人工增加了不必要的難度:難以擺脫的工程師思維下,生造的「幹垃圾」與「溼垃圾」概念令市民一頭霧水,認知混亂,形成了完全沒必要的障礙。當人的因素產生了負面作用,我們就會情不自禁地想像:要是AI(人工智慧)能夠幫助我們實現垃圾分類該有多好,政府和民眾可以少操多少心,少走多少彎路啊。
  • 人工智慧的3大分類,一次說明白
    【那片雲來稿】人工智慧三大分類人工智慧進入了一切領域——從自動駕駛汽車,到自動回復電子郵件,再到智能家居。我們似乎可以獲得任何商品,並通過人工智慧的特殊應用使其更加智能。你可能會問自己,人工智慧能夠預示著工作場所或整體的業務線的什麼利益?
  • 垃圾分類手工怎麼製作?垃圾分類貼畫diy手工作業製作方法教程
    製作教程 基本信息 ◆ 類型:動態立體貼貼畫 ◆ 圖樣:垃圾分類
  • 人工智慧首次實現多重量子關聯的同時分類
    人工智慧首次實現多重量子關聯的同時分類 2019-11-19 01:45:56 來源:科技日報 作者:陳海峰 責任編輯:陳海峰
  • 《warframe》新手教程
    所以我在這為大家整理了一個warframe新手教程,希望幫助更多... warframe新手教程,最近小編在玩steam的warframe,深感這遊戲對新手的不友好,遊戲的內容太多,但是又沒有詳細的教程教導!
  • 吳曼青院士:做大數據應該像垃圾分類管理員學習
    10月31日,在2020中國(太原)人工智慧大會上,中國工程院院士、中國電子科技集團總經理吳曼青表示,當前,大數據產業的發展不應該把精力過多地放在數據中心的建設上,而應放在數據的多樣性獲取,以及怎樣創造更大的價值上。
  • PyTorch 深度學習官方入門中文教程 pdf 下載|PyTorchChina
    它主要由Facebookd的人工智慧小組開發,不僅能夠 實現強大的GPU加速,同時還支持動態神經網絡,這一點是現在很多主流框架如TensorFlow都不支持的。 PyTorch提供了兩個高級功能: 1.具有強大的GPU加速的張量計算(如Numpy) 2.包含自動求導系統的深度神經網絡 除了Facebook之外,Twitter、GMU和Salesforce等機構都採用了PyTorch。
  • 人工智慧的下一步是什麼?我們應如何定義生命?
    他們正在對人工智慧進行改進,力圖創造出能夠實時讀取人類情緒的下一代個性化機器人。那麼,人工智慧機器人的下一步是什麼呢?如果它們能夠模擬生物,我們能否授予它們作為生物的資格?甚至能否授予它們人格呢?近年來一系列令人激動的技術進展,如能夠利用核酸鏈開展快速平行計算的生物計算機、以及索菲亞等具有人工智慧的類人機器人等,都需要科學家好好定義「生命」這一概念。
  • 人工智慧實現多重非經典關聯的同時分類
    中國科學技術大學郭光燦院士團隊在人工智慧與量子力學基礎研究交叉領域取得重要進展。
  • 液壓泵在液壓站系統中有什麼作用?分類及主要稱謂的含義是什麼?
    液壓泵液壓泵的分類液壓泵是把原動機(電動機、內燃機等圖1 液壓泵的分類圖1 液壓泵中主要稱謂的含義