誤區解讀:ML和DL之間的區別和使用情況

2020-11-26 IT168

  【IT168 資訊】深度學習是機器學習的一個子集,都是人工智慧的子集。機器學習與深度學習不完全屬於一個拳擊淘汰賽中,深度學習是機器學習的一個子集,而它們都是人工智慧(AI)的子集。但是,在機器學習和深度學習的定義和用例方面,市場上存在很多混淆,現在讓我們來澄清一下混淆。

  ·人工智慧(AI)是模擬和模仿計算機系統和機器中的智能人類行為的研究。

  ·機器學習是AI的一個子領域,它使用算法將AI概念應用到計算系統中。計算機識別並根據數據模式採取行動,隨著時間的推移學習提高其準確性,無需明確的編程機器學習背後的分析,如預測編碼、集群和視覺熱圖。

  ·深度學習是機器學習的一個子領域,是人工神經網絡的另一個名稱。深度學習計算機網絡模擬人類大腦感知、組織和從數據輸入的方式。撇開天網,深度學習今天依然是存在的。

  機器學習與深度學習

  通常人們對於機器學習與深度學習的想法可能會忽略一點,如前所述,深度學習是機器學習的一個子集。在這一點上,你更有可能在應用程式中使用機器學習,而不是深度學習,但它仍然是一個發展中的技術,而且部署起來很昂貴。現在有些產品已經上市了,隨著時間的推移,人們會發現深度學習將變得更加普遍。

  我們來看兩者之間的區別和使用情況。

  機器學習

  作為人工智慧的一個子集,機器學習使用算法來解析數據,從結果中學習,並運用學習來做出決定或預測。示例包括聚類、貝葉斯網絡和可視化數據映射。例如,在電子檔案資料查詢和合規性調查中,熱圖和視覺集群可以將圖形搜索結果呈現給人類,他們可以使用結果深入到其他模糊的數據中。

  機器學習技術分為兩類:監督機器學習和無監督機器學習。監督式學習取決於人為生成的種子集合,教導軟體如何定義數據。預測編碼就是一個很好的例子。該軟體指的是將數據模式匹配到相關度百分比的種子集。隨著時間的推移,預測編碼工具從持續進行的審閱反饋中學習。

  無監督機器學習取決於識別數據中包含的模式並將其與其他數據或搜索查詢進行比較。機器學習算法隨著數據集的增長和更多模式的出現而隨時間學習。無監督機器學習包括集群、概念搜索和接近重複數據刪除。

  例如,聚類匹配文檔之間相似的文本和元數據,並將數據呈現在可視化集群中。概念搜索通過識別和匹配概念來擴展基於文本的查詢。近似重複數據刪除比較類似的數據,並根據相似程度排除文檔,而電子郵件線程將孤立的電子郵件連結到相應的線程。這些分析中的每一個都從其行動中學習,以提高性能和準確性。

  機器學習基礎設施差異很大,單個系統可以實現有限的集群或網絡流量報告,而大型系統則包含數十臺伺服器和大規模並行處理(MPP)架構,用於跨多個數據源的海量數據。

  深度學習

  深度學習(也稱為人工神經網絡)基於所有機器學習算法。但是,它不使用數據分類等任務特定的算法。相反,它通過識別來自非結構化輸入的代表性數據,並輸出準確的行動和決定來模擬人類的大腦結構和功能。

  學習可以被監督或不受監督,這意味著大的神經網絡可以接受標記的輸入,但不需要它。學習程序教會神經網絡如何構建不同的處理層,當網絡處理輸入時,他們根據數據輸入和輸出創建自己的層。這種深度學習的水平允許神經網絡自動從原始數據中提取特徵而無需額外的人力輸入。

  神經網絡由多個簡單連接的處理器(稱為神經元)組成,這些神經元是為模仿人腦中的神經元而創建的數學函數。這些人造神經元組成了神經網絡的單元。

  簡單地說,每個神經元接收兩個或更多的輸入,處理它們,並輸出一個結果。一些神經元接收來自外部傳感器的輸入,而另一些神經元則被來自其他活動神經元的輸入激活。神經元可能激活額外的神經元,或者可能通過觸發動作影響外部環境。所有活動都是在自創的隱藏層中進行的,每個連續的圖層都會輸入前一層的輸出。

  實際上,神經網絡攝取非結構化數據:聲音、文本、視頻和圖像。網絡將數據分成數據塊並發送給單獨的神經元和層進行處理。一旦這個離散的處理完成,網絡產生最後的輸出層。

  大規模的可擴展性是神經網絡的關鍵。神經網絡的性能取決於它可以攝取、訓練和處理多少數據;數據越多意味著效果越好。這是另一個區別於更基本的機器學習,其算法通常在一定水平上平穩。深度學習只是通過其計算資源來限制其性能。因此,神經網絡的「深層」部分:計算資源越多,層次越深,產出越廣泛。儘管深度學習不是那麼快捷和容易,但更低的計算處理能力使研發工作發生了革命性的變化。

  機器學習和深度學習的常用用例

  重要的是要記住機器學習的用例已經在市場上了。深度學習的用例主要是現階段的發展目標,商業化程度有限。一些用例是相似的:區別在於神經網絡可以增長到接近無限的學習和輸出規模。機器學習更受約束,適合具體的實際計算任務。另外請記住,它們兩個不是相互排斥的。  

  展望機器學習和深度學習的未來

  你不會在每個街角都找到深度學習/人工神經網絡的身影。他們普遍需要大量的標記數據進行監督學習,或大量的非結構化數據進行無監督學習。深度學習技術開發人員需要花費大量的時間標記和向神經網絡輸入數據,或者需要輸入數以百萬計的非結構化對象來實現無監督學習。

  在今天的數據密集型世界中,擁有足夠的數據不是問題。標記足夠的數據,或將足夠的未標記數據引入神經網絡是一個挑戰。儘管處理能力不斷增加,價格也有所下降,但密集計算仍然需要對系統和支持進行大量的投資。

  儘管如此,深度學習在許多不同的業務垂直領域都有很好的用例。像谷歌和Facebook這樣的公司正在投入深度學習來開發這些實際的應用程式,而其他開發者也在跟風。

相關焦點

  • 侃侃急性腎損傷的診斷標準和誤區
    本文對AKI的診斷標準和潛在誤差進行了總結。AKI診斷標準AKI診斷主要基於血肌酐升高和/或尿量減少判斷。具體如下:◆ 48 h內血肌酐增加≥0.3 mg/dl (≥26.5 μmol/l);或◆ 7天內血肌酐增加,高於基線≥1.5倍;或◆ 尿量< 0.5 ml/kg/h,持續6 hAKI分期
  • PS、SOP和 ML之間的區別是什麼?
    SOP、PS、ML之間都有什麼區別呢?今天就由我們小編來為大家指點迷津吧!Personal Statement格式的詳解Personal Statement的中文名是「個人陳述」。它需要你以一個活生生的人的形象出現在一堆成績單和申請表文件的後面。PS需要你把自己想像成一個電視真人秀的參賽者,評委就是你想去的大學的招生委員們。
  • ML/DL重要基礎概念:偏差和方差
    我們可以將錯誤分為偏差(Bias)和方差(Variance)兩類。下面就來看看偏差和方差的定義、產生原因以及二者之間如何權衡。0x01 偏差和方差的定義 偏差和方差的定義如下:偏差(bias):偏差衡量了模型的預測值與實際值之間的偏離關係。例如某模型的準確度為96%,則說明是低偏差;反之,如果準確度只有70%,則說明是高偏差。
  • 呋塞米使用十大誤區
    此外,人們還擔心利尿劑的使用可能與有害影響有關,包括急性腎損傷(AKI)。這導致了臨床醫生對何時以及如何安全有效地在患有AKI和不患有AKI的危重病人中使用呋塞米的不確定性。在這裡,我們討論了關於呋塞米及其在危重病人中的應用的十個常見誤區(圖1)Myth #1 Frusemide causes AKI.No, it does not.
  • 評估腎功能,血肌酐、eGFR、ACR和BUN有何不同?
    評估腎功能,血肌酐、eGFR、ACR和BUN有何不同?評估腎功能有助於早期發現腎臟疾病,減緩或阻止病情惡化。那麼,臨床上常用的指標如血肌酐、估計腎小球濾過率、尿白蛋白肌酐比和血尿素氮之間都有什麼區別呢?一起來看看NKF官網是如何闡述的吧!
  • 英語中數詞加名詞使用八大誤區及其相關的正確引導
    英語中數詞加名詞使用八大誤區及其相關的正確引導英語中常見的詞性有:名詞,動詞,介詞,數詞,冠詞。而英語中就是圍繞這幾類詞進行相關語法的考察的。本次課程我們來講一下數詞和名詞搭配的使用語法,從常見的誤區下手進行相關引導,教你輕鬆避開學習誤區,輕鬆拿到高分!
  • 單模光模塊和多模光模塊之間的區別
    打開APP 單模光模塊和多模光模塊之間的區別 發表於 2018-05-03 10:36:00 今天,給大家介紹的是單模光模塊和多模光模塊,這兩者之間的區別是什麼。 首先,我們來了解一下: 什麼是光模塊?
  • 小蘇打和洗滌蘇打之間的區別
    人們對小蘇打和洗滌蘇打有很多困惑。即使這兩種化合物都是鈉鹽,並且它們都是天然存在的,有時使用一種化合物代替另一種化合物最終可能會產生不良結果。因此,在使用前了解小蘇打和洗滌蘇打之間的區別是很有用的。什麼是小蘇打?小蘇打是烘焙業必不可少的成分,在我們的廚房中非常常見。碳酸氫鈉是小蘇打的化學名稱,化學式為NaHCO 3。它是一種白色粉末,可在烘烤過程中充當膨鬆劑。
  • 刨根問底糾錯 看空調使用的誤區和常識
    家電產品的使用其實要比這些生活類的常識,更容易說出門道,但很多使用了多年,十幾,幾十年的朋友,對空調的使用誤區,並不熟知。例如空調加氟,是每年都必須加,還是一次都不用加?空調的清洗,是每個季度都清洗,還是完全不用去清洗?空調的噪音,是原來就這樣,還是沒有安裝合格所致?在這些問題面前,相信很多小夥伴都不知所措。
  • 商業智能和數據分析之間的區別
    商業智能如何與分析不同   乍一看,聽起來像數據分析和商業智能只是兩種說法相同的方式。兩者之間存在一些重要的差異。數據分析側重於找到業務發生的原因。為什麼去年銷量下降?這樣的問題可以通過查看公司現有數據然後使用該信息來做出有關未來發生情況的有根據的預測來回答。相比之下,BI又向前邁進了一步,研究了什麼,何時以及誰。作為BI一部分的工具和技術的深度允許更好地理解被檢查的項目並使其更容易查看信息。
  • 光電隔離器(光電耦合器)和固態繼電器之間的區別?
    光電隔離器和固態繼電器(如果有)有什麼區別?哪個是子類別?在速度和應用方面有什麼區別?大多數常見的固態繼電器都使用背靠背串聯MOSFET作為功率開關元件,從而可以處理交流電。為了獲得良好的驅動電壓到隔離柵,使用了一個光伏電池,這是一個很大的區別-耦合中的LED發光,並在光伏電池中產生數個伏特的DC,以強烈激活電晶體的溝道。MOSFET。
  • B肝兩對半定量和定性檢查的區別
    B肝兩對半定量檢查和定性檢查本身是比較容易區分的,不過最近依然有不少通過網絡諮詢的網友諮詢這兩者之間的區別,不清楚兩者檢查的意義,不明白什麼時候才是定性檢查、什麼時候才是定量檢查。藉此機會,我們就再次詳細的闡述一下B肝病毒標誌物的常規檢查方法和他們之間的區別和使用場景。
  • 解讀數據挖掘與數據科學之間鮮為人知的區別
    數據科學和數據挖掘在許多人看來很相似,因此必須了解它們之間的一些主要的區別。如今,數據科學家通常被認為是最有前途和最有利可圖的工作之一。美國勞工統計局預計,到2029年,美國對於數據科學家的市場需求將增加到37700人。
  • 休克:液體復甦的原則和層次|液體|患者|休克|反應性|-健康界
    2.臨床特徵、X線和CVP、超聲等不能用於確定有無液體反應性儘管上述指標能夠提示低灌注(比如下腔靜脈細小),但用其來確定容量狀態和液體反應性仍缺乏有力證據。使用CVP或補液後CVP的變化來預測容量反應性,其準確性猶如拋硬幣。臨床上還是推薦連續直接測量SV的變化,來明確容量反應性。
  • GitHub CEO霸氣回應:把youtube-dl還給開發者!
    但youtube-dl 的撤銷通知屬於一個更不尋常的類別: 反規避——RIAA指控該代碼旨在規避控制訪問或複製受版權保護材料的技術措施,違反了《千年數字版權法》(DMCA)第1201條。第1201條可以追溯到20世紀90年代末,並沒有預料到它對今天軟體使用的各種影響。
  • 商標和品牌之間有什麼關係和區別呢?
    摘要:很多人在打造品牌的時候,都會認為商標就是品牌,其實商標和品牌之間既有關係也有區別。在實踐中,商標和品牌的目的都是為了區別商品來源,便於消費者識別,但是品牌卻不完全等同於商標。下面我們就來看看商標和品牌之間的關係和區別都有哪些?
  • 學習分子和原子知識中的幾個誤區
    學習分子和原子知識中的幾個誤區分子和原子是兩種用肉眼看不見的微粒,但也是認識微觀世界的兩個重要概念。在學習時容易產生一些錯誤的認識,現舉例分析如下,以供參考。誤區1:物質都是由分子構成的解析:物質不全是由分子構成的。
  • 可燃氣體檢測儀有哪些使用誤區和注意事項
    打開APP 可燃氣體檢測儀有哪些使用誤區和注意事項 逸雲天電子 發表於 2021-01-07 14:14:13 可燃氣體檢測儀是我們工作時最常用到的儀器之一
  • 人類大腦認知六大迷思和誤區
    正因為如此,人們對大腦的認知仍存在種種誤區。10%的大腦一直以來,人們相信這樣的說法:我們只使用了大腦的10%。 科學家已經證明,我們絕不只僅使用10%的大腦容量,就連說話這樣最簡單的任務都需要使用10%以上的大腦。 這一誤區可能是源自心理學家威廉·詹姆斯(William James)1908年的經典著作《人的能量》(The Energies of Men)一書。
  • NMN和NADH之間的區別是什麼?
    NMN和NADH之間的區別是什麼?很多了解這塊保健食品的人對這兩個產品的功效與作用都稍微知道一些。它們本身的功效或者說最大的功效就是提升NAD+抗衰老,小編也聽晚上和一些人說其實二者是存在一些區別的,更有人說NADH比NMN對於提高人體機能抗衰老效果更顯著。