人工智慧機器學習三大類之回歸模型(RM)

2020-12-20 電子發燒友

人工智慧機器學習三大類之回歸模型(RM)

工程師1 發表於 2018-07-13 01:39:00

人工智慧之機器學習主要有三大類:1)分類;2)回歸;3)聚類。今天我們重點探討一下回歸模型(RM)。

回歸不是單一的有監督學習技術,而是許多技術所屬的整個類別。回歸的目的是預測數值型的目標值,如預測商品價格、未來幾天的PM2.5等。最直接的辦法是依據輸入寫出一個目標值的計算公式,該公式就是所謂的回歸方程(regressionequation)。求回歸方程中的回歸係數的過程就是回歸。回歸是對真實值的一種逼近預測。回歸是統計學中最有力的算法之一。

回歸概念:

回歸是一個數學術語,指研究一組隨機變量(Y1,Y2 ,…,Yi)和另一組(X1,X2,…,Xk)變量之間關係的統計分析方法,又稱多重回歸分析。其中, X1、X2,…,Xk是自變量,Y1,Y2,…,Yi是因變量。

回歸模型:

回歸模型(Regression Model)對統計關係進行定量描述的一種數學模型。它是一種預測性的建模技術,研究的是因變量(目標)和自變量(預測器)之間的關係。這種技術通常用於預測分析,時間序列模型以及發現變量之間的因果關係。

回歸分析:

回歸模型重要的基礎或者方法就是回歸分析。回歸分析是研究一個變量(被解釋變量)關於另一個(些)變量(解釋變量)的具體依賴關係的計算方法和理論,是建模和分析數據的重要工具。回歸分析是用已知樣本對未知公式參數的估計,給出一個點集D,用一個函數去擬合這個點集,並且使得點集與擬合函數間的誤差最小。

回歸分類:

在統計學中,回歸分析(regression analysis)指的是確定兩種或兩種以上變量間相互依賴的定量關係的一種統計分析方法。回歸分析按照涉及的變量多少,分為一元回歸和多元回歸分析;按照因變量的多少,可分為簡單回歸分析和多重回歸分析;按照自變量和因變量之間的關係類型,可分為線性回歸分析和非線性回歸分析。

常見的回歸種類有:線性回歸、曲線回歸、邏輯回歸等。

線性回歸:

如果擬合函數為參數未知的線性函數,即因變量和自變量為線性關係時,則稱為線性回歸。

通過大量訓練,得到一個與數據擬合效果最好的模型,可利用一些算法(比如最小二乘法、梯度下降法等)和工具(SPSS)來更快更好的訓練出適用的線性回歸模型。實質是求解出每個特徵自變量的權值θ。

在訓練過程中,特徵選擇,擬合優化等都需要考慮。

最終目標是確定每個權值(參數)θ或者通過算法逼近真實的權值(參數)θ。

需要注意的是,線性回歸不是指樣本的線性,樣本可以是非線性的,而是指對參數θ的線性。

線性回歸問題:可能會出現欠擬合、非滿秩矩陣問題等。

解決方法:解決欠擬合問題,可採用局部加權線性回歸LWLR(Locally Weighted Linear Regression)。解決非滿秩矩陣問題,可使用嶺回歸RR(ridge regression)、Lasso法、前向逐步回歸等。

算法優點:

1)最可解釋的機器學習算法之一,理解與解釋都十分直觀;

2)易於使用,因為需要最小的調諧;

3)運行快,效率高;

4)最廣泛使用的機器學習技術。

非線性回歸:

如果擬合函數為參數未知的非線性函數,則稱為非線性或曲線回歸。非線性函數的求解一般可分為將非線性變換成線性和不能變換成線性兩大類。

1) 變換成線性:處理非線性回歸的基本方法。通過變量變換,將非線性回歸化為線性回歸,然後用線性回歸方法處理。一般採用線性迭代法、分段回歸法、迭代最小二乘法等。

2)不能變換成線性:基於回歸問題的最小二乘法,在求誤差平方和最小的極值問題上,應用了最優化方法中對無約束極值問題的一種數學解法——單純形法。該算法比較簡單,收斂效果和收斂速度都比較理想。

常見的非線性回歸模型:1)雙曲線模型;2)冪函數模型;3)指數函數模型;4)對數函數模型;5)多項式模型。

打開APP閱讀更多精彩內容

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容圖片侵權或者其他問題,請聯繫本站作侵刪。 侵權投訴

相關焦點

  • 081 | 人工智慧 | 第一個機器學習程序
    spm=1001.2014.3001.5501人工智慧–> 機器學習 --> 深度學習人工智慧是指一種能夠讓機器像人類一樣思考的技術.機器學習是實現人工智慧的途徑之一, 就是用大量數據, 計算出一個模型, 然後利用模型, 對未知數據進行預判.深度學習則是機器學習的領域之一, 主要是指基於圖形建模,預判
  • 人工智慧、機器學習、深度學習三者之間的關係
    機器學習是研究機器怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的性能。只有讓計算機系統具有類似人的學習能力,才有可能實現人類智能水平的人工智慧系統。因此,機器學習在人工智慧中起著舉足輕重的作用,機器學習是人工智慧研究的核心問題之一,是當前人工智慧理論研究和實際應用的非常活躍的研究領域。深度學習則是機器學習的一個分支。
  • AI學習筆記:人工智慧與機器學習概述 - 計算機java編程
    機器學習:機器學習是指從一系列的原始數據中找到規律,提取人們可以識別的特徵,然後通過學習這些特徵,最終產生一個模型。流程:原始數據-->特徵提取-->模型。機器學習偏向於算法。比如可以參與到人不可觸及、高危的場景舉例:生物識別的通用流程1.5 人工智慧模型分類人工智慧的核心是機器學習,機器學習的核心是算法。常見的算法可以分為兩大陣營:1、傳統的機器學習算法:主要解決一些簡單的應用場景以及結構化的數據。
  • 人工智慧及機器學習與深度學習揭秘
    深度學習、機器學習、人工智慧,這些代表著未來技術的流行語。在本文中,我們將通過一些真實案例討論機器學習和高階的深度學習。在21世紀技術官社區未來的文章中,我們會持續探討垂直行業人工智慧的應用。當然,本文的目的並不是讓你成為數據科學家,而是讓你更好的理解用機器學習都做什麼。
  • 【乾貨】機器學習中的五種回歸模型及其優缺點
    【導讀】近日,機器學習工程師 George Seif 撰寫了一篇探討回歸模型的不同方法以及其優缺點。
  • 一篇文章讀懂:人工智慧、機器學習和深度學習的區別
    弱人工智慧有希望取得突破,是如何實現的,「智能」又從何而來呢?這主要歸功於一種實現人工智慧的方法——機器學習。 機器學習:一種實現人工智慧的方法 機器學習最基本的做法,是使用算法來解析數據、從中學習,然後對真實世界中的事件做出決策和預測。
  • 十個人工智慧的機器學習面試問題和答案
    根據最新行業報告的調查結果,機器學習,人工智慧和數據科學等新興技術的工作在新興工作中名列前茅。機器學習,人工智慧或數據科學等新興技術的職業生涯可以獲得高額利潤,也可以獲得智力刺激。在本文中,我編寫了一些最常見的機器學習面試問題及其相應的答案。
  • 深入廣義線性模型:分類和回歸
    雖然關於該類問題的介紹文章已經很多,但是本文詳細介紹了幾種回歸和分類方法的推導過程,內容涉及:線性回歸、最大似然估計、MAP、泊松回歸、Logistic回歸、交叉熵損失函數、多項Logistic回歸等,基本上涵蓋了線性模型中的主要方法和問題,非常適合新手入門線性模型。專知內容組編輯整理。
  • 機器喵大作戰 | 解剖人工智慧、機器學習和深度學習
    比如,機器並不能學習並識別貓的模型,但是可從海量的貓圖片中,發現黑貓白貓兩大類,然後把他們分類。這,就是「無監督學習」。▌強化學習在機器學習中,還有一種方法,叫做強化學習,俗稱:打一巴掌,給個甜棗。整個過程,很像訓練馬戲團的猴子,久而久之,機器對這類事物的判斷就會越來越趨向正確的方向。通過獎懲來進行強化,這就是「強化學習」。▌深度學習接下來,輪到了機器學習領域最重要的方法:深度學習。
  • 「3步套路」快速掌握機器學習算法和模型 | 極客時間
    我們簡要回顧了機器學習中兩大類問題的定義。在學習這兩大類模型和算法的時候,有這麼一個技巧,就是要不斷地回歸到上面提到的基本思路上去,就是這個「三步套路」,反覆用這三個方面來審視當前的模型。另外,我們也可以慢慢地體會到,任何新的模型或者算法的誕生,往往都是基於舊有的模型算法,在以上三個方面中的某一個或幾個方向有所創新。
  • 盤點機器學習和統計模型的差異
    考慮到機器學習和統計模型解決問題的相似性,兩者的區別似乎僅僅在於數據量和模型建立者的不同。這裡有一張覆蓋機器學習和統計模型的數據科學維恩圖。所屬的學派產生時間基於的假設處理數據的類型操作和對象的術語使用的技術預測效果和人力投入以上提到的方面都能從每種程度上區分機器學習和統計模型,但並不能給出機器學習和統計模型的明確界限。分屬不同的學派機器學習:計算機科學和人工智慧的一個分支,通過數據學習構建分析系統,不依賴明確的構建規則。
  • 小白也看得懂的機器學習模型工作原理
    給幼兒園的小朋友講清楚機器學習可能有點誇張,實際上這一問題的要求就是,儘可能簡單地解釋某一技術。這就是筆者在本文中嘗試做到的事。筆者將解釋什麼是機器學習以及不同類型的機器學習,再介紹常見的模型。本文裡,筆者不會介紹任何數學運算,小白請放心食用。
  • 入門機器學習之線性回歸
    下面列出了一些最常用的逐步回歸方法:標準逐步回歸法做兩件事情。即增加和刪除每個步驟所需的預測。向前選擇法從模型中最顯著的預測開始,然後為每一步添加變量。向後剔除法與模型的所有預測同時開始,然後在每一步消除最小顯著性的變量。這種建模技術的目的是使用最少的預測變量數來最大化預測能力。這也是處理高維數據集的方法之一。
  • 比Keras更好用的機器學習「模型包」:0代碼上手做模型
    做機器學習模型時,只是融合各種算法,就已經用光了腦細胞?又或者覺得,數據預處理就是在「浪費時間」?一位畢業於哥廷根大學、做機器學習的小哥也發現了這個問題:原本只是想設計個模型,結果「實現比設計還麻煩」。
  • 機器學習和人工智慧的重要趨勢
    Somasegar, Daniel Li   翻譯:王益軍  審校:心  連結:techcrunch時至今日,你很難不跟技術主管或開發人員今天討論人工智慧、機器學習、機器人。Madrona最近主持了一個關於機器學習和人工智慧的會議,該會議匯集了智能應用程式中一些最大的技術公司和的創業公司。通過對此次活動參與者的調查,我們得出一個關鍵主題。
  • 人工智慧、機器學習、深度學習之間究竟是什麼關係
    人工智慧時代已經到來。超多維所布局的智能計算視覺技術體系,對人工智慧領域聚焦於視覺層面的改變和顛覆。隨著人工智慧熱度的不斷提升,人工智慧、機器學習和深度學習頻頻被提及。今天我們就從行業內的主流觀點出發,淺析一下三者的區別與聯繫。人工智慧是研究、開發用於模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學。
  • 比Keras更好用的機器學習「模型包」:無需預處理,0代碼上手做模型
    原標題:比Keras更好用的機器學習「模型包」:無需預處理,0代碼上手做模型蕭簫發自凹非寺量子位報導|公眾號QbitAI做機器學習模型時,只是融合各種算法,就已經用光了腦細胞?但就目前的功能來說,已經足夠進行基本的機器學習建模了。「讓機器學習生產變得自動化」作者建立這個項目的初衷,是希望為所有人提供機器學習模型。無論是技術向工程師、還是非技術向的其他行業用戶,都能使用機器模型讓自己的工作更簡單。說白了,就是將機器學習變成一個「自動化」的過程,而他也這麼設計了。
  • 【專欄】機器學習模型之回歸、分類模型的評估
    n為樣本數量,p為特徵數量消除了樣本數量和特徵數量的影響(五)交叉驗證(Cross-Validation)交叉驗證,有的時候也稱作循環估計(Rotation Estimation在給定的建模樣本中,拿出大部分樣本進行建模型,留小部分樣本用剛建立的模型進行預報,並求這小部分樣本的預報誤差,記錄它們的平方加和。這個過程一直進行,直到所有的樣本都被預報了一次而且僅被預報一次。把每個樣本的預報誤差平方加和,稱為PRESS(predicted Error Sum of Squares)。
  • 如何使用JavaScript構建機器學習模型
    作者:Abhishek Soni參與:李澤南目前,機器學習領域建模的主要語言是 Python 和 R,前不久騰訊推出的機器學習框架 Angel 則支持 Java 和 Scala。本文作者 Abhishek Soni 則用行動告訴我們,開發機器學習模型,JavaScript 也可以。JavaScript?我不是應該使用 Python 嗎?
  • 教程 | 如何使用JavaScript構建機器學習模型
    那麼,讓我們看看 Javascript 在機器學習上能夠做什麼吧。根據人工智慧先驅 Arthur Samuel 的說法,機器學習為計算機提供了無需明確編程的學習能力。換句話說,它使得計算機能夠自我學習並執行正確的指令,無需人類提供全部指導。谷歌已經把自己移動優先的策略轉換到人工智慧優先很久了。