非線性回歸模型--多項式回歸

2021-03-02 醫數思維雲課堂


作者丨丹丹

來源丨醫數思維雲課堂(ID:Datamedi)   

 

在許多實際問題分析中,回歸分析的應用十分廣泛,它是處理變量之間相關關係最常用的一種統計方法。回歸分析可分為線性回歸和非線性回歸

線性回歸分析相信大家都已經非常熟悉了,它主要分析有線性回歸趨勢的兩個變量間的關係

但是在處理許多實際問題時,變量間的關係並非直線關係,例如細菌生長曲線、藥物動力學、毒物劑量與動物死亡率的關係等等。此時,若採用線性回歸分析將丟失大量信息,甚至得出錯誤結論。因此,就需要我們採用非線性回歸模型來處理此類問題。

非線性回歸有多種形式,包括雙曲線、二次曲線、三次曲線、冪函數曲線、指數函數曲線、S形曲線、對數曲線、指數曲線等。非線性回歸分析的關鍵是確定函數的具體形式。通常需要根據科學研究或生產實際中的具體問題或試驗數據的特徵做出合適的選擇。

下面小編將向大家介紹如何用R軟體實現非線性回歸中的多項式回歸

實例:某種合金中的主要成分為元素A和B,試驗發現這兩種元素之和x與合金膨脹係數y之間有一定的數量關係。試根據表給出的試驗數據找出y與x之間的回歸關係。

多項式回歸分析的步驟

①確定變量間的關係函數

當變量間的關係函數為多項式方程時,可進行多項式回歸分析。

多項式方程是指若在一次方程中引入x的二次、三次,甚至是更高次項,直線方程就成為一般多項式方程,如為某曲線型數據擬合多項式函數:

②根據試驗數據,畫出散點圖,觀察兩者之間的關係。

#輸入數據

x<-c(37.0,37.5,38.0,38.5,39.0,39.5,40.0,40.5,41.0,41.5,42.0,42.5,43.0)

y<-c(3.40,3.00,3.00,2.27,2.10,1.83,1.53,1.70,1.80,1.90,2.35,2.54,2.90)

alloy.data<-data.frame(x,y)#將數據形成數據框

plot(y~x,data = alloy.data)#畫散點圖

從散點圖中可以看出,圖中的點連成的曲線是一個二次函數,y與x之間可用二次多項式來描述:

該二次多項式的係數可以採用偏最小二乘法來計算。我們可以使用R語言中的lm( )函數來計算二次多項式的係數並建立回歸模型。使用anova( )函數進行回歸模型的方差分析。

alloy.model<-lm(y~x+I(x^2),data = alloy.data)

summary(alloy.model)

anova(alloy.model)

從模型的輸出結果中可以看出,二次多項式回歸方程為:

從回歸模型的方差分析結果可以看出,x的一次項和二次項對y都有顯著性

今天大家和小編一起學習如何使用R語言實現多項式回歸分析,下一期我們繼續學習非線性回歸模型中的多元非線性回歸分析,期待大家與小編共同進步!!!

想要了解更多,可以點擊閱讀全文哦。怎麼樣?是不是挺簡單的,希望大家多多練習。如果你有關於回歸分析方面的問題,可以及時聯繫小編,小編一定不遺餘力喲,期待我們的再次相約。

往期推薦

點擊圖片直達原文

關注醫數思維雲課堂——醫數思維雲課堂(ID:Datamedi),每周四20:00準時更新課程,陪60萬醫學生共同成長,轉載請聯繫我們授權。

覺得「好看」,請點這裡↓↓↓

相關焦點

  • 機器學習 | 多項式回歸處理非線性問題
    慶幸地是除了更換更加複雜的非線性模型外,仍可以使用線性回歸方法來擬合非線性數據,只不過在此之前,需要對輸入數據進行處理。多項式回歸是一種通過增加自變量上的次數,而將數據映射到高維空間的方法,從而提高模型擬合複雜數據的效果。
  • 多項式回歸
    例如, 不能用變量代換的方法將其轉換為可按線性模型方式分析的模型, 需要使用多項式回歸分析方法, 令
  • 建立非線性回歸預測模型,來看R教程!
    但是,建立線性回歸模型有很多前提條件(可以參考:SPSS操作:簡單線性回歸(史上最詳盡的手把手教程))。由於實際的臨床研究中,變量之間關係複雜,因變量和自變量之間並非呈現線性關係,如果強行建立線性回歸模型,就會影響模型的預測準確性。對於此類數據,應該如何處理呢?之前醫咖會發布過的《R語言課程》,王九誼老師在「多項式回歸、分段回歸、限制性立方樣條...」視頻課程中已做了詳細介紹。
  • 邏輯回歸的決策邊界及多項式
    0x02 邏輯回歸的非線性決策邊界 2.1 線性回歸轉換成多項式回歸對於線性這條藍色的直線可以比較完美地將數據分成兩類。但是直線的分類方式,太簡單了。這就從線性回歸轉換成多項式回歸,同理為邏輯回歸添加多項式項,就可以對非線性的方式進行比較好的分類,決策邊界就是曲線的形狀。
  • R與生物專題 | 第四十四講 R-非線性回歸
    在「R與生物統計專題」中,我們會從介紹R的基本知識展開到生物統計原理及其在R中的實現。
  • R語言多項式回歸
    含有x和y這兩個變量的線性回歸是所有回歸分析中最常見的一種;而且,在描述它們關係的時候,也是最有效、最容易假設的一種模型。
  • R語言中的多項式回歸、局部回歸、核平滑和平滑樣條回歸模型
    原文連結:http://tecdat.cn/?
  • SPSS分析技術:非線性回歸;非線性回歸與曲線直線化有哪些異同點及優劣勢?
    本文介紹的非線性回歸就是針對以上更為複雜的問題而提出的一個通用的模型框架,它採用迭代方法對用戶設置的各種複雜曲線模型進行擬合,同時將殘差的定義從最小二乘法向外大大擴展(例如最小一乘法等方法)為用戶提供了極為強大的分析能力。曲線直線化和非線性回歸因變量和自變量是非線性關係時,可以通過曲線直線化和非線性回歸對它們之間的關係進行擬合。
  • 人工智慧機器學習三大類之回歸模型(RM)
    回歸模型: 回歸模型(Regression Model)對統計關係進行定量描述的一種數學模型。它是一種預測性的建模技術,研究的是因變量(目標)和自變量(預測器)之間的關係。這種技術通常用於預測分析,時間序列模型以及發現變量之間的因果關係。 回歸分析: 回歸模型重要的基礎或者方法就是回歸分析。
  • 【乾貨】機器學習中的五種回歸模型及其優缺點
    回歸是用於建模和分析變量之間關係的一種技術,常用來處理預測問題。博文介紹了常見的五種回歸算法和各自的特點,其中不僅包括常見的線性回歸和多項式回歸,而且還介紹了能用於高維度和多重共線性的情況的Ridge回歸、Lasso回歸、ElasticNet回歸,了解它們各自的優缺點能幫助我們在實際應用中選擇合適的方法。
  • (案例)線性/非線性回歸分析Matlab算例
    [b,bint,r,rint,stats]=regress(y',X,0.05); fprintf('一元線性回歸模型參數為:\n')bfprintf('回歸模型擬合度係數R2為:\n')R2=stats(1)fprintf('回歸模型顯著性檢驗F統計量為:\n')F=stats(2)fprintf('回歸模型顯著性檢驗P值為:\n')PVAL=stats(3)fprintf('回歸模型在置信度區間下殘差分布圖為
  • 非線性回歸
    在數據科學中,回歸是最基礎的計算。通俗來講,回歸就是找出一堆數據之間的函數關係。線性回歸是最簡單的回歸,很容易利用最小二乘法解決。非線性回歸也可以使用最小二乘法去處理,然而如果數據之間看不到明顯的函數關係,最小二乘法利用起來就比較麻煩,比如下面的數據點就很難找到一個合適的數學函數進行擬合。
  • R語言中的多項式回歸、B樣條曲線(B-spline Curves)回歸
    p=18129 在線性模型的文章中,我們已經了解了如何在給出協變量x的向量時構造線性模型。但更一般而言,我們可以考慮協變量的變換,來使用線性模型。我們首先討論多項式回歸,進一步,我們會想到分段線性或分段多項式函數,可能還有附加的連續性約束,這些是樣條曲線回歸的基礎。
  • 常見的10個回歸分析模型算法,果斷收藏
    回歸分析的分類:按照自變量的多少分為:一元回歸分析和多元回歸分析;按照因變量的多少分為:簡單回歸分析和多重回歸分析;按照自變量和因變量之間的相關關係不同分為:線性回歸分析和非線性回歸分析。而回歸算法正是基於上述三種度量,利用技術建立的一種模型。
  • 七種常用回歸技術,如何正確選擇回歸模型?
    本文解釋了回歸分析的內涵及其優勢,重點總結了應該掌握的線性回歸、邏輯回歸、多項式回歸、逐步回歸、嶺回歸、套索回歸、ElasticNet回歸等七種最常用的回歸技術及其關鍵要素,最後介紹了選擇正確的回歸模型的關鍵因素。什麼是回歸分析?回歸分析是一種預測性的建模技術,它研究的是因變量(目標)和自變量(預測器)之間的關係。
  • 案例:用SPSS做一個簡單的非線性回歸
    當我們的非線性模型更加複雜,比如要考慮更多因素,常見模型解決不了問題,那麼可能就需要繼續學習和使用非線性回歸方法,SPSS也提供了強大的【非線性】回歸菜單。鑑於非線性回歸異常複雜和很難學,今天小兵選一個小入口,以考察一個因素為例,簡要演示SPSS非線性回歸過程。
  • 機器學習——多項式回歸和正規方程
    一、多項式回歸房價預測中:有兩個特徵,frontage和depth,即臨街長度和房子的寬度。線性回歸併不適用於所有數據,有時我們需要曲線來適應我們的數據,比如一個二次方模型或者三次方模型。通常我們需要先觀察數據然後再決定準備嘗試怎樣的模型。 另外,我們可以令:X2 = X2^3 , X3 = X3^3,從而將模型轉化為線性回歸模型。
  • [PRML]線性回歸模型--線性基函數模型
    這通常稱為線性回歸(linear regression)。因此,通過輸入變量的固定的非線性函數的組合來擴展這個模型的類:其中多項式回歸就是這個模型的一個特例,基函數是多項式基函數的一個限制是他們是輸入變量的全局函數,所以輸入空間的一個區域變化會影響其他區域。這個可以通過將輸入空間劃分成不同的區域並在每個區域擬合一個不同的多項式來解決,這會導致樣條函數(spline functions)。
  • python機器學習--線性回歸
    python機器學習--線性回歸線性回歸是最簡單的機器學習模型,其形式簡單,易於實現,同時也是很多機器學習模型的基礎。對於一個給定的訓練集數據,線性回歸的目的就是找到一個與這些數據最吻合的線性函數。針對線性回歸算法在之前的數模案例也有涉及喔,歡迎去看看上一篇博客數學建模預測模型實例--大學生體測數據模型在這裡插入圖片描述OLS線性回歸Ordinary Least Squares 最小二乘法一般情況下,線性回歸假設模型為下,其中w為模型參數
  • spss 非線性回歸 - CSDN
    各位SPSS學堂粉絲大家好,上次我們簡要給大家梳理了一篇有關非線性關係的文章,現在我們就關於此模型的數據如何用SPSS操作和結果分析進行詳細介紹,前面的描述性統計與相關分析等我們之前的文章中都有提到,這裡我們就不再示範,我們直接給大家示範假設檢驗部分的數據分析。