R語言數據分析(二)回歸分析(4)

2020-11-21 謙謙無咎由

多元線性回歸例題

例:某品種水稻糙米含鎘量y(mg/kg)與地上部生物量x1(10g/盆)及土壤含鎘量x2(100mg/kg)的8組觀測值如表2.1。試建立多元線性回歸模型。

x1=c(1.37,11.34,9.67,0.76,17.67,15.91,15.74,5.41)

x2=c(9.08,1.89,3.06,10.2,0.05,0.73,1.03,6.25)

y=c(4.93,1.86,2.33,5.78,0.06,0.43,0.87,3.86)

由表可知,其Fvalue=392.5, Pr>F的值3.186e-06,遠小於0.01,故拒絕原假設,認為y1與x1,x2之間具有顯著性的線性關係;

由方差分析表可知,對自變量x2檢驗F值為F=4.4792,Pr>|t|的值=0.0879,大於0.05,說明x2的係數沒有通過檢驗。

對常數檢驗t值為t=3.764,Pr>|t|的值0.0131, 小於0.05,說明截距項通過檢驗,估計值為3.61051,

許多實際問題中可能還會出現某幾個變量的係數並沒有通過檢驗,此時,可以在原程序中的modely1=x1-x2中去掉沒用通過的變量,直到所有的係數均通過檢驗。或者使用逐步回歸方法,讓軟體自動保留通過檢驗的變量。

多元回歸:非線性

建立多元非線性回歸方程在科學研究中應用廣泛,其重要方法是將非線性回歸方程轉化為線性回歸方程。轉化時應首先選擇適合的非線性回歸形式,並將其線性化。再確定線性化回歸方程的係數,最後確定非線性回歸方程中未知的係數或參數。

實例:湖北省油菜投入與產出的統計分析

1.投入指標

(1)土地(S)。土地用播種面積來表示。農作物播種面積是指當年從事農業

(2)勞動(L)。勞動用勞動用工數(成年勞動力一人勞動一天為一個工)來表示。勞動用工中包含著直接和間接生產用工。

(3)資本(K)。資本用物質費用來表示。物質費用包含直接費用和間接費用。主要有種子秧苗費、農家肥費、化肥費、農藥費、畜力、固定資產折舊費和管理及其他費用等。

2.產出指標

產出指標用湖北省歷年油菜生產的總產量(Y)來表示。

使用R語言

整個模型是顯著的,說明y與自變量有線性關係;但是變量t 的顯著性概率為0.9466,遠大於0.05,因此將model y1=x1 x2 x3 t改為 model y1=x1 x2 x3 ;

截距項Intercept 的顯著性概率為0.6117,大於0.05,因此將model y1=x1 x2 x3 改為model y1=x1 x2 x3 /noint;

要善於解釋經濟含義、本模型雖然滿足數學規則,但不能通過經濟檢驗。助於如何繼續修正模型,需要學習數學與經濟的交叉學科《計量經濟學》。

相關焦點

  • R語言從入門到精通:Day12--R語言統計--回歸分析
    回歸作為一個廣義的概念,涵蓋了許多變種,R語言中也為其提供了強大而豐富的函數和選項(但顯然選項越多,對初學者越不友好),早在2005年,R中就有200多種關於回歸分析的函數 (https://cran.r-project.org/doc/contrib/Ricci-refcard-regression.pdf,這個文檔提供了部分回歸分析函數列表,供大家參考)。
  • R 語言之數據分析「Resampling」
    本節主要總結「數據分析」的「Resampling」重抽樣思想,並通過 R 語言實現。有一種東西叫作「傳統」,它在很多時候很有用,但會讓你思維固化,在新的環境下讓你出錯。在總結回歸分析和方差分析的時候 ④R語言之數據分析「初章」,我總是會在模型的建立之前提到「統計假設」,在模型建立之後進行「假設檢驗」,原因想必大家都能理解,就是因為這些「統計假設」是我們模型建立思想的基礎,是支撐我們模型正確性的「必要條件」。但是,不可否認的是,這些「必要條件」最終會成為我們「數據分析」的局限,讓我們對「不滿足條件的數據集」束手無策。
  • 多元逐步回歸分析r方結果解釋_r語言多元回歸篩選變量逐步回歸分析...
    Minitab Express 1.5 for Mac 是一個強大的數據分析軟體,可以運行在Mac系統上軟體可以激活永久使用,支持語言英文;Minitab Express專為教學和學習介紹性統計而設計,包括概率分布
  • 用R進行Lasso regression回歸分析
    glmnet是由史丹福大學的統計學家們開發的一款R包,用於在傳統的廣義線性回歸模型的基礎上添加正則項,以有效解決過擬合的問題,支持線性回歸,邏輯回歸,泊松回歸,cox回歸等多種回歸模型,連結如下https://cran.r-project.org/web/packages/glmnet/index.html對於正則化,提供了以下3種正則化的方式
  • 【獨家】手把手教線性回歸分析(附R語言實例)
    如果被限制只能選擇單一的分析方法,那麼回歸方法將是一個不錯的選擇。本文只關注最基本的回歸模型,即那些使用直線回歸的模型,這叫做線性回歸(linearregression)。我們可以取這個誤差的平方(或者我們也可以取它的絕對值),然後我們把每個點的誤差項相加起來,然後得到直線和這個數據集的總誤差。在同一個實驗的不同的樣例集合中,我們會得到一個不同的數據集,很有可能一條不同的直線,並且幾乎可以肯定一個不同的總誤差。我們所用的誤差的平方值是一個非常常用的總誤差形式,它就是「方差」。它用同樣的方式來處理正值的誤差和負值的誤差,所以方差總是正值的。
  • r語言 多元回歸模型_r語言多元回歸模型殘差分析 - CSDN
    1.2估計的多元回歸方程回歸方程中的參數是未知的,正是我們感興趣的值。因此,當用樣本數據計算出來的來去估計未知參數時,就得到了估計的多元回歸方程,其一般形式為:式中,是參數的估計值,表示當不變時,每變動一個單位,y的平均變動量。其餘偏回歸係數含義類似。
  • R語言做主成分分析實例
    在做多樣本的RNA-Seq數據中經常會用到主成分分析(PCA)來分析,那麼什麼是PCA呢,這個可以百度一下,大概意思如下:主成分分析法是數據挖掘中常用的一種降維算法
  • 獨家 | 手把手教你用R語言做回歸後的殘差分析(附代碼)
    本文介紹了做殘差分析的方法及其重要性,以及利用R語言實現殘差分析。在這篇文章中,我們通過探索殘差分析和用R可視化結果,深入研究了R語言。殘差本質上是當一個給定的模型(在文中是線性回歸)不完全符合給定的觀測值時留下的gap。醫學中的病理學發現的殘留分析是一個形象的比喻。人們通常用代謝殘留水平來作為衡量藥物吸收的指標。
  • 16種常用的數據分析方法-回歸分析
    4、其他回歸方法 非線性回歸、有序回歸、Probit回歸、加權回歸等 之所以有不同類型的回歸分析,是由於原始分析數據X、Y變量的數據類型不同,不同類型的數據在進行回歸分析時,要採用合適的回歸分析類型。
  • 市場調研中的相關分析與回歸分析(2)
    (一)相關分析(2)   2.復相關與偏相關   引入更多的因素變量是我們減少判斷偏差提高準確度的方法之一,這就涉及到復相關和偏相關。為了方便後面的說明,這裡我們先簡單引入一下回歸分析,藉助回歸方程來解釋復相關係數和偏相關係數。
  • r語言一元回歸模型專題及常見問題 - CSDN
    一元線性回歸分析首先介紹回歸分析中最基礎的情況:一元線性回歸分析。它規定模型f函數只能是y=k*x+b的形式,即只使用一個變量x(故稱為一元)的線性形式來預測目標變量y。6.1.1引例利用某網站歷次促銷活動中促銷讓利費用和銷售金額的數據(單位是十萬元),將使用該數據集來說明線性回歸分析的應用。
  • 【R語言】相關性分析、相關係數的顯著性檢驗及可視化
    本篇文章介紹基於R語言的相關性分析、相關係數的顯著性檢驗及可視化,該教程為個人筆記,大家也可參考學習,不足之處也歡迎大家批評指正!相關性分析用於評估兩個或多個變量之間的關聯,能通過定量指標描述變量之間的強弱、直接或間接聯繫。
  • R語言ISLR工資數據進行多項式回歸和樣條回歸分析
    p=8531執行多項式回歸使用age預測wage。使用交叉驗證為多項式選擇最佳次數。選擇了什麼程度,這與使用ANOVA進行假設檢驗的結果相比如何?對所得多項式擬合數據進行繪圖。加載工資數據集。保留所有交叉驗證誤差的數組。我們執行K=10  K倍交叉驗證。1. rm(list = ls()) 2.
  • 第二十二章 相關回歸分析
    第二十二章 相關回歸分析   提要 相關回歸的意義,原理;小樣本的直線相關和回歸分析;相關係數和回歸係數的意義及假設檢驗;應用直線相關和回歸分析時的注意事項。   在醫學上,許多現象之間都存在著相互聯繫,例如身高與體重,體溫與脈搏,年齡與血壓,釘螺與血吸蟲感染等。
  • R 語言 lasso回歸
    在基因數據的分析中,經常會用到lasso(套索)這種方法來進行變量的篩選,其實就是在目標優化函數後邊加一個L1正則化項,其中參數lamda為超參數
  • 在回歸分析中t檢驗_回歸分析的t檢驗如何做 - CSDN
    商業數據分析預測的本質數據分析和業務是緊密聯合在一起的,其目的就是滿足商業決策的需求。預測未來發展情況,及早發現問題,對業務進行優化,制定最優的決策方案。4.二、 描述性統計分析1.單因素分析的計算公式3. 單因素方差分析的基本步驟4. 方差分析的應用單因素方差分析用於預測數據分析,預測變量是一個分類變量,反應變量是聯繫變量。例如:會計人員是否比教師收入更多?新藥物的治療效果是否有提高?等等。五、 簡單線性回歸分析1.
  • R語言mRNA差異表達分析
    上一篇文章介紹的是mRNA數據的整理,整理完就開始介紹的是如何用R語言來做差異表達分析,繼續碼字。
  • 數據分析不得不知的七種回歸分析技術
    回歸分析技術是一種非常重要的數據分析方法,有著廣泛的應用,能夠解決目標變量為連續的預測分析問題。什麼是回歸分析?回歸分析是一種預測性的建模技術,它研究的是因變量(目標)和自變量(預測器)之間的關係。這種技術通常用於預測分析,時間序列模型以及發現變量之間的因果關係。
  • Python數據分析|泰坦尼克邏輯回歸
    Python數據分析學習筆記,今天分享下利用Python進行邏輯回歸,預測鐵達尼號乘客生存情況。#導入2個Python常用數據分析的庫import numpy as npimport pandas as pd#將數據源文件讀取#注意Windows環境下,需要用r轉義一下,不然讀取不進來train = pd.read_csv(r"C:\\Users\\Administrator\\Desktop\\train.csv")test = pd.read_csv(r"C:\
  • R語言_018回歸
    通常,回歸分析可以用來挑選與響應變量相關的解釋變量,可以描述兩者的關係,也可以生成一個等式,通過解釋變量來預測響應變量。  下面介紹如何用R函數擬合OLS回歸模型、評價擬合優度、檢驗假設條件以及選擇模型,為了能夠恰當地解釋OLS模型的係數,數據必須滿足以下統計假設↓  如果違背了以上假設,統計顯著性檢驗結果和所得的置信區間就很可能不精確了。