線性擬合與曲線擬合,直接在圖上添加擬合曲線、擬合方程、判別係數...

2020-12-04 言爸說育兒

1、什麼是線性擬合?

線性擬合,顧名思義,針對兩組數據或多組數據,找出一條最佳擬合直線,常用於處理與自變量呈線性關係的因變量。線性擬合是數據處理的常用方法,擬合的目的是對呈現一定數值關係的因變量與自變量找出最佳擬合方程,一般用線性回歸來實現。

2、什麼是曲線擬合?

真實世界研究中,變量間不一定是線性關係,比如疾病療效與療程長短的關係、服藥後血藥濃度與時間的關係等常呈曲線關係。此時,線性擬合效果不佳,曲線擬合提供了一個很好的解決思路。

曲線擬合(Curve Fitting)是指選擇適當的曲線類型來擬合觀測數據,並用擬合的曲線方程分析兩個變量之間的關係。也可以說曲線擬合就是使用某個模型(或者稱為方程),將一系列的數據擬合出平滑的曲線,以便觀察兩組數據之間的內在聯繫,了解數據之間的變化趨勢。

通過對數據進行曲線擬合,我們不但能找到數據中潛在的某種規律,還能對數據的變化進行預測。

3、Excel實現線性擬合與曲線擬合

Excel軟體對於簡單的線性和曲線擬合,實現起來比較方便。

4、R語言實現線性擬合與曲線擬合

R語言的ggplot2函數在數據可視化方面很厲害,但是有的圖形用ggplot2實現起來會比較費勁,需要寫很多的代碼,耗時耗力,對於初學者不太友好。此時,可以用專門的包來實現,非常的方便,這也是R語言比Python強大的地方,很多R包能方便實現一些特定的用途。

比如我們想用ggplot2函數把擬合的方程顯示到圖形上,需要寫不少代碼來實現這一目的。但有一個R包basicTrendline,可以很方便實現,此包的優秀之處在於它可以一次性生成散點圖的擬合曲線、擬合方程、判別係數R2和P值,並把這些內容顯示在圖上。知識補充:R^2衡量的是回歸方程整體的擬合度,R^2等於回歸平方和在總平方和中所佔的比率,即回歸方程所能解釋的因變量變異性的百分比。R^2越大越好,說明曲線擬合的越好,當然也要注意過擬合的問題。

basicTrendline包可以使用函數「trendline」建立不同的擬合方程,只需要改變參數model的值就可以選擇不同模型來擬合。參數「model」的值如line2P為一次函數,line3P為二次函數,log2P為對數函數,exp2P為指數函數,exp3P為指數函數(帶常數項),power2P為冪函數,power3P為冪函數(帶常數項),更多內容可以通過?trendline查看其幫助文檔。

軟體操作

#install.packages("basicTrendline")

library(basicTrendline)

#使用R軟體自帶的數據集women,有兩個變量,分別為身高height和體重weight。

head(women)

str(women)

#加載數據

attach(women)

#我們想通過height來預測weight,把height賦值為x,weight賦值為y。註:如果直接用weight和height放到函數trendline裡有時候會出錯,為了保險,直接賦值為x和y。

x<-height

y<-weight

#添加趨勢線

# 一次函數:y=a*x+b

trendline(x, y, model="line2P", ePos.x = "topleft", summary=TRUE, eDigit=5)

# 二次函數:y=a*x^2+b*x+c

trendline(x, y, model="line3P", ePos.x = "topleft", summary=TRUE, eDigit=5)

# 對數函數:y=a*ln(x)+b

trendline(x, y, model="log2P", ePos.x = "topleft", summary=TRUE, eDigit=5)

# 指數函數:y=a*exp(b*x)

trendline(x, y, model="exp2P", ePos.x = "topleft", summary=TRUE, eDigit=5)

# 冪函數:y=a*x^b

trendline(x, y, model="power2P", ePos.x = "topleft", summary=TRUE, eDigit=5)

參考資料

醫學統計學與SPSS軟體應用. 王彤. 北京大學醫學出版社

小怪獸的R學社. 答疑貼2:R語言線性和非線性擬合

諾曼空間SpaceOfNorman.線性擬合

手把手教線性回歸分析(附R語言實例). https://blog.csdn.net/tMb8Z9Vdm66wH68VX1/article/details/79544739

在線曲線擬合方程. http://www.qinms.com/webapp/curvefit/cf.aspx

Excel曲線擬合的方法. https://www.xuexila.com/excel/hanshu/794088.html

寫在後面

今天開始,我們新增加了推薦有獎的活動,如果覺得統計諮詢會員比較好,請你幫忙推薦給需要的人,每推薦成功一位,會有30元的獎勵。詳情可在微信公眾號後臺,添加作者微信諮詢。

如果你有感興趣的統計問題,也可以在留言區留言,我會儘量解答。如果大家認可這篇推文,點個「在看」告訴我吧!

相關焦點

  • ...與曲線擬合,直接在圖上添加擬合曲線、擬合方程、判別係數R2和P值
    1、什麼是線性擬合?線性擬合,顧名思義,針對兩組數據或多組數據,找出一條最佳擬合直線,常用於處理與自變量呈線性關係的因變量。線性擬合是數據處理的常用方法,擬合的目的是對呈現一定數值關係的因變量與自變量找出最佳擬合方程,一般用線性回歸來實現。2、什麼是曲線擬合?
  • 什麼是曲線擬合?
    那麼,從上式可以看出,模態的曲線擬合是用複數,而不是實數,實際上是在傅立葉域進行擬合。第二個方面,與之前的直線或拋物線擬合相比,FRF曲線比它們更複雜,數據點更多。單個FRF有多少條譜線就有多少個數據點,有多少個測量自由度,就存在多少條這樣的FRF曲線,如果同時有兩個或兩個以上的激勵點,還需要乘以激勵點數,這樣,實際用於擬合的數據點是非常龐大的。
  • python散點圖中如何添加擬合線並顯示擬合方程與R方?
    CDA數據分析師 出品polyfit()函數可以使用最小二乘法將一些點擬合成一條曲線.numpy.polyfit(x, y, deg, rcond=None, full=False, w=None, cov=False)# x:要擬合點的橫坐標# y:要擬合點的縱坐標# deg:自由度.例如:自由度為2,那麼擬合出來的曲線就是二次函數,自由度是3,擬合出來的曲線就是3次函數首先我們先來構造一下需要被擬合的散點
  • 如何擬合Elisa標準曲線
    今天和大家分享使用Originpro 2018學習版以及ELISACalc軟體對Elisa標準曲線進行四參數擬合。下圖是標準品濃度(pg/ml)和酶標儀測得的對應OD值:Step3:進行Logistic曲線四參數擬合。點擊Analysis,Fitting,Nonlinear Curve Fit,Open Dialog…
  • origin擬合微生物生長曲線
    主要內容:微生物生長曲線,一般呈現出S型。對微生物生長數據繪製散點圖,然後擬合曲線。微生物生長曲線,一般呈現出S型。
  • 【基礎教程】Matlab 曲線擬合之polyfit與polyval函數
    xx=linspace(min(x),max(x)); % 繪圖用到的點的橫坐標yy=polyval(p1,xx); % 擬合曲線的縱坐標plot(x,y,'-or',x1,y1,'-ob',xx,yy); % 繪圖,原始數據+擬合曲線hold on;grid on;b0 = [y(1),-1];%設置初始值;Xi=linspace(min(x),max(x)); % 繪圖用到的點的橫坐標b
  • 擬合優度 - CSDN
    即:回到擬合優度的問題上,我們就容易理解,當所有樣本點都落在回歸線上時,回歸方程的擬合優度一定是最高的。此時,y的SST只包含SSR部分,沒有SSE。由此可知,在y的SST中,如果SSR所佔比例遠大於SSE所佔比例,換句話說,就是回歸方程如果能夠解釋的變差所佔比例較大,那麼,這個回歸方程的擬合優度就高。
  • 各種常見的曲線擬合方法
    這意味著從一次測量到下一次測量,留數會發生改變,但是極點不會改變,至少理論上是成立的。但是現實測量中,未必是這樣的。現實測量時系統極點可能會移動,這將會引起問題。由於實際測量時,系統極點也可能變化,這依賴於使用的FRF,將導致估計的極點可能存在差別,雖然理論上表明這是不會發生的。然而,用實測的FRF提取模態參數,且單獨考慮每個FRF時,那麼的確會出現極點發生移動的情況。
  • 最小二乘法:氣溫的曲線擬合和評估(從二次到六次多項式曲線擬合,用RMSE評估擬合效果)
    % 利用polyfit()函數進行2次、3次、4次、5次、6次多項式曲線擬合p2 = polyfit(M,T',2);p3 = polyfit(M,T',3);p4 = polyfit(M,T',4);p5 = polyfit(M,T',5);p6 = polyfit(M,T',6);MM = 1:0.1:12;% 利用polyval()函數計算多項式擬合函數的函數值
  • 擬合優度專題及常見問題 - CSDN
    即:回到擬合優度的問題上,我們就容易理解,當所有樣本點都落在回歸線上時,回歸方程的擬合優度一定是最高的。此時,y的SST只包含SSR部分,沒有SSE。由此可知,在y的SST中,如果SSR所佔比例遠大於SSE所佔比例,換句話說,就是回歸方程如果能夠解釋的變差所佔比例較大,那麼,這個回歸方程的擬合優度就高。
  • matlab插值擬合(二)
    1 基於最小二乘法的多項式擬合函數:polyfitp = polyfit(x,y,n),待擬合的多項式為p(1)*x^n + p(2)*x^(n-1) +…+ p(n)*x + p(n+1),其中x是擬合數據的自變量,y是因變量,n是擬合多項式的階數,如當n為1時,即為一次線性擬合。
  • 「C」使用 Excel 和 Math.Net 進行曲線擬合和數據預測
    錯誤的數據上圖是同一組探測器在同一天採集到的 19 次數據,總體來說重複性不錯,但很明顯最後 8 個探測器出了問題,導致採集到的數據在最後八個點一片混亂。即使把其中看起來最好的一組數據拿出來使用多項式擬合,也可以看出最後幾個點沒有落在擬合曲線上(只擬合最後 14 個點):雖然我知道這是硬體問題,但是遇到事情不能坐以待斃,軟體方面也許可以做些什麼。
  • 線性回歸擬合優度的度量:R平方
    線性回歸 Y = ax + b 的擬合程度,都是用 R 平方來進行判定,所以本篇文章來梳理 R 平方的具體計算方式
  • 技巧篇 | 雙夾心法標準曲線的擬合方法
    其可分為以下四大類:直接 ELISA、間接 ELISA、夾心 ELISA 和競爭抑制 ELISA。 而其中,最廣泛用於目標抗原或抗體的定量檢測方法就是雙夾心 ELISA(Double Sandwich ELISA),其通過將已知的抗原或抗體吸附在固相載體表面,通過待測 抗原與包被抗體反應,接著加入酶反應的底物,將底物催化成有色產物,最後 根據呈色的深淺進行定量分析。
  • StatQuest生物統計學 - 線性擬合的R2和p值
    R2是擬合所能解釋的數據波動的比例p值是擬合只是隨機變異的可能性大小上一節StatQuest生物統計學 - 擬合基礎已經講過線性擬合
  • MATLAB數據擬合工具在數學建模中的簡單應用
    3.數學建模接下來看看,如何使用MATLAB的數據擬合工具解決該問題。3.2 數據擬合在區域1中選擇相應坐標軸的變量名,在區域2中選擇擬合的函數模型,在區域3會會自動顯示擬合的圖像,在區域4中會給出擬合後的函數表達式。
  • 回歸方程的擬合效果怎麼看_分析線性回歸方程的擬合效果 - CSDN
    上圖中就是本次需要進行回歸分析的數據,之前有跟大家說過,SPSS Statistics的界面跟EXCEL是相似的,如果數據量比較小的時候我們可以直接輸入到數據視圖當中(也可以從上圖是當我們輸入完目標數據以後在變量視圖中就會出現三行數據,每一行數據從上到下是同我們三列數據一一對應的,我們進行稍微的調整以後就可以開始我們的分析了。
  • 科研必備:MATLAB常用數據擬合方法(贈安裝包)
    當需要研究兩個或多個變量之間的關係時,經常要用到曲線擬合。曲線擬合不僅能給出擬合後的關係式,還能用圖形直觀的展現出變量之間的關係。下面小編介紹一下自己常用的擬合方法並分享案例程序。對於比較簡單的數據擬合,小編推薦直接用Excel,Origin或者Matlab的cftool工具箱,這個比較簡單,就不多介紹了,接下來主要分享對於複雜一些的的數據的擬合辦法。
  • 概念理解:通俗的「過擬合與欠擬合」直觀解釋
    的確如此:你剛剛經歷了建模過程中最基本的錯誤之一,在訓練數據的時候過擬合了。在數據科學中,過擬合模型被解釋為在訓練集上具有高方差(high variance)和低偏差(low bias),導致新測試數據泛化能力不佳。我們可以用學習英語的過程來簡化「過擬合」概念的理解。我們要建立的模型是如何使用英語進行交流。
  • 擬合優度檢驗_擬合優度檢驗r方公式 - CSDN
    在這篇文章中,我們將看一下 Hosmer-Lemeshow邏輯回歸的擬合優度檢驗。 Hosmer-Lemeshow擬合優度檢驗Hosmer-Lemeshow擬合優度檢驗是基於根據預測的概率或風險將樣本分開。