最小二乘法原理
在我們研究兩個變量(x, y)之間的相互關係時,通常可以得到一系列成對的數據(x1, y1、x2, y2... xm , ym);將這些數據描繪在x -y直角坐標系中(如圖1), 若發現這些點在一條直線附近,可以令這條直線方程如(式1-1)。
Y計= a0 + a1 X (式1-1)
其中:a0、a1 是任意實數
為建立這直線方程就要確定a0和a1,應用《最小二乘法原理》,將實測值Yi與利用(式1-1)計算值(Y計=a0+a1X)的離差(Yi-Y計)的平方和〔∑(Yi - Y計)2〕最小為「優化判據」。
令: φ = ∑(Yi - Y計)2 (式1-2)
把(式1-1)代入(式1-2)中得:
φ = ∑(Yi - a0 - a1 Xi)2 (式1-3)
當∑(Yi-Y計)平方最小時,可用函數 φ 對a0、a1求偏導數,令這兩個偏導數等於零。
(式1-4)
(式1-5)
亦即:
m a0 + (∑Xi ) a1 = ∑Yi (式1-6)
(∑Xi ) a0 + (∑Xi2 ) a1 = ∑(Xi, Yi) (式1-7)
得到的兩個關於a0、 a1為未知數的兩個方程組,解這兩個方程組得出:
a0 = (∑Yi) / m - a1(∑Xi) / m (式1-8)
a1 = [∑Xi Yi - (∑Xi ∑Yi)] / [∑Xi2 - (∑Xi)2 )] (式1-9)
這時把a0、a1代入(式1-1)中, 此時的(式1-1)就是我們回歸的元線性方程即:數學模型。
在回歸過程中,回歸的關聯式是不可能全部通過每個回歸數據點(x1, y1、 x2, y2...xm,ym),為了判斷關聯式的好壞,可藉助相關係數「R」,統計量「F」,剩餘標準偏差「S」進行判斷;「R」越趨近於 1 越好;「F」的絕對值越大越好;「S」越趨近於 0 越好。
R = [∑XiYi - m (∑Xi / m)(∑Yi / m)]/ SQR{[∑Xi2 - m (∑Xi / m)2][∑Yi2 - m (∑Yi / m)2]} (式1-10) *
在(式1-1)中,m為樣本容量,即實驗次數;Xi、Yi分別任意一組實驗X、Y的數值。微積分應用課題一 最小二乘法
從前面的學習中, 我們知道最小二乘法可以用來處理一組數據, 可以從一組測定的數據中尋求變量之間的依賴關係, 這種函數關係稱為經驗公式. 本課題將介紹最小二乘法的精確定義及如何尋求 與 之間近似成線性關係時的經驗公式. 假定實驗測得變量之間的 個數據 , , …, , 則在 平面上, 可以得到 個點 , 這種圖形稱為「散點圖」, 從圖中可以粗略看出這些點大致散落在某直線近旁, 我們認為 與 之間近似為一線性函數, 下面介紹求解步驟.
考慮函數 , 其中 和 是待定常數. 如果 在一直線上, 可以認為變量之間的關係為 . 但一般說來, 這些點不可能在同一直線上. 記 , 它反映了用直線 來描述 , 時, 計算值 與實際值 產生的偏差. 當然要求偏差越小越好, 但由於 可正可負, 因此不能認為總偏差 時, 函數 就很好地反映了變量之間的關係, 因為此時每個偏差的絕對值可能很大. 為了改進這一缺陷, 就考慮用 來代替 . 但是由於絕對值不易作解析運算, 因此, 進一 步用 來度量總偏差. 因偏差的平方和最小可以保證每個偏差都不會很大. 於是問題歸結為確定 中的常數 和 , 使 為最小. 用這種方法確定係數 , 的方法稱為最小二乘法.
回歸直線方程公式與最小二乘法的原理
回歸直線方程公式與最小二乘法的原理
懸賞分:0 - 解決時間:2008-8-2 22:12
http://www.pep.com.cn/gzsx/jszx/xkbsyjc/dzkb/bx3/200412/t20041217_150871.htm(人教網) 在這個網頁圖片的上面有一個公式,我就是想知道那個公式的來源。
還有接著談到了最小二乘法。它是把求最小的問題轉換到了求它們的平方和最小的問題。可有時,它們的平方和最小時有一組數,可在去掉平方後他們並不是最小的呀。比如:1+6<3+4 ,可1^2+6^>3^2+4^2
誰可以幫我解釋一下嗎?
提問者: _雨昕 - 五級最佳答案........
最小二乘法是統計學求回歸方程的一條公式,即一組數據如果成線性相關(有一個相關指數r公式,描繪數據的線性程度,r>0.75或r〈-0.75有較強線性關係),即個用最小二乘法求回歸方程(一次函數)來估計數據未來的走向等之類的,它的原理是所有數據轉化為直角坐標系的坐標,在這各個坐標點上求一條各點到這條直線距離之和最小的一條直線,它肯定通過這組數據平均值的坐標點。
至於推倒比較麻煩,在高中數學不作要求,只求會運用,熟記公式即可
一元線性回歸案例中最小二乘法y=bx+a,其中的b和a的公式!
見上傳的圖片
那個符號的意思是求和,例如把把所有X的值相加,有平方號的是把X平方後再相加
可能B的分子比較難明,前一項是對應的X與Y相乘後再相加,得出的和再乘以N
後一項是所有X求和後乘以所有Y的求和.
對由一組樣本數據(x1,y1),(x2,y2).。。。(xn,yn)得到的回歸直線方程為y^=bx+a
下列說法不正確的是
1直線y^=bx+a必經過點(x拔,y拔)
2直線y^=bx+a至少經過(x1,y1),(x2,y2),.(xn,yn)中的一個點
3直線Y^=bx+a的斜率為∑x1y1-nx拔y拔比上∑x1的平房-nx拔平方
4直線y^=bx+a和個點(x1,y1),(x2,y2)..(xn,yn)的偏差∑〔y1-(bx1+a)〕的平方是該坐標平面上所有直線與這些點的偏差中最小的
有人知道最小二乘法求線性回歸方程是如何計算的嗎?
y = Ax + B:
a = sigma[(yi-y均值)*(xi-x均值)] /
sigma[(xi-x均值)的平方];
b = y均值 - a*x均值;