只要我們用到線性回歸,幾乎總要求出回歸係數,多數情況下,回歸係數的結果如下表所示:
表中的參數估計一列,就是求出的回歸係數,如這裡顯示,x的回歸係數時-0.347,z的回歸係數是1.828。
單因素的線性回歸中,大家對回歸係數的解釋幾乎都能說得上來,書本上說的很清楚了,所謂回歸係數,就是自變量x每增加1個單位(這個單位取決於x本身的含義),因變量的變化情況。聽起來好像很好理解啊,沒什麼問題。
但是多因素分析中呢?課本上也有說,就是,校正了其它因素後(或者在其它因素固定的情況下),自變量x每增加1個單位,因變量的變化情況。
那我要問一下,所謂「固定其它因素,或者其它因素不變的條件下」,這句話什麼意思呢?我想可能並沒有很多人去真正考慮過。今天這篇文章就是解釋這樣一個看似非常簡單的問題。
假定該有下面的數據,y是因變量,z和x是自變量
z
3
3
3
5
5
5
7
7
7
9
9
9
x
6
7
5
9
8
7
10
10
9
14
13
14
y
4
3
6
7
8
9
8
9
10
11
14
15
在單因素分析中,x的回歸係數為0.997,而如果把變量z也納入模型,x的回歸係數就變成了-0.347。為什麼會差別這麼大呢?
因為單獨分析x的時候,並沒有考慮到z的影響;而把變量z納入後,x的回歸係數意思就成了:當z固定的時候,x對y的影響。
這就要理解一下,什麼是z固定的時候,x對y的影響呢?我們先看下面這個圖。這是單獨看x與y的關係的散點圖,很明顯,y隨x的增加而增加。
再看下面這個圖,這是加上z變量後,x對y的影響,可以看出,在不同的z取值的時候,x對y的影響都是負向的了。
也就是說,第一個圖是x的回歸係數,第二個圖是x的偏回歸係數,即當z固定為3、5、7、9的時候,x對y的影響。此時的回歸係數就變成負值了。
當然,你可能會好奇,為什麼會出現這種結果,一個變量的值會從正變成了負。這當然是有可能的,以後會慢慢解釋這一問題。
有時課本上一句很簡單的話,你可能覺得很簡單,不用經過大腦,但如果讓你真正解釋的話,可能很多人都說不上來,這就是典型的眼高手低,感覺好像明白了,其實並不是真明白。
我經常遇到一些學生,問他們一些問題,好像都懂,但我讓他們給我解釋一下的時候,往往卻都說不上來。這就不是真懂,有時候,書本中的一句話,也需要好好琢磨的。