我們知道,我們可以利用回歸分析對具有相關關係的兩個變量進行統計分析。
也就是說只要給出我們樣本數據,我們就可以求出樣本的回歸直線方程。
接下來我們研究一個問題:
通過抽樣統計某地一年內某天的最高氣溫,
1月1日,2°;2月15日,-1°;3月5日,16°;4月10日,21°;5月12日,27°;
6月1日,33°;7月7日,38°;8月6日,32°;9月16日,29°;10月27日,24°;
11月22日,12°;12月8日,7°;
姑且不考慮是否具有線性相關,我們嘗試利用最小二乘原理求出日期與氣溫的「回歸直線方程」,利用公式,顯然是「可行」的。
在現實生活中,變量之間的常見關係有三種:一是確定性函數關係,變量之間的關係可以用函數表示;二是非確定性相關關係,變量之間有一定的關係,但不能完全用函數表達,變量問只存在統計規律;三是毫無關係的兩個變量,譬如上述的日期與氣溫。對於兩個變量,我們如何確定不相關,或者相關,相關性的強弱,如何解決?
當然我們可以求出回歸方程,然後再利用相關指數判斷,但似乎有點後知後覺的感覺!顯然我們需要尋求一個新的判斷方式——相關係數。
然而,在人教A版教材中, 「線性回歸方程」是教材的正文,「相關係數」是作為介紹性材料給出的。教材沒有很好地揭示兩者的內在聯繫。導致教師和學生按部就班地計算判斷,不明原因,接下來,本文從幾個角度來揭示兩者之間的關係,以促進大家對這塊內容的理解。
一、相關指數分析
從上篇文章《相關指數,為何相關,如何相關?》,我們知道我們可以藉助於相關指數判斷模型擬合效果的好壞來分析線性相關的強弱。
通過公式不難發現相關係數是由原始數據得到的,而相關指數則需要由預測值得到,也就是說,給出我們一組數據,我們可以直接求出相關係數,而要想求出相關指數,則必須求出回歸直線方程才可以。
顯然,兩變量幾乎不存在線性相關關係,所以沒有必要去求回歸直線方程了。
需要說明的是:相關係數和相關指數是兩個不同的概念,
相關係數是用來判斷兩個變量的線性相關性的強弱;相關指數來判斷回歸模型的擬合效果好壞。
一般是先求相關係數,分析相關性的強弱。然後求回歸方程,最後求出相關指數,分析模型的擬合效果。
二、向量分析
利用相關指數解析線性相關係數,可以看到了線性回歸方程在預測時的準確程度,可看到人們在定義線性相關係數時的一些本原性思考及其定義的合理性。利用向量和柯西不等式的角度解析線性相關係數,可以看到了隨機性數學與確定數學之間並不存在不可逾越的鴻溝,也有溝通之橋,可以相互滲透。
【前段時間,總會有讀者在公眾號的消息一欄給我留言,由於小編工作的特殊性,不能及時看到留言,當看到留言時,想回復,卻過了回復時間(我只能與兩天內的朋友們互動),所以以後大家如果有什麼疑問,不要在公眾號上發消息,可以選擇文章的評論或者加我好友私聊,我的微信號碼:「jingruiqiang」或者「282515512」。
近期總有新朋友給我發消息「歷史消息」,想看到歷史文章,抱歉,因為我不太會設置「自定義菜單」,是我的無知造就了您的徒勞,想看我歷史文章的朋友們,可以進入我公眾號的頁面,點擊右上方的「小人兒」,然後點擊「查看歷史消息」即可。
耳娛心憩之餘如有您偶或中意的「數學風景」,請幫我們隨手點讚、轉發。書不盡言!您的鼓勵是我們最大的動力。謝謝!】
微信號:shuxuefengjing數學風景,您掌上的數學教師!!!