要作數值預測,最好的方法莫過於回歸預測。通過建立起影響因素(即自變量)與目標變量之間的函數關係式,就可以對因變量的未來值進行預測。
儘管回歸分析在預測時比較準確,但是,實現比較複雜,因為它要求能夠找到所有或大部分影響事物的關鍵因素,這樣才能夠建立回歸模型進行預測。
但是,在真實的場景中,要找出影響事物的關鍵因素是非常困難的,比如,大多數社會經濟指標,如國內生產總值(GDP)、消費價格指數(CPI)、上證綜合指數等等,要找出影響因素來建模,基本上不太可能,所以這種場景下,採用回歸分析難以實現。
那該怎麼辦呢?
此時,可以嘗試使用另一種分析方法,即時間序列分析法。
時間序列分析,不像回歸分析,它是拋開了對事物發展的因果分析,只分析事物的過去和未來的聯繫,即它假定事物的過去趨勢會延伸到未來。
時間序列(Timeseries),指的是按照相等時間間隔的順序而形成的數據序列。一般情況下,大多數社會經濟指標,如GDP、CPI、利率、匯率等等都是時間序列。
時間序列的時間間隔可以是分秒(如股票金融數據),也可以是日、周、月、季度、年,甚至更大的時間單位。
時間序列分析基於這樣一個假設:事物過去的模型可以持續到未來。
簡單地,一個時間序列會隨著時間變化而變化,如下圖所示的幾種變化形式。
比如左上第一個序列,有著明顯的季節性波動;右上第二個序列,有整體下降的趨勢;左下第三個序列,呈現上升趨勢而且具有季節波動;右下第四個序列,沒有明顯的趨勢也沒有季節波動。
最常見的時間序列分析模型和方法有如下三大類:
1) 趨勢類分析:移動平均、指數平滑等;
2) 季節波動類分析:溫特斯方法、基於回歸的方法;
3) 平穩序列類分析:自回歸滑動平均模型。
每一大類中,都會有多種分析方法和模型。
大數據的哲學觀 事物發展都是有規律的
如何讓數據「說話」 數據解讀能力培養
大數據的核心價值是什麼?探索事物規律和特徵
一切不以應用為導向的大數據都是在耍流氓
大數據建模五步法 選擇-訓練-評估-優化-應用
教你如何優化出好模型! 好模型是優化出來的
大數據職位體系 兩大類別(系統類+應用類)
大數據職位發展通道 大數據職位的發展通道
大數據變革之工具變革 探索客觀事物的工具
大數據變革之思維變革 認知事物的新思維
大數據變革之文化變革 尊重事實的數據文化
作者簡介:
傅一航,大數據專家。
專注於大數據分析、大數據挖掘等應用技術,及大數據系統解決方案。致力於將大數據技術應用於政府、通信、金融、航空、電商、網際網路等領域。
聯繫作者: 2509626286@qq.com。