使用微軟Power BI進行時間序列預測

2020-09-05 佳雲大腦

作者 | GUEST

編譯 | VK

來源 | Analytics Vidhya

介紹

時間序列預測是機器學習的一個非常重要的領域,因為它讓你能夠提前「預見」並據此制定業務計劃。

在本博客中,我們將了解什麼是時間序列預測,Power BI如何製作時間序列預測圖和Power BI用於預測的模塊。

什麼是時間序列預測?

時間序列是以天、小時、月和年為單位定期收集數據。時間序列預測是機器學習中的一種技術,它通過分析數據和時間序列來預測未來的事件。

這種技術基於歷史時間序列數據提供了對未來趨勢的近乎精確的假設。

時間序列允許你分析主要模式,如趨勢、季節性、周期性和不規則性。它被廣泛應用於股票市場分析、模式識別、地震預測、經濟預測、人口普查分析等領域。

時間序列包括趨勢周期和季節性。不幸的是,許多人混淆了季節性行為和周期性行為。為了避免混淆,讓我們了解它們是什麼:

  • 「趨勢」:一段時間內數據的增加或減少稱為趨勢。
  • 「季節性」:通常,季節性具有固定和已知的頻率。例如,季節性因素,如一年中的時間或一周中的某一天,就會出現季節性的模式。
  • 「周期性」:當一個數據顯示波動時,一個周期就發生了。但不同於季節性,它不是固定的頻率。

Power View使用哪種算法進行時間序列預測?

Power BI提供了兩個指數平滑的版本,一個用於季節性數據(ETS AAA),另一個用於非季節性數據(ETS AAN)

Power BI會根據對歷史數據的分析,在開始預測折線圖時自動使用適當的模型。

如何在Power BI中創建時間序列預測圖。

在本教程中,我使用以下數據集。

要使用預測功能,我們使用「分析」選項卡,「分析」面板允許你向視覺效果添加動態參考線,以提供重要趨勢或信息的焦點。它位於Power BI桌面的可視化區域。

創建折線圖:

對於預測,請轉到分析窗格,我們可以看到預測選項。單擊Add,將forecast length設置為6年,置信區間為95%,然後單擊Apply。

現在你會注意到,我們在數據結束後有一條預測線,陰影灰色區域是我們的置信區間。

結論

如果你想在同一框架內快速查看趨勢和預測,以了解並做出任何業務決策,Power BI可以幫助你。

你可以在Python或R中使用Arima和其他時間序列模塊,下一次我將用Python討論Arima。

原文連結:https://www.analyticsvidhya.com/blog/2020/07/time-series-forecasting-using-microsoft-power-bi/

相關焦點

  • 輕鬆玩轉Power BI時間序列預測模型
    「時間序列模型簡單介紹」 在很多數據建模分析場景中,我們都需要根據歷史數據進而對未來做出預測。常用的時間序列預測模型有以下3種: 指數平滑模型(Exponential Smoothing) (t+h|t) = y(t) + (1-)y(t-1) + (1-) y(t-2) + …0 預測值由歷史數據根據不同權重所決定(例當前時間越遠,權重越小)
  • 如何使用XGBoost模型進行時間序列預測
    XGBoost也可以被用於時間序列預測,儘管它需要將時間序列數據集先轉換成監督學習問題。它需要用到一種被稱為前進式驗證的特殊方法來評估模型,因為使用k折驗證來評估模型容易導致偏向樂觀的結果。本教程中,你將探索如何為時間序列預測開發一個XGBoost模型。
  • 教程 | 如何使用 DeepAR 進行時間序列預測?
    在 2019 年的 WAIC 上,筆者在 AWS 展臺中布置並展示了一個使用 DeepAR 進行時間序列預測的項目,受到了廣泛的來自客戶、參觀者以及同事的關注,其中大部分是被展示項目中真實的電商客戶的數據及成果吸引,進行了一定的經驗交流。
  • R語言中使用多重聚合預測算法(MAPA)進行時間序列分析
    摘要:這是一個簡短的演示,在R語言中使用MAPA對時間序列數據進行預測。t+7 t+8 t+9 t+10 t+11 t+12457438.0 446869.3 450146.7 462231.5 457512.8 467895.1 457606.0 441295.7 471611.2 454282.0 458308.0 453472.5序列和預測的簡單圖解:每個時間預測狀態的詳細視圖:
  • 利用深度學習進行時間序列預測
    這些技術通常被數學家使用,他們試圖不斷改進這些技術來約束平穩和非平穩的時間序列。幾個月前,我的一個朋友(數學家、統計學教授、非平穩時間序列專家)提出讓我研究如何驗證和改進重建恆星光照曲線的技術。事實上,克卜勒衛星[11]和其他許多衛星一樣,無法連續測量附近恆星的光通量強度。克卜勒衛星在2009年至2016年間致力於尋找太陽系外的行星,稱為太陽系外行星或系外行星。
  • 使用卡爾曼濾波平滑時間序列,提高時序預測的準確率
    它很有用,因為它可以提供我們需要的預處理步驟,如去噪或離群值去除,保留原始數據中的時間模式。在這篇文章中,我們使用這些小工具來改進預測任務。更準確地說,我們試圖預測太陽能電池板的日發電量。最後,我們期望能從去噪過程中獲益,並產生比未進行預處理的情況更好的預測。
  • 獨家|手把手教你用Python進行時間序列分解和預測
    ,以及如何在Python中進行時間序列預測的一些基本方法和示例。時間序列預測的需求不僅存在於各類業務場景當中,而且通常需要對未來幾年甚至幾分鐘之後的時間序列進行預測。如果你正要著手進行時間序列預測,那麼本文將帶你快速掌握一些必不可少的概念。 目錄 什麼是時間序列? 如何在Python中繪製時間序列數據?
  • 時間序列預測的常見方法及思考
    利用這些時間序列數據來預測其未來一段時間的狀態有著廣泛的應用場景,比如在金融領域被使用來做現金流量預測、股票價格預測,在零售行業被使用來做業務收入預測、庫存消耗預測,在旅遊行業被使用來預測旅遊訂單量、客服服務量等,在氣象、人口密度預測等方面也被廣泛使用來幫助決策者做出有數據支撐的重要決策。
  • Power BI Desktop 2020年9月更新摘要
    (文檔地址:https://docs.microsoft.com/en-us/power-bi/collaborate-share/service-analyze-in-excel#connect-to-power-bi-data)部署管道允許內容創建者通過在開發、測試和生產環境中移動內容來提高Power BI內容發布的效率和準確性。
  • 使用LSTM深度學習模型進行溫度的時間序列單步和多步預測
    本文的目的是提供代碼示例,並解釋使用python和TensorFlow建模時間序列數據的思路。本文展示了如何進行多步預測並在模型中使用多個特徵。本文的簡單版本是,使用過去48小時的數據和對未來1小時的預測(一步),我獲得了溫度誤差的平均絕對誤差0.48(中值0.34)度。
  • 如何用XGBoost做時間序列預測?
    ,包括將時間序列轉化為有監督學習的預測問題,使用前向驗證來做模型評估,並給出了可操作的代碼示例。模型進行擬合、評估、預測。給定時間序列數據集的一系列數字,我們可以重新構造數據,使其看起來像一個有監督的學習問題。我們可以使用前一個時間步長的數據作為輸入變量,並使用下一個時間步長作為輸出變量。
  • 時域卷積網絡TCN詳解:使用卷積進行序列建模和預測
    在預測方面,我們希望預測未來時間序列的下一個條目。為了訓練我們的TCN網絡進行預測,訓練集將由給定時間序列的等大小子序列對(輸入序列、目標序列)組成。目標序列將是相對於其各自的輸入序列向前移動一定數量outputlength的序列。
  • 基於圖卷積神經網絡GCN的時間序列預測
    時間序列預測任務可以按照不同的方法執行。最經典的是基於統計和自回歸的方法。更準確的是基於增強和集成的算法,我們必須使用滾動周期生成大量有用的手工特性。另一方面,我們可以使用在開發過程中提供更多自由的神經網絡模型,提供對順序建模的可定製的特性。循環和卷積結構在時間序列預測中取得了巨大的成功。
  • 基於Holt的趨勢時間序列預測模型
    今天小編為大家帶來「基於Holt的趨勢時間序列預測模型」,一起來看看吧!基於Holt的趨勢時間序列預測模型一、模型簡介霍爾特指數平滑法是一種高級的線性指數平滑方法,該方法的優點是可以用不同的平滑參數對原序列的兩種因素進行平滑,具有很大的靈活性,因此在實踐中被廣泛地應用。二、計算流程Holt指數平滑模型由Holt於1957年提出。
  • 關注進化:深度圖進化學習的時間序列預測
    實際時間序列的應用需要考慮兩個因素來實現有效的預測:多變量之間的動態依賴建模和調整模型的內在參數。文獻中存在的一個缺口是,統計和集成學習方法系統地呈現出比深度學習方法更低的預測性能。現有的應用方法通常忽略了數據序列方面與用多個時間序列表示的多變量數據之間的糾纏。
  • 通過Python 代碼實現時間序列數據的統計學預測模型
    在本篇中,我們將展式使用 Python 統計學模型進行時間序列數據分析。** 問題描述 **目標:根據兩年以上的每日廣告支出歷史數據,提前預測兩個月的廣告支出金額。原始數據:2017-01-01 到 2019-09-23 期間的每日廣告支出。數據準備:劃分訓練集和測試集。
  • 乾貨|時間序列預測類問題下的建模方案探索實踐
    而時間序列就是該種現象某一個統計指標在不同時間上的數值,按時間先後順序排列而形成的序列。時間序列分析主要針對時間序列類問題的兩個領域,一個是對歷史區間數據的分析,通過對過往數據特徵的提煉總結來進行異常檢測和分類;另一類就是對未來數據的分析,根據過去時間點的數據對未來一個時間點或者幾個時間點的狀態或實際值進行預測。
  • 兩篇時序預測 |多元時間序列預測的低階自回歸張量補全
    >[Submitted on 18 Jun 2020]摘要:時間序列預測是一個長期的研究課題,在許多領域都有重要的應用。現代從傳感器網絡(如能源消耗和交通流)收集的時間序列往往是大規模和不完整的,存在大量的破壞和缺失值,很難進行準確的預測。在本文中,我們提出了一個低秩自回歸張量補全(LATC)框架來建模多變量時間序列數據。
  • Connecting the Dots: 基於圖神經網絡的多元時間序列預測
    多元時間序列預測可以很自然地從圖的角度來看待。多元時間序列中的變量可以看作是圖中的節點,它們通過隱藏的依賴關係相互連接。因此,利用圖神經網絡對多變量時間序列數據進行建模是一種很有前途的方法,可以在充分利用時間序列之間的相關性的同時,保留多變量時間序列的時間軌跡。
  • Meal Kit 的時間序列數據預測實踐
    在時間序列中,缺失的數據可能會隱藏起來,因為數據可能在時間步長(1周)內不一致,這將在構建模型時可能會導致問題。對每個供應中心標識的數據進行分組。其中一些食材並非每周訂購/提供的,那麼將這幾周的需求量取為0,但是價格設置為組內食材的平均值。我們假設這些食材在缺失的幾周內是有提供的,但是沒有人買。在研究了餐盒市場後,人們意識到大部分成本來自易腐商品。