大講堂 | 預測時間敏感的機器學習模型建模與優化

2020-11-30 手機鳳凰網

原標題:大講堂 | 預測時間敏感的機器學習模型建模與優化

雷鋒網AI研習社訊:機器學習模型現在已經廣泛應用在越來越多的領域比如地震監測,闖入識別,高頻交易;同時也開始廣泛的應用在行動裝置中比如通過邊緣計算。這些真實世界的應用在原有的模型精度基礎之上帶來很多實際約束比如預測要在很短或規定時間內完成。所以這樣的應用要求機器學習模型能夠同時優化預測精度和時間。本研究提出一個通用的理論框架來實現預測精度和速度的最優權衡。這一權衡可以通過選擇最優的特徵選擇實現,比如我們傾向於選擇能保證高精度卻又帶來較少計算量的特徵。但是特徵計算過程中廣發存在的計算依賴和冗餘,這導致我們對其加以建模並在優化過程中精確的考慮它們。這樣建立的整體模型是一個高度非凸並且離散的問題。對此,本文提出有效的等價及近似問題,並且提出新的基於非凸ADMM的方法及其相應的收斂性分析。本研究的代碼及數據現均已公開。

分享主題

預測時間敏感的機器學習模型建模與優化

分享嘉賓

趙亮,現為美國喬治梅森大學 (George Mason University)信息科學與工程學院助理教授。他於2016年於維吉尼亞理工大學獲博士學位。他的科研方向主要為,大數據挖掘及機器學習,具體領域有稀疏特徵學習,社會實踐預測,文本挖掘,分布式非凸優化, 網絡的深度學習,可解釋機器學習,多任務及遷移學習等。他獲得2018美國自然科學基金CRII Award。他於2016年被微軟搜索列為全球二十大學術新星之一。他在頂級期刊和會議發表論文40餘篇,包括ACM KDD, IEEE TKDE, AAAI, IJCAI, IEEE ICDM, ACM CIKM, and WWW. 他曾擔任空間資料庫領域著名會議SSTD 2017的專家小組主席, co-chair of LENS workshop at SIGSPATIAL 2018, 以及program committee of ACM KDD 2018, AAAI 2019, SDM 2019, IEEE ICDM 2018, 和IEEE ICDM 2017. 他曾擔任十餘個著名期刊的評審工作,比如 ACM TKDD, IEEE TKDE, KAIS, IJGIS, TBD, TIST, 和TMIS.

分享時間

北京時間10月30日(周二) 10:00

錯過直播不要緊,回放視頻上傳後也能看哦~

直播連結

http://www.mooc.ai/open/course/586

想了解更多雷鋒網 AI 研習社直播?

歡迎移步雷鋒網 AI 研習社社區~

相關焦點

  • 乾貨|時間序列預測類問題下的建模方案探索實踐
    隨著機器學習和深度學習的興起,時間序列預測類問題越來越多的被抽象為回歸問題,從而可以使用機器學習和深度學習的相關模型,不需要受到基本假設的限制,適用範圍更廣,更受到人們青睞。本文以疫情期間北京重點區域人群密度情況的預測為例,使用統計學模型ARMA,機器學習模型Xgboost和深度學習模型LSTM分別進行建模,並對這三種建模方案在實際操作時的複雜度、運行效率和預測準確度進行對比分析,從而直觀感受每種建模方案的優缺點,為真實場景中建模方案的選擇提供幫助和參考。
  • 【原創】Johannes小組JCIM論文:用於預測Frequent Hitter的機器學習模型
    它們不僅會引發錯誤的生化分析結果,而且有可能誤導後續一系列基於錯誤假設的研究,浪費大量的時間和資源。因此,發展可以識別「不良化合物」的可靠方法具有很高的應用價值。德國Hamburg大學J. Kirchmair小組研發的Hit Dexter1就是這樣一款基於機器學習模型的Frequent Hitters預測軟體。
  • 數據建模中分類與預測模型
    因此,本文基於上期數據預處理部分之後,介紹如何在清洗過後的數據基礎之上建立分類與預測模型,為此種模型的構建方法進行簡單介紹,輔助投資者對自身分析邏輯中的分析框架進行量化分析,方便其多元化的交易分析。  一、分類與預測的介紹  數據建模中分類與預測模型主要是尋求合適的分類模型並在此基礎之上進行未來預測。
  • 預測建模、監督機器學習和模式分類概覽
    機器學習和模式分類預測建模是建立一個能夠進行預測的模型的通用概念。通常情況下,這樣的模型包括一個機器學習算法,以便從訓練數據集中學習某些屬性做出這些預測。預測建模可以進一步分成兩個子集:回歸和模式分類。回歸模型基於變量和趨勢之間的關係的分析,以便做出關於連續變量的預測,如天氣預報的最高溫度的預測。
  • 即時配送的訂單分配策略:從建模和優化
    機器學習模塊負責從數據中尋求規律和知識,例如對商家的出餐時間、到用戶所在樓宇上下樓的時間、未來的訂單、騎行速度、紅綠燈耗時、騎行導航路徑等因素進行準確預估,為調度決策提供準確的基礎信息;而運籌優化模塊則在即時配送大數據平臺以及機器學習的預測數據基礎上,採用最優化理論、強化學習等優化策略進行計算,做出全局最優的分配決策,並和騎手高效互動,處理執行過程中的問題,實現動態最優化。
  • MemTrax機器學習分類模型有效應用於認知障礙的診斷支持
    我們主要研究目標是:驗證MemTrax 測試結果-識別正確率和反應時間,相關人口統計學和健康特徵能否有效地用於機器學習開發的預測模型對蒙特婁認知評估 (MoCA) 界定的認知健康進行分類(正常人群與 MCI患者)。以及上述機器學習模型能否有效地應用於臨床診斷確定的認知障礙患者嚴重程度(輕重度與嚴重性)的預測。
  • ...基於SEIR模型的北京市新冠肺炎疫情建模與復工影響預測」課題
    「工程經濟學」在線課程開始之後,通過向同學們介紹疫情發生後的疾病預測建模、政府出臺不同防控政策效應分析等熱點研究問題,我鼓勵選課同學建立在線研究小組來進行學習與研討。同學們的學習能力和熱情都很高,短短半個月的時間內閱讀了傳染病模型論文,收集公開數據,建立模型並結合實證分析,得出了一些初步的結果。
  • 人工智慧機器學習三大類之回歸模型(RM)
    人工智慧機器學習三大類之回歸模型(RM) 工程師1 發表於 2018-07-13 01:39:00 人工智慧之機器學習主要有三大類:1)分類;2)回歸;3)聚類。今天我們重點探討一下回歸模型(RM)。
  • 【乾貨】機器學習中的五種回歸模型及其優缺點
    【IT168 技術】線性和邏輯斯蒂(Logistic)回歸通常是是機器學習學習者的入門算法,因為它們易於使用和可解釋性。然而,儘管他們簡單但也有一些缺點,在很多情況下它們並不是最佳選擇。實際上存在很多種回歸模型,每種都有自己的優缺點。  在這篇文章中,我們將介紹5種最常見的回歸算法及特點。
  • 機器學習經典損失函數比較
    我們常常將最小化的函數稱為損失函數,它主要用于衡量模型的預測能力。在尋找最小值的過程中,我們最常用的方法是梯度下降法,這種方法很像從山頂下降到山谷最低點的過程。 雖然損失函數描述了模型的優劣為我們提供了優化的方向,但卻不存在一個放之四海皆準的損失函數。損失函數的選取依賴於參數的數量、局外點、機器學習算法、梯度下降的效率、導數求取的難易和預測的置信度等方面。
  • KDD 2018:滴滴提出WDR模型顯著提升ETA預測精度
    University of Southern California); Kun Fu (DiDi AI Labs); Zheng Wang (DiDi AI Labs); Cyrus Shahabi (University of Southern California); Jieping Ye (DiDi AI Labs); Yan Liu (University of Southern California
  • 謝國彤:疾病預測的機器學習、深度學習和經典回歸方法
    腦卒中預測模型和腦卒中或死亡預測模型的 H-L 統計量分別為 7.6 和 6.5,腦卒中預測模型的 AUC 為 0.66,而腦卒中或死亡預測模型的 AUC 為 0.70。基於機器學習方法的疾病預測儘管傳統的回歸方法在疾病預測方面有廣泛的應用,但這些方法在預測準確度和模型可解釋方面,都仍有提升的空間。
  • 萬字乾貨 | 一文助你了解機器學習
    筆者有幸參與了一個機器學習建模實驗室項目,項目的本質是抽象機器學習建模流程,將機器學習建模過程組件化,通過在畫布上對組件(算子)靈活連接,讓非專家用戶(不會寫代碼,不熟悉算法模型和調參的產品經理,市場運營,行政財務等職場人)可以快速搭建機器學習模型,實現業務預測,極大降低機器學習應用門檻。
  • 「蝴蝶效應」也能預測了?看機器學習如何解釋混沌系統
    李亞普諾夫時間表示混沌系統的兩個幾乎完全相同的狀態需要多長時間才能呈指數發散。  機器學習的方法能預測到的未來大大延長,比此前的預測方法能預測到的長了八倍,預測效果幾乎和真實情況完全匹配。  而且,這個算法對Kuramoto-Sivashinsky方程式本身一無所知;它只能看到方程式演進的數據。  這使機器學習方法變得更強大。
  • 複雜系統自動建模綜述:描述、預測與理論發現
    其次,隨著技術的發展,我們已經積累了關於複雜系統運轉的大量數據,特別是系統所產生的時間序列數據,而傳統人工建模方法很難與這種結構的數據相結合,換言之,傳統建模方法難以提取數據中隱藏的大量信息、知識。不過,AI中的一些算法卻非常擅長於從時間序列數據等中學習提取模型,同時,當前的硬體已經能夠支持我們藉助一些深度學習的算法對較大量級的數據進行學習分析。
  • 一文讀懂可解釋機器學習簡史,讓你的模型再也不是「Black Box」
    儘管這個領域才剛剛起步,但是它在回歸建模和基於規則的機器學習方面的相關工作卻始於20世紀60年代。最近,arXiv上的一篇論文簡要介紹了解釋機器學習(IML)領域的歷史,給出了最先進的可解釋方法的概述,並討論了遇到的挑戰。 當機器學習模型用在產品、決策或者研究過程中的時候,「可解釋性」通常是一個決定因素。
  • 提高建模效率,改變手工作坊式生產,AutoML的技術研究與應用進展...
    正因此,自動化機器學習方法AutoML應運而生,利用機器替代人工完成AI建模,從AI for APP到AI for system最後到AI for AI,用人工智慧的方法自動化完成AI模型的構建,大幅降低AI的使用門檻,從而提升建模效率。「自動化機器學習就好比構建一個AI行業的數控工具機,以前靠人現在靠機器,多快好省的以自動化的方式生產AI模型。
  • 機器學習模型成為NASA最新預測颶風強度的背後技術
    因此,為了預測未來的颶風強度,美國宇航局位於南加州的噴氣推進實驗室的科學家們提出了一種機器學習模型,聲稱可以準確預測颶風未來的快速強度事件。首先,科學家們介紹了這些測量結果與未來颶風強度變化之間的經驗關係,並確定了他們可以用於業務預報模型的觀測結果。之後,科學家們展示了機器學習模型對大西洋和北太平洋東部地區快速加強的預測技巧,以及從衛星觀測中得出的聯合預測因子。在研究雲衛星數據中的冰和液態水含量時,研究人員意識到,加強型風暴和颶風強度的冰和液態水含量較高,但不一定高於削弱型颶風。
  • 人工智慧視域下機器學習的教育應用與創新探索
    國外有些學者對機器學習進行了定義,Mitchell認為,機器學習是對能通過經驗自動改進的計算機算法的研究[10];Alpaydin認為,機器學習是指利用數據或以往的經驗,以此優化電腦程式的性能標準[11]。由此可知,機器學習是通過經驗或數據來改進算法的研究,旨在通過算法讓機器從大量歷史數據中學習規律,自動發現模式並用於預測。換句話說,機器學習即機器從數據中學習,其處理的數據越多,預測就越精準。
  • 新手必看的十種機器學習算法
    大的原則不過,對於預測建模來說,有一條通用的原則適用於所有監督學習算法。機器學習算法可以描述為學習一個目標函數 f,它能夠最好地映射出輸入變量 X 到輸出變量 Y。有一類普遍的學習任務。我們要根據輸入變量 X 來預測出 Y。我們不知道目標函數 f 是什麼樣的。