我一直堅信將人工智慧和機器學習民主化,並以這種方式傳播知識,以迎合廣大受眾,充分利用人工智慧的力量。對此的一個內聯嘗試是python包「 regressormetricgraphplot」的開發,該軟體包旨在幫助用戶使用單行代碼繪製評估指標圖,以針對不同的廣泛使用的回歸模型指標進行一目了然的比較。
使用該實用程序包,還可以通過將其應用於日常的預測回歸問題,顯著降低從業人員以業餘方式評估不同機器學習算法的障礙。 在深入介紹軟體包詳細信息之前,讓我們以簡單的外行術語理解一些基本概念。
通常,建模流程涉及預處理階段,擬合機器學習算法,然後進行評估。在下圖中,作為示例,描述了集成學習的建模步驟。塊A包括數據處理,例如清理,整理,聚合,推導新特徵,特徵選擇等。塊B和C描述了集成學習,其中預處理數據輸入到Layer-1中的各個模型中,分別是評估和調整。
第2層的輸入包括來自先前第1層的預測,然後使用投票方案得出最終預測,使用平均值合併結果。最後,方框D顯示了模型評估和結果解釋。數據(比例為70:30)被分為訓練和測試數據。使用了三種獨立的ML算法,即線性回歸,隨機森林和XGBoost。所有模型都是使用調整後的參數創建的,最後使用投票回歸模型。
使用不同的回歸指標進行評估,讓我們討論它們各自的公式以及相應的簡單說明。
表決回歸器是一個集合元估計器,它適合每個整體數據集上的基本回歸器。然後,將各個預測取平均,以形成最終預測,如下所示。
入門
終端安裝
Mac 安裝
使用Anaconda安裝
如果您將Python與Anaconda一起安裝,則可以運行以下命令開始使用:
代碼演練
用法
完整的示例程序可以在GitHub中找到 Demo.ipynb。