決策樹理論及案例解析

2021-02-19 玩偶奇遇

決策樹理論

畫出決策樹的方法,通常包括三步:

第一步,列出你想要實現的目標或者解決的問題(一般用正方形表示)

第二步,在它的右側畫出能夠實現這一目標的所有方案(一般用圓形表示)

第三步,在所有方案下面再列出這種方案可能的各個結果及其實現的概率(結果一般用三角形表示)

舉個例子。你已工作三年,想要進一步增加自己的收入。你的可能選擇有:

那麼你到底應該出去創業、兼職,還是在公司更努力地工作呢?讓我用決策樹的方法來思考一下。創業、兼職和繼續工作,形成了提高收入的三種解決方案。

對每種選擇帶來的收入結果和可能概率進行估算

比如,出去創業年收入超過100萬元的概率是多少呢?可能有5%

年收入在50萬元到100萬元之間,可能概率是20%

年收入在10萬元到50萬元之間,可能概率是30%

年收入在5萬元到10萬元之間,可能概率是30%

年收入還不到5萬元的概率,可能是5%

創業失敗,還有賠錢的可能。賠錢10萬元的概率,可能是10%

把兼職和繼續留在公司的情形也列出來就形成了決策樹。

那麼怎麼做決策呢?計算每個方案的可能收益,比較高低。方法是:把一個方案下每個結果的收入和它的發生概率相乘,然後求和。這就是這個選擇的收入期望。

例如創業這個環節,收入期望的下限是:

100✖5%➕50✖20%➕10✖30%➕5✖30%➕0✖5%➕(-10)✖10%=18.5萬元。

而兼職的收入期望下限是:

100✖1%➕50✖30%➕10✖20%➕5✖40%➕2✖9%=20.18萬元。

同樣的方法,留在公司的收入期望下限是:

100✖1%➕50✖10%➕10✖30%➕5✖59%=11.95萬元。

通過計算,你可以發現:

收入期望:兼職20.18萬元>創業18.5萬元>留在公司11.95萬元。

這樣對比就可以得出結論。當然,這個例子中的收入和概率是隨便寫的。不過我們可以看到,對概率和結果的主觀判斷的準確性非常重要,它直接決定了我們最終要採取的行動。如果我們對自己的能力評價偏高,可能會認為自己在創業中賺大錢的概率比較高。如果我們對自己的評價相對偏低,可能會認為自己在創業中賺大錢的概率比較低。

概率不是固定值,而是動態值。應用好決策樹理論的方法是通過不斷實踐,提升概率判斷的準確性,從而提升決策能力。

相關焦點

  • 決策樹怎麼畫?圖文解析繪製決策樹全教程
    決策樹的常見用途繪製出一幅決策樹的前提便是要有足夠的數據來支撐計算,當有足夠多的數據後,決策樹便能根據數據進行整理和計算,決策樹也可以對人們日常生活中的學習或者各種選擇進行分析和預測。1、企業的方案制定當企業在面臨機遇或者危機時,急需找到正確的決策,那麼便可以用決策樹對自己目前的狀況進行分析,選擇出適合當前的決策,來將利益最大化。
  • 決策樹在R語言中的實現
    隨著大數據時代的到來,數據量激增,機器學習方法起到越來越重要的作用。
  • 決策樹與迭代決策樹
    根據上圖其實我們不難可以想到,滿足樣本劃分的決策樹有無數種,什麼樣的決策樹才算是一顆好的決策樹呢?性能良好的決策樹的選擇標準是一個與訓練數據矛盾較小的決策樹,同時具有很好的泛化能力。言外之意就是說,好的決策樹不僅對訓練樣本有著很好的分類效果,對於測試集也有著較低的誤差率。2.
  • 決策樹
    機器學習中分類方法中的一個重要算法三、構造決策樹的基本算法3.1案例(3)剪枝函數決策樹生成算法得到的樹對訓練數據的分類很準確,但對未知數據的分類卻沒那麼準確,容易過擬合;因為決策樹考慮的特徵太多,構建得太複雜。 所以我們需要對決策樹進行剪枝:從已生成的樹上裁掉一些子樹或葉節點,並將其根節點或父節點作為新的葉節點,以此簡化樹。剪枝算法很多,這裡引入一種簡單的:極小化決策樹整體的損失函數。
  • 決策樹模型
    決策樹,便是一種把決策連接點畫成樹的輔助決策專用工具,一種找尋最優化計劃方案的繪圖法。它用圖型的方法, 列舉某一決策很有可能導向性的多種多樣結果。決策樹需要概率一起用來做決策,所以有兩個分支類型:方案枝,概率枝下邊大家再次上邊的例子表明下決策樹如何融合概率變為概率樹的方法來做決策的。決策樹只是是給了很有可能的全部回答,而且是用0分或是一百分來判斷結果,較為不光滑。
  • 【分類算法】基於 R 語言決策樹算法介紹及應用
    機器學習理論主要是設計和分析一些讓計算機可以自動學習的算法。機器學習算法是一類從數據中自動分析獲得規律,並利用規律對未知數據進行預測的算法。因為學習算法中涉及了大量的統計學理論,機器學習與統計推斷學聯繫尤為密切,也被稱為統計學習理論。在算法設計方面,機器學習理論關注可以實現的、行之有效的學習算法。
  • 決策樹與隨機森林(4)—— 決策樹C5.0算法
    這是許多決策樹構建的一個過程,然後這些決策樹通過投票表決的方法為每個案例選擇最優的分類。Question 2: 什麼叫做 Adaboost ?簡單來說,對於一個數據集,我們通過某種算法建立了第一個分類器,若第一個分類器對樣本 x1, x2 的分類效果好,對 x3 的分類效果差,那麼第二個分類器通過一個神奇的公式,把對 x3 的權重增加,x1, x2的權重降低。為什麼呢?
  • 機器學習----回歸模型(決策樹)
    4、節點的樣本數量達到了人為設定的閾值:樣本數量 < min_samples_split ,則樹停止分裂;決策樹回歸器模型相關API:import sklearn.tree as st# 創建決策樹回歸器模型 決策樹的最大深度為4model = st.DecisionTreeRegressor
  • R機器學習:決策樹
    今天你將學習決策樹算法背後的基本理論,以及如何在R中實現該算法。文章結構如下:決策樹是直觀的。他們所做的只是問一些問題,比如性別是男性還是某個特定變量的值高於某個閾值。根據答案,要麼多問幾個問題,要麼分類。很簡單!
  • sklearn學習(三):決策樹
    一.決策樹原理概述樹模型        決策樹:
  • 機器學習 | 決策樹之分類樹
    今天推出機器學習系列筆記第1期,本期分享內容為:機器學習之決策樹中的分類樹。(筆者使用的是Mac系統)決策樹(Decision Tree):是一種非參數的有監督學習算法,在已知各種情況發生概率的基礎上,通過構成決策樹來取淨現值的期望值大於等於零的概率,是直觀運用概率分析的圖解法,以解決分類和回歸問題。分為分類樹和回歸樹。
  • AI產品經理必懂算法:決策樹
    決策樹(Decision Tree)是一種以樹形數據結構來展示決策規則和分類結果的模型,它是將看似無序、雜亂的已知實例,通過某種技術手段將它們轉化成可以預測未知實例的樹狀模型。時隔半月,已近年關。AI產品經理必懂算法的第三篇終於來了,今天想和大家聊的是決策樹,閒言少敘,切入正題。
  • 如何用決策樹模型做數據分析?
    通常,一棵決策樹包含一個根結點,若干內部節點和若干葉結點,葉結點對應決策分類結果。分支做判斷,葉子下結論。我們看一個簡單的決策樹的模型,通過動物的一些特點來判斷它是否是魚類,在決策樹模型中,我們來看每一個節點是如何做判斷的。我們將所有要研究的動物作為樹最上端的起點,對它進行第一個判斷,是否能脫離水生存?如果判斷為是的話,它不是魚類。
  • python分類-決策樹
    這次學會的只是一個入門級別的python決策樹案例,還是給大家分享下吧。1、熵:熵表示的是數據中包含的信息量大小,或者是數據的混亂度;    混亂度越低,數據純度越低,數據混亂程度越高,熵越大。其中pi表示第i個類的數量佔比    信息增益=分裂前熵-分裂後熵。信息增益越大,意味使用某幾個屬性來進行分裂節點創建子節點所獲得的純度提升越大。    信息增益比=信息增益/分裂前熵。
  • 決策樹之ID3和C4.5
    一、決策樹       一種樹狀分類結構模型,是一種通過對變量值拆分建立起來的分類規則,又利用樹形圖分割形成的概念路徑的數據分析技術。二、決策樹的兩個關鍵步驟三、決策樹的構建步驟②數據是在一直持續劃分直至在一個分區中特徵無區別,因此決策樹很容易出現過度擬合的現象。③對於大規模的數據量,可以使用預剪枝的方法,來對決策樹進行剪枝。什麼叫過度擬合?來複習一下。在學習期間,它可能包含了訓練數據中的某些特定的異常,這些異常不會在一般數據集中出現。⑶第四步中:可以利用混淆矩陣、ROC曲線、AUC值等等模型評估指標來對我們的模型進行評估。
  • 決策樹學習筆記(三):CART算法,決策樹總結
    :CART算法,它可以說是學習決策樹的核心了。也就是說,CART樹的剪枝算法可以概括為兩步:1)是從原始決策樹生成各種剪枝效果的決策樹序列。2)是用交叉驗證來檢驗剪枝後的預測能力,選擇泛化預測能力最好的剪枝後的數作為最終的CART樹。
  • 項目案例之決策樹在保險行業的應用
    數據分析分析流程框架本次案例的數據數據的欄位含義如下:導入數據import pandas as pddf = pd.read_csvvar_char_uniq2:if len(df[var].unique())<2:del df[var]else: integer_encode(var)建模當我們發現,我們的數據中分類變量比較多,我們嘗試採取決策樹進行建模
  • 決策理論
    其後巴納德在《行政領導的功能》一書中,認為行政決策是實現組織目標的重要戰略因素。在巴納德社會協作系統理論的基礎上,發展為以西蒙和馬奇為代表的決策理論學派,核心理論是西蒙提出的決策理論。決策理論把系統理論、運籌學、計算機科學等綜合運用於管理決策問題,形成一門有關決策過程、準則、類型及方法的較完整的理論體系。決策一詞通常指從多種可能中作出選擇和決定。行政決策理論是用以指導和闡釋行政決策的理論依據。 代表性理論行政決策理論的種類較多,不同學者闡述問題的角度也各不相同。其中具有代表性的理論包括以下幾種。
  • 數據挖掘:基於R語言的實戰 | 第8章:決策樹
    第8章我們繼續來介紹數據挖掘中常用的有監督方法——決策樹模型。首先,本章對決策樹做了一個簡單的介紹,然後講解其建模過程,接著討論該模型的優缺點。本章的最後提供了一個使用R語言建立決策樹模型的案例,並給出了詳細的代碼及注釋。8.1節簡單介紹了決策樹模型。它是一種根據自變量的值不斷進行遞歸劃分以預測因變量的方法。
  • 《不確定性下的決策理論》短期課程(上)
    課程涵蓋了風險下的決策和不可計算的風險(模糊性),旨在讓同學們詳細了解決策理論中最重要的模型,如風險下的期望效用理論、主觀期望效用理論和模糊性下的最大最小化期望效用理論等。Hartmann老師著重講解了這些模型的公理化基礎,以及如何應用這些模型並進行經驗測試。