智能財務風險預警方法—支持向量機

2021-01-10 騰訊網

前言:財務預警是預防企業財務風險的重要舉措。而構建智能財務風險預警模型則能協助公司迅速定位財務風險的潛在源頭,避免大規模、高強度財務危機的爆發,對於已出現的財務風險有的放矢地採取針對性措施。本文介紹智能財務風險預警方法:支持向量機(Support Vector Machine,簡稱SVM),該方法是Cortes和Vapnik於1995年首先提出的一種線性分類,它在解決小樣本、非線性及高維模式識別中表現出許多特有的優勢,並能夠推廣應用到函數擬合等其他機器學習問題中。

「大數據與人工智慧環境下的智能財務風險預警方法」系列推文四:

智能財務風險預警方法—支持向量機

一、支持向量機理論

支持向量機是統計模型中一個比較年輕的模型,也是一種非常實用的時間模型,它的主要理論依據是統計學習理論中的維度理論,並且遵循著結構風險最小的原則,主要應用在處理模式與識別的分類問題上,或者時間序列預測,判別樣本等其他一系列判別方面的模型,此外,支持向量機還可以用在一些預測或者分析等領域,應用非常廣泛,工程科學等方面都能有所應用。當今世界上的支持向量機支持向量機的研究部分中,實際和理論方面的研究兩方在快速發展,如今支持向量機已經可以用於生物醫學識別,文本識別,人臉識別,手寫識別等非常多的領域。

支持向量機將分類樣本映射為向量空間的特徵向量集合,並在向量空間中構造最優分類超平面,使得在保證分類正確的同時,不同類別的集合與最優分類超平面的間隔最大。支持向量機算法最初提出是為了解決二元線性可分問題,目前 SVM 在線性可分、線性不可分等方面均有廣泛的應用。支持向量機方法基於統計學習理論的VC維數理論和結構風險最小化原理,簡言之,VC維度作為函數類的度量基本上是一個複雜的問題,如果VC維數較高,我們認為問題更複雜,直觀地,H樣本以H2的形式被所有可能的函數隔開,函數VC維度是它可以分離的最大樣本數H,機器學習的本質是模型的真實性,顯然,近似模型結果與實際之間存在一定的誤差,我們認為這些錯誤的積累是一種風險,當我們把樣本數據帶入分類器,並將結果與實際結果進行比較時,我們可以得到一些誤差,稱為經驗誤差。對經驗誤差的單一研究通常不會產生我們想要的高分類精度的結果,有兩個原因:第一,我們作為訓練樣本使用的數據是有限的,由於這部分數據不代表大量的其他樣本數據,因此用於近似訓練樣本數據的模型只能反映某些距離測試數據的特徵。第二,在大多數情況下,我們只追求這個經驗誤差的最小值,當經驗誤差最小化時,這並不意味著我們的模型完全適合於測試數據。在許多情況下,訓練數據可以達到95%以上,在替換測試數據時,學習模型具有非常低的精度,因此,我們添加了置信風險的概念,它表明我們可以信任分類器對測試數據進行分類的程度,當訓練樣本數據較大時,近似模型學習的結果可能較好,VC維數越小,其促進能力越強,因此,我們尋求在一組訓練樣本數據的擬合精度和儘可能少地識別訓練樣本的能力之間取得平衡,以便獲得更好的泛化能力。

二、支持向量機算法

SVM是從線性可分情況下的最優分類面發展而來的,基本思想可用下圖來說明。對於一維空間中的點,二維空間中的直線,三維空間中的平面,以及高維空間中的超平面,圖中實心點和空心點代表兩類樣本,H為它們之間的分類超平面,H1,H2分別為過各類中離分類面最近的樣本且平行於分類面的超平面,它們之間的距離叫做分類間隔(margin)。

設線性可分樣本集為(Xi,Yi,i=1,,n,X∈R,Y∈{+1,-1}是類別符號。d維空間中線性判別函數的一般形式為是類別符號。d維空間中線性判別函數的一般形式為g(x)=w:x+b(w代表 Hilbert空間中權向量;b代表閾值。)分類線方程為w·x+b=0,將判別函數進行歸一化,使兩類所有樣本都滿足g(x)的絕對值為1,也就是使離分類面最近的樣本g(x)的絕對值為1,此時分類間隔等於2/‖w‖,因此使間隔最大等價於使‖w‖(或‖w‖^2)最小。要求分類線對所有樣本正確分類,就是要求它滿足:

滿足上述條件,並且使‖w‖^2最小的分類面就叫做最優分類面,兩類樣本中離分類面最近的點且平行於最優分類面的超平面H1,H2上的訓練樣本點就稱作支持向量(support vector),因為它們「支持」了最優分類面。

利用 Lagrange(拉格朗日)優化方法可以把上述最優分類面問題轉化為如下這種較簡單的對偶問題,即:在約束條件

下面對(主:對偶變量即拉格朗日乘子)求解下列函數的最大值

若為最優解,則最優分類面的權係數向量是訓練樣本向量的線性組合。根據前面的分析,非支持向量對應的為0,因此上式中的求和實際上只對支持向量進行。b*是分類閾值,可以由任意一個支持向量通過式求得(只有支持向量才滿足其中的等號條件),或通過兩類中任意一對支持向量取中值求得。

通過分析可以看出,最優分類面是在線性可分的前提下討論的,在線性不可分的情況下,就是某些訓練樣本不能滿足條件,因此可以在條件中增加一個鬆弛項參數,變成:

對於足夠小的s>0,只要使

最小就可以使錯分樣本數最小。對應線性可分情況下的使分類間隔最大,在線性不可分情況下可引入約束:

在約束條件冪下對式求極小,就得到了線性不可分情況下的最優分類面,稱作廣義最優分類面。為方便計算,取s=1。為使計算進一步簡化,廣義最優分類面問題可以進一步演化成在條件的約束條件下求下列函數的極小值:

其中C為某個指定的常數,它實際上起控制對錯分樣本懲罰的程度的作用,實現在錯分樣本的比例與算法複雜度之間的折衷。

對於非線性問題,可以通過非線性交換轉化為某個高維空間中的線性問題,在變換空間求最優分類超平面。這種變換可能比較複雜,因此這種思路在一般情況下不易實現。

選擇滿足Mercer條件的不同內積核函數,就構造了不同的SVM,這樣也就形成了不同的算法。目前研究最多的核函數主要有三類:

(1) 多項式核函數

其中q是多項式的階次,所得到的是q階多項式分類器。

(2) 徑向基函數

所得的SVM是一種徑向基分類器,它與傳統徑向基函數方法的基本區別是,這裡每一個基函數的中心對應於一個支持向量,它們以及輸出權值都是由算法自動確定的。徑向基形式的內積函數類似人的視覺特性,在實際應用中經常用到,但是需要注意的是,選擇不同的S參數值,相應的分類面會有很大差別。

(3) S形核函數

這時的SVM算法中包含了一個隱層的多層感知器網絡,不但網絡的權值、而且網絡的隱層結點數也是由算法自動確定的,而不像傳統的感知器網絡那樣由人憑藉經驗確定。此外,該算法不存在困擾神經網絡的局部極小點的問題。從實驗結果來看,對不同的資料庫,不同的核函數各有優劣,而徑向基核函數在多數資料庫上得到略為優良的性能。

目前 SVM 是被各領域廣泛應用的機器學習算法之一,為了適用於不同領域多樣的數據,SVM 算法常與其他機器學習算法結合使用。

三、支持向量機的優點

支持向量機具有以下優點:

(1)科學性:擁有完整的理論體系,其思想核心是最大化分類邊際;

(2)有效性:支持向量機是運用自身的內積核函數來解決非線性問題,即將非線性問題轉化為核函數內的線性問題;

(3)實用性:它避開了傳統的從歸納到演繹的繁雜過程,直接根據訓練樣本進行預測,簡化了回歸與分類問題;

(4)魯棒性:對非支持向量樣本的調整對模型本身沒有影響,且對黑箱核函數的選擇不敏感;

(5)可推廣性:可以應用於包括財務預警在內的多種領域的研究,對構造函數的樣本集沒有特定的要求。

四、支持向量機應用於智能財務風險預警

任何風險都是有跡象的,財務風險也不例外,在發生之前,會在採購,付款,生產,存貨,銷售,收款,企業名聲等方面,或者財務管理等各個方面產生一系列異常的指標波動,智能財務風險預警主要基於大量數據分析。當前中國企業的形勢相當複雜,綜合來說,面臨風險的主要原因有兩個:外部因素和內部因素,但主要原因還是內部管理的問題,最終導致財務、公司治理等因素,這些因素最後會使得企業面臨困境。企業內部控制的主要因素是多方面的,企業可以通過管理降低風險水平。然而外部原因(客觀環境的變化及其影響),如法律政策背景的影響,行業變化的負面影響也可能導致企業面臨風險,雖然這些原因對企業來說是可以預測的,但大多數企業也都無法避免,也無法控制。支持向量機模型用於預測上市公司的財務困境風險,其中支持向量機模型是線性的,應射關係解決了維度問題,該算法簡單,準確,適合推廣,該模型基於最小結構風險原則,決策面和閾值可以通過數值計算軟體直接建立,極端解的結果是全局最優解,沒有困擾神經網絡方法的局部最小問題。因此,計算簡單,具有良好的泛化能力與傳統的神經網絡相比,支持向量機模型可以在過去的經驗數據和模型複雜度計算中選擇更好的參數,使模型具有良好的預測性能。在實踐中,實際樣本數據點與假設預測點不同,因此在正常情況下,預測點可能有一些數據點更為重要,而其他一些點則不那麼重要,特別是在預測中,在財務問題上,這些問題隨著時間的推移在模型中發生了很大變化,找到誤差和懲罰因子之間的平衡將影響算法的推廣和預測精度和泛化能力。

支持向量機模型可以在以往的經驗數據與模型的複雜度計算中,選取比較好的參數,從而使得模型具有良好的預測性能。在實際應用中,實際樣本數據點與假設的預測點並不相同,所以在通常情況下,可能存在了某些數據點對於預測點更為重要,而其他某些點則不那麼重要,尤其是財務風險的預測上,這些問題隨著時間的推移而變化很大,在模型的訓練樣本數據中,尋找誤差與懲罰因子的均衡將影響算法推廣和預測準確性的能力。

一個值得信賴的財務預警模型,可以或許讓企業的所有者對企業的財務運行狀況有足夠的重視。支持向量機相對於其他幾種智能財務風險預警模型而言,其通過求解凸二次規劃得到結果的方案,是一種高精度的全局最優解決方案。智能財務風險預警對於上市公司也是可以成為非常重要的一個方面,公司本身能及時的有效的發現潛在風險,也可以根據具體的財務狀況情況來調節公司內部的經營方案,避免公司進入經營困境之中。

經邦大數據致力於數字賦能用戶,實現風險可控下的運營價值最大化。目前已經在集團企業決策支持平臺、AI分析建模平臺、移動應用平臺和大數據集成平臺上取得豐碩成果,司企共建一批全國樣板客戶案例,獲得業界良好口碑。基本企業全面風險管控體系的基礎內控系統建設梳理與諮詢指導、核心風控系統的開發建設與實施落地、評價優化系統的監督評價與優化改進等服務,最終實現企業風控目標與戰略目標的統一。

相關焦點

  • 財務風險預警模型構建實證分析
    【摘要】財務風險預警模型可以從定量角度客觀準確判斷企業的財務危機程度,網絡的普及對此頗具影響。本文採用實證方法,選取了5個財務指標作為模型變量,構建了一個基於極值原理的Fisher線性判別模型,並對該模型進行了實證檢驗。結果表明,該模型具有較好的對企業財務狀況和風險狀況進行評價預警的能力。
  • 從零推導支持向量機 (SVM) | 雷鋒網
    3.3 支持向量定理 14 (線性支持向量機的 KKT 條件). 線性支持向量機的 KKT 條件如下。4.4 核方法上述核技巧不僅使用於支持向量機,還適用於一大類問題。,度量了模型對訓練數據的擬合程度;第二項稱為結構風險,也稱為正則化項,度量了模型自身的複雜度。
  • 「研究」支持向量機和其它類人工神經網絡的聯繫及區別
    支持向量機(Support Vector Machines,SVM)是20世紀90年代初,由Vapnik教授領導的研究小組提出的一種新的智能機器,它基於Vapnik等人在上世紀60年代末提出統計學習理論。
  • 論財務危機預警模型評析
    摘要:企業財務危機已成為企業利益相關者需要預測並應對的重要風險之一。企業應構建財務預警機制,及時溝通企業有關財務危機預警的信息,有效地防範和化解財務危機。本文對國內外財務危機預警模型逐一進行評析,旨在為構建符合我國實際並具有可操作性的財務危機預警模型提供借鑑。
  • 改進遺傳算法的支持向量機特徵選擇解決方案
    支持向量機是一種在統計學習理論的基礎上發展而來的機器學習方法[1],通過學習類別之間分界面附近的精確信息,可以自動尋找那些對分類有較好區分能力的支持向量,由此構造出的分類器可以使類與類之間的間隔最大化,因而有較好的泛化性能和較高的分類準確率。由於支持向量機具有小樣本、非線性、高維數、避免局部最小點以及過學習現象等優點,所以被廣泛運用於故障診斷、圖像識別、回歸預測等領域。
  • 改進遺傳算法的支持向量機特徵選擇解決方案介紹
    支持向量機是一種在統計學習理論的基礎上發展而來的機器學習方法[1],通過學習類別之間分界面附近的精確信息,可以自動尋找那些對分類有較好區分能力的支持
  • 支持向量機其實沒那麼玄乎
    在機器學習中,支持向量機也是一種常見的算法。支持向量機的原理是,在兩類的樣本中,尋找到能最好劃分類別的超平面。如果在平面中找不到,那就進入更多維度的空間,直至某個維度的空間能夠劃分出最合適的支持向量。兩條支持向量中間的那個超平面就是機器能夠利用的判斷邏輯。
  • 虛開等行為將實現智能識別和風險預警
    基於內外部數 據,結合業務專家辦案經驗總結的指標體系,構建智能風險研判分析模型,主動掃描發現潛 在違法風險企業,提高對涉稅違法犯罪的主動打擊能力。 疑點線索分析:支持稽查辦案人員高效精準開展各類線索和案件的疑點分析。針對不同 來源渠道的線索信息以及線索分析報告,梳理歸納線索分析報告的差異性,提煉線索分析功 能組件。
  • 支持向量機+sklearn繪製超平面
    核函數4.SVM 應用實例1.快速了解SVM 支持向量機(support vector machines,SVM)是一種二類分類模型。它的基本模型是定義在特徵空間上的間隔最大的線性分類器,間隔最大使它有別於感知機;而且SVM還支持核技巧,能夠對非線形的數據進行分類,其實就是將非線形問題變換為線性問題,通過解變換後的線性問題來得到原來非線形問題的解。舉個例子來說明支持向量機是來幹什麼的吧!
  • 25道題檢測你對支持向量機算法的掌握程度
    我相信你在不同的途徑中肯定也接觸過支持向量機,是不是覺得已經對這個東西有些頭痛,認為很多人都會,但是自己好像怎麼都不能明白過來它的原理,或者說你已經對自己有關支持向量機的知識已經很有自信了,那麼現在你來對地方了,這份技能測試就是專門測試你對於支持向量機的掌握程度已經是否可以應用。這份測試已經有超過550多人參加了,最後我會放出這些人的分數的分布情況,從而方便你對比一下自己的支持向量機的水平程度。
  • 如何使用支持向量機學習非線性數據集
    支持向量機(SVM)什麼是支持向量機呢?支持向量機是監督機器學習模型,可對數據進行分類分析。實際上,支持向量機算法是尋找能將實例進行分離的最佳超平面的過程。如果數據像上面那樣是線性可分離的,那麼我們用一個線性分類器就能將兩個類分開。
  • 超詳細支持向量機知識點,面試官會問的都在這裡了
    它的基本思想是在特徵空間中尋找間隔最大的分離超平面使數據得到高效的二分類,具體來講,有三種情況(不加核函數的話就是個線性模型,加了之後才會升級為一個非線性模型):當訓練樣本線性可分時,通過硬間隔最大化,學習一個線性分類器,即線性可分支持向量機;當訓練數據近似線性可分時,引入鬆弛變量,通過軟間隔最大化,學習一個線性分類器,即線性支持向量機;當訓練數據線性不可分時,通過使用核技巧及軟間隔最大化
  • 一種利用最小二乘支持向量機方法預測比採油指數的模型
    一種利用最小二乘支持向量機方法預測比採油指數的模型本篇文章來自中海油天津分公司和中國地質大學(武漢)等單位在油田開發方案設計時,比採油指數起著至關重要的作用。特別對於海上油田來說,受開發成本和時間限制的影響,存在測試時間較短和測試採樣點較少的劣勢。
  • Z值模型在房地產業上市公司財務預警分析中的應用
    本文對Altman非製造業上市公司財務失敗預警模型(Z3模型)在我國房地產業上市公司中的應用進行了實證研究。結果表明,房地產業上市公司大體上支持Z3值模型的有效性,企業管理者可利用Z3值模型進行財務分析,促進其改善經營管理;外部投資者、債權人可用其評價企業,並可作為投資決策的依據。
  • 機器學習|劉老師專欄—從邏輯回歸到支持向量機(一)
    劉老師專欄,今天分享的是從邏輯回歸到支持向量機解決分類問題的思路,算法理論知識固然重要,但更值得學習的是解決問題的思考方式,仔細欣賞劉老師的分享吧~需要複習邏輯回歸?請戳:機器學習|劉老師專欄——機器的「是非觀」機器學習|劉老師專欄——機器學習與是非題(二)機器學習|劉老師專欄——關於邏輯回歸的更多思考支持向量機是解決分類問題的另一個重要方法,關於這個方法的具體內容,因為我覺得插入公式和圖片都很麻煩,所以不再贅述。而且,相比於教材來說,贅述也不過是一種重複。
  • 深度講解支持向量機背後的數學思想
    在支持向量機(support vector machine,SVM)算法中,有諸多數學思想。學習SVM是一個非常好的實踐數學思想的過程,為我們以後創新解決問題思路提供了啟發。在卷積神經網絡興起之前,在機器學習界一直是非常受追捧的算法,不光是因為其有良好的泛化能力、很高的準確度,更是因為其完備的數學理論依據以及諸多較難理解的數學知識。
  • 一個簡單的案例帶你了解支持向量機算法(Python代碼)
    相反,「支持向量機」就像一把鋒利的刀—它適用於較小的數據集,但它可以再這些小的數據集上面構建更加強大的模型。現在,我希望你現在已經掌握了隨機森林,樸素貝葉斯算法和模型融合的算法基礎。如果沒有,我希望你先抽出一部分時間來了解一下他們,因為在本文中,我將指導你了解認識機器學習算法中關鍵的高級算法,也就是支持向量機的基礎知識。
  • 財務分析是什麼?財務分析的目的與基本分析方法
    因此可以這樣下定義:財務分析的本質是搜集與決策有關的財務信息,並加以分析和解釋的一項技術。財務分析的方法與分析工具很多,應根據分析者的目的而具體選擇。最經常用到的是圍繞財務指標進行單指標、多指標綜合分析、再加上借用一些參照值,運用一些分析方法(比率、趨勢、結構、因素等)進行分析,然後通過直觀、人性化的格式展現給用戶,比如報表和圖文報告等。
  • 【紅岸預警】 科陸電子頻繁變賣資產背後:財務危機深重 超12億元...
    紅岸預警:財務危機深重 或有12.52億資金遭佔用科陸電子的財務危機,從其他財務數據中也可見端倪。公司財務費用持續增長,2018年其財務費用為4.42億元,同比上升35.81%;2019年半年報為2.24億元,繼續同比增加20.95%。
  • 形象講解支持向量機
    支持向量機(SVM)是由分離超平面的判別分類器。換句話說,給定標記的訓練數據(監督學習),算法輸出最佳超平面,其對新示例進行分類。在二維空間中,這個超平面是將平面分成兩部分的線,其中每一類都位於兩側。本文以一個外行的角度來學習假設在圖表上給出了兩個標籤類的圖,如圖(A)所示。你能決定一個分類線嗎?