廣義可加模型GAM是什麼?如何在常用軟體上實現?

2020-12-05 計量經濟圈子

之前,我們引薦了①非參數, 半參數, 廣義可加, 偏線性, 單指數模型代碼公開,②廣義線性回歸模型估計:所有線性回歸的大倉庫,③廣義線性回歸模型估計:所有線性回歸的大倉庫(2)。今天,我們繼續引薦廣義可加模型(generalized additive model)及其程序。

線性模型簡單、直觀、便於理解,但是,在現實生活中,變量的作用通常不是線性的,線性假設很可能不能滿足實際需求,甚至直接違背實際情況。廣義加性模型是一種自由靈活的統計模型,它可以用來探測到非線性回歸的影響。

提出背景

非參數回歸不需要模型滿足線性的假設前提,可以靈活地探測數據間的複雜關係,但是當模型中自變量數目較多時 ,模型的估計方差會加大,另外,基於核與光滑樣條估計的非參數回歸中自變量與因變量間關係的解釋也有難度,1985 年 Stone 提出加性模型 (additive models) ,模型中每一個加性項使用單個光滑函數來估計,在每一加性項中可以解釋因變量如何隨自變量變化而變化,很好地解決了上述問題 。1990 年,Hastie 和 Tibshirani 擴展了加性模型的應用範圍 ,提出了廣義加性模型(generalized additive models)。

模型形式

經典的線性回歸模型假定因變量

與自變量

是線性形式:

其中,

通過最小二乘法獲得。

加性模型擴展了線性模型:

其中,

是光滑函數,

通過backfitting算法獲得。

廣義加性模型是廣義線性模型的擴展:

其中,

為線性預測值,

是非參數光滑函數,它可以是光滑樣條函數、核函數或者局部回歸光滑函數,它的非參數形式使得模型非常靈活,揭示出自變量的非線性效應。

模型不需要

的任何假設,由隨機部分

(randomcomponent)、加性部分

(additivecomponent)及聯結兩者的連接函數

(linkfunction)組成,反應變量

的分布屬於指數分布族,可以是二項分布、Poisson分布、Gamma分布等。

模型中不必每一項都是非線性的 ,可以納入線性等參數項 ,因為每個解釋變量的關係如都用非參數擬合會出現計算量大 、過擬合等問題 ,有時因變量與某個預測變量的關係簡化成參數形式會更便於解釋 ,這樣就出現了半參數廣義加性模型 ( semi-parametric generalized additive models) ,其形式為 :

優缺點

1) 可以引入非線性函數

2)非線性可能使得對

預測的更準確

3) 因為是」加性的」,所以,線性模型的假設檢驗的方法仍然可以使用

4) 因為是「加性」假設,所以GAMs中可能會缺失重要的交互作用

,只能通過手動添加交互項來彌補

應用示例

某研究者欲研究新生兒出生低體重與孕婦的年齡、先兆流產、妊高症的關係,共調查了997例婦女,整理後的數據見表1。調查包括孕婦的年齡age(0:<20歲;1:20~25歲;2:25~30歲;3:30~40;4:40歲以上),有無先兆流產xz(0:無;1:有),有無妊高症rg(0:無;1:有),試分析低出生體重與這些因素的關係。

分析

該資料的特點是因變量為二分類變量 ,體重小於2500 g 為低出生體重兒 。可以採用 logistic 回歸來分析低出生體重與解釋變量年齡 、先兆流產 、妊高症的關係 ,但是從醫學背景考慮 ,年齡較小與年齡較大的孕婦可能發生低體重的新生兒多 ,要使這種複雜的非線性關係直觀地呈現 ,我們用半參數 logistic 廣義可加模型擬合 ,變量 xz、rg 以參數形式 ,年齡 age 用光滑樣條來擬合 。

Stata軟體的程序:GAM: Stata module for generalised additive models

* 廣義可加模型 Generalized additive model運行程序示例:gam lnhwage educatn hours,df(3)* Graphsgamplot educatn,saving(graph1, replace)gamplot hours,saving(graph2, replace)graph combine graph1.gph graph2.gph,iscale(1.2)rows(1)ysize(2.5)xsize(5)graph export nonparametricfig21.wmf, replace

gam fits a generalized or proportional hazards additive model (GAM) by mazimizing a penalized log likelihood function. Each component of the resulting estimated function of the covariates is a cubic smoothing spline. The smoothness of each component function is determined by the 'equivalent degrees of freedom' of the corresponding covariate. Models supported: Normal (Gaussian) errors, binomial, Poisson, gamma, Cox (now with Stata's stcox), and link functions among identity, log, logit and inverse. This package is an update to accommodate the latest versions of the Windows operating system (specifically, Win 2000 and XP) and supersedes the version published in the STB (Royston P, Ambler G (1998) Generalized additive models. Stata Technical Bulletin 42: 38-43.)

R軟體的程序:Package 『gam』或者更為普遍使用的'mgcv'

gam is used to fit generalized additive models, specified by giving a symbolic description of the additive predictor and a description of the error distribution. gam uses the backfitting algorithm to combine different smoothing or fitting methods. The methods currently supported are local regression and smoothing splines

一些文獻對GAM方法的介紹:

註:由於網盤被過多分享很容易被blocked,決定還是把這個上傳到計量社群,有需要的群友可以自行下載。

相關焦點

  • 廣義差分模型 - CSDN
    為什麼呢,4,本章討論四個問題 什麼是自相關 自相關的後果 自相關的檢驗 自相關性的補救,第六章 自相關,5,第一節 什麼是自相關,本節基本內容 自相關的概念 自相關產生的原因 自相關的表現形式,6,一、自相關的概念,自相關(auto correlation),又稱序列相關(serial correlation)是指總體回歸模型的隨機誤差項之間存在相關關係。即不同觀測點上的誤差項彼此相關。
  • BIM建模用什麼軟體?常用的BIM軟體有哪些?
    BIM軟體廠商眾多,其開發的軟體各有優勢與適用領域,據不完全統計,目前全球BIM建模軟體有70款的多,僅為常用的就有25款,今天筆者就與各位聊聊BIM建模用什麼軟體?常用的BIM軟體有哪些?3.Autodesk Plant Design Suite主要應用於廠房工程,可應用3D模型提升廠房設計與審核質量,其包含的BIM軟體為Revit Structure,該軟體說明如前所述。
  • 常用統計分析軟體:SPSS、Stata、Minitab
    眾多新的統計軟體工具的出現成為了深入大數據洞察研究的重要助力。下面是幾款比較常用的統計分析工具。一、SPSSSPSS(StatisticalProductandServiceSolutions)是全球領先的統計分析與數據挖掘產品。成立於1968年,是世界上應用非常廣泛的專業統計和數據模型軟體之一。2009年IBM全資收購了SPSS公司,正式更名為「IBMSPSS」。
  • BIM建模軟體有哪些?關於常用BIM軟體的介紹!
    BIM軟體是實現BIM的一個工具,目前據不完全統計國際上稱得上BIM軟體的就有70多款,我國常用的也有二三十款之多,但常用的有哪些呢?今天我們就聊聊BIM建模軟體有哪些?關於常用BIM軟體的介紹!但至少可利用2D 或 3D 建築模型作為結構建模之參考,在此基礎上獨立搭建結構 BIM 模型作為分析使用。二、TeklaTekla是一家芬蘭公司,成立於1966年。Tekla Structures 從原名XSTEEL的軟體開發而來,提供結構工程師處理混凝土結構、鋼結構等較細緻的結構功能。
  • 抖音唱歌用什麼軟體好 主播常用伴奏歌曲軟體揭秘
    18183首頁 抖音唱歌用什麼軟體好 主播常用伴奏歌曲軟體揭秘 抖音唱歌用什麼軟體好 主播常用伴奏歌曲軟體揭秘 來源
  • R相關與回歸學習筆記(三十五)——樣條函數變換、線性可加模型(一)
    m個節點的三次樣條函數需要n+4個參數, 因為每段需要4個參數, m+1段需要4m+4個參數, 而在個節點上連續、一階導數連續、二階導數連續構成三個約束條件, 所以參數個數為m+4個。自然樣條函數假定函數在最左邊一段和最右邊一段為線性函數, 這樣m個節點需要m+2個參數。
  • 電氣人常用軟體大全,附軟體安裝包!
    電氣人必備什麼電氣軟體呢? 可能還有朋友不懂這些軟體的作用是什麼!
  • 廣義線性模型在生命表死亡率修勻中的應用
    實證分析結果表明,負二項回歸模型的擬合效果優於泊松回歸模型;進一步將年齡和年份兩因子選為數值型變量,對數據進行光滑處理,在負二項回歸模型下應用B-樣條函數進行修勻。在我國人口死亡率修勻的應用研究中,基於GLM的動態死亡率修勻方法可發現近20年來我國分年齡、分性別死亡率變化規律,具有很強的適用性。
  • BIM包括哪些軟體?常用的有哪些?
    BIM包括哪些軟體?常用的有哪些?其實這個問題筆者在之前的文章中不止一次提及過,但是還是有很多剛剛入門的小夥伴對於這個問題比較關係,這裡筆者就簡單的說一說。BIM包括的軟體非常之多,據不完全統計大概包括70款以上,因為BIM所涉及的範圍非常之廣,有建築、結構、水暖電、能耗、仿真、GIS、VR、AR等等,所以筆者沒辦法位大家一一舉例,目前大家能涉及到的軟體如下圖:常用的BIM軟體也是我們大家經常在市面上看到,這裡就簡單的為大家做個介紹:一、Revit(目前國內主流BIM軟體)Revit 原為Revit Technology
  • 廣義線性模型|二分類廣義線性模型—因變量是二分類變量
    (本例引用自陳希孺.廣義線性模型(一)[J].數理統計與管理, 2002,21(5):54-61)表1 小白鼠腹腔注射苯氰的毒性實驗結果圖2 廣義線性模型的命令調用  首先因本例小白鼠死亡與否是二分類數據,服從二項分布,可用probit回歸分析,因而在模型類型對話框中選擇「二元概率
  • 軟體無線電結構概述及其工程模型的EMC分析
    可以說這種無線電臺是可用軟體控制和再定義的電臺。 軟體無線電具有如下的特點: 第一、具有很強的靈活性,軟體無線電可以通過增加軟體模塊來增加新的通信功能。可以通過調用不同的軟體,轉換不同的通信方式,實現與其他無線電臺的通信,並可作為其他電臺的射頻中繼。 第二、具有極強的開放性。軟體無線電採用標準化、模塊化的結構,其硬體可以隨著器件技術的發展而更新或擴展。
  • 廣義線性模型學習
    設置正則化參數:廣義交叉驗證RidgeCV 通過內置的 Alpha 參數的交叉驗證來實現嶺回歸。該模型利用函數 logistic function 將單次試驗(single trial)的可能結果輸出為概率。scikit-learn 中 logistic 回歸在 LogisticRegression 類中實現了二分類(binary)、一對多分類(one-vs-rest)及多項式 logistic 回歸,並帶有可選的 L1 和 L2 正則化。
  • 電路仿真軟體有哪些?6款常用的電路仿真軟體推薦
    一些網友需要下載電路仿真軟體這一類軟體,但是,網絡上尋找電路仿真軟體卻比較麻煩。那麼,電路仿真軟體有哪些?小編今天就給大家整理了6款常用的電路仿真軟體推薦給大家,需要下載電路仿真軟體的網友可以挑選一下!
  • 物理學家開發神奇軟體 能模擬廣義相對論宇宙
    為了簡化和降低計算需求,現有的宇宙模型中仍然保留了經典的牛頓引力理論,並在描述宇宙膨脹時,假設宇宙在大尺度上是均質的,較小尺度上則是非均質的,即物質的分布並不均衡。根據不同區域物質密度的不同,宇宙的膨脹率也存在差異的。
  • 如何快速認識PR:premiere是什麼軟體?可以做什麼?
    現在的網絡真的是越來越強大了,全部都進入了信息化 的時代,所以,軟體是越來越重要,俗話說,人就應該是活到老,就要學到老,下面就由我和大家分享一個視頻製作軟體的使用。Adobe Premiere Pro 是由 Adobe 公司開發的一款非線性編輯的視頻編輯軟體。
  • 3dmax軟體製作簡易玫瑰花朵模型的分步驟教程
    3dmax軟體怎麼製作簡易玫瑰花朵模型?玫瑰花是生活之中的常用裝飾之一,在本期,模型雲就以玫瑰花為例,來講解3dmax製作花朵模型的方法,快來和模型雲一起看看3dmax軟體怎麼建模簡易玫瑰花模型的教程吧!
  • AMQP協議、模型及RabbitMQ常用組件
    消息收發的媒介是通過網絡傳輸來實現的。RabbitMQ最底層的技術原理,其實是網絡通信協議及其實現模型。目前,該協議最新版本是0-9-1簡單來說,AMQP 0-9-1 是一種消息傳遞協議用一句話來描述該協議:它使得符合該協議的客戶端應用程式能夠與符合該協議的消息中間件代理(broker)進行通信那麼AMQP 0-9-1 模型又是什麼呢?
  • Tobit, Truncreg, Heckman, Probit及其邊際效應實現程序及解讀
    前些日,咱們圈子引薦了①「實證研究中用到的200篇文章, 社科學者常備toolkit」、②實證文章寫作常用到的50篇名家經驗帖, 學者必讀系列、③過去10年AER上關於中國主題的Articles專輯、④AEA公布2017-19
  • 在JT引力中成功實現:統一量子力學和廣義相對論!
    科學家們一直試圖想出一個方程式來統一宇宙微觀和宏觀的定律:即統一量子力學和廣義相對論!現在我們又向前邁進了一步,新研究證明了這種統一在JT引力中能成功實現。在一維域的簡化玩具模型中,揭示了全息原理,即信息是如何存儲在另一個維度的邊界上。宇宙是如何開始的?研究最小事物的量子力學與廣義相對論研究的宏觀宇宙有什麼關係?