在這一節中我們開始處理一個常見的隨機過程: Poisson過程, 這是一個典型的離散型的隨機過程, 藉此我們可以了解離散型隨機過程研究的基本範式. 從理論價值來看, Poisson過程本身也是隨機過程的核心之一, 它從分類上屬於計數過程、獨立平穩增量過程(可加過程)、Markov過程這三個過程的交集, 藉助Poisson過程我們也可以進一步了解這三類過程.
Poisson過程的定義
首先我們需要解釋在上面引言中提到的一個概念: 計數過程, 這個我們在之前的筆記中並沒有給出定義, 這裡我們補上它的定義:
定義(計數過程): 定義在概率空間 上的隨機過程 被稱作是一個計數過程, 如果 表示的是時間區間 內某一個"隨機事件 "發生的次數.
[注 1]: 根據定義, 我們知道 可以取任意的自然數, 這意味著計數過程的狀態空間 ;
[注 2]: 計數過程的軌道一定是個不減函數, 因為 內計數一定包含了 內的計數( ), 也就是說 ;
[注 3]: 計數過程的增量 表示的是時間區間 內隨機事件 發生的次數.
Poisson過程是這樣的一個計數過程: 我們考察一個單行車道上某一時間段內汽車的流量, 可以想到, 在一定的時間尺度下, 小時間段內只會進行一次計數(因為是單行車道), 或者說在時間區間 內計數增量 大概率為 , 小概率比1大. 在最簡單的情況下, 這個增量和 之間存在線性依賴關係, 並且在不相交的時間區間內應該是獨立的, 也就是說我們希望這是一個獨立平穩增量過程, 且它的增量在時間區間長度足夠小的情況下應該和時間區間的長度線性依賴, 將這樣的想法嚴格化, 我們就有:
定義(Poisson過程): 一個計數過程 如果滿足:
(1) (在初始時刻才開始計數);
(2) 是獨立平穩增量過程;
(3) 的增量滿足在 足夠小的情況下, 以及 , 這裡 表示 的高階無窮小, 即 ,
我們就稱該計數過程為一個參數為 的Poisson過程.
現在我們來看看這個過程滿足什麼特性. 因為 是一個獨立平穩增量過程, 它的增量的分布在時間平移下保持不變, 於是 , 由於 , 我們進一步得到 , 因此我們有
當 是一個小量, 比如 的時候, 根據定義, 我們可以將上面的結果寫成
這裡 是Kroneker符號, 是 的概率. 我們可以通過歸一化條件
將其解出來:
也就是說我們有
我們將區間 劃分成兩個子區間 和 , 根據定義, 我們知道增量在這兩個區間上是獨立的, 於是它們積事件的概率等於各自概率的乘積, 此外 可以看作是在 條件下 發生的積事件, 利用全概率公式則有
容易看到, 這樣的約定下 確實是歸一化的.
我們考慮 上 的變化. 我們將區間 劃分為兩個子區間 , 因為這是獨立增量過程, 發生在這兩個區間上的增量是相互獨立的, 它們積事件的概率等於各自發生概率的乘積. 這個事件等效於在 的情況下 發生, 二者是獨立的, 於是根據全概率公式我們有:
也就是說我們有
或者說微分方程
這樣的結構暗示了數學歸納法. 為此我們需要求解得到 的表達式. 首先我們知道 , 注意到 的時候要滿足 必須有 和 , 於是我們可以寫出
它對應了微分方程
代入初值 我們可以解得 . 根據常微分方程的理論, 我們可以解出
這表明給定時刻 後隨機過程 服從參數為 的Poisson分布, 這就是我們稱其為Poisson過程的原因. 不僅如此, 利用Poisson過程是獨立平穩增量過程的特性, 我們可以發現它的增量滿足
也就是說Poisson過程的增量同樣服從參數為 的Poisson分布. 反過來, 如果一個初始計數 的獨立平穩計數過程的增量 服從參數為 的Poisson分布, 我們把上面的這個連等順序改一下, 就可以證明這個隨機過程本身服從參數為 的Poisson分布, 進而我們可以在小量展開的基礎上得到定義中的第(3)個要求. 綜上所述:
定理: 一個增量獨立且從零開始的計數過程 是一個參數為 的Poisson過程, 若且唯若 對任意 成立.
[證:] 必要性我們已經在上面的推理中給出來了, 現在我們來證明充分性, 從已知條件我們可以得知 增量獨立, 初值為零, 增量平穩. 因此只需要再證明
因為 , 於是 , 於是
當 的時候, 我們就有 .
當 的時候, 則有
當 的時候, 我們有
這樣根據定義, 我們就證明了這個命題.
Poisson過程的性質Poisson過程的數字特徵
回顧我們之前的定義, 我們關注的隨機過程 的數字特徵主要是它的均值函數 , 方差函數 , 自相關函數 和自協方差函數 . 對於Poisson過程, 它的數字特徵由下面的定理給出:
定理(Poisson過程的數字特徵): 設 是一個參數為 的Poisson過程, 則
(1) ;
(2)
(3) 對 , 有
(4)
[證]: (1)在上一部分我們已經得到了 時刻的Poisson過程的分布列為
這直接導致了 的期望和方差就是Poisson分布的期望和方差, 正如我們所熟知的, 參數為 的Poisson分布的期望和方差正是 , 既然Poisson過程在時間參數為 時服從參數為 的Poisson分布, 那麼它的期望和方差自然就是 . 不僅如此, 利用 我們還可以得到其二階原點矩
(2) 不妨設 , 我們考慮時間區間 , 這兩個自區間是不相交的, 從而其增量是獨立的, 注意到 , 而 和 分別就是這兩個區間上的增量, 於是
當 的時候, 我們就應該對應地將 拆成 , 同樣地推理過程給出的結果為 , 於是我們就有
(3) 注意到 , 我們利用第一節介紹的Poisson分布的特徵函數為 , 將這裡的 替換為 就得到了其 的特徵函數.
(4) 注意到協方差滿足, 利用(1)和(2)我們就有
證畢.
Poisson過程的可加性
我們知道Poisson分布具有可加性, 即如果 , 且 彼此獨立, 則 , 這個命題是在概率論中接觸的, 這裡我們回憶一下它的證明:
這裡關鍵就是利用 的獨立性和全概率公式. 類似地, 我們有:
定理: 設 和 是兩個獨立的Poisson過程, 參數分別為 和 , 若令 , 則 是一個參數為 的Poisson過程.
[證]: 我們在上一篇文章中就已經指出了兩個獨立的獨立平穩增量過程的和還是獨立平穩增量過程, 而兩個零初值的隨機過程的初值自然還是零, 因此 是一個零初值的獨立平穩增量過程, 要證明它是個Poisson過程, 我們只要證明(1) 它的增量 或者 (2) 滿足我們定義給出的小變化的概率分布. 按照(1)的思路就是模仿我們這一小節最開始的那個過程, 不過需要同時用到 的獨立性和它們各自的獨立平穩增量特徵, 比較麻煩. 這裡我們採用(2)這個思路進行. 因為 和 是獨立的, 它們的增量自然也是獨立的
設 是一個小量, 因為 , 我們就有 , 利用全概率公式我們就有
以及
進而
這樣我們就證明了這個命題.
Poisson過程的可分解性質
這個性質的意思不好直接敘述, 我們直接看下面的定理:
定理: 設 是一個參數為 的Poisson過程, 我們將 詮釋為在時間區間 上某隨機事件 發生的次數. 假定每次事件 發生以後, 我們有 的概率將其記錄下來, 每次記錄之間彼此獨立. 以 表示在時間區間 上記錄下來的 的次數, 則 是一個參數為 的Poisson過程.
注: 這個定理的這樣表述出來的意義很清晰, 假設一條道路上在一個時間區間內通過的車輛的數目是一個Poisson過程, 我們讓一個人去記錄通過的車輛的數目, 由於種種原因, 這個人無法將每次車輛通過都統計在內(粗心的記錄員), 我們希望從這個人的記錄反推實際情況. 這個定理描述的就是這樣一個模型.
[證]: 的初值和 的初值自然是一致的, 即 . 因為記錄 這個事情彼此是獨立的, 自然 的增量也是獨立的. 為此我們只需要證明 的增量 . 這裡我們需要注意到一個事實, 那就是記錄過程其實本身是一個Bernoulli實驗, 假設時間區間 上事件 發生了 次, 那麼在這個時間內記錄的次數 就服從二項分布 , 這個思考暗示我們使用全概率公式:
這就表明 .
Poisson過程的到達時刻與時間間隔
我們還是將Poisson過程放到計數過程這個模型中來, 用 表示某個事件 在時間區間 內發生的次數, 用 記錄 第 次發生的時刻(稱作到達時刻 ), 用 表示第 到第 發生的時間間隔 , 那麼顯然有
顯然, 和 構成 上面的一個隨機過程, 我們這一小節的任務就是找到它們的分布. 這個我們從 出發, 因為 是很容易和 關聯起來的.
我們現在來計算 的概率密度函數, 我們知道, 因此 這裡 表示第 次事件發生在區間 內, 這就要求在 時刻以前已經發生了 次事件, 而 內又發生了一次, 這樣我們就將 轉寫成了 這個我們已知其分布的事件的概率問題了. 根據這個論述, 我們有 這就是 的概率密度函數, 我們對上面的式子進行一個改寫, 寫成
這是 分布的密度函數, 這表明:
(為了和 函數區分開, 我們這裡用 表示Gamma分布.)
接下來我們尋找 滿足的分布. 我們從 開始, 注意到 , 因此
這是指數分布的密度函數, 因此我們有 . 接下來, 我們求解 , 從分布函數入手. 直接計算分布 不是很容易, 我們可以嘗試從條件概率出發, 因為 是已經知道的. 我們考慮條件概率 , 這個概率的意思是已知 , 求 落在 這個區間內的概率, 這等同於在時間區間 內至少發生了一次事件, 即 , 於是
最終的結果不含 , 這表明 和 是獨立的, 因此
這是指數分布的分布函數, 因此我們得到了 . 把這個想法推廣到一般情況, 條件概率就表示在已知 的情況下求 的概率, 這等價於在這個區間內至少發生了一次事件, 即這個事件, 而增量的分布只和增量所處時間區間長度有關, 於是
因而 的條件分布和 都無關, 從而
綜合這些結果, 我們得到了:
定理: , 這裡 表示獨立同分布.
根據這個定理, 我們可以用指數分布生成的隨機數種子去模擬Poisson過程的時間間隔 , 然後得到 , 接下來利用 就可以得到 的軌道了. 這個操作的實現可以參考下面的代碼:
import random import matplotlib as mpl import matplotlib.pyplot as plt %matplotlib inline import numpy as np import seaborn as sns from matplotlib import rcParams config = { "font.family":'serif', "font.size": 20, "mathtext.fontset":'stix', "font.serif": ['SimSun'], } rcParams.update(config) Lambda = 1/6 n = 30 T = np.random.exponential(scale=1/Lambda,size=n) # np.random.exponential(scale,size)中的scale參數為指數分布的參數lambda的倒數 t = np.hstack([[0],np.cumsum(T)]) # 這裡np.hstack(tup)可以幫助我們實現對數組的疊加, 這裡相當於 t=[0] 和 t.append(x) for each in np.cumsum(T) # np.cumsum(list) 相當於 Sum = []; for each x in list: x += x ; Sum.append(x) for i in range(n): plt.plot((t[i],t[i+1]),(i,i),c='r') plt.xlabel('$t$') plt.ylabel('$N_t$') plt.ylim([0,n]) plt.xlim([0,np.ceil(t.max())]) sns.despine() # 去掉邊框的上邊和右邊 plt.show()這裡給出一次模擬結果:
一次Poisson過程的模擬接下來我們敘述到達時刻的條件分布, 在敘述這個定理之前, 我們先介紹一個概念: 順序統計量 .
定義(順序統計量): 在總體 中隨機抽樣出容量為 的樣本 , 我們稱 從小到大排序得到的 為這 個樣本的順序統計量. 特別地:
我們會用到下面的一個結論:
[引理]: 設總體 是一個連續型隨機變量, 密度為 , 它的簡單隨機樣本 ( )的順序統計量 的聯合密度為
[證明]: 設 , 根據密度函數的定義, 我們有 這裡事件 表示對於每個 , 有且僅有一個 落在區間 上, 如果存在至少兩個落在同一個區間上, 則與順序統計的要求矛盾. 要實現這個事件, 我們只要首先從這 個中抽出一個讓它落在第一個區間上, 在剩下的 個抽出一個讓它落在第二個區間上, 以此類推, 我們就有 種選法, 從而Poisson過程的推廣
Poisson過程要求這個過程的強度 是個定值, 這個條件在很多情況下是不成立的, 為了解決這個問題, 我們將前面介紹的Poisson過程推廣到強度參數 隨時間變化的情況, 稱作非齊次Poisson過程 , 對應地, 前面介紹的Poisson過程就叫做齊次Poisson過程 .
定義(非齊次Poisson過程): 一個計數過程 如果滿足
(1) ;
(2) 具有獨立增量性;
(3) 它的增量滿足 和 ,
我們就稱這個計數過程為一個強度函數為 的非齊次Poisson過程.
[Remarks:]
[1]: 仿照之前的方式, 我們可以證明條件(3)與 等價, 原本的常係數的常微分方程此時會變成變係數的場微分方程. 當 的時候這個結果就退化到我們當時給出的齊次情況了.
[2]: 非齊次Poisson過程保留了Poisson過程的獨立增量性, 但是捨棄了平穩增量性.
[3]: 強度函數 一般不是預先給定的, 而是通過實際背景給出.
[4]: 非齊次Poisson過程的時間間隔不再服從指數分布, 而且也不再相互獨立. 我們以 為例, 則有
這就不再是Poisson分布了, 不過從這個例子還無法看出非獨立性. 我們考慮 則有可見 和 有關, 這就說明它們之間不是獨立的.
除了上面的推廣方向以外, 還有下面的一個推廣方向:
定義(複合Poisson過程): 設 是一個強度為 的Poisson過程, 獨立同分布, 且與 相互獨立, 令
則稱 是一個複合Poisson過程.
複合Poisson過程是隨機個隨機變量的和的典型例子, 利用本系列第一篇文章中給出的結果以及全期望公式, 我們可以證明:
定理: 若 是一個複合Poisson過程, 則
(1) 是一個獨立平穩增量過程;
(2) .
[證明]: (1) 該過程的增量為
考慮到 和 的獨立性, 在不相交的時間區間內上式給出的和自然是獨立的. 增量的平穩性則根據隨機個隨機變量的和的分布公式有
注意到 的平穩增量性, 上面的表達式最終只依賴於 , 這就證明了增量的平穩性.
(2) 利用全期望公式 , 我們首先有
於是
進而全期望公式給出
利用全期望公式算直接算方差不好算, 我們改用全期望公式算特徵函數. 得到二階矩後計算方差, 當然我們同時也能算期望:
於是
進而
於是方差為
當然我們可以進一步算出更高階的矩, 不過這裡我們不需要這樣做.
之前我們給出了Poisson過程的分解性質, 利用上面的結論, 我們可以給出一個更簡捷的證明:
假定 , 則
就表示了之前我們提到的選擇性記錄過程. 兩點分布的特徵函數為 , 因此 的分布就是
這是參數為 的Poisson分布的分布函數. 這就證明了我們前面給出的結論.
還有一個推廣方向的結果叫做條件Poisson過程 , 定義如下:
定義(條件Poisson過程): 若 是一個計數過程, 是一個非負的隨機變量, 若在已知 的條件下 是一個參數為 的Poisson過程, 則稱 為一個條件Poisson過程(或者稱作混合Poisson過程).
條件Poisson過程喪失了增量的獨立性, 但是保留了增量的平穩性.
最後一個推廣的方向源於Poisson過程的一個等價定義:
一個計數過程, 如果相鄰事件的時間間隔獨立同分布於 , 則這個計數過程就是一個參數為 的Poisson過程.
這個命題的證明比較麻煩, 這裡不給出它的證明. 很顯然, 如果我們將上面的 變成任意一個分布, 就得到了一個推廣:
定義(更新過程): 設 為獨立同分布的非負隨機變量序列, 令 , 對 , 令
或者
則稱 是一個更新過程. 這裡 可以理解為事件 在時間 內發生的次數.
顯然, 當 , 則上面的更新過程就退化為Poisson過程.
上述這幾個推廣在物理學中應用價值不大, 因此這裡只是簡單介紹一下, 對此有需求則可以翻看相關的教科書.