置信區間與串行數據鏈路如何關聯

2021-01-09 EDN電子設計技術

最近我對為數眾多的年輕工程師感到擔憂,他們在大學裡似乎沒有學過應用概率課程,不知道如何量化估計的確定性。高速串行通信需要估計某條通信鏈路的誤碼率(BER),並量化該估計的置信度。我聽到越來越多的年輕工程師這樣說:ziZednc

「好吧,我很肯定這條通信鏈路的誤碼率低於1E-12,」或者更糟糕的,「我對給你的BER估計值有99%的把握。」ziZednc

但他們對聲稱的99%常常又沒有任何依據。這個數字非常吸引人,因為它顯得非常有把握,同時又留了1%的退路以便在事情出現偏差時有合理的藉口。記住,這種營銷式的思路不應該屬於一個合格的工程師!ziZednc

置信區間

首先我們來看一下置信區間的精確數學定義:ziZednc

ziZednc

其中m』是一個可變的整數,m是實際觀察到的誤碼數,BER是鏈路的實際誤碼率, 是估計值。
公式1用文字描述就是:「如果BER比設想的糟,那麼估計的置信度就是本應觀察到更多誤碼的概率。」ziZednc

二項式分布

公式2的二項式分布定義了在已知任一比特出錯概率p的條件下,在一定比特數n中觀察到一定誤碼數m的概率。ziZednc

ziZednc

公式2完全正確,但並不實用,因為n!通常很大,大多數數字計算器或計算機都無法處理。因此我們必須找出機器能夠處理的近似公式。ziZednc

泊松分布

在實際的串行通信中,假設鏈路設計得非常好,公式2中的m和p值一般都很小,但n很大。在這種情況下,我們可以做以下兩次簡化近似:ziZednc

ziZednc

ziZednc

我們知道:ziZednc

ziZednc

ziZednc

將這兩個公式代入公式2就得到著名的泊松分布。ziZednc

值得注意的是,公式7中不再有任何大的階乘項,因而用數字計算機進行計算成為可能。ziZednc

ziZednc

置信區間與無誤碼觀察時間

假定我們看到一條處理n比特不出錯的鏈路,利用P(m)表達式,可以對公式1進行評估。直接將公式1進行擴展得到:ziZednc

ziZednc

雖然通過代數技巧可以得到這些無限和的諸多封閉解,但這並非其中的一個。我們很幸運,因為可以利用如下的概率公理:ziZednc

ziZednc

該公式表明,一個事件發生的概率等於1減去其補發生的概率。這樣公式8可以改寫為:ziZednc

ziZednc

由於m的值幾乎總是很小,所以公式10對設計良好的串行通信鏈路來說通常都是可跟蹤的。在這個特定案例(無誤碼觀察時間)中,m=0,並且:ziZednc

ziZednc

表1針對幾個不同的數值np給出了置信區間的計算結果。數值np可以被想像為無誤碼觀察時間,歸一化為UI/ ,其中UI是單位間隔。換句話說,如果我們估計鏈路的BER為1E-12,那麼np=1意味著我們觀察到1E12個比特,np=5意味著我們觀察到5E12個比特。ziZednc


表1:置信區間和無誤碼觀察間隔的關係。ziZednc

ziZednc

從表中的數據可以看出,只有當無誤碼觀察間隔達到5E12個比特,才可以斷言一條鏈路以等於或小於1E-12的BER運行的確定性高於99%。ziZednc

有誤碼的置信區間

如果我們增大觀察間隔會發生什麼?如果觀察間隔足夠大,我們會看到很少的誤碼。這對置信區間有什麼影響呢?在研究這個問題之前,讓我們先看看另一個問題:在表1所示的每一個案例中,我們希望觀察到多少誤碼?ziZednc

下面的數學公式可以精確地定義隨機實驗的期望輸出結果:ziZednc

ziZednc

其中n是完成的試驗次數,px是任何一次試驗成功的概率。在我們的案例中,「成功」意味著捕捉到一個誤碼。從公式12來看,不管觀察到的誤碼數是多少,我們的期望值就是觀察到的比特數乘以任何一個比特出錯的概率。它同時表明,表1中的數值np就是我們期望觀察到的誤碼數。ziZednc

接下來讓我們用更多的數據來豐富表1,如表2所示。ziZednc


表2:觀察到的誤碼數不同時置信區間與觀察時間的比較。ziZednc

ziZednc

現在我們給CI一個數字上標,表示觀察到的誤碼數。對每一列CIN,藍色粗體字代表最小觀察時間,它將產生一個大於99%的置信區間。注意,觀察時間的單位是期望誤碼數。表3列出了期望誤碼數和實際觀察到的誤碼數,以及兩者的比值(觀察值/期望值):ziZednc


表3:不同觀察時間下觀察到的誤碼數與期望誤碼數之比。ziZednc

ziZednc

趨勢很明顯:如果延長觀察時間並接受更多觀察到的誤碼,允許觀察到的誤碼數會越來越接近期望值,而在BER估計中仍能提供大於99%的置信度。這與我們的直覺一致,若是能將觀察時間無限延長,我們應該能夠精確地觀察到期望的誤碼數。ziZednc

精度

延長觀察時間的另一個好處是能夠提高BER估計的精度。為了定量地進行討論,我們需要確定一下「精確」的具體含義。因此,我們為BER估計的置信區間選擇了一個有用的範圍:70%到99%。ziZednc

如果置信區間涉及的BER估計範圍更小,就需要將特定的觀察定義得更「精確」。我們一般會說:「我們不信任低於70%的置信區間,也不在意置信區間比99%高多少,只要夠高就行。」ziZednc

圖1顯示了在不同的觀察時間下,置信區間是如何隨BER估計變化的。觀察時間已經被歸一化,這樣對於每一個觀察到的誤碼數,1E-12 BER估計中的置信度就非常接近99%。從這張圖可以清楚地看到,隨著觀察時間(和觀察到的誤碼數)的增加,曲線有效區域的傾斜度也隨之增加。圖2對此進行了量化,將BER估計的有用範圍作為觀察時間的函數繪成了曲線。ziZednc

隨著觀察時間接近無限,你可以想像這個極限:「CI與BER」曲線變成完美的階梯函數,有用的BER估計範圍趨於0,我們在不確定性為零的條件下得到了一個完全精確的BER估計。ziZednc


圖1:不同觀察時間下置信區間隨BER估計的變化。ziZednc

ziZednc


圖2:隨著觀察時間的延長,有用的BER範圍將縮小。ziZednc

ziZednc總結

置信區間讓我們可以量化鏈路BER估計的確定性。對串行通信鏈路設計師來說這是必不可少的工具,它能幫助我們以定量的方式跟其他工程師談論永遠不具有完全確定性的事件,這對於任何一個嚴肅的工程討論都特別重要。「我很肯定」這樣的表達不適合工程師,最好留給營銷人員推廣和辯護使用。ziZednc

使用文中介紹的置信區間的數學定義,你可以正確地向其他工程師表達估計的確定性。我還用文字說明了置信區間的含義,理由有二:ziZednc

● 你可以欣賞工程學理論的進步;
● 你可以將置信區間的基本思想應用到串行通信鏈路設計以外的學科中去。ziZednc

文章以數學公式和文字對置信區間進行了基本定義,還展示了觀察時間如何影響觀察到的誤碼和期望誤碼之間的關係以及BER估計的精度。希望這些已經引起你的興趣,激勵你繼續探索工程學的發展。ziZednc

《電子技術設計》2017年8月刊版權所有,轉載請註明來源及連結。ziZednc

ziZednc

相關焦點

  • 區間估計、置信區間
    點估計與區間估計刮獎猜測點估計就是單猜某一張彩票是大獎,區間估計就是將點估計的範圍擴大,可以一盒一盒、一個區域、一座城市,說白了就是設置一個半徑。下面採用置信區間構造區間估計但是這個區間多大會影響到所有估計中包含真值的比例,比如由樣本均值的抽樣分布可知,在重複抽樣或者無限總體抽樣的情況下,樣本均值的期望等於總體均值。無數個樣本均值最終可以構造成下面的圖形,但是實際中只能有有限個數據。均值與單個值的距離是相對的,如果某個值在均值的半徑範圍內,則均值也在這個值的對應半徑範圍內。
  • 通俗易懂告訴你:何為95%置信區間?
    CDA數據分析師 出品置信區間的概念是由原籍波蘭的美國統計學家耶日·奈曼提出的。簡單理解,比如從北京到張家界旅遊5天,你恐怕不能準確說出要花多少錢,但你可以給出一個範圍,比如10000—13000,你會覺得比較可信。
  • Pytorch貝葉斯庫BLiTZ實現使用LSTM預測時序數據和繪製置信區間
    本文將主要講述如何使用BLiTZ(PyTorch貝葉斯深度學習庫)來建立貝葉斯LSTM模型,以及如何在其上使用序列數據進行訓練與推理。在本文中,我們將解釋貝葉斯長期短期記憶模型(LSTM)是如何工作的,然後通過一個Kaggle數據集進行股票置信區間的預測。
  • 置信區間t分布
    1.陳述t分布的形狀和正態分布之間的差異2.說明t分布的形狀與正態分布之間的差異如何受自由度的影響3.在表格中使用以查找在置信區間中使用的t的值4.使用t計算器查找置信區間中使用的t的值在正態分布的介紹中顯示,95%的正態分布面積在平均值的1.96個標準偏差內。
  • 推論統計 | 抽樣分布,中心極限定理和置信區間
    因此,我們用置信區間回答的問題是:對於任何給定的估計(樣本),我們對樣本周圍的一定範圍實際上包含真實人口比例的信心如何?注意:1.置信度「級別」是指該方法的長期成功率,即這種類型的間隔多久捕獲一次感興趣的參數。2.一個特定的置信區間給出了相關參數的合理值範圍。
  • MAX9217/MAX9218在視頻鏈路中傳輸音頻數據
    MAX9217/MAX9218組是一個收發器對,發送器(MAX9217)將並行數據轉換成串行數據,發送給接收器(MAX9218);接收器再將串行數據轉換成並行數據。
  • 線性回歸分析詳解9:顯著性水平、置信度、置信區間及其計算方法
    置信區間是回歸分析的一個重要概念,但是,將回歸分析應用到需求預測時,並不強求引入置信區間,也就是說,用回歸分析做需求預測時,可以不進行置信區間的計算,而直接進行後續的預測步驟。所以,從這一點來說,大家可以跳過本章,直接進入專欄的第10章,用線性回歸分析進行預測。
  • 【乾貨】你明白臨床試驗中的P值和置信區間的含義嗎?
    P值或者置信區間上。那麼P值和置信區間代表什麼意思呢?為什麼我們要做計算P值或置信區間來做統計推斷呢?在講P值和置信區間之前,我們先講講樣本與總體。在《醫學統計學》中,根據研究目的而確定的同質觀察單位的全體成為總體。觀察單位,又稱個體,是統計研究中的基本單位,他可以是一個人、一個器官、一個細胞。
  • 我們常聽說的置信區間與置信度到底是什麼?
    這裡就涉及到統計學裡面的置信區間與置信度,本文簡要介紹了置信區間這一核心概念,它有助於我們從直觀上理解評價估計優劣的度量方法。本文討論了統計學中的一個基本術語 :置信區間。我們僅以一種非常友好的方式討論一般概念,沒有太多花哨的統計術語,同時還會使用 Python 完成簡單的實現!
  • 第四十講 R-線性回歸:預測模型及可信區間
    那麼,當我們取得了預測模型後,根據該預測模型對新數據進行預測得出的預測值是什麼?這個預測值的可信度如何呢?今天的講解中,我們會給出答案。我們首先建立一個簡單的線性回歸模型,該模型根據速度預測汽車的停車距離。
  • 串行ATA總線應用技術
    串行ATA (SATA-Serial ATA)是Intel代表的存儲設備開發商開發的ATA-7串行版本SATA 1.0。目的是把基於ATA的存儲能夠更普遍應用於桌面、移動存儲設備、低端伺服器和網絡存儲領域[1]。2004年4月,IDF再次對標準1.0版本的帶寬和物理層連接器進行較大改進,並發布了增強的標準SATA I,以兼容SAS物理層,滿足數據中心存儲需要[1]。
  • [理論+SPSS實戰] 點估計與區間估計詳細解析+把論文寫在抗擊疫情的第一線
    任意給你一袋食品,是100%在這個區間內,還是95%的可能在這個區間內,還是90%的可能在這個區間內?這個可能性(n%)就是常說的置信水平,也稱為置信度或者置信係數。如何利用SPSS計算置信區間step1:數據源step2:計算置信區間--SPSS
  • 參數估計之點估計和區間估計
    作者 | CDA數據分析師參數估計(parameter estimation)是根據從總體中抽取的樣本估計總體分布中包含的未知參數的方法。人們常常需要根據手中的數據,分析或推斷數據反映的本質規律。即根據樣本數據如何選擇統計量去推斷總體的分布或數字特徵等。統計推斷是數理統計研究的核心問題。所謂統計推斷是指根據樣本對總體分布或分布的數字特徵等作出合理的推斷。它是統計推斷的一種基本形式,分為點估計和區間估計兩部分。一、點估計點估計是依據樣本估計總體分布中所含的未知參數或未知參數的函數。
  • 單維測驗合成信度三種區間估計的比較
    有三種方法或途徑可以計算單維測驗合成信度的置信區間, 包括 Bootstrap 法、Delta 法和直接用統計軟體(如 LISREL)輸出的標準誤進行計算。本文通過模擬研究進行比較, 發現 Delta 法與 Bootstrap 法得到的置信區間相當接近, 但用 LISREL輸出的標準誤計算的與 Bootstrap 法得到的結果相差很大。
  • 什麼樣的人適合學習數據分析?小白如何自學數據分析?
    主圖時下的大數據時代與人工智慧熱潮,有很多人對數據分析感興趣,卻下手無從。零基礎小白剛接觸數據分析會有這樣的疑問,沒有數學基礎,可以學習數據分析嗎?如何找到一份數據分析的實習呢?什麼叫數據分析?什麼樣的人適合學習數據分析?應該學習哪些內容?需要用到哪些學習資料?自學數據分析如何安排時間?不是相關專業,如何打造簡歷?
  • 定目的、觀數據、斷樣本、選公式、縮誤差,五步估算你的樣本有多準
    如何快速準確地計算出置信區間?五步法:定目的、觀數據、斷樣本、選公式、縮誤差。如何快速準確的計算出置信區間,本人在工作總結了幾個方法步驟,快速估算出我們選取的樣本到底有多準。第一步:定目標1.
  • RS-485串行數據通信協議
    概述 串行數據通信的協議從RS-232到千兆位乙太網,雖然每種協議都有特定的應用領域,但任何情況下我們都必須考慮成本和物理層(PHY)性能。
  • Excel數據分析兩大利器,趨勢預測與規劃求解
    預測開始從2018年以後,預測2年的數據(19&20年),置信區間95%(默認),代表實際值95%會落在預測區間內,其它為默認值。,即未來趨勢的上限不超過此線; 最下面的橘色線:叫做置信下限,即未來趨勢的下限不超過此線; 上下兩根橘色線之間:叫做置信區間,即未來趨勢在此區間中波動; 中間加粗的橘色線:叫做趨勢線,即未來趨勢最有可能沿此線的趨勢發展
  • 高速串行 | 無法任性的AC耦合電容,選值要考量這麼多因素……
    我們知道,在串行信號中串個AC耦合電容,這個電容可以提供直流偏壓和過電流保護,但也會給鏈路帶了另一個問題PDJ(pattern-dependent jitter)。顧名思義,這和碼型有關。我們的鏈路可以等效成高通RC電路,當出現連續的「1」或「0」時,會出現下圖的直流壓降,這不僅會影響眼高,還會造成PDJ。
  • Logistic回歸分析得出某因素的p值<0.05,但OR值的95%可信區間包括1.0 ,如何解釋?
    在Logistic回歸分析時,偶爾會遇到這樣的情況:P值與OR的95%置信區間(CI)結果矛盾的情況,即P<0.05,但OR的95%置信區間卻包括