新型冠狀病毒疫情爆發以後,早期診斷成為控制疫情的關鍵,而螢光PCR技術成為首選的初篩檢測手段。目前核酸檢測率只有30-40%,使得檢測試劑盒的靈敏度備受關注。本期推薦林鏡中博士從引物探針設計的角度對試劑盒靈敏度的分析,以饗讀者。
1、前言
新型冠狀病毒疫情爆發以後,早期診斷成為控制疫情的關鍵,而螢光PCR技術成為首選的初篩檢測手段。到目前為止已經有數家企業獲得了新型冠狀病毒螢光PCR檢測試劑的臨床註冊批文,還有近百家企業開發了類似的產品。近期有諸多聲音反映現有的新型冠狀病毒螢光PCR檢測試劑盒靈敏度較低,目前檢出率只有30-40%,多次出現漏檢的情況。業界對此進行了廣泛的討論,一個共識是造成檢出率低,假陰性率高有很多原因,包括試劑盒的靈敏度、試劑盒原材料的質量、核酸提取的效率、儀器設備的質量、操作誤差等,但是對試劑盒的靈敏度低的原因沒有系統的分析。筆者認為,引物探針設計是決定試劑靈敏度的關鍵,設計上存在的問題是內在缺陷,很難通過優化試劑盒組分和調整實驗條件來得到顯著改善。
早期診斷的靈敏度事關新型冠狀病毒疫情防控的成敗,同時今後將有一大批企業申報該產品的註冊批文,最終推向檢測市場,對人民健康產生深遠的影響。疫情爆發後,世界衛生組織(WHO)發表了多個國家設計的新型冠狀病毒螢光PCR引物探針序列。筆者常年從事分子檢測試劑的研究開發,特別是螢光PCR技術。新型冠狀病毒疫情爆發後,我們也進行了相關產品的研發,我們發現WHO發布的來自不同國家的引物探針設計,有些存在比較明顯的缺陷。本文以美國CDC設計的N基因引物探針為例,論述Taqman螢光PCR引物和探針設計的基本原則,並提出一些建議,供同行們參考,避免走彎路,浪費資源,也算是為抗擊疫情盡一份力量。
任何技術都有優缺點,站在不同的角度,側重點不一樣,或者使用的參數或算法或軟體不一樣,結論也可能各有所異。理論分析畢竟與臨床樣本檢驗的結果不可同日而語。產品的靈敏度最終都得經過臨床試驗,達到註冊檢驗要求為標準。文中觀點難免偏頗,歡迎批評指正。
二、Taqman探針法螢光PCR的基本原理
實時螢光PCR是一種實時監控特定核酸目標序列PCR擴增的技術。Taqman探針法是實時螢光PCR中應用最廣泛的技術。它的基本原理是在反應中加入一對特異的引物及一條經螢光標記的Taqman探針,探針的5』端用報告螢光基團標記,3』端用淬滅螢光基團標記。在探針完整時,由於螢光共振能量轉移(FRET)的作用,報告基團的螢光被淬滅基團吸收發出不同於儀器收集波長的螢光,不能檢測到擴增信號,因此探針必須依賴Taq酶的5』-3』的外切活性,在引物結合到模板後隨著合成雙鏈的進程,將已經與模板結合成雙鏈的探針切割,使報告螢光基團脫離淬滅基團的屏蔽而發出儀器應檢測的螢光信號。常用的報告基團包括HEX、FAM、ROX、JOE、VIC等,淬滅基團包括TAMRA、BHQ等。
三、Taqman探針法螢光PCR引物探針的設計
一些最基本的原則可以參考美國ABI(賽默飛)的PrimerExpress 3.0指南(表1)。
表1:Taqman螢光PCR探針和引物設計指南(PrimerExpress 3.0, ABI)
根據我們的經驗,最重要的參數包括引物探針的位置、Tm值、髮夾結構、二聚體。以下以WHO發表的美國CDC的N基因引物探針(表2)為例加以詳細論述。
表2:美國CDC設計的引物探針序列
01
引物探針的位置
引物探針的設計原則中,最重要的是要避免假陰性(漏檢),同時保證特異性(避免假陽性),所以要選擇組內(需要檢出的序列)保守(即儘量避開突變或採用簡併序列)、組間(對照序列)特異的區域。此外,為了獲得最佳的擴增效果,還應儘量滿足表1中的基本要求。
用SARS和蝙蝠CoV的N基因序列作為對照,對新型冠狀病毒的N基因序列排序,從圖1、2、3中可見,在美國CDC的設計中,除了第二套的上遊引物不特異外,其餘探針和引物的位置都是選擇了組內保守組間特異的區域。第二套的探針和下遊引物都是在特異的區域,所以也不會產生非特異的擴增。
圖1:美國CDC 2019-nCoV 第一套引物探針位置
圖2:美國CDC 2019-nCoV 第二套引物探針位置
圖3:美國CDC 2019-nCoV 第三套引物探針位置
第三套設計的探針N3P對2019-nCoV不特異(可同時結合到蝙蝠CoV),5』端第二個位置設置為Y即T/C簡併,恰恰不能區分新型冠狀病毒、蝙蝠冠狀病毒和SARS病毒。但是上下遊引物均為2019-nCoV特異,可能不會產生非特異性(假陽性)擴增。
02
Tm值
Taqman探針法螢光PCR通常採用二步法,即在94℃左右變性,60℃退火和延伸。所以,通常引物的Tm值設計在60±2℃,探針在70±2℃。
圖4: 美國第一套設計的Tm值
圖5:USCDC N基因第二套Tm值
圖6a: USCDC N基因第三套Tm值,探針5』端第二個序列為C
圖6b: USCDC N基因第三套Tm值,探針5』端第二個序列為T
從圖4、5、6中可見,這三套設計中的Tm值基本符合表1中的要求。第三套的探針N3P 5』端第二個序列設計為Y(T/C簡併),此處為C時(圖6a),探針N3P的Tm值略高,但通過優化應該不會成為主要問題。
03
引物和探針的髮夾結構
穩定的二級結構(二聚體或髮夾)降低引物探針利用效率的重要因素,特別是探針的髮夾,容易造成探針利用率降低,從而使螢光信號偏低,影響檢測靈敏度。通常應控制髮夾的dG≥-1.0 (註:dG是一個用于衡量裂解二聚體或髮夾所需要能量的參數,二級結構越穩定,裂解所需的能量越多,dG越小)。
採用DNA Star軟體對美國CDC設計的三套引物探針的髮夾結構進行分析,結果(圖7)發現,第一套的下遊引物N1R具有一個穩定的髮夾結構(dG=-2.3kc/m),第三套的探針N3P具有一個稍微穩定的髮夾結構(dG=-1.3kc/m),其餘引物和探針均沒有穩定的髮夾。
圖7:USCDC引物和探針的髮夾結構
04
二聚體
設計時通常將二聚體(自身二聚體或配對二聚體)控制在dG>-5.0kc/m, 最好dG>-3.6 kc/m。從圖8顯示的三套引物探針的自身二聚體可見,第二套的探針具有一個非常穩定的自身二聚體(dG=-13.1kc/m),第二套的上遊引物N2F有一個穩定的自身二聚體(dG=-9.3kc/m),第三套下遊引物具有一個比較穩定的自身二聚體(dG=-7.0kc/m)。
圖9顯示,美國CDC的第二套引物探針具有比較穩定的配對二聚體(dG=-9.0kc/m)。圖10顯示第三套有兩個比較穩定的配對二聚體(dG=-10.1kc/m)。
圖8:美國CDC基因引物和探針的自身二聚體
圖9:美國CDC第二套引物探針的配對二聚體
圖10:USCDC第三套引物探針配對二聚體
此外,當採用一管多檢(多重PCR)時,即一管同時檢測多個位點或多種病菌時,還要考慮不同位點之間的引物探針的配對二聚體。例如第一套和第二套組合時(圖11),第一套的正向引物和第二套的探針有一個相對穩定的配對二聚體(dG=-8.3kc/m)。第一套和第三套組合時(圖12),第一套的探針和第三套的正向引物有一個穩定的二聚體(dG=-12.2kc/m)。第二套和第三套組合時,第二套的上遊引物和第三套的上、下遊引物各有一個比較穩定的二聚體(dG=-7.0kc/m圖13)。
圖11:美國CDC N基因第一套和第二套配對二聚體
圖12:美國CDC N基因第一套和第三套配對二聚體
圖13:美國CDC N基因第二套和第三套配對二聚體
綜上所述,美國CDC設計的三套引物探針,位置的選擇及Tm值的設計均比較合理,但是二級結構比較穩定。第一套的反向引物N1R存在一個非常穩定的髮夾(dG=-2.3kc/m,圖7)。第二套探針的自身二聚體非常穩定(dG=-13.1kc/m,圖8),上遊引物自身二聚體也比較穩定(dG=-9.3kc/m,,圖8),比較穩定的配對二聚體比較多(dG=-6.8 ~ 9.0kc/m,圖9),引物和探針的利用效率會比較低。第三套探針N3P具有一個相對穩定的髮夾(dG=-1.3kc/m,圖7),探針和引物值均有相對穩定的配對二聚體(圖10)。
四、結果的判斷
美國CDC提出對結果的判斷意見,認為只有當三個位點同時擴增曲線超過域值才能判斷為陽性(如圖11)。
筆者認為這種判別是沒有理論依據的。Taqman探針法螢光PCR除一對特異的引物以外還有一條特異的探針,基於設計的非特異性擴增的理論概率是非常小的。在新型冠狀病毒檢測中,以美國CDC的第一套引物探針為例,從圖1可見,上遊引物處SARS病毒有一個3-bp的插入,是不可能擴增的,蝙蝠病毒在上遊引物有4個突變,探針有1個突變,下遊引物有5個突變,理論上由於錯配檢測出最接近的蝙蝠序列(假陽性)的概率為(1/4)10=9.5367x10-7。如果出現假陽性,最大可能性是交叉汙染或氣溶膠汙染。正確的判斷應該是,上述三個位點至少一個位點的擴增曲線超過了域值,即可判斷病例為陽性。目前市場上常見的螢光PCR檢測試劑大多數也只使用一個位點。
五、結論和建議
引物探針的設計原則中,最重要的是要避免假陰性(漏檢),同時保證特異性(避免假陽性),所以要選擇組內(需要檢出的序列)保守(即儘量避開突變或採用簡併序列)、組間(對照序列)特異的區域,同時儘可能提高反應中引物和探針的利用效率。筆者認為參數的重要性依次是引物探針的位置、探針的髮夾結構、探針對上遊引物的相對位置、Tm值、引物髮夾、二聚體。
筆者對WHO發表的來自七個國家設計的引物探針進行了詳細分析,發現均存在一定的缺陷,有些缺陷比較明顯,主要體現在:
1) 不特異(德國的E基因、香港大學Orf1b基因);
2) 探針的髮夾結構穩定(中國CDC Orf1ab基因的探針、德國的SARS RdRP基因探針P1、香港大學N基因的探針);
3) 引物和探針的相對位置不合理(中國CDC的N基因、德國的E基因、香港大學的Orf1b基因及E基因(設計在反鏈上)、日本的N基因);
4) Tm值不合理(中國CDC的N基因及Orf1ab基因、德國的SARS RdRP基因及E基因、香港大學的Orf1b基因及N基因、日本的N基因、泰國的N基因);
5) 引物的髮夾結構穩定(美國CDC N基因第一套的反向引物、香港大學Orf1b基因的正向及反向引物、香港大學N基因的正向引物);
6) 引物探針的自身二聚體穩定(中國CDC Orf1ab基因反向引物、美國CDC的N基因第二套的探針N2P、德國的E基因探針P1、香港大學的N基因正向引物及探針);
7) 引物探針的配對二聚體穩定(中國CDC的N基因、美國N基因第二和第三套、德國的E基因)。
筆者認為存在穩定的髮夾結構的探針基本不可以用。探針離上遊引物太遠的擴增效率低,很難通過優化來提高效率,應該儘可能避免。其他二級結構可能通過添加PCR促進劑或加入過量的組分(引物探針、Taq酶等)得到改善,Tm值不理想可以通過調整退火和延伸的溫度,但是象以上一些設計的引物和探針Tm值幾乎一樣,是不合理的,應該避免。
實際上,新型冠狀病毒的基因組與最接近的蝙蝠冠狀病毒的差異達到4%,與SARS病毒的差異達到20%,而目前的數據顯示武漢新型冠狀病毒內部的差異非常小,約為十萬分之三(3.3x10-5),在基因組中或在N基因及Orf1ab基因中均有很多區域可以設計特異的、高效率的引物探針用於螢光PCR檢測試劑的開發應用。
磨刀不誤砍柴工,在科學技術面前沒有真正的捷徑可走。科學地設計引物探針是開發螢光PCR檢測試劑的基礎,是保證試劑盒靈敏度及特異性最基本的要素。為了避免走彎路,浪費資源,建議行業內的廠家,嚴格按照螢光PCR技術引物探針設計的原則開發新型冠狀病毒螢光PCR檢測試劑。
作者簡介:林鏡中,加拿大多倫多大學博士,美國加州大學博士後。深圳市海外高層次B類人才。現任深圳市賽格諾生物科技有限公司首席科學家/總經理。曾任深圳市太太基因工程有限公司創始人/總經理,美國Lynx醫藥公司高級研究員。
供稿、編輯:弋水 |校對:Bonnie| 責編:孫旭光
1
聲明
本公眾號原創發表的文章,任何個人、媒體、網站如需轉載,須在文首位置註明轉自「中國體外診斷網 CAIVD」,並註明作者。
1