在前兩期《質粒構建:從入門到精通之初窺門徑》、《質粒構建:從入門到精通之上下求索》(點擊標題閱讀)中給大家介紹了質粒構建的一些基本知識,在本期中將繼續為大家帶來質粒構建相關的乾貨,在本文中將為大家簡單介紹一下Kozak序列,並教大家如何在構建質粒之時添加Flag/HA等標籤、如何判斷該載體上的酶切位點是否有移碼以及如何添加鹼基避免移碼等知識。
另外,關於質粒構建的相關資料(包括相關軟體、常見標籤序列等)已經打包上傳,需要的可以在公眾號內回復「質粒構建」獲取下載連結。
讀完本文您將獲得以下知識
1. 認識Kozak序列;KOZAK是一個女科學家,她研究過起始密碼子AUG周邊鹼基定點突變後對轉錄和翻譯所造成的影響,並總結出在真核生物中,起始密碼子兩端序列為:—— G/N-C/N-C/N-ANNAUGG——,如GCCACCAUGG、GCCAUGAUGG時,轉錄和翻譯效率最高,特別是-3位的A對翻譯效率非常重要。該序列被後人稱為Kozak序列,並被應用於表達載體的構建中。
所謂Kozak規則,即第一個AUG側翼序列的鹼基分布所滿足的統計規律,若將第一個AUG中的鹼基A,U,G分別標為1,2,3位,則Kozak規則可描述如下:
(1)第4位的偏好鹼基為G;
(2)AUG的5』端約15bp範圍的側翼序列內不含鹼基T;
(3)在-3,-6和-9位置,G是偏好鹼基;
(4)除-3,-6和-9位,在整個側翼序列區,C是偏好鹼基。
Kozak規則是基於已知數據的統計結果,不見得必須全部滿足,一般來說,滿足前兩項即可。
真核引物設計需在AUG前加上GCCACC。【註:以上資料來源於百度百科】
例如在《質粒構建:從入門到精通之初窺門徑》中設計的引物如下
加上Kozak序列後:
另外,現在的過表達載體都有很強的啟動子,加不加Kozak序列對表達效率的影響有限。大家可以自行決定是否添加。
在構建過表達載體時,常常需要添加諸如Flag、HA、Myc等標籤,然而我選的載體上並沒有標籤怎麼辦?比如我們在《質粒構建:從入門到精通之初窺門徑》中選擇的pcDNA3.0就沒有相應的標籤,可是我需要添加標籤怎麼辦?這個時候我們就需要在設計引物的時候將標籤序列添加到引物上,這樣PCR出來的目的基因序列就自帶標籤了。
下面我們就以在PDCD1引物上添加Flag為例進行講解:
之前我們設計好的PDCD1引物為:
那麼問題來了,我們到底是把標籤添加到5』端還是3』端呢?在這裡先不回答這個問題,我們先看看5』端和3』端分別怎麼添加標籤吧。注意了,我們這裡講的5』端和3』端是基因序列的5』端和3』端,不是引物和其他序列的。
Flag蛋白序列一般為DYKDDDDK,密碼子為:GAT TAC AAG GAT GAC GAC GAT AAG。所以5』端和3』端加入標籤後分別為:
5』端的序列大家可能比較好理解,這裡需要提醒一下如果加在ATG前面需要在Flag序列前面也加上ATG,而目的基因的ATG 可以刪除也可以保留,當然建議保留。3』端當然得加在終止密碼子前面了!而對於3』端序列可能有些讀者反應不過來,為了便於理解,你可以直接將標籤序列加在CDS序列的3』端上,即將標籤序列當做CDS的一部分,這樣再設計引物就比較好理解為什麼3』端的序列是這樣子的了。如下圖:
可能有讀者擔心,這樣引物不就有很大一部分序列無法與模板匹配了麼?其實根本不用擔心,只要引物3』端是結合在模板上的就可以了。如下圖:
這樣我們PCR出來的基因就是帶標籤的了,只要連接入載體中就可以了。
最後我們回到一開始的問題,我們到底是把引物添加到5』端還是3』端呢?這個的選擇主要是看我們的目的基因,比如我們選擇的PDCD1這個基因就比較特殊!因為它的5』端是信號肽(Signal Peptide),而信號肽一般都會在蛋白成熟過程中被切割掉,所以如果你加在5』端,用Flag抗體做WB是檢測不到Flag-PDCD1的!
如何看出來這個基因有信號肽呢?
我們在NCBI上查詢CDS時有下圖:
你也可以去UniProt上查詢該序列信息:
我們可以看出來,PDCD1的前18個胺基酸組成了信號肽,而當你點擊Signal peptide的時候,UniProt給了如下解釋:
The signal sequence is usually removed in the mature protein; in these cases, the comment 『The displayed sequence is further processed into a mature form』 is added in the 『Sequence』 section.
PDCD1序列信息部分如下圖:
所以無論是在NCBI上還是UniProt上都可以查到PDCD1的信號肽是要被切割掉的!不能加在5』端,只能加在3』端。當然還有一些需要考慮對蛋白功能的影響等來決定標籤加在哪一端。
我們在設計引物時基本是不需要考慮移碼的,因為ATG後面就是我們的目的基因了。然而有些載體是自帶標籤的,這個時候一般都要考慮是否移碼,當然很多帶標籤的載體也是已經優化好,無需考慮移碼!但是,如果我選的載體就是要考慮移碼怎麼辦?我們就以下面的載體為例:
我們可以看到,當該載體表達時,是從Flag標籤的ATG表達的,密碼子都是三個一組,所以順序表達下去,當表達到BamHI時,剛剛好,不移碼,BamHI的TCC直接加目的基因ATGXXX就可以正確表達了。然而當我們不選BamHI而選擇EcoRI時,發現變為了GGA ATT C+ATGXXX,如果我們直接不加以改造就成了CAT GXX X……,這樣我們的目的基因就移碼了,而如果不需要移碼就需要在酶切位點之後添加2個鹼基,變為GGA ATT CXX ATGXXX,這樣我們的目的基因就不會移碼了:
按照上述規則,大家可以試試是否能推出各個酶切位點的移碼規則!
到這裡我們就把質粒構建的知識基本講完了,如果還有什麼不明白的歡迎入群交流哦,加小編微信時一定要備註姓名-單位/學校-研究方向,否則不予通過哦。
識別二維碼加微信
拉入官方微信群,備註:
姓名-單位/學校-研究方向
·END·