基於生物納米孔的單分子長讀長DNA測序技術具有快速和高通量的優點,但一直以來在同核苷酸延伸中識別準確性卻有所降低。近日,一項由布魯塞爾自由大學(VUB)和Oxford Nanopore Technologies公司研究人員開展的最新研究表明,一種具有兩個可讓DNA穿過的收縮結構的新型蛋白質納米孔或可提高某些均聚物區域的測序準確性。
據悉,新的雙重讀取納米孔是介於大腸桿菌CsgG納米孔(Oxford Nanopore Technologies幾年前從比利時獲得許可)與另一種大腸桿菌蛋白CsgF的肽段(有助於形成第二個狹窄)之間的複合體。本周二,由VUB結構與分子生物學教授Han Remaut領導的研究人員在Nature Biotechnology雜誌中發表了該複合物的低溫電子顯微鏡結構,論文題為「A dual-constriction biological nanopore resolves homonucleotide sequences with high fidelity」。他們還表明,雙重收縮孔提高了長達8個核苷酸的均聚物(特別是較長核苷酸)的一致性準確度。
論文通訊作者Han Remaut介紹,他對納米孔測序的關注源於其對細菌細胞表面蛋白,特別是對CsgG的關注。該蛋白形成跨膜通道,並負責將細菌的澱粉樣蛋白捲曲分泌到革蘭氏陰性細菌的外膜外。2014年,其研究小組發表了大腸桿菌CsgG的X射線結構。「通過觀察這個通道,我們發現這個通道具有的特點可能會適用於納米孔傳感應用。」他進一步解釋說,特別是通道在其中心具有明確定義的收縮,當分子通過孔時,該收縮會調節電流信號。該文章發表後,Oxford Nanopore獲得了該團隊專利的使用授權,將CsgG及其衍生物用於傳感應用,並開始了雙方的合作。2016年早些時間,Oxford Nanopore宣布將採用R9新型納米孔化學試劑,並稱其為大腸桿菌CsgG的工程版本。
事實上,雖然R9納米孔在一定程度上改善了野生型CsgG的測序性能,但仍需要進行更多努力以準確地識別更長的均聚物。Han Remaut表示:「當均聚物通過納米孔通道時,信號中的信息較少,因此,從5聚體均聚物開始,其識別準確性開始下降。」
Han Remaut團隊在新型雙重收縮孔中的工作來自於對curli分泌通路的興趣,其中還涉及與CsgG孔相互作用的另外兩種蛋白質:CsgE和CsgF。在膜的細胞外側發現的CsgF是捲曲素纖維分泌與組裝之間的耦合因子。當研究人員使用低溫電子顯微鏡解析了CsgG和CSGF的複合體結構後,他們發現,CSGF的N末端區域結合在CsgG的β桶內部,並在CsgG收縮入口上方約3納米處形成第二個頸縮。他們推斷,第二個頸縮口或許可以幫助解決均聚物的鹼基識別問題。「當均聚物通過第一個頸縮時,鹼基都是相同的鹼基,因此電信號的調製很小。」Han Remaut解釋說,「而如果有了第二個頸縮,它與第一個頸縮之間的距離是固定的,那麼你將獲得來自3nm外任何一個鹼基的信號。因此,如果你想要的話,你將獲得來自兩點的讀取信息而不是一個。」
Han Remaut
進一步,研究人員還確定了僅CsgF的N端部分(一種被稱為FCP的肽)仍與CsgG以及Oxford Nanopore開發的R9孔形成緊密而穩定的複合物。他們還表明,該複合物仍能捕獲和轉運單鏈DNA,並產生來自於兩個頸縮處的電信號。接下來,該團隊將FCP與Oxford Nanopore目前用於測序的R9衍生物之一結合起來,以查看添加第二個頸縮是否可以幫助提高均聚物中鹼基識別的準確度。他們發現,使用長度為3~9個核苷酸不等的合成poly-T寡核苷酸,對於5聚體到9聚體,與R9相比,R9-FCP的單分子讀準確性得到了提高。但是對於3聚體和4聚體,R9孔表現的更好。Han Remaut介紹說:「從5個核苷酸開始,R9的鹼基識別開始遇到困難,但雙重收縮孔的識別性能將至少維持到9聚體均聚物為止。」
接下來,他們在大腸桿菌基因組DNA中測試了R9-FCP和R9納米孔,發現對於長度不超過8個核苷酸的均聚物,R9-FCP數據比R9數據具有更好的一致性準確度。例如,對於8聚體,R9的一致性準確度下降到85%,而R9-FCP仍然達到95%。研究人員還表示,由於大腸桿菌基因組只有很少的長度超過8個聚體的均聚物,因此研究人員無法通過良好的統計數據測試更長的同聚物的識別性能。
但值得關注的是,本篇Nature Biotechnology論文發表後,也有學者發表了與Han Remaut研究團隊不同的觀點。
華盛頓大學研究人員Jens GundlachJens Gundlach就表示:「我覺得這些結果很有趣,但我並不完全相信對CsgG的這種修飾所帶來的好處。」其研究小組發表了利用MspA孔進行的精子納米孔測序工作。原因之一在於,引入第二頸縮會導致納米孔產生的離子電流信號比R9孔小得多。此外,在短的合成poly-T上,R9-FCP孔的性能較R9差。儘管對於較長均聚物它的性能優於R9,但仍然會出現錯誤。Jens GundlachJens Gundlach認為,總的來說,使用雙重讀取孔的想法是有缺陷的。「你只是在測量一個變量,即離子電流,因此無法區分放置在其中的兩個讀取頭。你不知道是哪個變量修改了電流。」 相反,這個信號將來自兩個頸縮中的多個鹼基,從而「將信號洗掉了,因此該孔的總體測序能力很差」。
而另一個潛在擔憂則來自孔複合物的穩定性。「我們發現該複合物的使用壽命超過24小時,並且某些孔超過48小時。」Han Remaut表示,「要確保孔具有與R9相似的壽命,這也是工程上必須注意的一點,這並不是你為雙重收縮孔需要付出的代價。」
不過,Han Remaut也表示R9-FCP孔仍有改進的空間,論文中的數據只是來自「一個非常早期的原型,但是具有非常有潛力的特性」。例如,FCP和R9仍可以進行工程設計以改善通道的性能。此外,他和他的同事使用的鹼基識別軟體是在R9上進行訓練的,而不是在雙縮孔上進行的。他說:「這些仍然是需要進一步改進的領域,直到能夠真正測試出這種雙重收縮通道能走多遠。」