CNV,拷貝數變異,就是染色體或者說DNA的大片段缺失、重複,是導致人類遺傳疾病的主要原因之一。
說起染色體研究來,多數人都會覺得應該有悠長的歷史了吧?從孟德爾的豌豆實驗開始,起碼研究了幾百年了吧。其實沒那麼久啦,跟新中國的年齡差不多,有些發現染色體的遺傳老前輩們都還在世呢。一直到1956年,前輩們才第一次搞清楚人類一共有46條染色體,還給編了號。說起這套編號,華裔遺傳學家們那是發揮了極大作用的。不光檢測技術是華裔最先搞出來的,連命名也是華裔爭取來的。我們現在覺得染色體按1、2、3~22號這麼排下來非常順口,感覺就是天經地義的。不過開始的時候還真不是這麼回事,那時候二戰結束沒多久,老外們也許可能大概政治覺悟還比較高,就打算用西方歷史文化的一些有象徵意義的標誌來給染色體命名。然後像莊有興之類的華裔遺傳學家們不樂意了,給染色體1號叫華盛頓、2號叫mj、3號叫lv啥的可不成,為什麼不喊唐宋元明清呢?俺們大中華,24史,正好夠用!吵來吵去的結果就是染色體按照數目編號,1~22號,加上性染色體XY,誰都別想添加私貨。(以上故事來源於網絡,真實性待考)
那時候發明的染色體檢測技術叫做G顯帶技術,一直用到現在,依然還是染色體檢測的最常用技術,現在說的染色體檢測,一般說得就是G顯帶了。
染色體檢查雖然解決了有沒有的問題,不過在現在看來那個解析度還是相當抱歉的。一般來說染色體上得有超過5,000,000個遺傳密碼(鹼基)的缺失、或者重複了,G顯帶才能看得出來。5,000,000個遺傳密碼(5Mb)是個什麼概念呢?至少得有幾百個基因吧。所以凡是染色體檢查出來有問題的,通常都會有疾病。更小的片段怎麼辦?起碼在20世紀最後十幾年之前是沒什麼好辦法的。
轉眼間幾十年過去了,日曆也翻到了21世紀,人類基因組計劃也完成了。分子生物學技術的發展那是突飛猛進,一日千裡。染色體檢查技術的發展也是相當感人,一日千「釐」,基本沒啥變化,依然只能看5,000,000以上的缺失或者重複。拜人類基因組計劃的實施,這個時候科學家們手頭已經有了大量的DNA片段。這些片段都是從染色體上切下來的,大小從幾十kb到幾個Mb不等。因為基因組計劃已經搞明白了這些片段屬於哪個位置,所以科學家們就拿這些片段當魚餌,標上螢光後扔到染色體的核型玻片上去。那些染色體上的片段就像喜歡不同口味的一大群魚兒一樣,對自己胃口的餌料(螢光標記的已知片段)就被相應的魚兒一口吞下去,然後餌料上的螢光就把他給照亮了。對於口味不合(序列不相同),沒吃上餌料的染色體就不發光。這樣只要看看一個細胞裡面有沒有螢光信號,有幾個螢光信號就能檢測那些50,000~1,000,000的片段有沒有、有幾個了。這個方法跟釣魚差不多,就是大名鼎鼎的FISH技術了,直到現在依然是CNV檢測的細胞學金標準技術。
雖說科學家們手上有不同位置的成百萬個染色體片段可以作為餌料來釣魚執法,看看想要檢測的細胞到底有沒有問題。可是螢光染料不夠啊,紅橙黃綠青藍紫全算上也才7種,更何況實際上因為光譜是有寬度的,最多也就用4-5種。所以一口氣標個萬兒八千種螢光,把想要的片段都查一遍是不可能的。FISH通常只是作為針對性的1-2種目標的專用檢測技術。
用FISH技術來做CNV檢測,就相當於一個魚塘裡面我原本不知道有沒有某種魚。那麼我先劃個區域圍起來,搞個小魚池。然後找一種非常特別的只有我想檢查的那種魚才吃的飼料扔下去,其他魚不吃這個飼料都餓死了,而我想找的那種吃這種飼料的魚兒就活下來了。最後直接清點有幾條魚剩下的,我就能推算出來原本那個大池塘裡面這種魚有多少了。
如果魚塘裡就10種魚,我可以圍10個小池塘出來,一個個進行餓魚行動,還能搞得定。那100種呢?1000種呢?1,000,000種呢?很顯然,就算我再不怕苦、再不怕累,這事兒也幹不下來。不過沒關係,我們還有辦法。
因為我禍害小魚塘的小魚兒有功,組織上表示很欣賞,給我升了官,讓我去大海裡餵鯊魚,哦不,做生物調查了。這次我得到高人指點,高到看不到頭髮那種,搞了個漁網,每個網眼下面裝一串釣魚鉤,全掛上特定的魚餌,釣鉤A裝的是三文魚餌,釣鉤B帶魚、釣鉤C鱷魚、釣鉤D鯊魚、釣鉤E鯨魚、釣鉤F美人魚……然後我把漁網裝上浮標,平攤開來扔到海裡去。等我收網的時候我只要看看每串吊鉤上掛了幾條魚,我就知道這種魚有多少了。這事兒容易,雖然我對大馬哈魚和三文魚傻傻分不清,不過我知道魚鉤上放的是什麼餌料,對著打鉤算數就行。
這種高級版的FISH技術就是aCGH,科學家們管那張網叫做微陣列array就是aCGH打頭的那個a,記得要小寫,管那些魚餌叫做探針,至於那些魚,自然就是基因了。所以用aCGH這個方法,可以很方便地對全基因組所有想要的基因片段同時進行檢測。當然科學家們也不是一開始就想到網箱掛吊鉤這麼腦洞大開的技術的,中間還出現過打一網魚逐個清點等等過渡技術(CGH)。
講到這裡,聰明如你的讀者肯定就有疑問了,萬一魚兒要是咬錯了魚鉤怎麼辦,那豈不就算錯帳了?這個問題非常好,雖然科學家們已經充分做好了防火防盜防師兄的準備了,但是保不準有智商不在線的魚兒傻傻咬錯鉤啊。所以aCGH的結果一般都需要通過FISH技術再來驗證一遍,數一數、認一認這些魚兒到底對不對。劃重點了,aCGH的結果通常都是要進行驗證的哈。
就是因為aCGH需要其他技術來做驗證,比較麻煩,所以aCGH雖然開創了CNV檢測的一片新天地,但是很快就沒落了。aCGH出來的時候,北京正在修體育館準備開奧運會;等到廣州辦完亞運會的時候,aCGH就已經不太說得上話了。取而代之的是SNP ARRAY,aCGH和SNP ARRAY統稱為CMA技術,不過現在說的CMA多數都是後者,單純的aCGH已經很少了。
我們繼續來進行海洋漁業資源調查。由於前期創造性地使用了aCGH進行渾水摸魚,搞清楚了漁業資源的種類和數量。組織上對我的工作非常滿意,在不增加工資和人手的基礎上給了我新的任務,除了數量和種類之外,進一步搞清楚魚類的性別。
雖然我幹的一直是渾水摸魚的活,但是隨便報個性別比例上去顯然是不行的。於是傳說中萬能的「科學家們」又出現了,不但把魚餌換成了針對性更強的,而且還是性別特異性的魚餌。比如拿壯陽丸來釣男美人魚,拿豐胸丸來釣女美人魚;不但如此,男美人魚吃了豐胸丸的釣餌之後不但咽不下去,估計還能把腸子都吐出來;這樣就能夠有效地避免吃錯藥、掛錯鉤、算錯帳了。
原本這樣已經很完美了,不過我突然發現,有了性別檢測數據以後,我計算和管理漁業資源的能力有了質得飛躍。啥情況呢?舉個慄子吧。原本我發現海裡的美人魚數量明顯減少,雖然大量地投放了好吃的下去(美人魚該吃啥?小魚嗎?隨便了,就當我知道吧),但是美人魚數量依舊增長緩慢。現在有了性別檢測以後我才發現,哦,原來是因為男美人魚年年打仗都快死絕了,女美人魚都守寡呢。難怪魚口不增長呢,原來是因為性別不調啊!趕緊申請一批二次元粉、死宅黨扔海裡去。反過來也可以,如果男生魚太多了,女生魚太少,都去搞gay了,自然魚口就不增長了,要不要扔些聖母白蓮花下去?這下我的調查技術終於突破了,從一項單純的檢查技術實現了躍遷,直接和魚群健康的處理技巧掛鈎起來了。
繞回來繼續講SNP ARRAY吧,因為有了SNP的信息,還有CNV的信息,兩者提供的結果就可以互相印證,aCGH需要驗證才靠譜的毛病也就被解決了,於是SNP ARRAY迅速走到了前臺,把aCGH掃到一邊去了。
形勢總是不斷變化的,沒過幾年,上級又來意見了。現在的主題是漁業資源保護,繼續網箱釣魚把魚兒搞死有偷魚吃的嫌疑,已經不符合精神文明建設需求了。漁業資源還得繼續查,又不能用老辦法,怎麼辦呢?為了不被掛到東南枝上去,那些就剩下幾根頭髮的專家們又被拽回來了。在付出了最後幾根短毛的沉重代價之後,這幫沒毛們終於又搗騰出了新的方案—無創魚兒檢測系統。簡單講就是搞一個水閘,裝上一個安檢門,每條魚兒遊過去的時候都會被掃描一遍,然後記錄下來是什麼魚,公魚母魚還是不男不女魚,搞不搞gay,念不念佛,是不是吃素都一一記錄下來。最後電腦上按幾下就什麼都有了。真是太棒了!不過這套系統雖然很牛x,不過現階段這套叫做CNV-SEQ的NGS技術還是只能掃描表面,看看外表屬於什麼魚,差不多回到了aCGH的階段。如果想要搞清楚魚類性別,還得加上一個叫做WES SEQ的NGS的X光掃描件,穿透衣服、褲褲看看胸胸和屁屁才行。
故事講到這裡就該結束了,現在的CNV SEQ技術還存在局限性,差不多也就是aCGH水平,很多結果依然存在錯誤的可能性,還需要CMA也就是SNP ARRAY技術來驗證才行。廢棄CMA使用CNV SEQ屬於技術上的倒退,存在風險。CNV SEQ+WES SEQ可以和SNP ARRAY相比擬,SNV上檢測效果更是好得多,在謹慎面對其局限性的情況下,有可能在未來取代SNP ARRAY。
以上,限於篇幅,MLPA、QF PCR這些現今依舊大放光彩的技術就沒有介紹了,抱歉。再次感謝在CNV檢測技術付出了汗水、心血和頭髮的科學家們,再次感謝您的閱讀。
更多遺傳知識,歡迎閱讀往期文章