基因組測序正在弄清楚基因組中DNA核苷酸或鹼基的順序-組成生物體DNA的As,Cs,Gs和Ts的順序。人類基因組由超過30億個這些遺傳字母組成。
如今,大規模的DNA測序-雄心勃勃的項目(例如對整個基因組測序)所必需的規模-大多是由高科技機器完成的。就像您的眼睛掃描字母序列來閱讀句子一樣,這些機器「讀取」 DNA鹼基序列。
從生命的化學字母翻譯成我們的書面字母的DNA序列可能如下所示:
也就是說,在這個特定的DNA片段中,腺嘌呤(A)之後是鳥嘌呤(G),之後是胸腺嘧啶(T),其後是胞嘧啶(C),另一個胞嘧啶(C ), 等等。
什麼是基因組測序?
就其本身而言,並不是很多。通常將基因組測序與「解碼」進行比較,但是序列在代碼中仍然非常多。從某種意義上說,基因組序列只是一個很長的字母串,用一種神秘的語言表達。
當您閱讀一個句子時,其含義不僅限於字母順序。這些字母的單詞和語言語法也是如此。同樣,人類基因組不僅僅是其序列。
將基因組想像成一本書,沒有大寫或標點符號,單詞,句子或段落之間沒有間斷,並且在句子之間甚至句子中散布著無意義的字母串。這樣一本書的英文段落可能看起來像這樣:
即使使用熟悉的語言,也很難找出段落的含義:敏捷的棕狐跳過了懶狗。那隻狗靜靜地躺在夢鄉吃晚飯。而且,基因組是用一種不太熟悉的語言「書寫」的,這增加了閱讀過程中涉及的困難。
因此,對基因組進行測序不會立即打開整個物種的遺傳秘密。即使手頭上有人類基因組序列的草稿,仍有許多工作要做。科學家們仍然必須將這些字符串轉化為對基因組工作原理的理解:組成基因組的各種基因做什麼,不同的基因如何關聯以及基因組的各個部分如何協調。也就是說,他們必須弄清楚那些基因組序列字母的含義。
為什麼基因組測序如此重要?
基因組測序是了解基因組的重要一步。
至少,基因組序列將代表一個有價值的捷徑,幫助科學家更加輕鬆快捷地找到基因。即使科學家只是在學習解釋這些線索,基因組序列的確包含一些有關基因位置的線索。
科學家們還希望,能夠研究整個基因組序列將有助於他們了解整個基因組的工作原理,即基因如何協同工作以指導整個生物體的生長,發育和維持。
最後,基因只佔基因組DNA的不到25%,因此了解整個基因組序列將有助於科學家研究基因外的基因組部分。這包括控制區域的控制區域,這些區域控制基因的打開方式,以及長段的「廢話」或「垃圾」 DNA(之所以這樣稱呼,是因為我們尚不知道該做什麼,如果有的話)。
您如何測序基因組?
這個問題的快速答案是:分片。整個基因組無法一次全部測序,因為可用的DNA測序方法一次只能處理一小段DNA。
因此,相反,科學家必須將基因組分解成小塊,對其進行測序,然後以適當的順序重新組裝它們,以得出整個基因組的序列。測序中涉及的許多工作都在於將這個巨大的生物拼圖遊戲組裝在一起。
切割基因組並將其重新放在一起有兩種方法。一種策略,稱為「逐個克隆」方法,涉及首先將基因組分成相對較大的片段,稱為克隆,長約150,000個鹼基對(bp)。科學家使用基因組作圖技術(稍後將詳細討論)來確定每個克隆在基因組中的位置。接下來,他們將每個克隆切成較小的,重疊的片段,以進行測序,每個片段的大小約為500 BP。最後,他們對片段進行測序,並使用重疊部分重建整個克隆的序列。
另一種策略稱為「全基因組shot彈槍」方法,該方法包括將基因組分成小片段,對片段進行測序,然後將片段重新組裝成完整的基因組序列。
這些方法中的每一種都有優點和缺點。逐個克隆的方法可靠但緩慢,並且映射步驟特別耗時。相比之下,全基因組shot彈槍方法可能非常快,但是將一次如此多的微小序列一次組合在一起可能非常困難。
兩種方法都已用於測序整個基因組。使用全基因組shot彈 槍法對流感嗜血桿菌的基因組進行測序,而對麵包酵母釀酒酵母的基因組進行逐克隆測序。使用兩種方法對人類基因組進行測序。