摘要:合成生物學是一門以工程學思想為指導,對天然生物系統進行重新設計與改造,並設計與構建新的標準化的生物元件、組件與系統的新興學科。它是生物化學、分子與細胞生物學、系統生物學等與工程學、數學、計算機科學等相融合的交叉學科,並在醫藥、能源、環境等領域取得了令人矚目的成果。介紹合成生物學的定義、相關概念、學科特點與現階段研究內容,並綜述最新研究進展,如基因調控開關、基因計數器、生物邏輯門元件、生物計算、人造生物圖案、可擦寫數據寄存器、電生物反應器「合成」生物燃料等開創性的研究成果,並展望合成生物學的巨大發展前景。
關鍵詞:合成生物學;生物積塊;基因線路;邏輯門;電生物反應器
2010年J. Craig Venter團隊創造了人類歷史上第一個人造細胞Synthia(Gibson et al. 2010),在科學界引起了巨大反響,從而使「合成生物學」(synthetic biology)進入了大眾的視野。合成生物學是近年興起的,綜合了分子與細胞生物學、生物化學、生物信息學、系統生物學等,並與工程學、數學、計算機科學等交叉的一門新興學科,是基因工程和代謝工程的「升級」版本,具有巨大的發展潛力,並已在生物醫藥、生物能源、環境治理、生物計算及相關基礎研究領域取得了令人矚目的成果。2004年美國MIT出版的《技術評論》一書把合成生物學選為將改變世界的十大技術之一。2010 年,《自然》雜誌盤點當年12件重大科學事件,合成生物學排在第4位;在當年12月《科學》雜誌評出的十大科學突破中,合成生物學排在第2位。
1. 合成生物學的研究內容
合成生物學是以工程學思想為指導,對天然生物系統進行重新設計與改造,同時設計併合成新的生物元件(element)、組件(device)和系統(system)的嶄新學科。目前研究應用包括兩個主要方面:一是「自上而下」的方法,通過對現有的、天然存在的生物系統進行重新設計和改造,修改已存在的生物系統,使之增添新的功能;二是「自下而上」的方法,通過設計和構建新的生物元件、組件和系統,創造自然界中尚不存在的人工生命系統。
由於合成生物學多學科交叉及多領域應用的特性,目前沒有一個公認的標準定義,我們採用「合成生物學組織」網站(http:// syntheticbiology.org)的一段描述。合成生物學包括兩條路線:①新的生物元件、組件和系統的設計與建造;②對現有的、天然的生物系統的重新設計。
1.1 合成生物學目前的具體研究內容
(1)底盤生物(chassis)及其基因組的合成、簡化與重構,以作為各類生物元件、組件及系統的運行平臺,如T7噬菌體基因組的重構(Chan et al., 2005)、克雷格文特爾人造細胞Synthia(JCVI1.0)的構建等。
(2)生物大分子(如核酸和蛋白質)的合成、改造與模塊化,如DNA合成技術的發展(Kosuri et al., 2010;Matzas et al., 2010);人工創造遺傳物質,如類DNA化合物(XNA)的合成(Pinheiro et al., 2012);非天然胺基酸的合成(Noren et al., 1990;Wang and Schultz 2002;Chin et al., 2003;Mehl et al., 2003;Wang et al., 2003)及相應新密碼子、tRNA的構建(Hohsaka et al., 2001;Hohsaka et al., 2001),基於蛋白質工程的酶功能的優化、改造等。
(3)合成及優化代謝網絡,如青蒿酸(Martin et al., 2003;Ro et al., 2006;Hale et al., 2007;Tsuruta et al., 2009)、紫杉醇(Ajikumar et al., 2010)及高級醇(Atsumi et al., 2008)的生物合成基因簇的優化及異源表達。
(4)各類生物功能元件的標準化,以及基於標準化生物元件的基因線路的設計與多領域應用。
1.2 合成生物學的基本概念
1.2.1 生物積塊
生物積塊(biobricks)是指將天然存在的基本DNA功能片段,如啟動子(promoter)、核糖體結合位點(ribosome binding site, PBS)、功能基因、終止子(terminator)等進行優化,確定動力學模擬參數及載體、宿主背景,在各元件頭尾兩端加上特定的酶切位點,並採用統一的描述與分類方法使之標準化,從而更有效率的進行查詢、設計與基因操作。
國際遺傳機器大賽(international genetically engineered machine competition, iGEM)的主辦單位美國麻省理工學院(MIT)「合成生物學聯合會」(synthetic biology community)建立了生物積塊文庫,目前正在迅速發展壯大中。
1.2.2 基因線路
基因線路(gene circuit)借鑑電磁學中描述電器件關係的線路(circuit)概念,將標準化的生物元件(如生物積塊)進行重新設計與構建,構成具有預期的全新功能的生物組件與系統,並進行數學模擬和系統性能分析(如穩定性、魯棒性、敏感性等)。目前的研究內容包括基因調控開關(genetic switch)、振蕩器(oscillator)、同步時鐘(synchronized bacterial clock)、計數器(counter)、邏輯門元件(logic gates)、生物計算與存儲等。
2. 合成生物學最新研究進展
2.1 基因調控開關
基因調控開關研究對基因轉錄及表達的控制,是合成生物學基本手段之一,因此研究開展的也較早。
James J. Collins課題組的Isaacs等(2004)構建了轉錄水平的RNA開關。該開關是一段25bp 的核苷酸序列,位於啟動子和核糖體結合位點之間,轉錄後該段crRNA(cis-repressed RNA)自發摺疊,導致下遊功能基因不能翻譯表達;通過誘導表達另一段與該crRNA 序列互補並結合能力更強的taRNA(trans-activating RNA)後,打開crRNA的摺疊,使下遊基因順利表達。
Blount等(2012)利用最近發展的dTALE(designer transcriptional activator-like effector)技術(Kay et al., 2007;Romer et al., 2007;Boch et al., 2009;Moscou and Bogdanove 2009;Bogdanove and Voytas, 2011),在釀酒酵母(Saccharomyces cerevisiae)中通過誘導表達具有精確位點特異性,並且其結合位點可以任意「定製」的DNA結合蛋白來結合啟動子核心區域,從而阻遏特定基因的轉錄,實現DNA生物元件中反相器(inverter)的功能(Blount et al., 2012)。
dTALE技術利用來自一種黃單孢菌屬(Xanthomonas)植物病原菌的轉錄激活因子蛋白(transcriptional activator),其DNA結合域的結構與DNA結合位點的鹼基有一一對應的關係,因此可以通過調整該DNA結合域的胺基酸序列來「定製」其DNA結合位點。利用該技術,可以對不同基因的啟動子區域合成對應的dTALE,因此可以提供可重複的並行的「阻遏信號」,相對於之前數量有限且不能任意擴展的各種阻遏調控機制,這種TALOR(transcription activator-like orthogonal repressors)為基因線路的複雜化提供了有力工具。
Egbert等(2012)發現,通過在Shine-Dalgarno 序列和翻譯起始位點(translation initiation site)之間插入若干重複的鹼基組合(ribosome binding simple sequence repeat, rbSSR)如AT、AC、A、T等,可以使下遊基因的轉錄水平發生可預測性的下降。
2.2 基因計數器
能夠在細胞中運行的工程化的基因計數器是為細胞「編程」及在細胞中構建複雜人工網絡的基礎功能模塊之一。
James J. Collins 課題組的Friedland等(2009)構建了兩種基因計數器,第一種基於RNA開關調控的轉錄級聯反應,可以對同一誘導物的添加次數進行3次計數,並且可以通過增加轉錄組件來進行擴展。第二種基於DNA重組酶的存儲器級聯反應,也可以對同一誘導物的添加次數進行3次計數,改進後還可以對每次加入不同的誘導物的情況計數,同樣可以通過增加新的DNA重組系統來進行擴展。第二種計數器還具有「記憶」功能,即每次計數對應不同的DNA翻轉變化,不僅可以通過輸出信號來讀取最終計數,還可以通過檢測計數器中DNA序列的狀態來讀取即時計數。
2.3 邏輯門元件
邏輯門是數字電路的基本運算單元,也是計算機科學及自動化編程的基礎。在細胞中模擬各種邏輯門元件的功能,並將其有序連接以進行複雜的邏輯運算與輸出,是通過數位化編程在細胞中構建複雜人工代謝網絡的基本研究內容。
Win和Smolke(2008)開發了一個基於RNA的邏輯門元件,這些RNA元件可以與輸入信號(效應物分子)發生反應產生結構變化,從而激活或阻遏下遊報告基因的翻譯表達。
通過組合不同的RNA元件,可以行使各種邏輯門(與門、與非門、或門、或非門)和信號過濾器的功能。
2010年,該研究組進一步構建了一種可以將細胞內特定蛋白質濃度作為輸入信號的RNA邏輯門元件(Culler et al., 2010)。將預先編程的RNA邏輯門元件植入細胞內,並感應特定蛋白質信號分子的濃度變化,使細胞可以根據蛋白質信號分子的濃度,來自動調節目標基因的表達。上述結果表明,可以通過特定的邏輯門元件,對細胞中天然的調控網絡進行重新編程,從而控制細胞行為或賦予細胞新的行為,這對細胞天然代謝網絡的改造具有極大的應用價值。
2.4 生物計算
如果將攜帶有邏輯運算元件的單個細胞視為一個運算單元,那麼通過數以億計的細胞之間的相互作用,便可以產生強大的計算能力,這就是生物計算的潛力和價值所在。2011年1月,Nature雜誌同期發表了兩篇論文,分別介紹利用不同微生物進行複雜的邏輯運算。
Tamsir等(2011)利用基於群體感應(quorum sensing)調控的基因線路,首先在大腸桿菌(E. coli)中構建了6種簡單的或非(NOR)邏輯門,即由兩個串聯的啟動子來控制一個抑制基因的表達,抑制基因控制著輸出信號(報告基因)的表達;另外構建了2種單輸入的反相器和緩衝器(buffer)。
將含有這8種邏輯門的E. coli菌株的菌斑在培養平板上以不同的方式排列組合,菌斑之間通過群體感應效應物分子的擴散進行通信,可以構建出所有16種雙輸入布爾邏輯門,包括最複雜的(異或)XOR門和EQUAL門(Tamsir et al., 2011)。Regot等(2011)採用分布式計算方法,分別構建了4種基本邏輯運算的基因線路,並轉入釀酒酵母(Saccharomyces cerevisiae)細胞中,作為單位邏輯運算細胞。初始信號為外部添加的效應物,細胞間通信信號為由初始信號產生的可擴散至其他細胞的分子,報告基因的表達水平作為最終輸出信號。然後採用不同的組合方式,將各類細胞混合培養,並檢測輸出信號,可實現多路選擇器(multiplexer)和進位加法器(carry adder)等邏輯運算功能(Regot et al., 2011)。
2.5 人造生物圖案
Chenli等(2011)構建了一個可以調控大腸桿菌宏觀生長圖案的基因線路(Regot et al., 2011)。該線路通過誘導型啟動子及群體感應效應控制大腸桿菌cheZ 鞭毛基因的表達,可以形成空間上有序排布的周期性條紋狀圖紋。通過數學模擬分析圖案形成的原理,還可以調控條紋數量的變化。這對理解自然界中各種生物圖案的形成原理,以及分化發育中細胞在時間、空間的有序排列和調控提供了嶄新的思維,也顯示了合成生物學在基礎研究領域的強大潛力。
2.6 可擦寫數據寄存器
與邏輯門元件、同步時鐘、計數器等一樣,數據寄存器也是為細胞編程的基礎元件之一。
Bonnet等(2012)構建了一個可擦寫的重組酶可尋址數據(recombinase addressable data, RAD)模塊。該數據寄存器利用來自噬菌體的DNA重組酶和切除酶系統,以外源誘導效應物作為輸入信號,通過分別誘導表達整合酶、表達整合酶加切除酶、降解整合酶、降解整合酶加切除酶4 種方式,來翻轉及回復一段含有組成型啟動子的特定DNA序列,從而選擇性的開啟該DNA序列兩端的不同報告基因(輸出信號)的表達,達到存儲和擦寫的目的。該存儲器可在基因組DNA中穩定存儲並可反覆擦寫達100個細胞分裂周期以上。
2.7 合成生物學應用舉例:電生物反應器將CO2轉變為生物燃料
隨著石油資源面臨枯竭,生物能源的研究越來越受到重視。短短數年,生物燃料的發展便從第一代的玉米、甘蔗乙醇,第二代的秸稈纖維素乙醇發展到了第三代的微藻產油。但目前生物燃料除成本居高不下之外,還存在一個基本問題,即光合作用的能量轉化效率不夠高。
曾因研究光合作用機制而獲得諾貝爾化學獎的Hartmut Michel撰文稱,光合作用出現兼有進化上的「合適」性和歷史偶然性,其光能轉化效率並不高,最終僅能轉化光能的4%,低於目前研究的光伏發電(photovoltaic)的光能轉化效率(太陽能電池轉化效率15%與電池利用效率80%)(Michel, 2012)。
James C. Liao課題組的Li等通過改造真氧產鹼桿菌H16(Ralstonia eutropha H16)的代謝網絡,使該菌可以CO2為唯一碳源和電能為唯一的能量輸入來生產高級醇及其他高分子化合物(Atsumi et al., 2008;Atsumi et al., 2010;Li et al., 2012)。將該菌的培養溶液通電,可使通入的CO2 變為甲酸,通過改造真氧產鹼桿菌的胺基酸及聚羥基脂肪酸酯(PHA)合成途徑,該菌可以利用甲酸合成異丁醇和3-甲基-1-丁醇。異丁醇是理想的石油替代燃料並可直接用於汽車發動引擎。該系統還可以通過改造代謝網絡合成其他化合物,如生物塑料、生物藥製品等。
將光伏發電與該技術相偶聯,前者相當於光合作用的光反應,後者相當於暗反應,可以組成比光合作用效率更高、更易控制的光能利用系統。該系統也可以作為能量存儲轉換系統,將來源於風力發電、水利發電、核電等的電能轉變為化學能儲存,應用潛力巨大。
3. 展望
合成生物學是一門迅速成長的新興交叉學科,自2000年左右開始,相關的研究論文數量逐年上升。隨著相關技術的進步(如DNA合成測序技術的發展),合成生物學的許多基礎研究工作(如底盤生物的基因組簡化與重構)、標準化生物元件庫的擴充、基因線路設計的創新等,都會在近幾年得到飛速發展。
在應用方面,隨著青蒿酸、紫杉醇的生物合成,微藻產油及高級醇合成基因簇的改造,砷離子生物傳感器的應用,合成生物學已經在生物醫藥、生物能源、環境治理等領域展現了巨大的潛力,並且在生物計算、微生物成像等許多方面展現了極具創意的應用,對其他學科的發展有著不可忽視的影響。21世紀是生物學的世紀,而合成生物學將是未來生物學發展的重要分支,必將對人類生活產生重大影響。