近幾年農口植物研究領域,國人在CNS正刊上屢有斬獲,筆者梳理的文獻如下表所示。這些文章聚焦在基因定位和克隆領域,研究物種多為重要農作物。基因定位和克隆算是經典的研究方向了,每年僅水稻的此類研究文獻都有大幾十篇,以發表P系列(Plant Jounal,Plant Biotechnology Journal,Plant Cell等)雜誌最為常見。那麼下表中的研究為什麼能發到正刊上呢?筆者就以儲成才團隊1月7日在Nature發表的題為「Genomic basis of geographical adaptation to soil nitrogen in rice」的研究論文為例,嘗試解讀下發表Nature的奧秘。
Genomic basis of geographical adaptation to soil nitrogen in rice
水稻耐低氮基因克隆和功能驗證
發表期刊:Nature
發表時間:2021
影響因子:42.779
氮肥的使用極大地提升了作物的產量,尤其是伴隨著第一次「綠色革命」矮杆基因的發現。但是過量的施用氮肥也帶來了不可忽視的土壤酸化和水體富營養化的問題。提升作物氮肥的利用率能平衡產量和氮肥施用。然而最近幾十年來,作物的育種目標一直集中在高氮肥施用條件下的高產上,可能導致的結果是新培育的品種普遍都氮肥利用率低。大田的管理能提升氮肥的利用率,但是從培育高氮素利用率品種角度切入更適用。亞洲栽培稻遺傳多樣性廣泛,不同生態區也有大量的地方栽培。這些材料包含了大量的適應當地環境(包括土壤肥力)的遺傳變異,是優良的遺傳育種資源。目前水稻中有幾個氮素利用效率的基因被克隆(NRT1.1B,OsNR2),但是在更廣泛的群體範圍內,氮素利用的遺傳基礎並沒有被全面的揭示。本文就利用水稻的核心種質進行GWAS分析,鑑定到OsTCP19一個啟動子區域的突變和氮素響應的水稻分櫱表型關聯。該基因的等位基因和不同地理區域的土壤氮素含量相關。下面筆者就詳細解讀下本文的材料方法和研究邏輯。
1. 基因定位材料
GWAS:110個微核心種質(Rice Mini-Core Collection),基本為地方種,來自於52個國家,覆蓋了所有水稻的亞群(subgroup),20個熱帶粳,10個溫帶粳,28個Aus型,30個秈稻,3個香米和19個混合型(admixed accessions)。
溫馨提示:本文的GWAS材料數量偏少,一般情況下GWAS需要200個個體以上,但是由於本文的材料大多數為地方種,連鎖不平衡(LD)衰減程度遠高於栽培種,所以定位的解析度沒問題,但是如果是微效位點的性狀的話,可能關聯位點的顯著性就不太高了。
表型鑑定成熟期的分櫱數,每穗粒數,千粒重。分櫱氮素響應值(tillering response to nitrogen,TRN)=((moderate nitrogen-low nitrogen)/low nitrogen)。分櫱氮素響應值最高,作為GWAS的表型值。
2. 驗證材料
基因功能驗證材料採用中花11號背景(T-cr敲除突變體,各種目標轉基因材料)。
3. 克隆基因的育種應用潛力材料
採用包含優良目標基因等位基因的輪迴親本材料粳稻越光(Koshihikari)構建近等基因系NILOsTCP19-H。OsTCP19-H為氮高效利用等位基因。以該近等基因係為供體親本,秀水134和空育131為輪迴親本繼續構建近等基因系KY131OsTCP19-H和XS134OsTCP19-H 。
4. 表型鑑定方法
水稻的水培實驗用於基因表達和原生質體準備。共有200株水稻苗,培養液為正常氮素的750 ml Kimura B營養液。營養液每天更換,置於人工培養箱中。設置了6種不同梯度的氮素濃度,其中0.15mM 硝酸銨為低濃度,1.25mM的硝酸銨為中等濃度。
水稻核心種質的栽培:水稻種子在育苗盤中育苗30天,然後移栽到大田,每個材料間距20 cm,種植3行,每行8株。種植地為華南農業大學實驗基地。
克隆基因的育種應用潛力材料:越光,近等基因系,中花11和cTO材料種植於北京,育苗移栽同以上,種植間距20cm,每個材料種10行,每行8單株。設置4個重複,高氮素和低氮素兩種環境。
低氮素分櫱響應材料(low tillering response to nitrogen,low-TRN),高氮素分櫱響應材料(high tillering response to nitrogen,high-TRN),空育131和其背景的滲入系,秀水134和其滲入系大田實驗在海南陵水實驗基地進行,設置低氮和中等氮素兩種處理,栽培條件和以上類似。
以上大田實驗氮肥採用尿素,在苗期,分櫱期和抽穗期施用。50kg/ha為低氮處理,150kg/ha為中等氮素處理,300kg/ha為高氮處理。氮素利用率為土壤中單位速效氮的水稻籽粒產量。
中花11和轉基因植株種植於溫室中,苗移植於塑料盤中,0.5kg/m2和1.5kg/m2分別作為低氮和中等氮素處理。
5. GWAS分析方法
基於已經發表的重測序獲得的SNP數據,依據MAF<5%過濾,保留1,889,946個SNPs作為GWAS的輸入基因型文件。GWAS分析模型為GEMMA。PCA採用ngsTools包中的ngsCovar模塊分析。PCA的前4個主成分作為協變量控制核心種質的群體結構。閾值採用Bonferroni校正。基於候選基因OsTCP19的關聯分析,作者開發了35個PCR標記,MAF≥5%的標記被保留,最終有7個標記和表型顯著關聯。
OsTCP19啟動子區域單倍型分析
候選基因為OsTCP19,下載其啟動區域2.5Kb範圍的數據(3K水稻計劃),由於數據有1.9%的缺失,作者又採用Beagle進行imputation,刪除MAF≥1%的SNP,剩餘79個高質量SNPs,被分成174個單倍型。低頻率的單倍型被認為是基因型錯誤引起的,過濾完之後剩餘20個高置信度的單倍型。
野生稻中OsTCP19基因的等位基因分析
依據已經報導的446個普通野生稻數據(其中11個缺失率高於80%的accessions去除),作者發現5個SNPs和OsTCP19緊密連鎖。這5個SNP用來評估該基因的單倍型。
6. 水稻品種的地理分布和土壤氮素含量分析
以水稻3K基因組計劃中水稻的6個亞群和起源信息為基礎。選擇1764個地理信息準確的秈稻品種,OsTCP19基因的等位基因頻率在某個國家或者地區數量大於3的被保留,然後計算OsTCP19基因的等位基因頻率與土壤氮素含量的皮爾遜相關係數。
為了分析42個國家/地區水稻種植區的土壤氮素含量,作者首先以5'×5'的空間解析度從全球土壤數據集中收集土壤氮含量數據。通過加權四個土層(0–4.5 cm,4.5–9.1 cm,9.1–16.6 cm和16.6–28.9 cm)的深度來獲得平均土壤氮含量。然後從全球環境歷史資料庫(HYDE 3.2.1)獲得最近幾十年的水稻種植面積,其空間解析度與全球土壤數據集相同。從氣候研究部門(CRU TS v.3.23)收集了包括年均溫度和降水(1990年至2014年)在內的氣候數據。這些氣候數據是在水稻種植地區提取的,然後取平均值為42個國家或地區的數值。
其他的基因分子克隆和功能驗證實驗比如亞細胞定位、原生質體螢光素酶、酵母雙雜等實驗細節筆者在這裡就不介紹了,感興趣讀者可以閱讀原文。
1. 表型的探索
產量是衡量氮素利用率的最常用指標。水稻的分櫱數,每穗粒數和粒重是產量構成的直接因子。為了進一步細分產量表型,作者評估了三個不同的氮素處理梯度(高氮,中氮,低氮)下的表型,發現分櫱數量在所有的參試材料中均與氮素從低到中增加呈顯著正相關,但是氮素從中到高時差異表型並不明顯。每穗粒數和千粒重卻隨著氮素的升高而降低。為了發現更合適的表型,作者計算了氮素響應值((moderate nitrogen–low nitrogen)/low nitrogen),發現分櫱氮素響應(TRN)最明顯,且不同材料之間的變異最大,暗示該指標是一個理想的衡量氮素利用率的表型。下文的GWAS分析表型就用這個了。
2. 全基因組關聯分析
利用混合線性模型進行GWAS分析,在水稻的第6號染色體上定位到了一個最顯著關聯的SNP位點,該位點能解釋20%的表型變異。連鎖不平衡分析發現該位點位於一個20Kb的block中,該block中有3個注釋的基因(LOC_Os06g12210, LOC_Os06g12220 and LOC_Os06g12230)。為了獲得置信度更高的位點,作者用更嚴格的閾值,發現一個SNP位於LOC_Os06g12210附近,2個SNPs位於LOC_Os06g12220附近,12個SNPs位於LOC_Os06g12230(OsTCP19)附近。由於這些位點與氮素響應相關,作者又調查了這3個基因的表達情況,發現只有LOC_Os06g12230在根部的表達明顯受氮素的抑制,且與銨鹽相比,該基因的表達跟硝酸鹽更相關。此外,高TRN材料中OsTCP19在根中的表達強烈的低於低TRN材料,這個趨勢和TRN的值一致。因此作者推斷OsTCP19是TRN表型的casual基因。以上的3個候選基因在高TRN和低TRN材料中莖基部表達差異均不明顯,暗示有可能有移動的信號在根系和莖基部之間傳導。
為了解決低深度測序帶來的未檢出變異的問題,作者對OsTCP19基因和promoter區進行了重新測序,發現了一些新的和TRN關聯的位點。包括promoter區的一個InDel突變和4個SNPs;編碼區的一個SNP和一個InDel。
至此基因定位和候選基因的篩選部分結束,下文就是基因的機制研究。
3. OsTCP119基因的功能
OsTCP19編碼一個植物特異的轉錄因子,隸屬於TCP基因家族。該基因主要定位於細胞核中,在根系和莖基部高表達。中花11中過表達該基因(自身啟動子和CaMV35S啟動子)均表現出分櫱數顯著降低的表型,而RNAi的轉基因植株則表現出分櫱數顯著增加的表型。CRISPR敲除突變體也產生了分櫱數增多的表型。這些結果表明OsTCP19是水稻分櫱數的負調控因子。
OsTCP119基因被證明是有功能的,但是該基因的promoter區和基因區存在較多的變異,那到底是哪個變異才是導致表型差異的causal變異呢?單倍型分析將該基因等位變異分成2種單倍型,即高TRN型(OsTCP19-H)和低TRN型(OsTCP19-L)。110個水稻微核心種質中,幾乎所有的aus型為OsTCP19-H型,幾乎所有的粳稻為OsTCP19-L型,秈稻中大部分(76.7%)也為OsTCP19-L型。構建的OsTCP19-H型等基因系(OsTCP19-H來源於Kasa,背景為粳稻越光)表現出高于越光的TRN值和低的OsTCP19表達。氮素處理下,OsTCP19-H的啟動子活性顯著降低,和OsTCP19-H基因的強烈下降趨勢一致。為了精準判定功能突變,作者分別引入了五個OsTCP19-H promoter區的突變到OsTCP19-L型的promoter區。發現攜帶29bp InDel的突變能顯著增強OsTCP19-L基因的表達活性,甚至與OsTCP19-H的表達活性相當。其他位點的突變並未引起OsTCP19-L活性的改變。在中花11中,作者特異性地刪除了該 29bp位點,結果發現OsTCP19基因表達被抑制,TRN更高。這些結果表明promoter區的29bp的InDel是causal突變。
4. OsTCP19基因的上下遊調控
作者在29bp的側翼鑑定到了2個LBD蛋白結合位點,然後又依據已經發表的文獻擬南芥中的LBD蛋白鑑定到了水稻的的2個氮素誘導的LBD蛋白,繼續轉基因驗證了LBD蛋白對該29bp InDel的調控(上遊)。
對中花11野生型和OsTCP19過表達植株進行轉錄組測序,鑑定到2993個差異表達基因(DEGs),822個和發育進程(development-related processes)有關,經TCP結合順式作用篩選到304個DEGs是OsTCP19的潛在靶基因。由於OsTCP19受氮素調控,它的靶基因應該也受和OsTCP19基因相關的氮素調控。作者基於氮素處理的轉錄組測序數據分析生成了一個OsTCP19相關的氮素響應基因集。與以上的304個基因取交集後發現15個潛在的靶基因,這其中有一個基因DLT,該基因已經被證明通過油菜素內脂信號途徑促進水稻分櫱。DLT在OsTCP19過表達植株中被強烈抑制,但是在OsTCP19敲除突變體中上調。酵母單雜實驗和LUC實驗表明OsTCP19能和DLT的promoter區直接結合併抑制其活性。ChIP–qPCR實驗表明OsTCP19-H和OsTCP19-L顯著富集在DLT的promoter區。EMSA實驗證明OsTCP19-H和OsTCP19-L能顯著降低DLT promoter的遷移速率。
DLT的組織表達模式和OsTCP19類似,但是相反的氮素響應表達模式。除了低的分櫱之外,OsTCP19過表達植株也表現出典型的油菜素內脂缺失表型,包括株高降低、直立以及深綠的葉片、穗長變短,對油菜素內脂敏感性降低,和dlt突變體的表型絕類。此外,過表達DLT能恢復因過表達OsTCP19導致植株分櫱數降低的表型。這些結果表明OsTCP19能直接結合在靶基因DLT上,並提出OsTCP19-DLT基因調控分櫱生長的module。
5. OsTCP19等位基因的地理分布
正如以上結果所呈現的,110個水稻微核心種質單倍型分析發現OsTCP19-L型集中在粳稻和秈稻中,而OsTCP19-H型集中在aus和香稻中。3K水稻計劃中的3024個水稻accessions又鑑定到20個高置信度的單倍型,其中12個歸屬於OsTCP19-H型,剩餘的8個歸屬於OsTCP19-L型。3K水稻計劃中OsTCP19-H型等位基因在aus中佔比94%,香稻中佔比93.8%,粳稻中佔比僅4.9%。在III型秈稻中佔比68.7%,II型秈稻中佔比29.5%,I型中僅佔比7.3%。這些結果提示我們不同水稻亞群中OsTCP19的等位基因分布和起對環境的適應性有關,尤其是不同地理位置的土壤氮素含量。收集42個國家和地區的土壤氮素含量之後,我們發現OsTCP19-H型等位基因頻率和土壤氮素含量有極強的關聯。氮素貧瘠的地方集中在恆河流域的印度東北部和孟加拉國,這些地區主要栽培OsTCP19-H型aus稻。而在一些氮素富饒的地方,比如中國東北部,朝鮮和日本,幾乎不存在OsTCP19-H型。OsTCP19-H基因頻率和土壤氮素含量之間存在極顯著的負相關。這些結果表明OsTCP19-H型等位基因參與了水稻對氮素貧瘠土壤環境的適應性,並在馴化過程中得到了保留。
最後滲入系的品比實驗證明OsTCP19-H型等位基因能提升氮素的利用率,對培育環境友好型水稻新品種具有重大實用價值。
1. 關於表型:環境適應性表型或者脅迫類表型往往是非常複雜的複合表型,與多種表型均存在相關性,篩選到一個合適的表型作為抓手非常重要。本文首先將氮素響應的經典表型產量做了分解,然而分解後的表型可能並未關聯到令人滿意的結果,作者又做了探索(這個過程可能比較難受),終於找到了一個複合型的表型:分櫱氮素響應值(tillering response to nitrogen,TRN)=((moderate nitrogen-low nitrogen)/low nitrogen),該表型在不同材料中的變異大,解析度更高,最重要的是GWAS得到了極顯著關聯的位點。表型部分就是需要不斷的嘗試,篩選到一個合適的表型就成功了一小半了。
2. 關於基因定位:本文的基因定位設計簡單,甚至略顯單薄,僅僅用110個水稻的微核心種質進行GWAS,正常情況下,GWAS+QTL定位是此類文章的標準配置,甚至會用兩個以上的群體進行定位結果的交叉驗證。本文定位的結果能被認可的原因,筆者認為有以下幾點:首先作者的表型鑑定工作量較大,表型鑑定的體系也完整,側面上有利於提升定位的可靠性;其次是作者也構建了NIL系,並有預期的表型,效果也類似於圖位克隆;最後就是分子功能驗證表型也明顯。以上三點使GWAS的定位結果更加solid。
3. 關於機制研究:OsTCP19基因的功能驗證和機制的研究相對中規中矩,最大的特色在於探索了OsTCP19的上遊互作蛋白,同時又篩選到下遊的互作基因DLT並進行了驗證,打通了油菜素內脂調控的水稻分櫱分子機制的任督二脈。
4. 基因育種應用潛力:通過不同單倍型和大量的土壤氮含量的相關性,發現秈稻、粳稻以及不同地域特異的單倍型,並通過構建高氮地區推廣品種OsTCP19-H型單倍型,並進行了三年的小區品比實驗,證明了該基因在改良當前水稻主栽品種低氮環境適應的巨大潛力。這一點是本文的最大的亮點之一,也是目前絕大多數基因定位和克隆文章都缺少的內容。
本文立意高遠,定位到的基因OsTCP19具有改變全球水稻種植格局的潛力。這一點與上文表格中水稻的耐冷基因定位克隆,水稻的抗稻瘟病基因定位和克隆,玉米葉片夾角的基因定位與克隆以及小麥的抗赤黴病基因的定位與克隆有相通之處。這些重要基因基本上來源於遠緣種、野生或者地方種,而且有些基因並未在主栽品種中利用,在應用層面具有廣闊的想像空間。所以到這裡大家應該明白了選擇什麼樣的材料、做什麼樣的實驗才能發Nature了吧?
點擊下方圖片進入OmicStudio資料匯總(整合了B站和公眾號中的精品資源,及時更新,永久有效)
雲平臺網址:https://www.omicstudio.cn
雲平臺特點:
所見即所得
生信人員直接開發
可下載PPT格式
繪圖帶數據處理功能
分析參數多樣(結合多年售後經驗提供)
一鍵分析
聯川生物雲平臺OmicStudio至今已幫助28000+科研夥伴處理各類組學數據,點擊量累計超77000+。目前提供多種雲工具、生信分析流程以及各種乾貨資料和用戶文章,已被Theranostics,Bioresource Technology Reports等雜誌的多篇文章引用。
結合甜瓜實例來了解群體結構分析三劍客 | 群體遺傳專題
深水稻為什麼能適應水淹脅迫?|群體遺傳專題
Nature Genetics|從GWAS結果裡挖掘候選基因方法|群體遺傳專題
GWAS 方案設計中的影響因素 | 群體遺傳專題
詳解GATK突變硬過濾 | 群體遺傳專題