去年秋天,千人基因組計劃(1000 Genomes Project)揭示了人類基因組中8800萬個突變,但科學家們並不清楚其中大部分突變對於人體健康的意義。而且遺傳變異與疾病之間的已知關聯,其實很多也並不明確。科學家們如何能準確確定哪些基因或遺傳變異是真正有害的呢?
患有罕見疾病的患者常常會被這種不確定性困擾,他們在無數次被醫生檢查和檢測之後,通過測序了解了自己的全部或部分基因組,這些測序能提供了一些有希望的答案,但要揭示因果關係,並在此基礎上制定一個治療計劃,依然不容易。來自比利時魯汶大學的免疫學家Adrian Liston說,即使是知道患者的突變,也不一定就能起到治療的作用。
外顯子組測序,也就是覆蓋了編碼蛋白基因組中1%-2%的序列,一般來說會揭示30,000 個遺傳變異,這需要仔細的被評估。生物信息學工具方面的發展也令研究人員快速的縮小了龐大的突變列表。一些網站平臺也幫助研究人員構建了因果關系列表。這些步驟很重要, 因為在動物模型或者細胞系中檢測候選基因需要大量的資源。
目前有一些免費工具,可以用於分析這種因果關係,見下:
EXOMISER
www.sanger.ac.uk/science/tools/exomiser
Exomiser 是2014年推出的一種開源性JAVA軟體包,這種工具能篩選並優化來自全外顯子組或全基因組序列數據中的候選基因和突變,主要側重於表型數據。
這一程序由Monarch Initiative研發的多種不同運算法則組合在一起——Monarch Initiative是一個構建生物生物信息學工具,幫助科學家們更輕鬆的分析表型、疾病、模型系統和轉化研究中基因的跨機構合作組織。
工作機理:
用戶輸入患者的臨床病症和外顯子組,那麼Exomiser 就能基於更多人群中突變出現的頻率,突變類型和突變造成的破壞,以及參與特定疾病或臨床病症的相關基因,來生成一個候選突變列表。
Exomiser與其它Monarch Initiative 工具的區別在於前者還能從模式動物中收集數據,預測一個突變是否參與了這個患者的疾病病理,來自多倫多大學Michael Brudno實驗室的計算生物學專業Orion Buske說。
這一工具的關鍵在於 Human Phenotype Ontology ,這是一個超過11,000例臨床表徵和症狀的標準表,已經被廣泛用於遺傳學研究。斑馬魚、小鼠、果蠅和其它模式生物的類似注釋能通過 Exomiser繪製出人體和其它物種之間的聯繫。而且這種注釋也能在功能方面撒網,雖然科學家只了解了與疾病表型有關的35%的人類基因,但是你可以在其它物種中碰碰運氣,Buske說。
「我們人體都很保守,因此可以在一般情況下了解人體,這雖然不完美,但總比什麼都不知道要好,」Buske說。
此前一項研究也指出,利用人類和模式動物表型的外顯子組序列數據評估,能提高診斷效率(Genet Med,doi:10.1038/gim.2015.137,2015年)。
如何入手:
從這篇Nature Protocols 文章開始(10:2004-15、 2015 年)。Exomiser 是一個獨立應用程式,可以下載到單機上運行,並且也被納入了NIH的Undiagnosed Diseases Network。
注意事項:
Exomiser 包含了從千人基因組計劃和Exome Variant Server的數據,新版本還收集了來自Exome Aggregation Consortium (ExAC)的數據。
CLINVAR
www.ncbi.nlm.nih.gov/clinvar
ClinVar 是一個公開的資料庫,其中收集了與疾病相關的遺傳變異。這一資料庫由美國國立衛生研究院2013年為了生物技術信息開發而構建,來自美國聯盟醫療體系(Partners Healthcare )的臨床遺傳學家Heidi Rehm表示,到目前為止,已經從研究人員和其它資料庫中獲得了包含超過125,000份獨特突變的臨床注釋。
ClinVar 將基因突變對健康影響的多方面性質都考慮在內了,比如對於一個突變,這個研究組說它是良性,但另外一個研究組又認為它其實性質更加嚴重。而且 ClinVar 也有自己的分類,「可能致病性(likely pathogenic)」就是一種更清楚的定義和標準化。
工作機理:
ClinVar 採用的是星標系統(star-based system),可以評估某個特定突變在疾病中的本來或者注釋作用。四星級是最高級,也就是說這個突變的功能已經經過了多位專家的測評。這樣詳細審查過程的好處在於用戶能信任三、四星突變的功能注釋,Rhem說,但是在ClinVar 資料庫中只有少量此類數據(3,800個)。
更多時候是只有一星的突變,這通常只基於單個提出注釋功能的研究成果,還有沒有星的,也就是提交者沒有提供解釋標準和支持證據。ClinVar 工具的一個問題在於其資料庫中大多數臨床上重要的突變(83%)都是某個家庭中獨一無二的,或者非常罕見的。
如何入手:
充分了解ClinVar,可以參閱近期的一份詳細用戶手冊(Curr Protoc Hum Genet, doi:10.1002/0471142905.hg0816s89, 2016),此外還有YouTube上的一個視頻video 也解釋了不同的搜索項。由於這一工具依賴於提交數據,因此Rehm也鼓勵實驗室共享數據,提交數據嚮導可以在 ClinVar 網站上找到。
注意事項:
雖然 ClinVar希望能滿足你的所有需求,但實際上並沒有那麼完美,這主要是因為資料庫依賴於自願提交的材料。「我們嘗試說服所有的雜誌將ClinVar 作為出版資料的一部分,」Rehm說,目前他們正在朝著這個方向來努力。
同時,他們也在通過多個來源分析患者遺傳數據中候選突變的臨床意義,包括人類基因突變資料庫 (Human Genetic Mutation Database,HGMD)——收集已發表文獻中的突變,雖然HGMD管理不佳,「但至少它能找出你的突變也許會出現在哪裡,」Rehm也在努力挖掘疾病特異性資料庫,尋找特殊突變。
MATCHMAKER EXCHANGE
www.matchmakerexchange.org
Matchmaker Exchange是一個致力於把人類基因和臨床特徵聯繫起來的獨立資料庫網站。目前這一平臺主要依靠三個已有的資料庫,未來也許能吸納更多數據,Matchmaker Exchange 除了能收集整理基因-疾病信息,而且也能聯合從事罕見病研究的研究人員,共享信息和合作研究。其最終的目標是幫助研究人員能針對某個因果關係基因構建更為可靠的病例,並發布這些信息,因為實驗室中的許多罕見病候選基因並未發布,Rehm說。
(配對︰ Matchmaker Exchange最初是由PhenomeCentral, GeneMatcher 和 DECIPHER (虛線箭頭)交換構建的,但這個平臺很快就能查詢更大數量的資料庫,每種數據都會給了解罕見遺傳學疾病帶來各種不同的方法。
工作機理:Matchmaker Exchange的各大資料庫:
GeneMatcher
創建一個你感興趣的基因條目。如果有兩人創建了同樣的基因條目,那麼資料庫(會無法搜索)就會給他們發送一封電子郵件。截至今年5月,已經有來自55個國家的1,675 位用戶呈遞了4,459 個基因,其中1,200個基因獲得了超過5,200的匹配。
GeneMatcher的共同創建者之一,約翰霍普金斯醫學院的Nara Sobreira說,「它將大家召集在一起,了解患者的詳細病症,關聯基因的突變。」患者也可以用這一工具。
一些研究也採用了這一方法,比如來自貝勒醫學院的研究人員通過 GeneMatcher 再次分析外顯子組數據,並利用配對工具尋找相似病例,可提高診斷率。
他們目前在GeneMatcher網站,找到世界各地的其他醫生和研究人員,其患者或動物模型有著相同基因的突變。通過GeneMatcher交換項目提供的應用程式界面,提交者還可以查詢PhenomeCentral和Decipher資料庫。
PhenomeCentral
臨床醫師和科學家利用 PhenomeCentral 分析表型,PhenomeCentral能幫助用戶將罕見,未命名的疾病與Human Phenotype Ontology聯繫起來。而且也能調用 Exomiser 軟體包,過濾和分析每個病例匹配的基因。
DECIPHER
這個基於 web 的資料庫匯集了各種生物信息學工具,能幫助臨床醫師解釋變異,並在共享突變和臨床數據的基礎上進行配對。資料庫中有幾種方法可以用於配對,比如,非註冊用戶能搜索DECIPHER中開放患者記錄,這覆蓋了56,000個表型,1,200 個序列突變,以及28,000個拷貝數變異,和關聯數據提交人。用戶也可以將自己的項目提交上去,分享已獲患者同意的數據,匹配其他研究人員的數據。
未來還將有更多資料庫即將上線,包括患者門戶網站,如PEER,PatientKind,ClinGen的 GenomeConnect,以及Monarch Initiative的模式生物資料庫。
如何入手:
你需要針對這三個資料庫中之一創建一個單一日誌,挑選最適合你數據,以及有你最想知道問題的資料庫。創建一個條目需要大約10分鐘,然後就可以篩選其它你想要查詢的其它數據了,Buske 說。
注意事項:
使用Matchmaker Exchange的一個理想時間是在項目的晚期,此時你已經有了一個候選基因,或者兩個關聯基因,基因已確定因果關係,不過你並不清楚哪一個更加匹配你的案例。
Tips:
Whole-genome or whole-exome?
全外顯子組測序似乎是更好的選擇,原因就是兩個字:便宜。對基因組中非編碼區中的突變進行詮釋依然是個難題,因此目前大多數的數據仍不可用,來自魯汶大學的Adrian Liston說。
但儘管如此,去年PNAS發布的一種head-to-head比對新方法指出,全基因組測序對於檢測發現罕見病候選突變來說更為有效。
採用與你的患者儘可能相似的參考人群
譬如千人基因組計劃中的大規模參考人群也許並不合適於您的研究項目,如果你需要的人群在這些資料庫中找不到,比如說研究項目是一個相對偏僻的村莊,並不包含在這些項目中,那麼你就不得不開始構建自己的參考資料庫,或者看看是否有其他人在做。
儘可能分析一個家庭
分析父母,或者理想情況下,健康的兄弟姐妹的外顯子,「如果你要尋找de novo 突變,這個就是必需的,」Liston說。
閱讀更多的文獻
生物信息學工具可以幫助你縮小候選基因的範圍,通過閱讀相關基因文獻就能做到這一點。
藉助團隊的力量
將候選列表中的基因從10個減少到1-2個並不容易,可以組建一個專家團隊,包括了解特定疾病進程的專家,讓他們來幫助你確定候選基因。組建後的團隊通過多次碰面討論,進行決策,比如在其他家庭成員中發現某個特殊的突變(Sanger validation)。
為發布論文尋找證據
Liston在準備他的論文時,需要尋找第二個收到同樣突變影響的獨立家庭,但他沒有找到,為此他求助了其它支持證據,比如細胞系或者動物模型。
(本網站所有內容,凡註明來源為「醫脈通」,版權均歸醫脈通所有,未經授權,任何媒體、網站或個人不得轉載,否則將追究法律責任,授權轉載時須註明「來源:醫脈通」。本網註明來源為其他媒體的內容為轉載,轉載僅作觀點分享,版權歸原作者所有,如有侵犯版權,請及時聯繫我們。)