希望組CEO汪德鵬第一次接觸到三代測序技術,是在2009年。當時有傳言說三代技術可以在15分鐘內就完成一個全基因組測序,而且成本僅在大約1000美元左右,全世界都為之震驚。
但從實測的數據來看,無論是測序結果還是測序成本,三代測序平臺都遠遠沒有沒有達到大家的預期,使得這項技術在全世界面前都面臨非常大的爭議。「單分子測序的錯誤率一直保持在15%左右,如果沒有特殊的算法,數據是很難用的。」在那個時間點,整個行業對這項技術都持比較保守的態度。
時間繼續向前推進到了2012年,在進行一次難度較高的植物基因組組裝時,汪德鵬與團隊用二代數據嘗試了多次都沒有辦法解決問題。經過了大約3個月的文獻調研,他發現通過三代測序和二代測序相結合將有可能解決一直以來困擾他們的問題。
心動不如行動,汪德鵬的團隊馬上開始進行測試,該試驗以三代測序為主,並通過二代測序對結果進行矯正,最終使得基因組組裝的完整性得到了大幅地提升。正是這次成功的經歷使得汪德鵬對於三代測序在基因組組裝方面的前景信心滿滿,半年後,希望組開始布局三代測序技術,並成為國內首家提供三代測序應用領域服務的公司。
三代測序用於臨床檢測,須有算法做支撐
彼時,Oxford Nanopore測序儀的錯誤率在30%左右,並且連工程樣機都很難獲得。與此同時,另一種三代測序平臺進行一次人的10X覆蓋深度的全基因組測序,其成本動輒便要超過10萬人民幣。
2013到2018這幾年間,希望組主要利用三代測序平臺做面向科研的技術服務。經過二代測序的矯正,三代測序現在已經可以滿足各式的科研需求,但如果要在臨床應用,這樣的錯誤率和成本還是不能被接受的。在臨床檢測市場,到現在仍然是二代測序的天下。
汪德鵬認為,二代測序之所以能成為精準醫學的主流技術,其主要原因是因為二代測序已經經歷了較長的發展時間,有完整的資料庫和算法做支撐,有大量的臨床樣本信息做考據。但不可否認的是,二代測序的檢出率並不能完全滿足臨床需求,例如,對遺傳病的檢出率整體上還不超過50%。
「剩下的50%,我們希望通過三代測序來部分解決。」汪德鵬這樣表示,「除了三代測序,現有的其他技術都很難做到。」人類基因組中包含了50%以上的重複序列,二代測序由於讀長很短,沒有辦法精確地對這些重複序列進行判斷。
同樣是因為二代測序的短讀長,大片段的結構變異、微衛星串聯重複以及單體型信息,在過去都是臨床檢測上的難點甚至盲點,三代長讀長測序技術的出現將完美填補之前臨床檢測上的這些空白。
PacBio和Oxford Nanopore的三代測序技術在讀長和測序速度上都佔據優勢,尤其是Oxford納米孔測序儀,其讀長甚至可以超過1Mb(一百萬鹼基對),並且在測序的過程中還能同時檢測DNA的甲基化修飾。汪德鵬判斷,在不遠的未來,三代測序將有望成為遺傳病檢測的主流技術。
孤獨的公司
當理想走進現實時,會經歷許多波折。希望組從2014年便開始嘗試將三代測序應用到臨床遺傳病檢測,但這個過程並非一帆風順。「我們從2014年就啟動了相關研究,但直到近期才開始與少量醫院展開合作。這些年,我們填了很多坑,包括算法、流程、資料庫的構建等方方面面。」他這樣表示。
這其中,最核心的原因是因為三代測序的算法不如二代測序成熟,很難下載到開源軟體,一般的商業化公司往往對此望洋興嘆、知難而退。而希望組正是全球首家用三代測序進行遺傳病檢測的商業化公司。
汪德鵬調侃道,公司不僅在國內顯得很孤獨,在全球領域同樣也是孤獨的存在。「在國內找不到同伴,在美國的ACMG和ASHG這樣的醫學遺傳學盛會上,我們也找不到同伴。最近兩年,每次涉及到三代測序精準醫療技術服務的,就我們一家企業。」
沒有任何經驗可供參考,沒有任何模式可以照搬,希望組只能靠自己一路摸索。而在這個過程中,他們面臨的最大的困難就是團隊的組建,無論是實驗研發團隊還是生信研發團隊,都對每一個成員和個體提出了非常高的要求。因此,在團隊成員的搭建過程中,希望組表現出對專業度和產業經驗的極致追求。
CEO汪德鵬畢業於北京大學生命科學學院,隨後進入華大基因,主持參與了一系列一代測序和二代測序相關的推廣工作,緊跟測序行業時代脈絡,把握住了幾乎每一個關鍵性節點。
CTO吳昕師從我國著名生物信息學專家羅靜初,曾任中通軟聯開源諮詢公司副總裁、全球知名的跨國農業公司孟山都(Monsanto)中國應用架構師、孟山都生物科技有限公司生物信息科學家等職位;在生物信息學、基因組學R&D及IT諮詢服務領域有近二十年的工作經歷。
CSO劉山林畢業於哥本哈根大學,曾以主要負責人身份主持或參與國家高新技術研究發展計劃(863計劃)、「十二五」國家科技支撐計劃及深圳市自由探索研究等一系列重大項目;作為核心科研人員在Science、NAR、PNAS、GigaScience、Current Biology等國際知名SCI雜誌發表文章30餘篇,被引數千次,其中通訊/第一作者10篇。
「很多公司都不願意走這條路,但我們有非常棒的合伙人團隊和投資人,他們都對團隊很信任,也有耐心。」他補充道。在與汪德鵬的交流過程中,你會發現他是一個對自我極為挑剔的人。當預測到二代測序即將進入價格戰和渠道為王的階段時,便果斷地從更為小眾的三代測序技術切入,他認為這樣的選擇更具創新價值。
「但這就很考驗投資人的眼光。」汪德鵬繼續說道。在最初,他也擔心自己堅持的方向沒有投資人認可。但隨著經緯中國、遠毅資本等領先機構的加入,以及公司內部研發的快速推進,汪德鵬也對自己的想法越來越有底氣,「大的方向很多公司去搶,但是做事情一定要提前布局。」
到現在,希望組已經在基於三代測序的遺傳病診斷和輔助生殖領域取得了大幅的領先優勢,即使有新的公司進入,也很難跟上希望組的腳步。
三代測序或許能打開更廣闊的測序市場
2016年,Oxford Nanopore測序儀的錯誤率大約在30%,在經過了連續幾次的升級和迭代後,目前人類基因組測序的錯誤率已經接近5%,「這對結構變異和甲基化檢測沒有太大影響,結構變異和甲基化檢測不太在乎單鹼基的準確度。」談到這裡,汪德鵬對業界普遍認為三代測序還只能應用在科研領域的認知有點懊惱,「其錯誤率已經得到了極大的改善,且成本還在持續下降。」
「任何技術都不是完美的,但是通過開發軟體、算法,通過對數據的矯正,我們可以對缺陷進行彌補。」汪德鵬這樣說道。
過去,二代測序的最大優勢是成本低、通量高,而在讀長和測序速度上,一直是三代測序更具優勢,但是現在隨著Oxford Nanopore推出PromethION48測序平臺以後,三代測序的成本已經接近二代測序,通量也與二代測序最高通量持平,大約3天便可以產出5-8Tb的數據。他認為,在三代測序一路狂奔的升級迭代下,二代測序的優勢將逐步弱化,一旦三代測序解決單鹼基準確度的問題,可以直接進行SNP的識別,三代測序便會成為大部分應用場景的主導技術。
不僅如此,三代測序或許還能成為測序技術打開基層醫療市場的一把鑰匙。三代測序儀對測序場景不挑剔,NASA甚至還用Oxford Nanopore的測序儀在太空完成了測序。這些更為靈巧的儀器不需要給它們配備專門的實驗室,價格也不像二代測序儀一樣動輒上百萬。即便是社區醫院,都有可能具備三代測序平臺的建設能力。此外,由於流程更簡便,三代測序的測序速度也更快。
汪德鵬告訴動脈網,他們通過三代測序進行一次遺傳病檢測的周期大約為1周,這其中還包含了人工注釋的時間,而二代測序的周期則接近一個月。隨著流程的優化,他們甚至希望能在2年之內實現當天出報告的願景。
成本和可靠性是衡量技術是否適合在臨床使用的重要指標,汪德鵬認為,1萬元一次的全基因組測序價格,可能是三代測序技術發展的一個分水嶺,或許可以推動該技術在臨床應用上的快速爆發。
成本下降帶來的價值體現
在將三代測序的應用到臨床的早期,由於成本和準確度的原因,希望組走了不少彎路。但隨著三代測序成本的下降,此前的投入和布局價值得到了體現。
他們在一個項目中接觸到了一位來自雲南的患者,其家族5-6代人都患有同一種遺傳病。患者在進行一代測序、二代測序後都沒有得到明確的致病原因,希望組在對其家族進行三代測序的遺傳檢測後,發現這是一種由600萬個鹼基對的倒位突變導致的疾病。
「患者跟我們說這解決了他們家族的『魔咒』,我們也很興奮。」汪德鵬表示,「我們可以解決一代測序和二代技術都沒有辦法解決的問題,並且通過遺傳分析,這些數據可以給醫生提供臨床幹預和指導的有效信息。」從成本上,汪德鵬透露目前三代測序15X全基因組檢測的成本已經可以控制在1萬元以內。
「這項技術一定很快就能成為遺傳病檢測的重要手段。」他如是說道,可以預見,作為全球第一家用三代測序做遺傳病檢測的公司,希望組將具有顯著的先發領先優勢。
未來:看好輔助生殖應用和腫瘤、微生物檢測
汪德鵬透露,公司已經在輔助生殖領域的難題平衡易位診斷上取得良好的結果。即使是臨床級別的全基因組測序,他們也能做到僅僅倚賴15X測序深度的三代數據便可以得到明確的斷點位置,這對想要解決問題的患者來說相當具有吸引力。目前希望組已經進行了相當數量的樣本測試,且有兩篇文章已經發表在國際權威雜誌上,一篇正在投稿中。
汪德鵬告訴動脈網,他的願望就是能通過希望組,把三代測序變成全世界遺傳病檢測的主流方法之一,「這個技術不成熟,但是我們把它變成熟了。」他計劃在2-3年內可以實現全部突變類型的遺傳病均可快速診斷的宏偉目標。
在三代測序臨床檢測應用沉澱數年後,汪德鵬還希望公司在遺傳病檢測以外的領域取得突破,他非常看好三代測序輔助生殖、腫瘤檢測、微生物檢測上的應用,也看好大數據的未來價值。「三代測序應用場景非常廣,我們一定會做更多的布局。」汪德鵬表示。