「生命密碼」破譯加速度 中國精準醫學再次刷新世界紀錄

2021-01-11 央廣網

全基因組測序在臨床醫學領域正變得越來越重要。

在波及全球的新冠肺炎疫情期間,全基因組測序作為醫學領域的「緝毒犬」,在核酸檢測試劑盒還沒研發出來的時候,全基因組測序是診斷新冠肺炎的金標準。比病毒基因組大幾十萬倍的人基因組更是儲存著人生老病死的生命密碼,是精準醫學時代必須破譯的天書。隨著精準醫學的快速發展,全基因組測序對速度的需求也進一步擺在了業界面前,越來越受關注。

中國方案刷新全基因組測序速度的世界紀錄

全基因組測序技術將人基因組隨機打斷成數億個短片段平行測序,因此測完之後只是一大堆零散的數據,必須進行分析運算才能得到有生物學意義的結論。

承啟生物開發人員正在一臺高端家用電腦上調試Chi-Cloud

眾所周知,蘋果公司的賈伯斯為了治療,測了他的全基因組。彼時測序儀還不夠先進,賈伯斯花費了10萬美元實驗費用,用時幾個星期;相比之下,幾千美元的分析費用和幾天的運算時間並不顯眼。隨著測序儀器的不斷進步,現在一個人的全基因組測序的實驗成本已降至600美元以下,耗時縮短到一天,而分析費用卻並沒有減少太多,因此分析成本成為全基因組測序技術中的主要成本構成之一。究其原因,是因為全基因組測序的數據量非常龐大,算力需求驚人。全基因組測序數據分析的單任務完成時間普遍較長,通常需要20-30個小時。後來,許多團隊和公司紛紛採用FPGA、GPU等專用硬體來提升分析速度,但仍舊以小時為單位,無法「立等可取」。

雲計算廠商看到這樣的需求,開始涉足全基因組「測序數據云分析」領域:從Illumina公司推出的BaseSpace,到Google開發的DNANexus,再到阿里雲、百度雲等等。他們利用雲計算龐大的計算資源來加速運算。但遺憾的是,即便不計成本地同時動用幾十上百臺伺服器,單任務完成時間依然很難壓到半小時以內。

不久前,全基因組「測序數據云分析」領域傳來「爆炸性」消息:深圳承啟生物科技有限公司利用自主研發的雲平臺Chi-Cloud及高精度算法FANSe3,成功實現了單機5分鐘分析完成一個人全基因組數據集,再度刷新世界紀錄。

為什麼說是「再度刷新世界紀錄」呢?因為承啟生物曾在2018年以單機1小時的成績刷新過人全基因組測序數據分析速度的世界紀錄,比傳統技術快了幾十倍。如今再加速到5分鐘,一騎絕塵。

提升速度的「殺手鐧」:自研的FANSe算法

驚嘆之餘,不禁要問:承啟生物用了什麼「秘密武器」,能將單機解碼全基因組的速度提升到不可思議的5分鐘?答案是承啟生物自主研發的算法,可以以驚人的速度將測序得到的數億條短序列精準地與30億鹼基的人基因組進行比對,遠遠快過國外同類算法。只用CPU進行運算,就足以秒殺以往需要FPGA、GPU等專用加速硬體的性能。甚至單機5分鐘的速度,承啟使用的也並不是什麼高端伺服器,而只是一臺配置較好的家用電腦而已。

此前,大型測序中心為了處理海量測序數據,使用國外算法時大都需要巨額的硬體投入和專業維護,能耗也居高不下,成本很高。而承啟生物可讓大型測序中心無需購置和維護超算集群,能耗也大為降低。甚至連電腦都不用買,直接利用承啟生物的雲平臺即可。在「單機5分鐘」的強勁能力下,基因組測序的分析成本幾乎降至零。

自主創新讓全基因測序不再受制於人

日前,臺積電業績說明會上明確表示:在5月15日之後已經沒有接收華為的訂單,而且對華為的晶片供貨也將在9月14日停止,讓業界擔心華為今年的5nm晶片是否足夠自家的手機使用。

承啟生物實驗室一景

核心技術是企業乃至國家與地區的安身立命之本,只有實現核心技術自主才能不被扼住命運的咽喉,免於受制於人。

同通訊行業類似,基因組測序的分析同樣依賴於晶片。使用國外算法,單機運行效率並不高。為提高單機運算速度,只能採用專用晶片加速。

但受國內晶片技術局限,目前國內僅有自主CPU,而高性能FPGA、GPU等加速晶片依然被國外壟斷。

而FANSe3算法不依賴專用加速硬體,只要重新編譯就可在國產CPU上高效運行,從根本上避免晶片禁運風險。

當然,國內晶片孱弱的現實短期內難以改變。為應對國產CPU性能與國際頂尖水平的現實差距問題,FANSe3和承啟雲平臺架構在設計之初便支持大規模分布式運算和自適應任務調度,擴展性強,可利用多個CPU共同運算一個任務。簡單來說,如果一臺電腦性能不夠,可以將多臺電腦聯網捆綁起來,獲得成倍的性能提升。

由於FANSe3每一行代碼都是自主開發的,因此承啟生物還專門對國產測序儀的數據特性進行針對性適配和優化,成功規避其不足之處,使國產測序儀的能力得以充分釋放,比肩甚至超越國外最先進的水平。

至此,不用擔心中國的全基因組測序技術受制於人。

速度這麼快,能算準嗎?錯誤率十億分之一

與速度同樣重要的是算法的準確性。此前國際頂級醫學期刊就曾刊文指出,將一些病人的樣本送去兩家國際知名測序公司測序,結果絕大部分病人收到的兩份報告裡面測到的突變都不一致,使得醫生無所適從,而其主要原因之一便是傳統的算法不準確、不穩健。目前承啟生物的FANSe3的錯誤率已經可以穩定在十億分之一以下,並且經大量實驗表明,FANSe系列算法在基因組突變分析、轉錄組表達分析等應用上,準確度幾乎為100%,遠超國外基於BWA、Bowtie等傳統算法方案,並在醫學科研和臨床應用中成功分析超過50萬例樣本。

承啟生物實驗室一景

但要實現基因測序的準確性,算法只是一方面,同時還要確保從採樣、運輸、前處理到測序的實驗全過程萬無一失。

為此,承啟生物經過數年研發,開啟「全鏈條穩健」的方式:在其自有的保存運輸技術方案中,即便不使用乾冰、冰袋的情況下,檢測樣本也能經得住三天-55~45°C的劇烈溫差波動而保持完好;在樣本前處理和建庫階段,即便樣本發生降解,承啟生物研發的實驗方案也能確保實現近乎100%的準確性。基因檢測的應用場景也進一步擴寬,基因檢測門檻大大降低。

而且,這一系列技術仍然是承啟全自主研發,所用全部材料和設備均可100%國產。

普惠精準醫療時代的開端

對許多臨床急性病症來說,時間就是生命。承啟生物實現的單機5分鐘分析突破,以超高速的運算助力重症患者「與死神賽跑」。

而更重要的是,在技術安全和效率之外,單機5分鐘分析全基因組可以讓普惠精準醫療離我們更近。

長久以來,國內衛生支出高一直是個老大難問題,中國的個人衛生支出費用一直很高,以2016年的衛生支出數據來看,在中國,個人需要承擔35.9%,而這一數字在德國、法國僅為12.4%、9.8%。「看病貴」的問題在國內說了好多年。而基於基因組測序的精準醫療檢測,雖然已在多個醫學領域顯示出良好的成效,但幾乎無法進入醫保,動輒萬元的高昂檢測費用只能病人自費承擔。

承啟生物的新技術可以讓全基因組測序的硬體成本變得幾乎忽略不計,同時因為效率提升又大幅縮小人力成本。成本降低,也就意味著基因組測序的普及性更高。顯然,在未來醫療發展和大健康需求背景下,我們需要這樣一項「又快又準又便宜」的新技術以實現普惠精準醫療。有理由相信,隨著全基因組測序在常規醫療中的應用越來越廣泛,未來將成為常規檢驗。基於承啟生物自主技術,基因測序可以極低的成本來到我們的身邊。

相關焦點

  • 破譯遺傳密碼 掌握生命秘密
    中科院院士眼中的「明日世界」——  破譯遺傳密碼 掌握生命秘密  你想像過,在科幻電影中才會出現的場景,也許有一天會成為現實嗎——  那時,有一本記錄著自身遺傳密碼的書伴隨自己從出生到死亡,裡邊密密麻麻的符號能夠清楚地表明你患有某些疾病的機率;癌症這樣可怕的疾病也有辦法被攻克,因為醫院可以監測到你的身體指標
  • 中國再次刷新脈衝磁場最高強度紀錄—新聞—科學網
    據華中科技大學8月12日確認消息:該校自行研製的脈衝磁體近日實現90.6特斯拉(特斯拉是磁感應強度單位)的峰值磁場,再次刷新中國脈衝磁場的最高強度紀錄,使中國繼美國
  • 《易經》成功破譯生命密碼:生命到底是什麼?從哪裡來到哪裡去?
    生命的秘密,可以說被一致認為是地球上最大的秘密!生命到底是什麼?從哪裡來到哪裡去?九億年前的前寒武紀,地球上開始出現原始生命;到了七千萬年前的時候,天空開始出現了飛鳥,地面上也有野獸也奔跑了;算過來人類出現僅僅也就兩百萬年,只能算是後生小子。
  • 《易經》破譯了生命密碼:生命到底是什麼?從何而來去往哪裡?
    我們生存在這顆蔚藍色的星球上,在這個星球上的所有的一切事物都是由無數的生命組成。不管是人類還是動物甚至於微生物,都是鮮活而又燦爛的生命。那麼生命到底什麼?從哪裡來到哪裡去?生命所帶了的無數的謎題,是這個星球上最大的,也是最難以解開的秘密。
  • 《生命的密碼》:探究生命密碼的一生
    文丨周國清 人類是由猿猴進化而來,是物競天擇的產物,這在如今已是孩童亦知的公理,然而,其背後隱匿的,卻是數百年甚至上千年來人類對生命科學的思考與探索,無數人為此傾盡一生,甚至付出了生命的代價,只為破譯那最原始的生命密碼。
  • 75歲老奶奶全馬352刷新世界紀錄 配速530
    75歲老奶奶全馬352刷新世界紀錄 配速530
  • 甲午戰爭前 中方高級電報密碼已被日方破譯(圖)
    李鴻章赴日談判時,因日方破譯了中方的電報密碼,李與北京往返的密電內容及中方割地賠款的底線,全部為日方所了解,因而整個和談的進程都在日方掌控之下……  對電報密碼失密的途徑,歷來有各種說法,有說是李鴻章身邊人洩密的,有說是日本的語言學家和電報專家聯手成功破譯的,但這些說法的背後又都透射出種種疑點。只有一點是各方普遍認同的:日方破譯中方電報密碼的確切時間,是1894年6月。
  • 上海啟動國際人類表型組計劃,全面解讀人類生命密碼
    上海啟動國際人類表型組計劃,全面解讀人類生命密碼 姜泓冰/人民日報 2018-03-27 08:30
  • 破譯中國4萬多文字密碼的首部《黃帝字典》在滬首發
    中國文字至今約有8300年歷史,被聯合國高度讚譽為「活化石」。但一個個文字究竟「音從何來」,似乎成為了世界之謎,致使人們只停留在「認字並不識字」的階段。據介紹,新加坡環球中文中心GCC機構耗時16年,破譯了中國4萬多文字密碼,據此出版的《黃帝字典》,解讀了一萬多個文字、170多萬個詞組密碼,如一個「活」字為什麼發「活huó」這個音?為什麼是「三點水」加「舌」字構成?
  • 山東一名女子因坐月子無聊,隨手破譯2套美國密碼,國家獎勵711萬
    例如這篇文章要講的主人公,就是這樣,她是敢於嘗試的,也是敢琢磨的,結果居然把美國人的密碼給破譯了,而且還在坐月子的時候學到了。那到底發生了什麼事呢?在她看來,之所以要破譯這些密碼,是因為在坐月子的時候自己實在太無聊了。出生在山東省的王小雲,家境並不富裕,直到她7歲的時候,家庭條件才稍有改善,才有幸正式接受教育。
  • 澳洲數學家助力 黃道十二宮殺人案密碼被破譯
    人們花費了51年時間才破解了這段密文1969年,黃道十二宮殺手將加密信寄給了《舊金山紀事報》包括一名墨爾本數學家在內的一個志願者密碼破譯小組,在近日破解了50多年前舊金山一名連環殺手寄給一家報紙的神秘密碼,這名殺手自稱「黃道十二宮」(Zodiac)。
  • 深圳科學家編寫「生命密碼」
    酵母菌生命原始碼:實現人工編寫和合成 據了解,「人工再造生命體」酵母基因組人工合成項目由美國發起,中、美、英、法等多國共同協作承擔該項目工作,重新設計並化學合成真核生物釀酒酵母的全部16條染色體(一千四百萬個鹼基,大小約為人基因組的5%),現已完成五條染色體的重新設計與合成。其中,來自華大基因、天津大學、清華大學的中國科學家完成4條,佔完成量的66.7%。
  • 密碼界聖杯,百年無人解的天書,破譯後是中世紀婦女衛生保健手冊
    尤其是在這100年裡,世界經歷了一戰二戰,一戰二戰的期間就湧現出一批解密方面的專家,他們之前都是軍方的人,後來他們也都來參與這本書的數據解讀。一戰時期,曾破解德國密碼的「美國密碼破譯之父」亞德裡研究過手稿之後也表示束手無策,二戰末期,破解了日本海軍密碼的美軍破譯人員,也對伏尼契手稿同樣可奈何但最終都無法破解。
  • 生命密碼數字密碼的含義大全
    談起生命密碼已經有一段時間了,尤其是在西方,生命密碼與塔羅、星座並列為三大神秘學,有著精準的預測性,他是一門科學,與中國的易經有異曲同工之妙,是西方最主要的命理學,而且很精準。研究好生命密碼可以改變命運,避免人生的坎坷。
  • 田徑史上最難刷新的6大世界紀錄:王軍霞上榜 博爾特9秒58第三
    田徑號稱人類運動之母,每個時代天賦出眾、實力強勁的名將巨星無不渴望打破世界紀錄,代表人類開拓運動新極限,其中一批天之驕子堪稱百年一遇的超級天才,創造的世界紀錄代表著人類目前最高極限,塵封多年無人接近,更別談超越刷新,接下來盤點6個最難打破的田徑世界紀錄,博爾特百米9秒58第三 榜首塵封近40年
  • 加州十二宮殺手密碼51年後告破!破譯者是3名普通公民
    據外媒報導,美國聯邦調查局(FBI)當地時間11日證實,一組困擾了警方半個世紀的加州十二宮殺手密碼,已於近日被破解。破譯者是3名普通公民,但都擁有密碼破譯方面的專業知識。據報導,破譯團隊由三名成員組成,他們都非官方人士,而是普通公民身份,但都擁有密碼破譯方面的專業知識。這三人分別是美國網站設計師大衛·奧蘭查克(David Oranchak)、澳大利亞應用數學家山姆·布萊克(Sam Blake),以及比利時密碼破譯軟體工程師亞爾·萬·艾伊可(Jarl Van Eycke),艾伊可同時也是一名倉庫經理。
  • 走近大科學工程:解鎖農作物的生命密碼
    解鎖農作物的生命密碼  ——探訪中國農作物基因資源與基因改良重大科學工程項目  走近大科學工程  本報記者 馬愛平  位於北京市海澱區中關村南大街12號中國農業科學院院內的作物科學研究所重大科學工程樓,即使是在建成16年後的今天,外表看起來也頗為壯觀。
  • 「世界胎齡最小」寶寶演繹生命奇蹟
    本版撰文:秦興梅 王學良 如果不是家人不言放棄的堅持和全體醫護人員365個日夜的堅守,他的生命或許像顆流星一掠而過。而現在,剛剛迎來一周歲生日的深圳男嬰小宸禧,不僅刷新了世界胎齡最小寶寶的紀錄,而且以幾近健康的成長,創造了生命奇蹟。
  • 揭秘至今仍未被破譯的五個世界級密碼[組圖]
    儘管數學、語言學和計算機科學發展到現在已經相當強大了,但是仍然有一些千奇百怪的密碼難題至今仍未破解
  • 復旦人類表型組:破解人群生命健康密碼的探索者
    據悉,泰州隊列是我國完全獨立擁有智慧財產權、人類遺傳資源使用權,不依賴於國外技術力量的大型中國人群研究隊列,並具備了「人類遺傳資源採集、收集、買賣、出口、出境審批」資質。在設計上,泰州隊列由流行病學、遺傳學、臨床醫學、生物統計學、管理學等多領域交叉的科學家參與,兼顧流行病學基本要素,更突出了生命組學的需求,注重各種臨床表型的前移,豐富了大型隊列研究的內涵。