葛毅:人工智慧熱潮下,基因組學研究的機遇和挑戰——生物谷人物專訪

2020-11-29 生物谷

編者按

從新千年的鐘聲敲響的那一刻起,我們便開始感受到了網際網路帶來的巨大的變革。近幾年來,大數據技術和人工智慧取得了突破性進展,從出行方式、通訊渠道、消費習慣到飲食起居,我們生活的方方面面正被這一波波的新技術重塑改變著。另一方面,我們對於健康管理、疾病預防和治療的傳統認知,正被人類基因組計劃打開的生命科學研究新認知不斷顛覆。究竟是信息技術還是生物技術,是這個時代的主旋律呢?擁有計算機和生命科學雙重教育背景的金唯智中國區總經理葛毅,喜歡把上帝看做一個偉大的程式設計師,利用AGCT的四進位代碼來編寫生命的奧秘。在他看來,BT和IT代表的兩股技術方向,就像兩片銅鑼,相互撞擊之下才能奏出21世紀華美的樂章。

人工智慧熱潮下,基因組學研究的機遇和挑戰

生物谷:葛總您好,作為在兩個領域都有豐富的實踐經驗的複合型人才,您是如何看待生命科學和信息科學的發展和關係的呢?

葛毅:生命是個複雜的現象,生命科學有一個很難處理的問題,就是很難量化,很難用精準的數學模型或算法去表達。後人類基因組時代,我們對生命的認識取得了很多突破性進展,也有些三十年前面臨的問題依然存在較大挑戰,可以算是「機遇與挑戰並存」。

我是在1988年進清華學生物醫學工程儀器專業,近三十年來一直圍繞IT和生命科學工作。這兩個交叉學科都是讓人興奮的學科,也出現了不少的突破。

1999年我曾就職於一家在美國新澤西的公司,PHYSIOME SCIENCES,主要研究的就是通過超級計算機進行建模來模擬生物路徑、藥物動力學和藥物對生物體的作用。當時,公司花了500萬美元購買了最先進的UNIX伺服器—IBM的eServer p690(「Regatta」)。儘管當時沒有「大數據」的概念,我們實際是做了今天所謂大數據的工作 - 通過收集大量實驗數據及文獻報導總結出數學模型,然後通過這個模型預測藥物對生物體的作用。取得了一定的成績,但也存在能否替代實驗室試驗,結果是否被生物學家所承認的問題。現在的計算機性能得到了大幅的提升,如何精準的預測生物體對藥物的反應或生物路徑,還是面臨同樣的問題。去年,我在美國參加了BI-IT World大會,看到的一些最新的模型和算法,性能上有很大的提升,但仍然沒辦法替代動物實驗和臨床測試。總的來說,我認為比較成熟模型也還是需要理論和實踐相結合,利用數學模型的預測來指導一些方向和假設,通過實驗來印證假設是否是正確的,就像我們金唯智現在用基因生物信息學方法來輔助客戶進行抗體藥物的研發一樣。

說到這兩個學科的關係,一直以來,IT都是為生命科學做服務的,不論是我們做的基因數據的分析,還是醫學圖像的模式識別。以金唯智為例,我們配備集聚先進的IT資源來為生命科學領域的研究人員服務,從智能化、信息化的訂單管理系統到高性能計算和雲存儲的生物信息分析平臺,這些IT領域的先進技術在幫助研究人員加速項目進展方面起了很大的助力。反過來,生命科學的發現和應用需求也極大地促進了IT技術的發展,比如人工神經網絡和遺傳算法,其實都是從大腦結構和生物遺傳的自然現象悟出的人工智慧算法。

生物谷:英特爾的創始人之一戈登·摩爾,曾經提出了著名的「摩爾定律」,用來形容計算機的飛速發展,如今形容測序行業,又有「超摩爾定律」這一說法,您覺得這背後有什麼共同之處?

葛毅:我們所期待的,是摩爾定律所帶來的效果。正是因為微處理器性能如同摩爾定律預測的那樣飛速發展,使得個人計算機進入千家萬戶成為現實,催生了大量的應用,也給計算技術行業帶來了騰飛的機會。對於測序行業的超摩爾定律,我們也是希望,能夠產生更多的測序技術發展帶來的應用場景。

就像PC機剛進入家庭時,人們也不太清楚應該如何使用,好像除了玩個遊戲也不能做什麼。現在,我們的日常工作和生活都已經離不開PC機了,從工作、學習、購物、娛樂到孩子教育的方方面面。實際上,現在的移動網際網路的很多商業模式和服務也是一個基於智慧型手機的應用場景延伸。那麼,基因測序在科研上還可以有什麼新的應用?醫學上還有沒有類似無創產前基因檢測NIPT(Noninvasive Prenatal Testing)這樣的應用領域?除了鑑定祖先,還有沒有其它更實用的情景呢?

在我看來,食品和健康領域將來可能會出現更多的應用。現在我們可以用基因測序鑑定大馬哈魚是否是正宗的,隨著測序成本的降低,下一步是否可以用來做常規食品和水果的檢測呢?研究上,我們已經開始通過分析腸道菌群來評估腸道健康和疾病進程,未來是否可以用來指導我們個人的飲食習慣呢? 這可能需要我們大家集思廣益,共同來創造和推動應用開發。作為全球基因組學服務商,金唯智的科研人員也在通過和全球合作夥伴的協作,努力尋找基因測序的更加廣泛應用。

生物谷:測序成本的降低使得基因測序技術的廣泛應用,隨著而來的是如何處理分析海量生物大數據, 作為金唯智的全球CIO,您對這個問題如何看待?

葛毅:基因數據可以說天然具有大數據屬性,每次的測序都會產生大量的基因序列信息。測序成本的降低,為研究人員從基因序列角度理解和研究生命現象提供了大量的便利。

當然,數據本身並不能產生知識, 只有有效地對數據進行處理、分析和挖掘, 才能發揮出數據的價值。在我看來,數據處理的關鍵問題是如何能夠去偽存真,實現sample to  answer - 樣本的分析處理能否回答所研究的問題。

由於生命現象的複雜性,作為生物大數據的基因數據也很難清晰的解釋所有的研究問題。現在有很多研究開始將臨床表徵和基因數據信息進行聯合分析,以便從更完整的角度來得到對人類疾病和健康的準確了解。這是基因組學和大數據分析的發展帶來時代機遇,也存在很大的挑戰。最大障礙還是醫療數據分享問題 。如何形成一個完整的規劃?樣本數據的標準化?如何處理醫院間的數據分享的安全和法律顧慮? 

相比標準統一的基因數據,臨床信息的記錄和信息缺少一定的規範和標準,數位化程度比較低,語言表達的差異化,在使用起來會有一定的困難。現在階段,我們需要做的一個很重要的工作可能是先要制定一個大家都能認可的規範,把這些不同的醫療信息匯聚起來。國內外已經有一些政府和行業協會開始著手解決這個問題,發起制訂標準規範,建立可分享的生物樣本庫。金唯智依託南京揚子科技創新平臺,也參與了國家的醫療大數據測序和挖掘工作,我們期待未來可以在這個領域和科學家們一道,更好的解釋生命的奧秘和促進疾病的治療。

生物谷:就您看來,目前處於爆發式發展階段的人工智慧技術對於未來生命科學的研究領域會帶來哪些可以期待的變化?

葛毅:就像我們前面提到的生物大數據的分析方面,把基因數據和醫療信息進行結合,人工智慧會有比較重要的應用和發展。人工智慧領域應用的很多基礎理論,早在80年代我在清華求學時就接觸到了,當時叫做模式識別,能夠輔助處理一些簡單的問題。目前的人工智慧的很多理論和我當年在清華求學時學到的可以說是大同小異,表面上看起來只是神經網絡的層數多了些,好像沒有什麼大的變革。但現在龐大的數據資源和超強的計算機性能,加上算法的優化,為人工智慧提供了前所未有的能力,比如戰勝人類圍棋手的AlphaGo。

在生命科學領域,因為生命現象本身的複雜性,很多研究能否取得突破性的進展和研究方向的選擇有很大的關係。目前,在金唯智我們也已經著手做了一些實踐,類似基因合成領域的密碼子優化,抗體藥物研發中的靶點篩選,基因編輯領域的gRNA設計等都可以通過人工智慧的算法來輔助指導,幫研究人員尋找最優的答案,提高他們的研究效率。

對於未來,隨著基因技術和人工智慧算法的不斷優化,定製化的生命設計在技術上應該是可以實現。相比目前的很多早教培訓,通過優化基因建立各方面的技能優勢對很多家長來說更具有誘惑力,這種以往在科幻小說裡出現的情形,很有可能改變未來的人類,但也有很多倫理問題。

生物谷:作為全球基因組學服務供應商,金唯智在行業內率先推出了電商化的在線訂單系統和移動端,已然在數位化和信息化平臺建設方面走在行業前列。未來,金唯智又會給基因組服務領域帶來什麼新的改變呢?

葛毅:每一家公司的存在都應該能夠解決一些社會發展的需求和問題。對於金唯智的來說,高效率、高質量的服務來降低研究人員的成本是我們的使命。諸如引進最先進的高通量測序平臺HiSeq X Ten、NovaSeq、及PacBio Sequel,推出智能化的在線訂單系統,以及最近發布的移動端訂單管理,都是我們圍繞效率和質量所做的努力。通過引入德國工業4.0的理念,將我們的實驗流程進行智能化改造,顯著地提高了訂單處理的效率和質量,以及客戶在訂購服務到接受結果的諸多便利。

儘管技術手段和研究熱點不斷在變化,但我想,研究人員對時間和質量的需求依然不會變。金唯智目前在全球多個國家運營著15個基因組實驗室,為包括30位諾貝爾獲獎者在內的數萬名全球研究人員提供研究服務。未來,除了繼續鞏固和增強我們在基因組學領域的服務能力,依託聚集的龐大的客戶群體,我們將組建一站式的生命科學服務平臺。希望通過一些優質廠商的合作,擴展基因組學服務以外的蛋白質組學、代謝組學等方面的業務,共同為生命科學領域的研究人員提供全面的服務。

我們將繼續在人工智慧和大數據分析方面開拓創新,通過我們的CLIMS4雲平臺更高效地為科研工作者提供更準確的基因分析和更優質的基因合成服務。

新年寄語

正如當年被這個描述所吸引進入生物行業,現在我也更加相信,21世紀是生命科學的世紀。在過去的18年裡,金唯智有幸參與見證了諸多生命科學領域的重大突破和進展。從Sanger測序到二代、三代測序服務,幫助全球科學家解讀生命的奧秘。從H7N9病毒、伊波拉病毒到寨卡病毒,我們和健康領域研究人員及醫生—道為破解病毒傳播機制爭取先機。從世界首例人類線粒體基因組,綠藻葉綠體基因組到釀酒酵母基因組的人工合成,我們在書寫生命的道路上攜手前進。

2018年,金唯智願與生命科學研究的同行們一道,用我們不斷提升的高效和優質服務,助力大家向著下一個突破和發現邁進!

相關焦點

  • 走進細胞組學最前沿!國際基因組學大會細胞組學會議在青舉行
    11月21日,國際基因組學大會細胞組學會議(ICG-15 CELLOMICS)在青島拉開帷幕。本次會議由青島西海岸新區、深圳華大生命科學研究院主辦,青島中德生態園管委、青島華大基因研究院、國際海洋基因組學聯盟和青歐生命科學高等研究院承辦。
  • 曾春雨:幹細胞療法未來發展機遇大於挑戰
    2013年6月7日美國《循環研究》雜誌(Circulation research)在線發表第三軍醫大學附屬大坪醫院曾春雨教授的一篇研究論文,該研究發現通過預處理或基因修飾的幹細胞,使其獲得類似「抗旱」的能力,可讓幹細胞在小鼠梗死心臟中的存活率從8%左右提高到16.7%。此研究結果一經公布,立即吸引了國內外專家的關注。8月2日,生物谷就此項研究成果及幹細胞療法對心臟疾病治療等問題採訪了曾春雨教授。
  • 多倍體作物研究,機遇與挑戰並存—新聞—科學網
    近日,以「多倍體作物基因組解析與品種改良」為主題的第637次香山科學會議在北京召開。會上,一位專家生動地描述了多倍體作物超強的抗逆與適應性。   與會專家指出,面對多倍體作物基因組研究的機遇與挑戰,我國科學家應強化科研使命,加強合作交流,共同實現農業和人類社會的可持續發展。
  • 國際基因組學大會細胞組學會議在青島舉行 開啟國際技術合作新篇章
    11月21日,國際基因組學大會細胞組學會議(ICG-15 CELLOMICS)在青島拉開帷幕。本次會議由青島西海岸新區、深圳華大生命科學研究院主辦,青島中德生態園管委、青島華大基因研究院、國際海洋基因組學聯盟和青歐生命科學高等研究院承辦。
  • 食品組學:食品分析現在和未來的挑戰(5)
    在這種情況下,食品組學作為一門新興學科來研究食物和營養,主要通過應用先進的組學技術來改善消費者的健康和幸福感。因此,食品組學作為一門全面的學科,包含了食品、先進的分析技術(主要是組學工具)和生物信息學。基因組學、轉錄組學、蛋白質組學和代謝組學的發展為我們現在利用食品組學來解決各種不同的問題帶來了極大的機遇。
  • [TILS]周劍峰教授專訪:EBV相關淋巴組織增生性疾病的挑戰和機遇
    [TILS]周劍峰教授專訪:EBV相關淋巴組織增生性疾病的挑戰和機遇
  • 作物基因組學研究進展
    隨著測序技術的發展,已經實現對重要農作物,如水稻、小麥、玉米、大豆、油菜、棉花、蔬菜等作物基因組的測序或重測序,在此基礎上完成對控制重要農藝性狀基因的克隆和鑑定。本文綜述了2017年度主要農作物基因組研究方面取得的一系列重要進展。1、基因組學領域論文分析在SCIE資料庫共獲得954篇基因組學研究相關的文獻。
  • 清華廖洪恩課題組在人工智慧挖掘影像基因組學領域合作發表系列論文
    推進中國「腦計劃」研究清華廖洪恩課題組在人工智慧挖掘影像基因組學領域合作發表系列論文清華新聞網9月14日電 清華大學醫學院生物醫學工程系教授廖洪恩課題組與首都醫科大學附屬天壇醫院張力偉教授課題組合作,通過人工智慧技術研究大量腦幹膠質瘤患者磁共振影像學特點,深度挖掘其與該基因的關聯,獲得普通醫學研究手段難以獲得的診斷經驗。
  • 英國基因組學公司選擇WekaIO來加速基因組學研究
    加速500萬個基因組計劃的基因組研究。英國基因組學公司選擇WekaFS來滿足未來五年所需的預期容量擴展,同時為其DNA管道提供最高性能。英國基因組學歸英國衛生與社會保健部所有,負責執行500萬個基因組計劃。該項目的目的是對來自國家衛生局(NHS)的罕見病患者,其家庭以及常見癌症患者的500萬個基因組進行測序。
  • 分子診斷:機遇伴隨著挑戰——專訪廈門致善生物科技有限公司副總...
    【編者按】隨著老年人口的增加,醫療模式的轉變,社會市場對分子診斷的需求不斷增加,伴隨著相關企業市場擴張和自身創新的需求,分子診斷市場面臨前所未有的發展機遇。作為體外診斷市場中發展速度最快的市場,分子診斷產業也面臨著諸多挑戰。
  • 癲癇的基因檢測和蛋白質組學研究
    基因檢測既可以在臨床試驗室也可在以科研為主的試驗室進行。根據檢測的目的不同,主要分為藥物基因組學檢測,診斷試驗,預測試驗,產前診斷及攜帶者檢測。綜上所述,基因檢測對於疾病診斷和治療是否有用,要綜合疾病的臨床特點,基因在發病中的作用,基因檢測對於治療和預後的影響等多方面綜合考慮。
  • 進化-系統發育基因組學(Phylogenomics)
    系統發育學(Phylogenetics)是通過重建系統發育樹來研究生命類群之間進化關係的學科,是進化生物學研究的重要領域之一。
  • 食品組學:食品分析現在和未來的挑戰(1)
    食品組學:食品分析現在和未來的挑戰(1)   ——基本現狀 例如,對於食品生產、加工、配製、使用當中,養分含量、有毒汙染物的產生和天然毒素失活等對食品影響的鑑定;遵從食品和貿易相關法規,確保食品的安全性和可溯源性;檢測摻假物質;對食品化學成分的表徵;對食物流變性、形態、結構或表面的研究;以及物理性能分析、物理化學性能分析、熱分析,或微生物分析以及感官評價等,這些性能將對食品的安全性、質量、食品加工和驗收等有著十分重要的影響。
  • 彭廣敦教授:空間轉錄組測序技術轉錄組學研究領域的新方向
    4月21日,由生物谷主辦的2017多組學研究與臨床轉化前沿論壇在上海隆重開幕。本次會議多組學研究和臨床轉化研討會以邁向臨床精準醫療為主題,聚焦基因組學、轉錄組學、蛋白質組學和代謝組學等多組學技術聯用研究臨床疾病,以及多組學數據的整合交叉分析應用,會議涉及基因變異、測序分析、轉錄調控、代謝研究、RNA幹擾等,力圖打通多組學研究到臨床應用的通道,推動多組學技術在醫學轉化上的應用。來自中國科學院上海生化細胞所的彭廣敦教授分享了「空間轉錄組測序技術」精彩議題。
  • 十二位分子遺傳學家萬字長文,燭照遺傳學和基因組學的未來
    在Nature Genetics Review期刊創辦20周年之際,該期刊編委會邀請了十二位現代分子遺傳學家,就遺傳學和基因組學領域面臨的主要挑戰和機遇進行探討,為廣大研究者指點迷津,燭照莘莘學子的書案。
  • 2018年基因組學研究盤點
    2018年12月21日/生物谷BIOON/---2018年即將過去,本期為大家帶來的是2018年度基因組學領域研究的相關盤點,希望讀者朋友們能夠喜歡。目前研究表觀基因組學的研究人員不得從成千上萬個細胞中提取DNA和相關的表觀遺傳學物質來得到一份樣本,隨後他們會對樣本進行生化分析來確定表觀遺傳學物質是否存在。本文中,研究人員學習了更多內容,比如他們通過研究鑑別出了健康細胞和疾病細胞表觀基因組學的差異。
  • 全球環境與健康領域的研究熱點,以及我國環境與健康研究面臨的機遇與挑戰
    理論和方法創新是我國環境與健康研究的挑戰和機遇,需要不斷聚集和吸引優秀科學家形成集群優勢持續攻關,探尋環境致病的原因和機理,為我國區域高發疾病環境汙染尋因,以及為相關健康保障技術的研發奠定理論與方法基礎。
  • 龍膽族葉綠體基因組進化和系統學研究取得進展
    葉綠體基因組由於缺乏重組,而常被認為是連鎖的單一基因座;然而,越來越多的研究表明,葉綠體基因組中不同區域以及不同編碼基因具有不同的核酸替代速率,經受不同的自然選擇壓力。目前對葉綠體單基因或不同功能組基因的進化研究較少。此外,傳統基於葉綠體基因組的系統基因組學研究,通常將葉綠體基因組直接串聯起來進行系統樹構建,因此,單基因遺傳變異導致的系統發育不一致性常被忽略。
  • 蛋白質組學研究進展與趨勢
    1.蛋白質組學研究的研究意義和背景 隨著人類基因組計劃的實施和推進,生命科學研究已進入了後基因組時代。在這個時代,生命科學的主要研究對象是功能基因組學,包括結構基因組研究和蛋白質組研究等。儘管現在已有多個物種的基因組被測序,但在這些基因組中通常有一半以上基因的功能是未知的。
  • 奧維森基因與西部開發研究院共建基因組學研究中心
    西部開發研究院的工作隸屬中國社會科學院,主要職能是積極配合我國「一帶一路」倡議,為「一帶一路」沿線國家的合作發展提供經濟、科技、教育和民生等領域的理論依據。奧維森基因是行業領先的跨組學技術合作夥伴,致力於將國際領先的基因組學和生物信息學技術相結合,提供優質、高效、性價比優的技術服務。