生命是數位化的,生命的信息可以被儲存、克隆、改寫,人類可以通過修改「生命程序」治癒腫 瘤甚至返老還童。人類是否可以擁有一個預測未來健康的水晶球?答案也是肯定的。這並不是天方夜譚,以基因測序為代表的生命科學正在飛速發展,當以「碳基」 為基礎的基因科學與以「矽基」為基礎的IT技術結合,破譯「生命的公式」正在變成可能。大數據、人工智慧以及深度學習等技術趨勢正在帶領網際網路向更加智能 的未知世界探索,而對人類基因數據的研究和分析,也在利用這些新興的技術和手段,讓人類對自身有更理性的認知,讓自己變得更健康。這就是華大基因CEO王俊在3月22日深圳IT峰會上分享的內容。
以下是王俊的演講實錄:
當我們講數位化、計算機,IT的時候,習慣於以矽為體系。但是在講到生命的時候是以碳為體系。生命的基礎是碳,生命是數位化的。為什麼說生命是數位化的?它能夠儲存?能夠編程嗎?能夠改變程序實現不同的生命形式嗎?可以克隆嗎?這當然是可行的。
為什麼可以從一隻羊身上提取一個細胞克隆成另一隻羊?因為那隻羊的細胞儲存了羊的所有「生命程序」。DNA可以儲存多少年呢?至少可以上百萬年。現在沒有任何一種存儲介質可以把信息儲存上百萬年時間。它能夠計算嗎?當然可以,計算和編程的基本單位就是基因。我們每個人身上都有一套蘊藏著所有生命信息的基本程序,這套基本程序就是生命的語言。它的語言怎麼形成的呢?在最開始的時候,就像每個程式設計師寫出一個功能模塊,然後希望所有人都用這個功能模塊,在生命體裡形成一些基因、一些蛋白質、一些小分子,基因、蛋白質、小分子不斷擴張自己,在不斷擴張自己同時,整個過程不斷複製、不斷擴張、不斷延展,有時候一個基因不夠用,可以和其他基因一起合作,兩個基因、三個基因一起合作,當一堆基因合作更好的時候,就形成個體。
人身上有2萬—3萬個基因,不同物種有不同基因,比如酵母菌有4000個基因,所有不同基因組合形成不同的生命程序,而不同的生命程序與周圍環境適應就形成了個體。每一套程序代表著不同的生存策略,這套不同的生存策略就是針對於不同環境體系而來。而檢測這套程序好不好用的唯一標準就是它能不能活下去,能否傳播更多後代。當個體選擇了可以活下去並傳播更多後代的這套程序就叫做可以適應於環境的生命語言。達爾文進化學說、適者生存理論都是在這個基礎上建立。
每個人的生命程序是不同的。藏族人可以適應高原而生活在平原的我們不行,這是因為我們身體中的程序沒有寫進適應高原的基因。在漢族人體系裡只有5%的人有這個基因,而藏族人達到95%。導致這種差異的原因不僅僅是複雜極端的環境,還與飲食相關,比如南方傣族人因為祖先經常吃檳榔,所以體內基因很多跟檳榔適應。
個體水平為什麼會變化?為什麼藏族人跟漢族人不一樣?在這些表象的背後有很多有意思的東西。比如它的變化來源是什麼?當一個精子一個卵子結合的時候,基因發生了重組。每一代當中,孩子和父母之間有100個基因突變,這些改變形成了不同的生存策略。環境時時刻刻變化、基因也在時時刻刻變化,而基因組可以作為預測程序。人類的基因是由於祖先上千年、上萬年不斷學習、進化,對後來有可能遇到的環境做出的預測。你體內的基因不會告訴你能否去高原,但一定會告訴你去過高原會有什麼反應。
如果每個人生下來就有一個盒子,這個盒子可以清楚告訴你往哪去會發生什麼樣的影響,這個盒子會如何指導我們生活呢?首先,如果這個盒子可以告訴我能活多少歲。比如遵循基因告訴你的事情,你可以活到150歲,但是為什麼活不到150歲?因為你會得各種各樣的病,這些病從年輕的時候一直到年老都有關係,而這些病跟基因,或者跟環境、跟數位化、跟IT、BT有什麼關係呢?
基因中的問題有點像寫程序的時候出了一個「bug」,基因這套程序不能正常運行,人體就會出現很嚴重的問題。比如各種各樣罕見疾病。中國有大於5.6%的孩子有各種各樣的出生缺陷。生命這套程序在不斷試代碼,試代碼過程中不斷試錯,但每一個錯誤並不代表新的往前演化的可能。面對這種情況我們該怎麼辦?能否可以通過基因檢測程序,在孩子出身之前,做一些檢測,早點發現早點控制,當然可以。如果這樣的話,談戀愛結婚之前不要配八字,可以先配一下基因,看生命基因程序是不是匹配。
預測是一方面,但如果出現這些問題,可不可以治療呢?我們又有一個非常瘋狂的想法,能不能通過大數據挖掘發現一些罕見病的解決方案呢?答案也是可以的。
華大基因有一個計劃,搜集100萬人的基因數據,尋找那些單純從基因來說應該患有某種基因疾病,但是非常健康的人,我們稱呼他們「超級英雄」,這些人體內有非常明確的致病基因,但是卻非常健康,這是為什麼?因為他們體內有另外一套基因在保護他。就像程序中的一段出現了「bug」,但是另外一段修復了,整個程序依然非常健康。如果能夠找出那一段是什麼,也許就可以找出罕見性疾病的藥物。這就是基因測序的意義。
接下來是腫瘤。很多人面對腫瘤威脅,從基因科學角度,腫瘤是生存過程中人體受環境因素影響導致的基因程序變異。人所有的細胞都來源於第一個細胞——受精卵細胞,從那個細胞開始不斷複製、成長都會引發程序變化。不同環境影響會導致程序非常大不同,比如抽菸增加肺部細胞變異率。用簡單的IT方式來講,就是你生命程序中的那段代碼被黑客給黑了。被黑的概率會隨著環境因素不同而變化。如果經常抽菸,如果經常生活在不好的環境裡,或者受到各種各樣病毒感染,程序被黑的概率非常之高。有人會說我身體有上億個細胞,一個細胞被黑也許沒有關係,但是如果一個細胞被黑,它很有可能獲得比其他細胞更強的適應性,它可以不斷擴張。從一個腫瘤細胞發展到最後可以用CT掃描檢查出來,平均要15年。也就是說15年體內有腫瘤細胞你都不知道。我們能不能早點發現它,答案是可以的,因為所有細胞最終都要游離到血液裡,我們通過非常深度的基因檢測可以看到體內有沒有腫瘤細胞。
這也是預測,但如果得了腫瘤怎麼辦?每一個人的腫瘤的基因都不一樣,你需要做的是對所有細胞做基因檢測,而不是簡單的手術、放療、化療。這樣的治療有可能在未來兩三年內飛速發展,而所有努力都是為了增加腫瘤患者的生存概率。
還有慢性疾病、感染性疾病,其實萬物都跟基因有關係。只有小於1%的微生物可以被培養,所以根本沒有辦法搞明白到底什麼讓你發燒、什麼讓你腹瀉,但可以把DNA提取出來,一個小時內就知道到底怎麼會感染。而早一點這樣做,就可以早一點擺脫疾病風險。
華大基因要完成這個生命公式,在這個公式的一邊是自己的基因、環境因素的基因,各種各樣的東西,而另一邊是表現的狀況,比如身高、體重、各種各樣的病理特徵、健康與否。中間這個公式怎麼寫呢?這個時候就要涉及到百度首席科學家吳恩達的研究範疇了。
現在我們只知道這個程式的輸入端和輸出端,但中間怎麼編程,毫無所知。該怎麼辦呢?這就需要大數據。健康大數據取決於把所有輸入端、輸出端全部計算清楚,如果研究清楚身高基因的關係,需要100萬人。要研究清楚絕大部分複雜疾病和基因以及環境的關係,需要100萬人。你需要把100萬人的各種各樣信息全部搜集,才能得到「生命公式」。
用什麼方法?這種方法貴不貴?這種方法非常昂貴。1999年中國華大基因參與了1%人類基因組計劃。當時測序需要10億美金。最近已經降成1萬美金一人,但要搜集100萬人的數據仍然很貴,現在可以做到1000美金,明年500美金就可以測定一個人的完整基因。但什麼時候可以免費呢?基因測序免費這一天的到來事實上取決於基因本身的數據價值遠遠大於產生他的數據所需要的成本。對於華大來講這個趨勢在2019年左右,5年左右時間我們可以真正達到這樣的結果。除了這種基因數據之外,我們知道現在比較時髦的詞比如物聯網可以收集各種各樣輸入輸出數據,比如智能廁所,當在廁所方便時,所有代謝物、蛋白質數據等等都收集起來;比如躺在床上,各種各樣的體徵數據都收集完成後,再通過網際網路將不同的人的數據相連,就將形成一個基因組網絡。
為什麼基因組網絡那麼重要?根據基因研究發現,所有男人12萬年前來源於一個男人,所有女人12萬年前也來源一個女人,有人說這就是亞當和夏娃。中國70%漢族人追溯到6000年前就三個人,如果把每個人的基因數據連起來,形成基因組網絡,將是不可估量的。
我們講網際網路,超級計算機,這些正在成為不可估量的機會。每個人在上面產生數據和支持,基因組也是一樣的。人類基因組計劃就是把基因和病之間的關係搞清楚,並在上面尋找各種各樣的機會,這些機會、信息和知識是以前一個個人的基因組不可想像的。而要實現這些同樣需要人工智慧,深度學習,因為如此龐大的數據量已經不是一個單一的模型能夠解決的。
歐巴馬提出一個精準醫療計劃,就是要做100萬人基因組庫,當所有人完成後,我們會有一個水晶球,預測你未來健康的走向,而這樣的預測很有可能再做一些改變,我們聽過3D列印、細胞存儲、基因編輯,我們聽過合成生物學,喝的啤酒的酵母將不是自然界酵母,而是計算機寫出來的,酵母產生的啤酒味道也許比你現在喝的任何啤酒味道都要好。還有,生命信息的存儲——幹細胞,幹細胞什麼意思?就是年輕時候的生命信息。當你年老的時候能不能把年輕時候的信息再寫進程序,也許就年輕了。所有像科學幻想的東西都在生命科學界以飛速方式往前走。如果真正基於一個所謂人工智慧方式、大數據處理方式,能管理健康、掌握預測的程序和健康的關係,這就是基因科技的魅力。
當我們定義一個生命的時候,其實我們並不清楚,如果未來當計算機賦予它更多生命邏輯,它會變成一個生命體嗎?如果計算機大腦已經可以跟人腦匹配,它有生命性嗎?當我們擁有改變人類基因能力的時候,我們該怎樣控制這種能力?所有這些值得大家思考。
網際網路是矽基維度而生命科學是碳基維度,作為另外一個緯度的IT人,我希望給大家帶來的不僅僅是對生命的認知,而且是對生命認知最佳的理性選擇。
【企業頭條】是國內首個企業自媒體聯盟,覆蓋了國內外著名的重量級企業、主流媒體以及最具成長性的創新型機構。
同時,我們通過傳播達人匯覆蓋了1000餘名企業與媒體的傳播精英,眾籌傳播思想,分享傳播案例,打造傳播人的家園是我們的核心價值。
讓巨人站在巨人的肩膀上,打造「企業級媒體」,推動產媒融合,核心價值是信任、跨界、共贏。