計算生物學:從「什麼是」到「什麼不是」

2021-01-19 中國生物技術網

  2015年是《Plos Computational Biology》創刊十周年,藉此機會,正好可以梳理十年來計算生物學領域的發展,展望今後計算生物學的機遇和挑戰。作為計算生物學領域的著名期刊,《Plos Computational Biology》幾乎囊括了該領域的所有方向,總結該期刊的發展歷程也正好可以講述計算生物學領域的十年來的成就。

  從「什麼是計算生物學」到「什麼不是計算生物學」

  實際上計算生物學的起步很早,發展至今已經有了很多的分支和方向。計算生物學的分支方向已經融入了生命科學的不同,甚至已經成為了基礎生物學密不可分的一部分,深度融入了從分子尺度到生態系統尺度的不同領域。因此,我們現在不會再問「什麼是計算生物學?」相反,回顧這些年來發表在該期刊的文章,更加合適的問題應該是「生命科學研究中,有沒有哪些領域和方向沒有涉及到計算生物學?」現在大多數的研究院所都會招募在計算生物學領域有所建樹的研究者。而且越來越多的地方開始培訓計算生物學的研究生博士生,而且有該領域的經歷也可以算是自己個人簡介上面濃墨重彩的一筆。這正說明了,計算生物學越來越得到了生命科學領域的認可。

  下一個十年會有哪些奇蹟

  那麼,下一個十年又會怎樣呢?相比之前,有哪些事情是之前無法實現的呢?近年來,隨著海量實驗數據的積累和計算機性能的快速提升,計算生物學得到了長足的發展。這兩個方面將會繼續推動計算生物學的前進,都有可能實現從量變到質變的轉變,從而實現計算生物學飛躍式發展。尤其是當大數據時代已經到了,巨量生物學數據必然要求著數據分析的軟體和方法有很大進步,這種倒逼或許會促進從數據到知識的轉化。美國國立衛生研究院2012年提出的BD2K(Big Data to Knowledge)項目正是旨在催化從數據到知識的轉化。

  大數據到大數據集

  數據的量級在下一個十年可能會更大。生物學領域的數據將會更加量化,這能夠補充傳統生物學領域那些描述性的數據。舉個例子,未來研究者會持續分辨、分類和量化在不同環境中的微生物群體,這些微生物可能在不同的人身體的不同位置、組織,這些人有不同的健康狀態、年齡等。還有,這些微生物可能在不同的土壤、水域,整合這些微生物的環境信息也是非常必要和有意義的。再例如,發現和分類具有平行效果或者冗餘效果的細胞信號通路。還有,可以發現在不同細胞環境下的轉錄後翻譯的模式。這些數據都已經不單單是傳統的生物數據,而是更多地整合了大量包括相關信息及其環境的大數據集。可以說這些數據集將會包括生態系統,診斷模式,不同的腫瘤類型等等。整合這些信息,可能促進分析方法和模型的進一步發展,這是之前所不敢想的。

  標準化數據處理可能容忍生物多樣性和統計誤差

  傳統生物學實驗往往局限於特定的條件,依賴於特定的方法和實驗材料。但是,隨著數據量變大,數據的尺度也是非常宏大,如果能夠發展新的分析方法,或許能夠從海量數據中找到具有生物學意義的、穩定的、普適性的知識,這些知識可能針對不同的遺傳多樣性是普適的,而且能夠容忍統計誤差。可以預料到的是,數據的精確性和連續性是需要克服的最大障礙。這些原始數據裡面包含了大量的背景信息、背景噪音。比如表達強度、結合強度以及mRNA-蛋白質相關性等,都會成為背景噪音的來源。這些問題都需要解決,因此,如果有標準化的處理方法能夠針對不同的實驗,合理地將隨機性噪音統一化,那麼這些問題都可以迎刃而解。此外,生命科學領域,來自儀器的測量誤差、遺傳多樣性、多樣化的分子結構都對數據的標準化處理和分析造成了困難。解決了數據標準化處理方法,那麼計算生物未來將會非常光明。

  分析整合數據集需要超級計算機

  單獨的數據集僅僅只能提供有限的信息,如果能夠整合不同生物學領域、尺度的數控,那麼意義將非常重大。然而,面對這樣的整合數據集,現有的方法和計算能力還遠遠不夠。考慮到能夠使用這些單獨數據集一起得到更多有用的信息,因此需要有一個單獨的數據分析框架,能夠深度融合不同的生物組織樣式、尺度的數據。現有的計算能力還十分有限,我們對生物系統的模擬還只限於很小的體系和很短的時間尺度,這些體系只佔到了細胞的很小一部分,而且也很難做到非常真實地模擬生物系統。如果需要模擬整合體系長時間尺度的系統,則需要非常大量的計算能力。超級計算機應用在該領域非常必要,起碼需要達到百億億次每秒的計算速度才能算能用。

  數據共享意義重大

  《Plos Computational Biology》是一個具有開發閱讀權限的期刊,在這樣開發的框架下,作者們鼓勵數據和工具的共享。而且,作者們也堅定地認為,這種共享是非常重要的。生物計算正以前所未有的速度在發展和革新,開放共享的數據和軟體將會極大促進全球範圍內的研究者們的參與和貢獻。

  沒人能夠預測未來的計算生物學會有怎樣的走向,但是,有一點是肯定不會變的,那就是未來的世界計算機只會越來越重要。而且生物領域的計算方法和模型也會越來越多,也會更加深度地整合進入不同的生物學分支。標準化的數據分析方法可能會帶來更加可信的結果,這些方法允許不同的數據的整合以及較小的統計學誤差。大數據量的積累,如果用了超級計算機的助力,無疑會對未來的計算生物學產生巨大的推動。《Plos Computational Biology》歷經十年發展,也已經走向成熟,如今再問「什麼是計算生物學?」雖然也沒有問題,但是顯然,問「什麼不是計算生物學?」會更加合適。和國際計算生物學學會(International Society for Computational Biology)攜手、和越來越多的讀者一起,《Plos Computational Biology》將繼續作為計算生物學發展和交流的平臺之一,見證計算生物學在下一個十年更加輝煌。

本公眾號由中國科學院微生物研究所信息中心承辦

微信公眾號:中國生物技術信息網

輸入「七月排行」可瀏覽二零一五年七月人氣文章。

輸入「六月排行」可瀏覽二零一五年六月人氣文章。

輸入「五月排行」可瀏覽二零一五年五月人氣文章。

輸入「四月排行」可瀏覽二零一五年四月人氣文章。

輸入「三月排行」可瀏覽二零一五年三月人氣文章。

輸入「二月排行」可瀏覽二零一五年二月人氣文章。

輸入「一月排行」可瀏覽二零一五年一月人氣文章。

輸入「十二月排行」可瀏覽十二月人氣文章。

輸入「十一月排行」可瀏覽十一月人氣文章。

輸入「十月排行」可瀏覽十月人氣文章。

截止到2014年10月31日Top30文章列表已整理完畢。輸入標題後括號中的期號可瀏覽該篇文章,如「20140518」。

輸入「伊波拉」可瀏覽伊波拉相關專題人氣文章。

輸入"轉基因"瀏覽轉基因相關專題人氣文章。

輸入"大數據"瀏覽大數據相關專題人氣文章。

輸入「癌細胞」可瀏覽癌細胞、癌症相關專題人氣文章。

輸入「糖尿病」可瀏覽糖尿病相關專題人氣文章。

輸入「測序」可瀏覽測序相關專題人氣文章。

輸入「免疫」可瀏覽免疫相關專題人氣文章。

1、中式體檢讓美國醫生瞠目結舌(20140518)
2、Nature:中國將大力改革科研資助體系,「973」和「863」將被停止(20141025)
3、施一公組:六年,一場「聚光燈」下的負重跑(20140704)
4、「科研過勞症」離你並不遙遠(20140822)
5、25位諾獎獲得者聯名支持轉基因(20140802)
6、一篇Ebola論文之沉重:六名作者去世(20140831)
7、哈佛大學遺傳學家:轉基因食品安全之我見(20140508)
8、Nature:中國科學界面臨重大改革(20140924)
9、國內科學家們為什麼顯得浮躁?(20141011)
10、施一公、王曉東院士:基礎研究有什麼用(20140505)
11、中國人為什麼反轉基因(20140810)
12、揭秘:人類為何越來越易過敏?(20140918)
13、轉基因基礎解惑(20140622)
14、饒毅:扒鐵路保龍脈與反轉基因保龍種(20140808)
15、2014年度國家自然科學基金分析(20140821)
16、每日步行2公裡癌症風險減半(20140913)
17、Nature:戳穿甜味劑的健康謊言(20140918)
18、圖解常用腫瘤標誌物(20140515)
19、腿粗的人智商高(20141024)
20、《柳葉刀》上的中國(20140808)
21、湯森路透發布2014年最新SCI雜誌影響因子(20140730)
22、睡眠,世界上最有效的健康仙丹(20140926)
23、「全球轉基因農作物發展現狀和未來展望國際研討會」共識(20141018)
24、世界頂級癌症專家教你怎樣活得更久(20140920)
25、人為何會得癌症?(20140921)
26、如何拉出健康的便便?(20140830)
27、腸道可能在撒謊(20140831)
28、2014年中國大學研究生教育排行榜揭曉(20141030)
29、改變腸道菌,一天也不晚(20141031)
30、施一公:八面玲瓏的人難做科學家?(20140811)




相關焦點

  • 所有的生物學都是計算生物學
    計算生物學帶來了我們對生命的理解,它使生物學概念變得嚴格和可測試,它提供了一個參考範本,可以規範個人對生物學的見解。生物學中的下一個重大進化將由數學、統計和計算方法驅動,需要被吸收到主流生物培訓中,將生物學轉變為定量科學。
  • 什麼是生物?什麼是生物學?
    人生因為學習與思考而更加具有深度,那麼什麼是生物?什麼是生物學?我的學習來自百度百科的一部分生物 [shēng wù]具有生命活力的物體本詞條是多義詞,共3個義項展開生物,是指具有動能的生命體,也是一個物體的集合。而個體生物指的是生物體,與非生物相對。
  • 計算神經生物學:給機器一個大腦
    支撐這一技術的科學叫做計算神經生物學,用最簡單的話說,就是為不同的大腦功能建立不同的模型。什麼是計算神經生物學?「計算神經生物學是近年來迅猛發展的關於神經系統功能研究的一個新的交叉學科。它吸收了數學、物理學等基礎理論,以及信息科學等相關領域的研究理論和方法來研究神經科學所關心的大腦工作原理。」
  • 計算生物學
    計算生物學(Computational Biology)是指通過開發和應用數據分析的理論和方法、數學建模、計算機仿真等技術來研究生物醫學相關問題的學科
  • "計算神經生物學"研究:給機器人一個"大腦"(圖)
    支撐這一技術的科學叫做計算神經生物學,用最簡單的話說,就是為不同的大腦功能建立不同的模型。  什麼是計算神經生物學?  「計算神經生物學是近年來迅猛發展的關於神經系統功能研究的一個新的交叉學科。它吸收了數學、物理學等基礎理論,以及信息科學等相關領域的研究理論和方法來研究神經科學所關心的大腦工作原理。」
  • 生物學專業到底學什麼?畢業後能幹什麼?
    原標題:生物學專業到底學什麼?畢業後能幹什麼?從2003年人類的全部基因被解碼到2016年可以運用CRISPR/Cas9 技術篩選和改變包括人類的基因,我們對地球上生命物種的影響和改造日益增大。而急劇增加的人才需求也讓越來越多的學生選擇進入生物學,最終從事與生物相關的工作。
  • 20世紀最偉大生物學家:生物學研究有什麼特別之處?
    這使得生物學跟物理學大相逕庭。物理學,無論是它的基礎研究,比如研究基本粒子及其相互作用,還是應用研究,比如地質物理學或者天文學,都跟生物學非常不同。固然,在後兩個例子中,我們同樣會處理漫長歲月內的變化,我們觀察到的可能也是歷史進程的終產物。美國大峽谷中層層疊疊的巖石是一個明顯的例子。不過,雖然星系也會「演化」,但它們卻不是通過自然選擇發生的。
  • 生物學研究的終極目的是什麼?
    20世紀50年代,分子生物學研究取得了一系列突破性進展,這和信息科學的誕生在時間上如此巧合,信息科學中使用的一些術語,如程序、編碼等,後來都在遺傳學中利用上了。當前人們似乎認為分子生物學已經到了「最後開花結果」的階段了。
  • 計算生物學中機器學習的十大攻略,從入門菜鳥到骨灰級專家的必備寶典
    來源:Biodatamining編譯:Kathy機器學習已經成為很多領域的必備工具,除了在通常的計算機領域風生水起,在生物信息學、計算生物學和健康信息學中都逐漸變得舉足輕重。同時隨著近年來數據的增加和網絡服務的拓展,生物學正在被新的技術不斷變革創新,和機器學習產生了前所未有的緊密結合。
  • 量子計算與普通計算有什麼不同,為什麼它會那麼快
    最近中科大教授獲得了量子計算的國際獎項,引起眾人關注。特別是量子計算中量子兩字,來源於違反常理的量子力學,為量子計算添加了一絲神秘色彩。那麼量子計算與普通計算究竟有什麼不同,它為什麼會算的那麼快。計算是一個輸入、然後按照一定的規則處理,再輸出結果的過程。計算機就是能夠完成這個過程的工具,他可以是我們熟悉的電子計算機,也可以是我們的手指頭,還可以是一個生物學實驗。想像一下,我們是怎麼教一個3歲的小朋友計算1加2的?是不是先幫他掰開1根手指,保持住,再幫他掰開另外2根手指,然後,數一數有幾根立起來的手指頭?
  • 20世紀最偉大生物學家:生物學研究有什麼特別之處?丨展卷
    固然,在後兩個例子中,我們同樣會處理漫長歲月內的變化,我們觀察到的可能也是歷史進程的終產物。美國大峽谷中層層疊疊的巖石是一個明顯的例子。不過,雖然星系也會「演化」,但它們卻不是通過自然選擇發生的。在生物學之外,我們見不到類似於自然選擇的過程:某種構型的精準複製,複製中出現的突變,稀有的突變日益普遍。即使我們可能偶然瞥見了這樣的過程,它也不會一再發生、漸趨複雜。
  • 從原子到生命—結構生物學的前世和今生
    就像照相機最開始經歷了什麼?最開始用的是膠片,成像非常慢。後來就換了CCD(電荷耦合元件),CCD的好處就是成像速度非常快,但是缺點是需要把電子信號轉換為數位訊號,信噪比越來越差,嚴重損害了它的解析度。當時很多科學家就說,如果能夠利用感受電子束這種最直接的探測方式,可以將信噪比提高几個數量級。
  • 生物學能教會經濟學家什麼? | 書評
    MIT教授羅聞全在新書《適應性市場》中指出:經濟學家不應該緊盯著精確數學模型,他們更應該借鑑生物學的思考
  • 會議|第三屆世界華人計算生物學大會
    大會簡介隨著理論算法和計算機軟硬體的發展,計算生物學在生物大分子結構預測、藥 物小分子及蛋白質設計、生物分子及系統層面的功能機理研究等領域起到了越來越 重要,越來越定量的作用。世界華人計算生物學大會(以下簡稱「大會」)旨在將 全球計算生物學領域的傑出華人科學家匯集在一起,分享世界計算生物學領域的最 前沿研究成果並推動中國計算生物學領域的發展。首屆會議於 2012 年在張增輝和 李國輝教授的倡議下在中國科學院大連化學物理研究所成功舉辦;第二屆會議於 2018 年在廣州中山大學成功舉辦。
  • 圓周率的計算依據是什麼?
    在古代的數學史上,圓周率的研究和計算一定程度上反應了當時的數學水平。古希臘阿基米德,阿拉伯的卡西,古印度阿耶波多,古代中國祖衝之和劉徽等等數學家,都致力於圓周率的研究和計算,先後給出了圓周率的估值。劉徽等人使用的是割圓術:使用內接於圓的正多邊形逼近圓,多邊形的邊數越多,其周長與面積也越接近圓。思路很簡單,但其計算量是個不小的挑戰。也似乎在計算前,缺少了對計算的論證。
  • 【在線科研】計算生物學的算法基礎
    計算生物學的算法基礎Algorithmic Foundation of Computational Biology課程背景1866年,揭示了遺傳的基本規律,這是最早運用數理統計於生物實驗的一個成功的範例
  • 生物信息學/計算生物學相關從業者建議讀哪些書籍和論文?
    生物信息學/計算生物學這門學科所包含的內容實在過於龐大和繁雜,你幾乎不可能同時掌握所有細分領域。生物學處理和效應是複雜的,基因過表達和沉默、基因編輯和敲除、藥物和安慰劑、正常與畸形、存活與死亡、治癒與耐藥......生物數據的獲取方式和數據類型是複雜的,從簡單的生化儀器檢測的數值到定量和定性的組學測序結果,以及靜態和動態的圖像和影像等等。生物數據分析過程是複雜的,常常是一種檢測儀器就對應了一套數據分析方法。
  • 計算生物學,交叉學科中的靈感碰撞 | 專訪李鐵軍教授
    在我從事計算生物學研究的過程中,我漸漸體會到數學在生物裡面的應用大概可以分成兩類。我覺得做計算數學的人,你要在生物裡想要得到更大的成就,你就要進到他們內部,去做一點真的有影響力的事情。你希望你的工作能夠不僅僅只是在停留在數學的層面,你需要去真的影響做生物的人,我覺得這是一個非常重要的方面。我也把我的一些學生投入進來共同做這樣的問題,其中一個集中關注的問題就是現在非常熱門的單細胞轉錄組數據分析。
  • 計算生物學夥伴研究所舉行UliSchwarz實驗室揭牌儀式
    10月16日上午,中國科學院副院長李家洋、德國馬克斯-普朗克學會副主席赫伯特教授在中科院-馬普計算生物學夥伴研究所共同為Uli Schwarz實驗室揭牌。2003年,他倡導並組織召開了計算生物學前瞻研討會,引起國際學術界的高度重視。基於此次會議富有成效的研討,2005年中科院和馬普學會共同在上海成立了計算生物學夥伴研究所。夥伴研究所的建立標誌著中德科技合作進入了一個新的階段。鑑於Schwarz教授在促進中德合作方面的顯著成就,他先後被授予中華人民共和國國際科學技術合作獎(1997年)和友誼獎(2003年)。
  • 計算物理學到底是幹什麼的?
    原標題:計算物理學到底是幹什麼的?本文由微信公眾號環球科學ScientificAmerican授權轉載。計算物理學家是實驗物理學家還是理論物理學家,還是只是些程式設計師?