系統生物學導論|計算模型的基本概念

2020-12-16 子瞻工作室

1.模型範圍

Systems biology models consist of mathematicalelements that describe properties of a biological system, for instance,mathematical variables describing the concentrations of metabolites. As a modelcan only describe certain aspects of the system, all other properties of thesystem (e.g., concentrations of other substances or the environment of a cell)are neglected or simplified. It is important – and, to some extent, an art – toconstruct models in such ways that the disregarded properties do not compromisethe basic results of the model.

系統生物學模型由描述生物系統特性的數學元素組成,例如描述代謝物濃度的數學變量。由於模型只能描述系統的某些方面,系統的所有其他特性(例如,其他物質的濃度或細胞的環境)都被忽略或簡化。重要的是——在某種程度上也是一門藝術——以這樣的方式構建模型,被忽視的屬性不會損害模型的基本結果。

2.模型陳述

Alongside the model elements,a model can contain vari ous kinds of statements and equations describingfacts about the model elements, most notably, their temporal behavior. Inkinetic models, the basic modeling paradigm considered in this book, thedynamics is determined by a set of ordinary differential equations describingthe sub stance balances. Statements in other model types may have the form ofequality or inequality constraints (e.g., in flux balance analysis), maximalitypostulates, stochastic processes, or probabilistic statements about quantitiesthat vary in time or between cells.

除了模型元素之外,模型還可以包含各種陳述和等式,這些陳述和方程式描述有關模型元素的事實,尤其是它們的時間行為。在動力學模型中,這是本書考慮的基本建模範例,動力學是由描述物質平衡的一組常微分方程確定的。其他模型類型中的語句可能具有等式或不等式約束的形式(例如在通量平衡分析中),極大值假設,隨機過程或有關隨時間或單元間變化的數量的概率性語句。

3.系統狀態

In dynamical systems theory, asystem is characterized by its state, a snapshot of the system at a given time.The state of the system is described by the set of variables that must be kepttrack of in a model: in deterministic models, it needs to contain enoughinformation to predict the behavior of the system for all future times. Eachmodeling framework defines what is meant by the state of the sys tem. Inkinetic rate equation models, for example, the state is a list of substanceconcentrations. In the corre sponding stochastic model, it is a probabilitydistribution or a list of the current number of molecules of a species. In aBoolean model of gene regulation, the state is a string of bits indicating foreach gene whether it is expressed (「1」) or not expressed (「0」). Also, thetemporal behavior can be described in fundamentally different ways. In adynamical system, the future states are determined by the current state, whilein a stochastic process, the future states are not precisely predetermined.Instead, each pos sible future history has a certain probability to occur.

在動力學系統理論中,系統的特徵在於其狀態,即給定時間的系統快照。系統狀態由在模型中必須跟蹤的一組變量描述:在確定性模型中,它需要包含足夠的信息以預測將來所有時間的系統行為。每個建模框架都定義了系統狀態的含義。例如,在動力學速率方程模型中,狀態是物質濃度的列表。在相應的隨機模型中,它是概率分布或物種當前分子數量的列表。在基因調控的布爾模型中,狀態是一串字符串,指示每個基因是被表達(「1」)還是未被表達(「0」)。同樣,可以以根本不同的方式描述時間行為。在動態系統中,未來狀態由當前狀態確定,而在隨機過程中,未來狀態未精確確定。相反,每個可能的未來歷史都有一定的發生概率。

4.變量、參數、常量

The quantities in a model can be classified asvariables, parameters, and constants. A constant is a quantity with a fixedvalue, such as the natural number e or Avogadro’s number (number of moleculesper mole). Parameters are quantities that have a given value, such as theKmvalue of an enzyme in a reaction. This value depends on the method used andon the experimental conditions and may change. Variables are quantities with achangeable value for which the model establishes relations. A subset ofvariables, the state variables, describes the system behavior completely. Theycan assume independent val ues and each of them is necessary to define thesystem state. Their number is equivalent to the dimension of the system. Forexample, the diameter d and volume V of a sphere obey the relation V=πd3/6,where π and 6 are constants, V and d are variables, but only one of them is astate variable since the relation between them uniquely determines the otherone.

模型中的量可以分為變量、參數和常數。常數是具有固定值的量,例如自然數e或阿伏加德羅的數(每摩爾的分子數)。參數是具有給定值的量,例如反應中酶的Km值。此值取決於所使用的方法和實驗條件,並可能發生變化。變量是具有可變值的量,模型為其建立關係。變量的子集,即狀態變量,完全描述了系統的行為。他們可以假定獨立的Values,每一個都是定義系統狀態所必需的。它們的數目相當於系統的維數。例如,球體的直徑d和體積V服從關係V=πd3/6,其中π和6是常數,V和d是變量,但其中只有一個是狀態變量,因為它們之間的關係唯一地決定了另一個變量。

Whether a quantity is avariable or a parameter depends on the model. In reaction kinetics, the enzymeconcentration appears as a parameter. However, the enzyme concentration itselfmay change due to gene expression or protein degradation, and in an extendedmodel, it may be described by a variable.

數量是變量還是參數取決於模型。在反應動力學中,酶濃度作為參數出現。但是,酶濃度本身可能會因基因表達或蛋白質降解而改變,在擴展模型中,可能會用一個變量來描述。

5.模型行為

Two fundamental factors thatdetermine the behavior of a system are (i) influences from the environment(input) and (ii) processes within the system. The system structure, that is,the relation among variables, parameters, and constants, determines howendogenous and exogenous forces are processed. However, different systemstructures may still produce similar system behavior (out put); therefore,measurements of the system output often do not suffice to choose betweenalternative models and to determine the system’s internal organization.

決定系統行為的兩個基本因素是(i)來自環境(輸入)的影響和(ii)系統內的過程。系統結構,即變量、參數和常量之間的關係,決定了如何處理內生力和外生力。但是,不同的系統結構仍可能產生相似的系統行為(輸出);因此,對系統輸出的測量通常不足以在備選模型之間進行選擇,也不足以確定系統的內部組織。

6.模型分類

對於建模,根據一組標準對流程進行分類。

A structural or qualitativemodel (e.g., a network graph) specifies the interactions among model elements.A quantitative model assigns values to the elements and to their interactions,which may or may not change.

結構或定性模型(例如網絡圖)指定模型元素之間的相互作用。定量模型將值分配給元素及其相互作用,這些值可能會改變,也可能不會改變。

In a deterministic model, thesystem evolution through all following states can be predicted from the knowledge of the current state. Stochastic descriptions give instead a probabilitydistribution for the successive states.

在確定性模型中,可以從當前狀態的知識邊緣來預測所有隨後狀態的系統演化。相反,隨機描述給出了連續狀態的概率分布。

The nature of values that time, state, or space mayassume distinguishes a discrete model (where values are taken from a discreteset) from a continuous model (where values belong to a continuum).

時間,狀態或空間可能假定的值的性質將離散模型(其中值是從離散集合中獲取)與連續模型(其中值屬於連續體)區分開來。

Reversible processes can proceed in a forward and backward direction. Irreversibility means that only one direction is possible.

可逆過程可以向前和向後進行。不可逆性意味著只能有一個方向。

Periodicity indicates that the system assumes a series ofstates in the time interval {t, t+Δt} and again in the time interval {t+iΔt,t+(i+1)Δt} for i=1,2, . . . .

周期性表示對於i = 1,2,…,系統在時間間隔{t,t+Δt}中並在時間間隔{t+iΔt,t+(i+1)Δt}中再次呈現一系列狀態。

7.穩定狀態

The concept of stationary states is important for themodeling of dynamical systems. Stationary states (other terms are steady statesor fixed points) are determined by the fact that the values of all statevariables remain constant in time. The asymptotic behavior of dynamic systems,that is, the behavior after a sufficiently long time, is often stationary.Other types of asymptotic behavior are oscillatory or chaotic regimes.

穩態的概念對於動力學系統的建模很重要。固定狀態(其他術語是穩態或不動點)由以下事實決定:所有狀態變量的值都保持時間恆定。動態系統的漸近行為,即經過足夠長的時間後的行為通常是平穩的。其他類型的漸近行為是振蕩或混沌狀態。

The consideration of steady states is actually an abstraction that is based on a separation of time scales. In nature, everything flows.Fast and slow processes – ranging from formation and breakage of chemical bondswithin nano seconds to growth of individuals within years – are coupled in thebiological world. While fast processes often reach a quasi-steady state after ashort transition period, the change of the value of slow variables is oftennegligi ble in the time window of consideration. Thus, each steady state canbe regarded as a quasi-steady state of a system that is embedded in a largernonstationary envi ronment. Despite this idealization, the concept of stationary states is important in kinetic modeling because it points to typicalbehavioral modes of the system under study and it often simplifies themathematical problems.

穩態的考慮實際上是基於時間尺度分離的一種抽象。在自然界中,一切都會流動。快速和緩慢的過程-從納秒級的化學鍵形成和斷裂到數年之內的個體生長-都與生物界相關。儘管快速過程通常會在短暫的過渡期後達到準穩態,但在考慮的時間範圍內,慢變量值的變化通常可以忽略不計。因此,每個穩態都可以看作是嵌入較大的非平穩環境中的系統的準穩態。儘管有這種理想化,平穩狀態的概念在動力學建模中還是很重要的,因為它指出了所研究系統的典型行為模式,並且通常簡化了數學問題。

Other theoretical concepts in systems biology are onlyrough representations of their biological counterparts. For example, therepresentation of gene regulatory networks by Boolean networks, the descriptionof complex enzyme kinetics by simple mass action laws, or the representation ofmultifarious reaction schemes by black boxes proved to be helpfulsimplifications. Although being a simplification, these models elucidatepossible network properties and help to check the reliability of basicassumptions and to discover possible design principles in nature. Simplifiedmodels can be used to test mathematically formulated hypotheses about systemdynamics, and such models are easier to understand and to apply to differentquestions.

系統生物學中的其他理論概念僅是其生物學對應物的粗略表示。例如,通過布爾網絡表示基因調控網絡,通過簡單的質量作用定律表示複雜的酶動力學或通過黑盒表示多種反應方案被證明是有助於簡化的。儘管只是簡化,但這些模型闡明了可能的網絡屬性,並有助於檢查基本假設的可靠性並發現自然界中可能的設計原則。可以使用簡化的模型來測試關於系統動力學的數學公式化的假設,並且這種模型更易於理解並適用於不同的問題。

8.模型分配的不唯一性

Biologicalphenomena can be described in mathematical terms. Models developed during thelast few decades range from the description of glycolytic oscillations withordinary differential equations to population dynamics models with differenceequations, stochastic equations for signaling pathways, and Boolean networksfor gene expression. However, it is important to realize that a cer tainprocess can be described in more than one way: a biological object can beinvestigated with different exper imental methods and each biological processcan be described with different (mathematical) models. Some times, a modelingframework represents a simplified lim iting case (e.g., kinetic models aslimiting case of stochastic models). On the other hand, the same mathe maticalformalism may be applied to various biological instances: statistical networkanalysis, for example, can be applied to cellular transcription networks, thecircuitry of nerve cells, or food webs.

生物現象可以用數學術語來描述。在過去幾十年中發展起來的模型從用常微分方程描述糖酵解振蕩到具有差分方程的種群動力學模型、信號通路的隨機方程和基因表達的布爾網絡。然而,重要的是要認識到,一個CER過程可以用多種方式來描述:一個生物物體可以用不同的實驗方法來研究,每個生物過程可以用不同的(數學)模型來描述。有些時候,一個建模框架代表了一個簡化的lim&iting案例(例如,動力學模型作為隨機模型的限制情況)。另一方面,同樣的數學形式可以應用於各種生物學實例:例如,統計網絡分析可以應用於細胞轉錄網絡、神經細胞迴路或食物網。

The choice of a mathematical model or an algorithm todescribe a biological object depends on the problem, the purpose, and theintention of the investigator. Modeling has to reflect essential properties ofthe system and differ ent models may highlight different aspects of the samesystem. This ambiguity has the advantage that different ways of studying aproblem also provide different insights into the system. However, the diversityof modeling approaches makes it also very difficult to merge estab lishedmodels (e.g., for individual metabolic pathways) into larger supermodels (e.g.,models of complete cell metabolism).

描述生物學對象的數學模型或算法的選擇取決於研究者的問題,目的和意圖。建模必須反映系統的基本屬性,不同的模型可能會突出顯示同一系統的不同方面。這種歧義性的優點在於,研究問題的不同方法也可以提供對系統的不同見解。然而,建模方法的多樣性也使得很難將已建立的模型(例如,對於單個代謝途徑)合併成較大的超模型(例如,完全細胞代謝的模型)。

相關焦點

  • 系統生物學導論|模型與建模
    即使一般的生化原理(如轉錄和翻譯的中心教條或酶催化反應的生物化學)已經確立,單個分子和系統的生物化學往往是未知的,並且在物種之間可能有很大的差異。實驗導致了關於獨立過程的生物學假設,但往往仍不清楚這些假設是否可以結合成一個更大的連貫的圖片,因為它往往很難從對一個複雜系統的部分的知識中預測其全局行為。
  • CIS科研項目-所有生物學都是計算生物學,你怎麼看?和布朗大牛聊聊
    聽完確實很意外,好的教授真的不會掉書袋,他講的我都能聽懂,聽得進去而且還理解我之前不知道的新概念…好神奇!教授回答我的問題時,我感覺教授的信息更新真的突破了地緣障礙吧,一些本地人都未必察覺到的情況教授可以有instant產出的系統總結。
  • 清華首次提出「類腦計算完備性」及計算系統層次結構,登上Nature
    來自清華大學、北京信息科學與技術國家研究中心、美國德拉瓦大學(University of Delaware)科研團隊的研究者在論文《A system hierarchy for brain-inspired computing》(一種類腦計算系統層次結構)中提出了「類腦計算完備性」(neuromorphic completenes)概念。
  • 威斯康辛大學《機器學習導論》2020秋季課程完結,課件、視頻資源已...
    對想要學習這門課程的學生,Sebastian Raschka 教授的建議是:你至少要熟悉基本編程知識並完成了編程入門課程。 課程總共由七個部分組成: 第一部分:簡介 L01:什麼是機器學習 1.1 課程概述:「Stat 451:機器學習導論(FS 2020)」的簡介 1.2
  • 《卡桑德拉生物志》:生物學愛好者的小眾概念設計
    板磚自詡是個半吊子的概念設計師和生物學愛好者。他在301醫院附近長大,從小經常去醫院裡串門,看各種人體解剖掛畫。在高中時,他還獲得了全國生物奧賽的二等獎,大學卻陰差陽錯去學習了服裝設計。在遊戲和影視行業打拼多年,板磚認識最多的朋友是野生動物保護圈的。在板磚看來,生物學帶給他的最為重要的設計理念是「合理」與「效率」。
  • 清華施路平團隊新研究登上《自然》,提出類腦計算系統新框架
    論文中提出了一種全新的系統層次結構,這一結構包括軟體、硬體和編譯三個層次,具有圖靈完備的軟體抽象模型和通用的抽象神經形態結構。在過去50年中,根據摩爾定律,傳統數字計算機的性能得到了提高。摩爾定律指出,技術進步將使集成電路(微晶片)大約每18-24個月性能提升一倍。
  • 營養與健康所等建立MAnorm2計算模型
    近期,Genome Research在線發表了中國科學院上海營養與健康研究所中科院計算生物學重點實驗室(馬普夥伴計算生物學研究所)研究員邵振課題組的方法學論文——MAnorm2 for quantitatively comparing groups of ChIP-seq samples
  • 學會判斷生物模型
    近幾年的高考或平時的考題中時有對生物模型的考察,新課程標準將對生物模型的分析與建構作為能力要求。通過概念圖解、細胞亞顯微結構、生物學過程圖解等概念模型或物理模型的分析與建構能較好地考查考生分析、獲取與處理信息的能力。
  • 理解資料庫與數據模型的概念
    信息世界是對現實世界的抽象,人們把事物的特徵和聯繫通過符號記錄下來,並用規範化的語言描述現實世界的事物,從而構成一個基於現實世界的信息世界,這個信息世界就是概念模型。概念模型主要用來描述顯示世界的概念化結構,它使資料庫的設計人員在設計的初始階段,擺脫計算機系統及資料庫管理系統的具體技術問題,集中精力分析數據以及數據之間的聯繫。
  • 人文計算與數字人文:概念、問題、範式及關鍵環節
    人文計算則不同,其自身就是學科交叉、融合的產物。人文計算以數據為研究的基本素材,研究過程至少涉及統計學、計算機科學、語言學、圖書情報學、人文科學等學科領域,有可能還需要其他學科領域的參與。  總體來說,雖然經過了幾十年的發展,無論是國內還是國外,人文計算還處於分散式實踐摸索階段。時至今日,與人文計算有關的許多認識還很模糊,甚至某些基本概念都還存在爭議。對人文計算相關理念、方法的模糊乃至錯誤認識,將影響人文計算的學科發展,並在具體的人文計算實踐過程中造成偏差。
  • 機械設計的基本概念和方法
    通過計算或類比,即可決定零、部件的基本尺寸。 (4)部件裝配草圖及總裝配草圖的設計。 根據已定出的主要零、部件的基本尺寸,設計出部件裝配草圖及總裝配草圖。草圖上需對所有零件的外形及尺寸進行結構化設計。在此步驟中,需要很好地協調各零件的結構及尺寸,全面地考慮所設計的零、部件的結構工藝性,使全部零件有最合理的構形。
  • 顏寧等點評:AI精準預測蛋白質結構,結構生物學何去何從?
    他們對媒體宣傳中說 Alphafold2最後只用相當於100個GPU的資源訓練了兩周就產生了最後的模型,學界大 多數實驗室都可以做到,這是不客觀的。因為產生一個新的想法,到訓練成功的模型,中間起碼要反覆測試重複100次甚至1000次。這就像吃了十個饅頭的餓漢一 樣,不能說吃了最後一個饅頭吃飽了,就覺得只吃最後一個饅頭就夠了。
  • 計算系統在新形勢下的新機遇和新挑戰
    計算系統論壇計算系統在新形勢下的新機遇和新挑戰12月19日-20日,以"新變局、新技術、新機遇"為主題的2020中國計算機教育大會(CECC2020)在廈門國際會議中心成功舉辦。計算系統是一個複雜而又寬泛的研究領域,隨著計算機軟硬體及網絡系統的飛速發展,大數據、雲資料庫、數據管理、作業系統、處理器、計算機視覺等都被納入其中。打造一套能夠幫助學生培養系統思維,並實現對當前主流軟硬體體系融會貫通的教學體系,不僅需要充分發揮知名高校在教學改革方面的經驗,也離不開頂尖企業在前沿技術方面的研發成果。
  • 【榮譽分享】安慶一中學生建構生物學模型榮獲兩項實用新型專利
    因為豇豆做的骨架易斷,所以在用橡皮筋作磷酸分子纏繞在豇豆上時得小心翼翼;做完的模型還要能螺旋轉動,考慮到牢固性,用細鐵絲代替了牙籤;紅椒、青椒、檸檬和紫甘藍在切塊過程中儘可能均勻……為了提高成功率,我們協商後決定,首先繪製模型圖紙:
  • 2019年合成生物學年度進展回顧|合成生物學|基因組|基因|細胞
    該系統稱為"Prime Editing",其能夠以精確、高效和高度通用的方式直接編輯人體細胞,可以有效地進行四種類型的單鹼基置換:C到T,T到C,A到G和G到A。該方法擴大了生物學和治療學研究的基因編輯範圍,解決了傳統單鹼基編輯工具的弊端,並有可能糾正多達89%的已知致病基因變異。
  • MIT 重磅研究成果:已開發出大腦神經迴路計算模型
    在近幾年,人工神經網絡——一種參照大腦運作模式而建成的計算模型——已經成為了最為炙手可熱的人工智慧系統,並且應用於從語音到圖像的各個領域。
  • 基本粒子和相互作用的標準模型|眾妙之門
    有趣的是,對元素周期表的理解打破了道爾頓的原子概念。1897年J.J.湯姆遜[4]發現了比原子更為基本的粒子:帶負電的電子。1911年盧瑟福通過實驗發現了α粒子的大角度散射過程。這使得人們對原子有了新的理解,即原子有內部結構,而且有點類似於太陽系的模型。
  • 東南大學《959地理信息系統基礎》考研真題詳解——才聰學習網
    2021年東南大學交通學院《959地理信息系統基礎》考研全套資料導論1.1複習筆記一、地理信息系統基本概念、1數據與信息(1)數據與信息的基本概念②地理信息系統的基本概念a.地理信息系統是一種計算機系統,通常由若干相互關聯的子系統構成;b.地理信息系統的操作對象是地理數據或稱空間數據。