Your SlideShare is downloading. ×
Sysbiobook
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×

Saving this for later?

Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime - even offline.

Text the download link to your phone

Standard text messaging rates apply

Sysbiobook

1,616
views

Published on

Published in: Technology, Education

0 Comments
2 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
1,616
On Slideshare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
30
Comments
0
Likes
2
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. 系统生物学数学基础 (初稿) 雷锦誌 清华大学 周培源应用数学研究中心 2007 年 9 月
  • 2. 系统生物学数学基础 前言 什么是系统生物学? “Systems biology is the science of discovering, modeling, understanding and ultimately engineer- ing at the molecular level the dynamic relationships between the biological molecules that define living organisms.” Leroy Hood, Ph. D., M.D., President Institute for Systems Biology All biological phenomena, whether it’s digestion of a sugar molecule, beating of the human heart, or neutralizing an invading virus, are the result of complex systems. Thus our approach is to focus research on biological systems as a whole, rather than pursue the traditional approach of focusing on individual genes, proteins, or parts of an organism. 系统生物学的研究内容? 系统生物学研究方法? Scientists from multiple disciplines (biology, chemistry, mathematics, physics, etc.) work closely together to fully understand all aspects of the inherently complex systems intrinsic to living organisms. Such in-depth understanding is ultimately essential to realizing our goal of predictive, preventive, personalized medicine. 系统生物学与数学? • “它(物理学)的范畴可定义为我们全部知识中能够用数学语言表发的那个部分”--爱因斯坦 • 统计,模型,分析,模拟...... 总结定性、半定 建立数学模 E E 收集经验数据 d 性规律 型 s   d   d   d   c 用经验资料验证 求解、发展数学 ' 模型 理论 “Most readers of this publication will know that ‘post-genomics’ and ‘proteomics’ are phrases that mean little that is specific but herald an encyclopaedic era of information about the way biological cells and their genes and proteins behave. But how best to make sense of it all? It is, at last, possible to anticipate mathematics becoming useful in the modelling of the systems.” –Nature 407 2000, 819. 内容简介? • 基因表达 • 基因调控网络 – Toggle switches – 生物振荡 2
  • 3. 系统生物学数学基础 – 生命节律 – 胚胎发育 • 细胞分裂与分化 • 系统生物学前沿介绍 • 随机过程(Master equation, Langevin equation, Fokker-Plank equation) • 微分方程(建模,定性理论,数值求解) • 随机微分方程(建模,数值求解,稳定性分析) • 反应扩散方程(建模,数值求解) 补充阅读材料: 1. Mackey, M. C., Santillan, M., Mathematics, Biology, and Physicss: Interactions and interepen- dence, Notices AMS, 52(2005)(8). 2. Sontga, E. D., Molecular systems biology and dynamics: an introduction for non-biologists. 3. Alon, U., An introduction to systems biology, Chapman Hall/CRC, London, 2007. 4. Fall, C. P., Marland, E. S., Wagner, J. M., Tyson, J. J., (Eds.) Computational cell biology, Springer-Verlag, New York, 2001. 5. Alberghina, L., Westerhoff, H. V. (Eds.) Systems biology: Definitions and perspectives. Springer, Berlin, 2005. 3
  • 4. 目录 第一章 化学反应的数学描述 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.1 引言 . . . . . . . . . . . . . . . . . . § . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.2 常微分方程 . . . . . . . . . . . . . . § . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.3 化学主方程 . . . . . . . . . . . . . . § . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.4 化学朗之万方程 . . . . . . . . . . . . § . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.5 计算模拟 . . . . . . . . . . . . . . . § . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 § 1.5.1 常微分方程的数值模拟 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 § 1.5.2 求解化学主方程 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 § 1.5.3 求解Fokker-Plank 方程 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 § 1.5.4 求解化学朗之万方程 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 § 1.6 Michaelis-Menten and Hill Equations . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 § 1.7 补充阅读材料 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 第二章 基因表达 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 2.1 引言 . . . . . . . . § . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 2.2 实验事实 . . . . . § . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 2.3 数学模型 . . . . . § . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 2.4 基因表达的随机性 § . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 2.5 反馈控制 . . . . . § . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 2.6 补充阅读材料 . . . § . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 第三章 基因调控 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 § 3.1 Toggle Switches . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 § 3.1.1 Bistability . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 § 3.1.2 A model for repressor expression[21] . . . . . . . . . . . . . . . . . . . . . . . . 20 § 3.1.3 Noise induce switches–extrinsic noise . . . . . . . . . . . . . . . . . . . . . . . . 22 § 3.1.4 Noise induce switches–intrinsic noise . . . . . . . . . . . . . . . . . . . . . . . . 23 § 3.2 生物振荡 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 § 3.2.1 Atkinson Oscillator . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 § 3.2.2 A synthetic gene-metabolic oscillator . . . . . . . . . . . . . . . . . . . . . . . . 28 § 3.2.3 Mechanisms of noise-resistance in genetic oscillators . . . . . . . . . . . . . . . 29 § 3.2.4 振荡的同步 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 § 3.2.5 常微分方程定性分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 § 3.3 生命节律 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 § 3.3.1 Dimerization and proteolysis of PER and TIM . . . . . . . . . . . . . . . . . . 42 § 3.3.2 Circadian rhythm generator . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 § 3.4 胚胎发育 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 § 3.5 Morphogen gradient . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 § 3.6 模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 § 3.7 二阶常微分方程边值问题的数学基础 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 i
  • 5. § 3.7.1 解的存在唯一性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 § 3.7.2 问题的求解 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 第四章 神经科学 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 4.1 离子通道与Nernst 方程 § . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 4.2 细胞膜模型 . . . . . . . § . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 4.3 离子通道的激活与失活 . § . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 4.4 Morris-Lecar 模型 . . . § . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 4.5 Hodgkin-Huxley 模型 . § . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 第五章 细胞增生与分化. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 § 5.1 一些数据 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 § 5.2 造血干细胞的数学模型与参数估计 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 § 5.2.1 数学模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 § 5.2.2 参数估计 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 § 5.3 造血干细胞模型的动力学分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 § 5.4 整体模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 第六章 细胞调亡 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 第七章 蛋白质折叠与随机动力学. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 参考文献 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 名词索引 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 插图索引 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
  • 6. 第一章 化学反应的数学描述 {ch3} § 1.1 引言 考虑N ≥ 1 种分子{S1 , · · · , SN } 的化学反应. 假设所有分子充分混合在一个体积(体积为Ω) 固定 的容器中. 并且假设温度不变。共有M ≥ 1 个反应通道{R1 , · · · , RM }. 以X(t) = (X1 (t), · · · , XN (t)) 记该系统在时刻t 的状态, 其中 Xi (t) 表示系统中分子Si 在时刻t 的个数, (i = 1, · · · , N ). 系统状态X(t) 是一个随机过程, 这是因为每个化学反应发生的时间是随机的, 受热力学涨落的映 像. 对每个反应通道, 可以定义相应的Propensity Function aj , 使得 aj (x)dt 表示给定X(t) = x 时, 反应Rj 在时间区间[t, t + dt) 内, 在容器中某处发生一次的概 率(j = 1, . . . , M ). 每个反应都会引起分子个数的改变.定义反应通道Rj 的状态改变向量(state-change vector) vj 如 下: vji 表示分子Si 因为反应Rj 所引起的改变量(j = 1, · · · , M ; i = 1, · · · , N ). 这里vji 0 表示反应Rj 产生分子Si , vji 0 表示反应Rj 消耗分子Si . 函数aj 和向量vji 一起给出了反应通道Rj 的完整描述. 根据这些量, 我们可以建立数学模型, 用 于描述所研究的化学反应. 对于两个分子的反应, Propensity function aj (x) 可以按以下形式定义: aj (x) = cj hj (x). (1.1.1) 其中cj 是反应通道Rj 的specific probability rate constant, 定义为cj dt 表示随机选取的反应Rj 的一对 反应物分子, 在下一个无穷小时间dt 内发生反应的概率. 这个概率等于这一对分子在下dt 时间内发生 碰撞的概率, 乘以这对已经发生碰撞的分子确实发生了反应Rj 的概率. 常数cj 也可以用反应数率常 数(reaction rate constant) kj 来表示. 函数hj (x) 表示在状态X(t) = x 时, 可以发生反应Rj 的所有不 同的反应物的组合数. (相应地, 我们有v1 = (+1, −1, 0, · · · , 0) 和v2 = −v1 .) 如果Rj 是单分子反应, 上面的讨论仍然适用, 但是cj 与相应分子的量子性质, 例如降解率有关. 而hj (X) 等于相应分子的个数. 例: 对以化学反应 R1 : X1 + X2 → 2X1 , 我们有a1 (x) = c1 x1 x2 . 而逆过程 R2 : 2X1 → X1 + X2 对应的propensity function 为a2 (x) = c2 x1 (x1 − 1)/2. 1
  • 7. 系统生物学数学基础 § 1.2 常微分方程 假设在t 时刻, 系统的状态为X(t). 则在时间区间[t, t + dt) 内, 反应Rj 发生的概率为aj (X)dt. 如 果发生了反应, 分子Si 的个数的改变量为Xi (t) + vji . 因此, 在t + dt 时刻, 分子Si 的个数平均改变量为 M Xi (t + dt) − Xi (t) = aj (X)vji dt (i = 1, · · · , N ). j=1 两边除以dt, 并且令dt → 0, 我们得到相应的常微分方程 M dXi aj (X)vji (i = 1, · · · , N ). = (1.2.2) {eq:1.2:1} dt j=1 在这里, 分子的个数是整数, 因此Xi (t) 是整数值的函数. 因此上面对时间t 的微分数学上并不严 格成立. 然而, 如果分子的个数充分大, 上面公式可以给出很好的近似. 通常, 在描述化学反应时, 适用浓度描述系统的状态, 即Z = (Z1 , · · · , ZN ), 其中Zi = Xi /Ω. 此时 上面方程可以表示为化学速率方程(chemical rate equation) M dZi aj (Z)vji (i = 1, · · · , N ). = ˜ (1.2.3) {eq:cre} dt j=1 其中 aj (ΩZ) aj (Z) = ˜ . Ω 例: 对前面的例子, 我们有常微分方程模型 dZ1 = k1 Z1 Z2 − k2 Z1 (Z1 − 1/Ω) dt (1.2.4) {eq:1.2:3} dZ2 = −k1 Z1 Z2 + k2 Z1 (Z1 − 1/Ω) dt 这里k1 = c1 Ω, k2 = c2 Ω/2 分别为反应R1 和R2 的反应速率常数. 当Ω → +∞ 时, 我们得到了孰知的 方程(chemical rate equation) dZ1 2 = k1 Z1 Z2 − k2 Z1 dt (1.2.5) {eq:1.2:4} dZ2 2 = −k1 Z1 Z2 + k2 Z1 dt 由上面的例子可以看到, 方程(1.2.5) 仅仅是当体积充分大(当然分子数也充分大)时的近似形式. 而对 于大量的生物学问题, 相应的反应都是在细胞内完成的, 体积并不是很大, 而且分子数也不大, 所以上 面方程只能得到近似的描述, 而且还可能得到错误的描述. 因此, 我们需要好的数学模型. § 1.3 化学主方程 以为系统的状态随时间的变化是随机过程, 为了得到更加精确的描述, 我们使用随机描述来建立 数学模型, 既化学主方程(chemical master equation). 定义条件概率函数P (x, t|x0 , t0 ) 如下: P (x, t|x0 , t0 ) = Prob{X(t) = x, given that X(t0 ) = x0 }. (1.3.6) {eq:1.3:1} 2
  • 8. 系统生物学数学基础 这样, 化学反应的动态过程可以通过函数P (x, t|x0 , t0 ) 随时间的变化描述出来. 为此, 取dt 充分小, 使 得在时间dt 内发生两次或者更多次化学反应的概率可以忽略. 这样, 我们可以根据t 时刻的条件概率 写出t + dt 时刻的概率:   M M P (x, t + dt|x0 , t0 ) = P (x, t|x0 , t0 ) × 1 − [P (x − vj ), t|x0 , t0 )aj (x − vj )dt]. aj (x)dt + j=1 j=1 令dt → 0, 我们就可以得到化学主方程 M ∂ [aj (x − vj )P (x − vj , t|x0 , t0 ) − aj (x)P (x, t|x0 , t0 )] . P (x, t|x0 , t0 ) = (1.3.7) {eq:cme} ∂t j=1 方程(1.3.7) 从本质上反应了我们所研究的系统. 如果可以求解出P , 则可以完整地刻划随机过 程X(t). 然而, 除了很特殊的情况, 方程(1.3.7) 的精确解一般是得不到的, 当分子数或者是反应的数量 很大时, 即使是数值解也不容易得到. 为了进一步研究前面的常微分方程模型的含义, 我们来看X(t) 作为随机过程的平均量的动力学. 为此, 定义条件期望 E(t|x0 , t0 ) = xP (x, t|x0 , t0 ). x 表示当X(t0 ) = x0 时, 在时刻t ≥ t0 的平均状态. 这里求和的范围可以取所有允许的状态. 如果把函 数P 拓展定义到全空间RN ×[t0 , +∞), 其中当X(t) = x 是不允许出现的状态时, 定义P (x, t|x0 , t0 ) = 0, 则上面的求和可以拓展到全空间RN : E(t|x0 , t0 ) = xP (x, t|x0 , t0 ). (1.3.8) {eq:1.3:2} x∈RN 为简单, 我们省略初始条件, 而记E(t) = ( X1 (t) , · · · , XN (t) ). 由(1.3.7), 可以得到 M d Xi = vji aj (x)P (x, t) (1.3.9) {eq:1.3:3} dt j=1 x∈RN 方程(1.3.9) 给出了平均动力学方程. 记 aj (X) = aj (x)P (x, t) x∈RN 则 M d Xi = vji aj (X) (1.3.10) {eq:1.3:4} dt j=1 如果系统的随机性可以忽略, 则 aj (X) = aj ( X ), 我们可以得到化学反应速率方程(1.2.2). 但是, 一 般地, (1.3.10) 并不等价于方程(1.2.2). 如果是单分子反应, 则aj (X) = cj Xjk , 则 aj (X) = aj ( X ). 方程(1.3.10) 等价于(1.2.2). 因此, 我们看到只对单分子反应, 常微分方程(1.2.2) 才反应平均动力学. 因此, 对于多分子反应, 常微分方程模型(1.2.2) 的结果的解释需要特别的小心. 如果分子的数目很大, 即x ≫ vj , 我们可以把方程(1.3.7) 的右边展开成x 的泰勒级数. 由此, 可以 得到(我们在这里省略初始条件)   M N ∂2 ∂ ∂ 1 aj (x)P (x, t) − P (x, t) = aj (x)P (x, t)vji + aj (x)P (x, t) ∂t ∂xi 2 ∂xi ∂xk j=1 i=1 1≤i,k≤N M − aj (x)P (x, t) + · · · j=1 3
  • 9. 系统生物学数学基础 其中忽略了vji 的高阶项. 令 M M Ai (x) = vji aj (x), Bik = vji vjk aj (x) (1.3.11) {eq:1.3:5} j=1 j=1 则有方程 N ∂2 ∂ ∂ 1 P (x, t) = − Ai (x)P (x, t) + Bik (x)P (x, t). (1.3.12) {eq:fk} ∂t ∂xi 2 ∂xi ∂xk i=1 1≤i,k≤N 这个就是Fokker-Plank 方程. 其中Ai (x) 和Bik (x) 的含义我们将在后面介绍. 从上面的推导可以看到, Fokker-Plank 方程是当分子数很大时, 对化学主方程的近似. 为描述化学反应的随机性, 我们可以分析协方差 σik = (Xi − Xi )(Xk − Xk ) (1 ≤ i, k ≤ N ). (1.3.13) {eq:var} 协方差σik 时时间t 的函数. 通过概率转移函数P , 上面协方差可以表示为 (xi − Xi (t) )(xk − Xk (t) )P (x, t). σik (t) = x∈RN 我们可以推导出σik 满足的方程: dσik d Xi d Xk )(xk − Xk )P (x, t) + )(xi − Xi )P (x, t) = (− (− dt dt dt x∈RN x∈RN ∂ (xi − Xi (t) )(xk − Xk (t) ) + P (x, t) ∂t x∈RN M (xi − Xi )(xk − Xk ) (aj (x − vj )P (x − vj , t) − aj (x)P (x, t)) = j=1 x∈RN M (xi − Xi )(xk − Xk )aj (x − vj )P (x − vj , t) = j=1 x∈RN M − (xi − Xi )(xk − Xk )aj (x)P (x, t) j=1 x∈RN M (xi + vji − Xi )(xk + vjk − Xk )aj (x)P (x, t) = j=1 x∈RN M − (xi − Xi )(xk − Xk )aj (x)P (x, t) j=1 x∈RN [Ai (x)(xk − Xk ) + Ak (x)(xi − Xi )] P (x, t) + = Bik (x)P (x, t). x∈RN x∈RN 这里Ai (x), Bik (x) 如前面所定义. 由此, 我们得到σik 所满足的方程. dσik [Ai (x)(xk − Xk ) + Ak (x)(xi − Xi )] P (x, t) + = Bik (x)P (x, t) (1.3.14) {eq:var:1} dt x∈RN x∈RN 4
  • 10. 系统生物学数学基础 当随机性很小时, 即xi − Xi 很小, 我们可以把Ai (x) 和Bik (x) 展开成泰勒级数: N ∂Ai ( X ) (xl − Xl ) + · · · Ai (x) = Ai ( X ) + ∂xl l=1 N ∂Ak ( X ) (xl − Xl ) + · · · Ak (x) = Ak ( X ) + ∂xl l=1 N ∂Bik ( X ) (xl − Xl ) Bik (x) = Bik ( X ) + ∂xl l=1 ∂ 2 Bik ( X ) (xp − Xp )(xq − Xq ) + · · · + ∂xp ∂xq 1≤p,q≤N 带入方程(1.3.14), 并且注意到关系 x ∈ RN (xi − Xi )P (x, t) = 0, x ∈ RN P (x, t) = 1 我们可以得到方程 N ∂ 2 Bik ( X ) dσik ∂Ai ( X ) ∂Ak ( X ) = σil + σlk + Bik ( X ) + σpq . (1.3.15) {eq:var:2} dt ∂xl ∂xl ∂xp ∂xq 1≤p,q≤N l=1 定义矩阵 ∂ 2 Bik ( X ) σ = (σik ), A = (∂Ai ( X )/∂xl ), B = (Bik ( X ), C = ∂xp ∂xq 上面方程可以简写为 dσ = (Aσ + AT σ + Cσ) + B. (1.3.16) {eq:df} dt 这个就是所谓的Fluctuation-Dissipation Theorem (通常的形式是忽略了高阶导数项C). § 1.4 化学朗之万方程 现在我们建立数学模型, 用于直接描述随机过程X(t) 本身. 假设在时刻t, 系统的状态为X = xt . 令Kj (xt , τ ) (τ 0)表示反应Rj 在下个时间区间[t, t + τ ] 内发生的次数. 因为每次这样的反应都把分 子Si 的个数增加vji , 系统中分子Si 在时刻t + τ 的个数为 M Kj (xt , τ )vji , (i = 1, · · · , N ). Xi (t + τ ) = xt,i + (1.4.17) {eq:1.4:1} j=1 这里, Kj (xt , τ ) 是随机变量. 要得到对所有τ 的精确描述, 我们需要求解化学主方程. 然而, 我们 可以在下面的条件下给出很好的近似. 条件一: 首先, 取τ 充分小, 使得在时间区间[t, t + τ ] 内, 系统的状态只有微小的改变, 因此, 所有 的propensity function 几乎保持不变: aj (X(t′ )) ≈ aj (xt ), ∀t′ ∈ [t, t + τ ], ∀j ∈ [1, M ]. (1.4.18) {eq:1.4:2} 通常地, 每次反应都只使某种分子地个数增加或减少1 , 所以, 当系统地反应物地数量远大于1 时, 只要 取τ 充分小, 上面的条件一是很容易满足的. 根据条件一, 在时间区间[t, t + τ ] 内发生的所有反应都不改变系统的propensity function. 因此, 所 有反应在时间区间[t, t + τ ] 发生的概率可以认为是相互独立的. 因此, Kj (xt , τ ) 等于当propensity func- tion 等于aj (xt ) 时, 反应通道Rj 在时间τ 内的发生次数. 这个次数满足独立Possion 分布Pj (aj (xt ), τ ). 5
  • 11. 系统生物学数学基础 这里P(a, t) 表示当某个事件在任意无穷小事件区间dt 内出现的概率为adt 是, 在长度为t 的时间 区间内出现的次数. 令Q(n; a, t) 表示P(a, t) 等于n (整数) 的概率, 则由关系 Q(0; a, t + dt) = Q(0; a, t) × (1 − adt) 可以得到 ∂Q(0; a, t) = −at, Q(0; a, 0) = 1. ∂t 由此容易得到Q(0; a, t) = e−at . 对任意n ≥ 1, 根据概率的乘法定律, 由关系 t Q(n − 1; a, t′ ) × adt′ × Q(0; a, t − t′ ). Q(n; a, t) = t′ =0 通过数学归纳法, 可以得到一般的公式 e−at (at)n , (n = 0, 1, 2, · · · ). Q(n; a, t) = n! 现在, 我们可以计算随机变量P(a, t) 的均值和方差 P(a, t) = var{P(a, t)} = at. 当at ≫ 1 时, 可以证明 e−at (at)n (n − at)2 ≈ (2πat)−1/2 exp − . n! 2at 因此, 当at ≫ 1, 随机变量P(a, t) 可以由具有相同的均值和方差的正态分布来近似: P(a, t) ≈ N (at, at), if at ≫ 1. (1.4.19) {eq:1.A3} 因此由条件一, 方程(1.4.17) 可以近似为 M vji Pj (aj (xt ), τ ), (i = 1, · · · , N ). xi (t + τ ) = xt,i + (1.4.20) {eq:1.4:3} j=1 条件二: 时间区间τ 充分大, 使得在时间区间[t, t + τ ] 内发生的化学反应的次数的期望值大于1, 即 Pj (aj (xt ), τ ) = aj (xt )τ ≫ 1, ∀j ∈ [1, M ]. (1.4.21) {eq:1.4:4} 很显然, 这个条件和条件一是矛盾的, 可能会出现这样的情况: 两个条件无法同时满足. 在这种情况下, 我们的模型不能满足. 但是, 在很多情况下, 这这两个条件是可以同时满足的, 例如, 当发生系统中的反 应每种分子的个数都足够大时. 这时aj (xt ) 是大数, 即使τ 很小, 上面的条件也是可以满足的. 当条件二满足时, 我们可以把Possion 分布Pj (aj (xt ), τ ) 近似为具有相同的均值和方差的正则分 布. 因此, 我们由下面的关系 M vji Nj (aj (xt ), τ ), (i = 1, · · · , N ). xi (t + τ ) = xt,j + (1.4.22) {eq:1.4:5} j=1 这里N (m, σ 2 ) 表示均值为m, 方差为σ 2 的正则分布. 注意到在这里, 我们把整数的Possion 分布变成 为连续实数的正则分布. 这样, 分子数Xi 也相应的变成为是实数的. 另外, M 个正则分布是相互独立 的. 这是因为我们假定所有的Possion 分布Pj 都是相互独立的. 利用正则分布的简单关系 N (m, σ 2 ) = m + σN (0, 1), 我们可以把(1.4.22) 改写为另外的形式: M M vji [aj (xt )τ ]1/2 Nj (0, 1), (j = 1, · · · , N ). xj (t + τ ) = xt,j + vji aj (xt )τ + (1.4.23) {eq:1.4:6} j=1 j=1 6
  • 12. 系统生物学数学基础 这里的正则分布Nj (0, 1) 都是独立的. 下面, 假设τ 同时满足条件一和条件二, 并记τ 为dt. 另外, 我我们用白噪声ξj (t) 记满足独立正则 分布Nj (0, 1) 的随机变量. 这里, 白噪声满足关系 ξi (t)ξj (t′ ) = δij δ(t − t′ ), ∀i, j ∈ [1, M ], ∀t. ξj (t) = 0, 并记Xj (t) = xt,j , 则方程(1.4.23) 可以表述为 M M 1/2 vji aj (xt )ξj (t)(dt)1/2 , (j = 1, · · · , N ). xi (t + dt) = xi (t) + vji aj (xt )dt + (1.4.24) {eq:1.4:7} j=1 j=1 引进维纳过程(Winer process) Wj , 使得 dWj = Wj (t + dt) − Wj (t) = ξj (t)(dt)1/2 可以改写上面的方程为 M M 1/2 vji aj (xt )dWj , (j = 1, · · · , N ). dxi (t) = vji aj (xt )dt + (1.4.25) {eq:1.4:8} j=1 j=1 这里dxj (t) = xj (t + dt) − xj (t). 这个就是化学朗之万方程(Chemical Langevin Equation). § 1.5 计算模拟 前面我们介绍了描述化学反应的几种数学模型, 分别涉及到常微分方程, 差分方程(化学主方程), 偏微分方程(Fokker-Plank 方程), 随机微分方程. 这些方程的计算模拟分别涉及不同的数学领域, 可以 参考相应的数学专业教材. 这里简单介绍如下. § 1.5.1 常 微 分 方 程 的 数 值 模 拟 差分法, 软件: xppaut. § 1.5.2 求 解 化 学 主 方 程 Gilliespie 算法: 1. 初始化Xi ,并令初始时间t = 0. M 2. 计算aν (ν = 1, · · · , M ),并令a0 = aν . ν=1 µ−1 3. 产生[0, 1] 上的平均分布随机数r1 和r2 , 并令τ = (1/a0 ) ln(1/r1 ),取µ 为满足条件 ν=1 µ r2 a0 ≤ ν=1 aν 的整数,则(τ, µ) 是满足概率密度为 aµ e−a0 τ , if 0 ≤ τ ∞ and µ = 1, · · · , M P (τ, µ) = 0 otherwise 得随机数。 4. 令t = t + τ , 并根据反应反应通道Rµ 更新分子个数,即Xi → Xi + vµi . Here P (τ, µ) is the “reaction probability density function” that defined as P (τ, µ)dτ = probability that, given the state (X1 , · · · , XN ) at time t, the next reaction in V will occur in the in- finitesimal time interval (t + τ, t + τ + dτ ), and will be an Rµ raction. 7
  • 13. 系统生物学数学基础 The probability P is the product of P0 (τ ), the probability that, given the state (X1 , · · · , XN ) at time t, no reaction will occur in the time interval (t, t + τ ); times aµ dτ , the subsequence probability that an Rµ reaction will occur in the time interval (t + τ, t + τ + dτ ): P (τ, µ)dτ = P0 (τ ) · aµ dτ. To find and expression for P0 (τ ), we first note that [1 − ν aν dτ ′ ] is the probability that no reaction will occur in time dτ ′ from the state (X1 , · · · , XN ). Therefore, P0 (τ ′ + dτ ′ ) = P0 (τ ′ ) · [1 − aν dτ ′ ] ν from which it is readily deduced that M P0 (τ ) = exp[− aν τ ], ν=1 Thus, we obtain the reaction probability density function aµ e−a0 τ , if 0 ≤ τ ∞ and µ = 1, · · · , M P (τ, µ) = (1.5.26) {eq:1.5:1} 0 otherwise § 1.5.3 求 解 Fokker-Plank 方 程 差分法. § 1.5.4 求 解 化 学 朗 之 万 方 程 随机微分方程数值方法: 以Wt 表示随机过程, 如果满足下面条件: 1. 连续; 2. 独立增量过程: 如果t1 t2 t3 t4 , 则 (Wt2 − Wt1 )(Wt4 − Wt3 ) = 0; 3. 对任意t, τ ≥ 0, Wt+τ − Wt 是均值为零的高斯分布, 且满足 (Wt+τ − Wt )2 = τ ; 则Wt 称为是维纳过程. 通过维纳过程, 一维随机微分方程可以表示为 dx = f (x, t)dt + g(x, t)dWt . (1.5.27) {eq:sde} 一个随机过程x(t) 满足方程(1.5.27), 表示过程x(t) 满足几分方程 t t x(t) = x(0) + f (x(s), s)ds + g(x(s), s)dWs . (1.5.28) {eq:isde} 0 0 这里的随机积分表示Itˆ 积分. o Itˆ 公式: 如果随机过程x(t) 满足随机微分方程(1.5.27), 则随机过程V (x, t) 满足下面关系: o 1 ∂ 2V ∂V ∂V ∂V g(x, t)2 dt + dV = + f (x, t) + g(x, t)dWt . (1.5.29) {eq:ito} 2 ∂x2 ∂t ∂x ∂x 公式(1.5.29) 就是Itˆ 公式. o 考虑下面随机微分方程, m j bj (Xt , t)dWtk , dXt = aj (Xt , t)dt + (1.5.30) {eq:app1} k k=1 8
  • 14. 系统生物学数学基础 这里j = 1, · · · , n, X = (X 1 , · · · , X n ), Wtk 表示第k 个Wiener 过程在时刻t 的值. 强1.0 阶Runge-Kutta 格式如下面给出:[27] m j j bj (Xti )∆Wtk Xti + aj (Xti )∆t + Xti+1 = (1.5.31) k i k=1 m n ∂bj 1 bl (Xti ) (Xti )((∆Wtk )2 − ∆t), k + k l 2 ∂Xt i k=1 l=1 这里∆t = ti+1 − ti , ∆Wtk = Wtk − Wtk . i i+1 i § 1.6 Michaelis-Menten and Hill Equations 这一节介绍两个在生化反应的模拟过程中常用的方程[4] . 首先, 我们考虑抑制子蛋白和DNA之 间的相互作用. 考虑抑制子X 辨认并且结合好其目标DNA 的作用位点(promoter) D 上的过程, 所形 成的复合物记为[XD]. 基因只有当抑制子没有结合到promoter 上时(自由的)才会表达. 这样, 基因或 者是自由的, 或者被抑制子所结合. 这样, 我们有一下方程: D + [XD]1 = DT (1.6.32) {eq:mm1} 这里DT 为常数, 是相应作用位点的总浓度. 抑制子X 和目标D 都在细胞内扩散, 并且偶尔会碰撞, 然后结合成为复合体. 假设X 和D 碰撞在 一起并且结合的速率为kon . 则复合物的生成速度正比于碰撞速率kon , 细胞中反应物的浓度X 和D. 另 一方面, 复合物以速率koff 分解. 这样, 复合物[XD] 的变化速率等于其合成速率和分解速率的差: d[XD] = kon XD − koff [XD]. (1.6.33) {eq:mm2} dt 在平衡态时, 有d[XD]/dt = 0, 可以得到关系 Kd [XD] = XD 其中Kd = kon /koff 为复合体的解离常数. 根据关系(1.6.32), 我们可以得到下面关系: D 1 = . (1.6.34) {eq:mm3} DT 1 + X/Kd 一些数据: kon ∼ 108 − 1011 M −1 sec−1 , koff 1sec. (1.6.34) 给出了在一段时间内(例如, 大于1 sec), 自由的基因位点占总数的百分比与抑制子X 的浓度的 关系. 当X = Kd 时, %50 的位点是自由的. 假设当位点是自由的时, 相应基因的转录率为β. 则mRNA 的产生率(成为promoter activity) 和 抑制子X 的关系为 β promoter activity = . (1.6.35) {eq:mm4} 1 + X/Kd 这里Kd 称为repression coefficient. 现在, 我们考虑另一种情况, X 要和诱导物SX 结合称复合体[SX X] 以后才有活性. 如果每个X 只能结合一个SX , 则有关系 X + [SX X] = XT 其中XT 表示X 的总数. 假定X 和SX 碰撞并结合成复合体的速率常数为jon , 复合物的分解速率常数 为joff . 则复合物的动力学方程(质量作用定理)为 d[SX X] = kon XSX − joff [SX X]. (1.6.36) {eq:m21} dt 9
  • 15. 系统生物学数学基础 并且假定诱导物SX 的数量充分大, 其数量的变化可以忽略. 在平衡态时, 有关系 KX [SX X] = XSX 这里KX 是复合物[SX X] 的解离常数. 则复合物[SX X] 的数量和诱导物的数量SX 的关系可以 由Michaelis-Menten 方程(也称为米氏方程)表示出来: X T SX [XSX ] = . (1.6.37) {eq:mm11} SX + K X 现在如果X 上有n 个结合位点, 可以同时和n 个SX 结合成复合体[nSX X] 并且被激活. 则有关系 [nSX X] + X0 = XT . (1.6.38) {eq:mm16} 这里X0 表示自由的X, 并且中间态(与X 结合的诱导物的个数少于n 个) 都忽略. 复合物[nSX X] 的形 成是通过X 和n 个SX 分子的碰撞而形成. 设反应速率常数为jon , 则 n collision rate = jon X0 SX . (1.6.39) {eq:mm12} 令离解常数为joff : dissociation rate = joff [nSX X]. (1.6.40) {eq:mm13} 参数joff 通常对应与X 和SX 之间连接的化学键的强度. 复合物[nSX X] 的动力学方程为 d[nSX X] n = jon X0 SX − joff [nSX X] (1.6.41) {eq:mm14} dt 这里假设细胞内S 的数量很大, 其数目的变化可以忽略. 在平衡态的时候, 有关系 n joff [nSX X] = jon X0 SX . (1.6.42) {eq:mm15} 由关系(1.6.38), 我们有 n (joff /jon )[nSX X] = (XT − [nSX X])SX . 由此可以得到结合的X 所占的比例 Sn [nSX X] = nX n (1.6.43) {eq:mm17} XT K X + SX n 其中KX = joff /jon . 这个就是Hill equation, 系数n 通常称为是Hill 系数(Hill coefficient). 当n 1 时, 通常称为是合作的. 没有结合的抑制子X 的浓度是 X0 1 = . (1.6.44) {eq:mm18} 1 + (SX /KX )n XT 现在考虑另外的情况, 假设存在诱导物S. 抑制子可以和诱导物结合为复合体[XSX ]. 诱导物通过 和抑制子结合, 阻止抑制子抑制基因的表达, 从而诱导基因的表达. 此时, 抑制子X 可以有三种状态: 自由的, 与DNA 位点结合, 或者与诱导物结合: XT = X0 + [XD] + [nSX X]. (1.6.45) {eq:mm5} 这样, 我们得到下面动力学方程: d[XD] kon X0 D − koff [XD], = (1.6.46) dt d[nSX X] n jon X0 SX − joff [nSX X]. = (1.6.47) dt 这里, 我们假设复合物[nSX X] 不能与D 结合, 并且细胞内SX 的数量很大, 其数目的变化可以忽略. 在平衡态时, 可以得到关系 n KX [nSX X] = X0 SX , Kd [XD] = X0 D (1.6.48) {eq:mm8} 10
  • 16. 系统生物学数学基础 这里KX = joff /jon 为解离常数(for lac repressor, KX ∼ 1µM ∼ 1000 inducer (IPTG) molecules/cell). 由上面关系(1.6.45) 和(1.6.48) 可以求解出 X0 1 = . n XT 1 + D/Kd + SX /KX 由自由DNA 所占比例与自由抑制子的浓度的关系(1.6.34), 可以得到promoter activity (记为f = f (SX ))和诱导物SX 之间的关系 β f= . (1.6.49) {eq:mm19} n 1 + (XT /Kd)/(1 + f DT /(βKd ) + SX /KX ) n 当SX /KX ≫ DT /Kd 时, 上面关系可以近似为 β f= . (1.6.50) {eq:mm20} n 1 + (XT /Kd )/(1 + SX /KX ) 上面关系给出了基因的活性与诱导物的浓度之间的关系. 当SX = 0 时, 有f (SX = 0) ≈ β/(1 + XT /Kd ). 这个也称为是是basal promoter activity, 表示当没有诱导物时的promoter 活性. 当 SX = S1/2 ∼ (XT /Kd )1/n KX 时, 基因的活性恢复达到最大值的一半(f = β/2). 现在考虑激活子的情况: 只有当X 结合到基因位点D 上时, 相应的mRNA 才会被转录. 根据前面 的讨论, 基因的promoter activity 和激活子的浓度的关系可以通过Michaelis-Menten 方程表示出来: βX ∗ promoter activity = . (1.6.51) {eq:mm10} Kd + X ∗ 这里X ∗ 表示具有活性(可以和DNA 位点结合) 的激活子的浓度. 如果存在诱导物SX 可以和激活子结合(假设激活子存在n 个作用位点), 激活子只有当与n 个诱 导物结合为复合体[nSX X]后, 才有活性(这里忽略中间状态, 即与X 结合的诱导物的个数少于n 个的 情况). 此时, 有关系 X + nSX ⇆ X ∗ , X ∗ + D ⇆ D∗ 通前面的讨论, 有活性的激活子的浓度为 n X T SX X ∗ = [nSX X] = n. n K X + SX 因此, 基因的活性和诱导物的浓度的关系为 βX ∗ f (SX ) = . (1.6.52) {eq:mm22} Kd + X ∗ 当 SX = S1/2 = (Kd /XT )1/n KX 时, 基因的活性达到其最大值的一半. 一般地, 如果一个基因既有抑制子, 又有激活子, 基因的活性系数为 βi (Xi /Ki )ni i f (X1 , · · · , Xm ) = (1.6.53) {eq:mm22} 1 + i (Xi /Ki )mi 这里Xi 表示抑制子或者是激活子的浓度, Ki 表示相应的抑制或激活系数. 11
  • 17. 系统生物学数学基础 § 1.7 补充阅读材料 1. van Kampen, N. G. 1992. Stochastic process in physics and chemistry. North-Holland, Amster- dam, 1992. 2. Gillespie, D. T. 1977. Exact stochastic simulation of coupled chemical reactions. J. Phys. Chem. 81:2340-2361. 3. Gillespie, D. T. 2000. The chemical Langevin equation. J. Chem. Phys. 113:297–306. 12
  • 18. 第二章 基因表达 § 2.1 引言 我们知道, 所有生物的遗传信息, 都是以基因的形式储藏在细胞内的DNA (或RNA) 分子中. 随 着个体的发育, DNA 分子能有序地将其所承载的遗传信息, 通过密码子-反密码子系统, 转变成蛋白质 分子, 执行各种生理生化功能, 完成生命的全过程. 科学家把这个从DNA 到蛋白质的过程称为基因表 达(gene expression), 对这个过程的调控是现阶段分子生物学研究的中心课题. 图 2.1: 中心法则 {fig:dogma} 基因表达调控主要表现在以下几个方面: 1. 转录水平上的调控(transcriptional regulation); 2. mRNA 加工成熟水平上的调控(differential processing of RNA transcript); 3. 翻译水平上的调控(differential translation of mRNA). § 2.2 实验事实 § 2.3 数学模型 常微分方程模型: 13
  • 19. 系统生物学数学基础 Property Yeast (S. cerevisae) E. coli 6 ∼ 4 × 109 Proteins/cell 4 × 10 Time to tran- ∼ 1min ∼ 1 min scribe a gene Time to trans- ∼ 2min ∼ 2 min late a protein Typical mRNA 2 − 5min 10 min to over 1 h lifetime ∼ 30min (rich Cell generation ∼ 2 h (rich medium medium to several time to several hours hours Timescale of transcription ∼ 1sec factor binding to DNA site 表 2.1: Typical parameter values for the Bacterial E. Coli cell and Saccharonmyces cerevisae (Yest)(Alon , 2007) {tab:1} dX1 λ+ (n − X1 ) − λ− X1 = 1 1 dt dX2 λ2 X1 − δ2 X2 = dt dX3 λ3 X2 − δ3 X3 = dt 化学主方程: dP (X1 , X2 , X3 ) λ+ (n − X1 + 1)P (X1 − 1, X2 , X3 ) − λ+ (n − X1 )P (X1 , X2 , X3 ) = 1 1 dt + λ− (X1 + 1)P (X1 + 1, X2 , X3 ) − λ− X1 P (X1 , X2 , X3 ) 1 1 + λ2 X1 P (X1 , X2 − 1, X3 ) − λ2 X1 P (X1 , X2 , X3 ) + δ2 (X2 + 1)P (X1 , X2 + 1, X3 ) − δ2 X2 P (X1 , X2 , X3 ) + λ3 X2 P (X1 , X2 , X3 − 1) − λ3 X2 P (X1 , X2 , X3 ) + δ3 (X3 + 1)P (X1 , X2 , X3 + 1) − δ3 X3 P (X1 , X2 , X3 ). (0 ≤ X1 ≤ n, X2 , X3 ≥ 0) Chemical Langevin equation 14
  • 20. 系统生物学数学基础 图 2.2: Intrinsic and extrinsic noise in gene expression (Elowitz et. al. 2002) dX1 = λ+ (n − X1 ) − λ− X1 (2.3.1) 1 1 dt λ+ (n − X1 )ξ1 (t) − λ− X1 ξ2 (t) + 1 1 + fλ+ (n − X1 )ηλ+ (t) − fλ− X1 ηλ− (t), 1 1 1 1 dX2 = λ2 X1 − δ2 X2 + λ2 X1 ξ3 (t) − δ2 X2 ξ4 (t) (2.3.2) dt + fλ2 X1 ηλ2 (t) − fδ2 X2 ηδ2 (t), dX3 = λ3 X2 − δ3 X3 + λ3 X2 ξ5 (t) − δ3 X3 ξ6 (t) (2.3.3) dt + fλ3 X2 ηλ3 (t) − fδ3 X3 ηδ3 (t), 图 2.3: A model of the expression of a single gene. Each step represents several biochemical reactions, which are associated with transition between promoter states, production and decay of mRNAs and proteins. {fig:gene} 15
  • 21. 系统生物学数学基础 60 ’md-1.dat’ using 1:3 50 40 mRNA 30 20 10 0 0 20 40 60 80 100 120 140 Time 图 2.4: 模拟结果(Gillespie 算法): [mRNA] vs. Time. {fig:ge1} 60 ’md.dat’ using 1:3 50 40 mRNA 30 20 10 0 0 50 100 150 200 Time 图 2.5: 模拟结果(求解Langevin 方程): [mRNA] vs. Time. {eq:ge2} § 2.4 基因表达的随机性 § 2.5 反馈控制 § 2.6 补充阅读材料 1. Orphanides, G., Reinberg, D., (2002) A unified theory of gene expression, Cell 108, 439-451. 2. Smolen, P., Baxter, D. A., Byrne, J. H., (2000) Mathematical modeling of gene networks. Neuron 26, 567-580. 3. Kærn, M., Elston, T. C., Blake, W. J., Collins, J. J., (2005) Stochasticity in gene expression: from theories to phenotypes. Nat. Rev. Genet. 6, 451-464. 4. Paulsson, J., (2005) Models of stochastic gene expression. Phy. Life Rev. 2, 157-175. 16
  • 22. 系统生物学数学基础 5. Elowitz, M. B., Levine, A. J., Siggia, E. D., Swain, P. S., Stochastic gene expression in a signle cell. Science 297(2002), 1183-1186. 6. Swain, P. S., Elowitz, M. B., Siggia, E. D., Intinsic and extrinsic contributions to stochasticity in gene expression. PNAS 99(2002), 12795-12800. 17
  • 23. 第三章 基因调控 § 3.1 Toggle Switches § 3.1.1 Bistability 正反馈可以产生双稳态. 在这里, 我们考虑下面的例子. White-opaque switching is an epigenetic phenomenon, where genetically identical cells can exist in two distinctive cell types, white and opaque. Each cell type is stably inherited for many generations, and switching between the two types of cells occurs stochastically and rarely–roughly one switch in 104 cell divisions. The gene Wor1 was identified as a maser regulator of white-opaque switching[39, 28]. In opaque cells, Wor1 forms a positive feedback loop: it binds its own DNA regulatory region and activates its own transcription leading to the accumulation of high levels of Wor1. 上述的正反馈调控过程可以用图3.1 表示. 图 3.1: 基因表达的正反馈调控. {fig:3:bistabili 以GA 表示被激活基因的个数(对单拷贝基因, 也可以理解为被激活的概率), M 表示细胞内相应 基因的mRNA 的个数, P 细胞内基因所表达出来的蛋白质的个数. 在很多情况下, 蛋白质以二聚物或 者高聚物的形式在表示调控基因的表达(与启动子结合). 我们以Pn 表示n-聚物的个数. 这里, 我们忽 略中间产物, 即蛋白质或者以分离的形式存在, 或者以n-聚物的形式存在. 则上述过程包括下列反应. 其中蛋白质的聚合和与启动子的结合是快过程 λ+ k+ 1 nP ⇄ Pn , Pn + GR ⇄ GA . (3.1.1) {eq:3:fast1} λ− k− 1 基因的转录和mRNA 的翻译是慢过程 λ+ λ− δ λ δ GA −→ M, GR −→ M, M −2 ∅, M −3 P −3 ∅. 2 2 − − → → → (3.1.2) {eq:3:slow} 18
  • 24. 系统生物学数学基础 上述过程可以用常微分方程描述为(这里只考虑单基因拷贝, 因此GR = 1 − GA ) dPn = k + P n − k − Pn (3.1.3) dt dGA + = λ1 Pn (1 − GA ) − λ− GA (3.1.4) 1 dt dM = λ+ GA + λ− (1 − GA ) − δ2 M (3.1.5) 2 2 dt dP = λ3 M − δ3 P − k + P n + kn Pn − (3.1.6) dt 假设快过程很快达到平衡, 即上面方程(3.1.3)-(3.1.4) 右边为零, 则有 Pn Pn = KP n , GA = (3.1.7) {eq:3:5} An + P n 其中K = k − /k + 为n-聚物的解离常数, An = (λ− /λ+ )/K. 代入慢过程的方程, 可以得到 1 1 Pn dM − δ2 M = λ2 1 + a (3.1.8) An + P n dt dP λ3 M − δ3 P = (3.1.9) dt 这里λ2 = λ− , a = (λ+ − λ− )/λ− . 2 2 2 2 令 ˜ x = M/(δ3 A/λ3 ), y = P/A, t = δ3 t 可以把上面方程组无量纲化 dx = λ(1 + ay n /(1 + y n )) − δx (3.1.10) dt dy = x−y (3.1.11) dt 这里还以t 表示无量纲化以后的时间, 并且 λ2 λ3 δ2 λ= 2, δ=δ . Aδ3 3 由上面方程, 系统的平衡态由代数方程 g(y) = δy 其中 yn g(y) = λ 1 + a 1 + yn 所给出. 当n = 1 时, 上述方程有唯一的正解 (−δ + aλ + λ)2 + 4δλ −δ + aλ + λ + y∗ = . 2δ 当n 1 时, 上述方程可以有一个正解, 或者三个, 也可能有两个. 解的个数与参数δ 有关. 存在临界 值δ1 δ2 , 当δ = δ1 或者δ = δ2 时, 系统有两个平衡点. 而当δ δ1 或者δ δ2 时, 系统有只有一个平 衡点. 当δ1 δ δ2 时, 系统有三个平衡点. 令(x∗ , y ∗ )为某平衡点, 该平衡点的稳定性由线性化矩阵 λg ′ (y ∗ ) −δ A= −1 1 19
  • 25. 系统生物学数学基础 y gy 15 2.0 1.5 10 1.0 5 0.5 y ∆ 0.5 1.0 1.5 2.0 2.5 4.5 5.0 5.5 6.0 6.5 (A) (B) 图 3.2: 分岔图(λ = 4, a = 4, n = 4) {fig:3:bistabili 的特征值所决定. 矩阵A 的特征值为 1 (δ + 1)2 + 4(λg ′ (y ∗ ) − δ) . −(1 + δ) ± λ1,2 = 2 当特征值满足Re(λ1,2 ) 0 时, 平衡点是稳定的. 由此, 容易得到以下结论: 如果λg ′ (y ∗ ) δ, 则平衡点 是不稳定的, 如果λg ′ (y ∗ ) δ, 则平衡点是不稳定的. 当δ1 δ2 时, 中间值的平衡点是不稳定, 另外两 个平衡点(分别对应与高表达水平和低表达水平). 当δ δ1 或者δ δ2 时, 系统只有一个平衡点, 而且 是稳定的. 因此, 当δ1 δ δ2 时, 系统表现出双稳态. 当δ 从小于δ2 变为大于δ2 时, 系统从低表达态 变换到高表达态, 从δ 从大于δ1 变为小于δ1 时, 系统从高表达态变换到低表达态. 这样, 双稳态为系统 的switch 创造了条件. § 3.1.2 A model for repressor expression[21] In the context of the lysis-lysogeny pathway in the λ virus, the autoregulation of λ repressor expression is well characterized. In the section, we present two models describing the regulation of such a network. The full promoter region in λ phage contains the three operator sites known as OR1, OR2 and OR3. We first consider a mutant system whereby the operator site OR1 is absent from the region. The basic dynamical properties are as follows: The gene cI expresses repressor (CI), which in turn dimerizes and binds to the DNA as a transcription factor. In the mutant system, this binding can take place at one of the two binding sites, OR2 or OR3. Binding at OR2 enhances transcription, which takes place downstream of OR3, whereas binding at OR3 represses transcription, effectively turning off production. 图 3.3: Dynamical properteis of λ repressor cI. {fig:sw1} 这一调控系统的化学反应可以分为两类: 快反应和慢反应. 快反应包括分子的结合与分解, 相应 的反应常数的大概在几秒钟. 因此, 相对于慢反应(大概需要几分钟), 可以认为快反应总是处于平衡态. 20
  • 26. 系统生物学数学基础 令X, X2 和D 分别表示抑制子单体, 抑制子dimer 和DNA 的promoter site 的浓度, 我们可以把相应的 化学平衡方程表示为 K1 2X ⇆ X2 K2 D + X2 ⇆ DX2 (3.1.12) {eq:sw1} K3 ∗ D + X2 ⇆ DX2 K4 DX2 + X2 ⇆ DX2 X2 其中DX2 和DX2 分别表示dimer 结合到位点OR2 和OR3 上的情况, DX2 X2 表示同时结合到两个 ∗ 位点上的情况. 这里Ki 表示平衡常数, 并且记K3 = σ1 K2 , K4 = σ2 K2 . 则σ1 和σ2 分别表示相对 于dimer-OR2 的结合强度. mRNA 的转录和降解一般是慢过程: k t DX2 + P −→ DX2 + P + nX (3.1.13) {eq:sw2} k d X −→ A, 这里P 表示RNA 聚合酶的浓度, n 表示平均每个mRNA 可以表达的蛋白质的个数. 这些反应都是不 可逆的. 令X = [X], Y = [X2 ], D = [D], U = [DX2 ], V = [DX2 ], Z = [DX2 X2 ] 分别为各反应物的浓度, ∗ 则抑制子的浓度的变化方程为 dX = −2k1 X 2 + 2k−1 Y + nkt P0 U − kd X + r. (3.1.14) {eq:sw3} dT 这里, 我们假设RNA 聚合酶的浓度P0 保持为常数. 参数r 表示蛋白质CI 的basal rate of production, 即在没有转录调控因子时基因cI 的表达率. 另外, 变量Y, U 和D 与X 的关系可以通过令快反应(3.1.12) 达到平衡来给出: K1 X 2 Y = K2 DY = K1 K2 DX 2 U = (3.1.15) {eq:sw4} σ1 K2 DY = σ1 K1 K2 DX 2 V = σ2 K2 U Y = σ2 (K1 K2 )2 DX 4 Z = 另外, DNA 的总浓度是常数, 记为dT : DT = D + U + V + Z = D(1 + (1 + σ1 )K1 K2 X 2 + σ2 K1 K2 X 4 ). 22 (3.1.16) {eq:sw5} 由(3.1.15)-(3.1.16) 求解出Y, U , 并且代入(3.1.14), 得到下面方程(这里注意到关系K1 = k1 /k−1 ): nkt K1 K2 P0 DT X 2 dX − kd X + r. = (3.1.17) {eq:sw6} 22 1 + (1 + σ1 )K1 K2 X 2 + σ2 K1 K2 X 4 dT 为简化分析, 我们首先把上述方程无量纲化. 分别以M 和T 表示浓度和时间的量纲, 则所有浓度 的量的量纲都是M , σ1 , σ2 是无量纲参数, 其他参数的量纲如(??) 所给出. [K1 ] = [K2 ] = M −1 , [kt ] = M −1 T −1 , [kd ] = T −1 , [r] = M T −1 . (3.1.18) {eq:sw7} √ √ 因此, 引进信的无量纲变量x = X K1 K2 和t = T (r K1 K2 ), 可以得到下面的无量纲化方程 αx2 − γx + 1. x= ˙ (3.1.19) {eq:sw8} 1 + (1 + σ1 )x2 + σ2 x4 这里的导数表示对无量纲化时间t 的导数. 并且得到新的无量纲化参数 α = nkt P0 DT /r, γ = kd /(r K1 K2 ). 这里α 表示抑制子所能提高的转录率和基础转录率之间的相对比值, γ 表示蛋白质的降解率和基础表 达率之间的比值. 21
  • 27. 系统生物学数学基础 对于λ phage 的情况, 我们有σ1 ∼ 1 和σ2 ∼ 5. 因此方程(3.1.19) 中有两个参数α 和γ. 这两个参 数可以决定平衡态时抑制子的浓度. 下面我们来详细分析. 当参数α 和γ 变化时, 系统可以有一个平衡 态, 或者是三个平衡态. 令 αx2 f (x) = +1 1 + (1 + σ1 )x2 + σ2 x4 则平衡态的数目取决于方程 f (x) = γx 的解的个数. 对给定的α, 存在两个临界值γ1 γ2 , 使得当γ γ1 或者γ γ2 时, 只有一个平衡态; 当γ1 γ γ2 时, 有三个平衡态; 当γ = γ1 或者γ = γ2 时, 有两个平衡态. fx 20 15 10 5 x 0.2 0.4 0.6 0.8 1.0 图 3.4: Bifurcation plots for the variable x and concentration of λ repressor (α = 50, σ1 = 1, σ2 = 5) {fig:sw2} 如果x = x∗ 是系统的平衡点, 则令y = x − x∗ , 在平衡点附近, 我们有线性化方程 y = (f ′ (x∗ ) − γ)y. ˙ 根据微分方程的稳定性理论, 如果f ′ (x∗ ) − γ 0, 则对应的平衡点是稳定的, 如果f ′ (x∗ ) − γ 0, 则对 应的平衡点是不稳定的. 特别地, 当γ1 γ γ2 时, 系统有三个平衡点(x∗ x∗ x∗ ), 其中x∗ 是不稳 1 2 3 2 定的, 另外两个(high level x3 和low level x∗ ) 都是稳定的. 这就是所谓的双稳态. 当参数γ 从小变到大 ∗ 1 时, 在γ = γ2 处, 系统会突然从low level 态变到high level 态; 当参数γ 从大变到小时, 在γ = γ1 处, 系 统从high level 态变到low level 态. 这就是双稳态诱导的状态转移(switch) 的机制. § 3.1.3 Noise induce switches–extrinsic noise We now focus on parameter values leading to bistability and consider how an additive external noise source affects the production of repressor. Physically, we take the dynamical variable x described above to represent the repressor concentration within a colony of cells and consider the noise to act on many copies of this colony. In the absence of noise, each colony will evolve identically to one of the two fixed points, as discussed above. The presence of a noise source will at times modify this simple behavior, whereby colony-colony fluctuations can induce novel behavior. If an additive noise source alters the “background” repressor production. As an example, consider the effect of a randomly varying external filed on the biochemical reactions. The field could, in principle, impact the individual reaction rates, and because the rate equations are probabilistic in origin, its influence enters statistically. We posit that such an effect will be small and can be treated as a random perturbation to our existing treatment; we envision that events induced will affect the basal production rate, and that this will translate to a rapidly varying background repressor production. In 22
  • 28. 系统生物学数学基础 order to introduce this effect, we generalize that aforementioned model such that random fluctuations become αx2 − γx + 1 + σξ(t). x= ˙ (3.1.20) {eq:sw9} 1 + (1 + σ1 )x2 + σ2 x4 where ξ(t) is a rapidly fluctuating random term with zero mean ( ξ(t) = 0), σ is a parameter to indicate the strength of the perturbation. In order to encapsulate the rapid random fluctuations, we make the standard requirement that the autocorrelation be “δ-correlated,” i.e., the statistics of ξ(t) are such that ξ(t)ξ(t′ ) = δ(t − t′ ). 引入能量函数φ(x), 方程(3.1.20) 可以改写为 ∂φ(x) x=− ˙ + σξ(t). (3.1.21) {eq:sw10} ∂x 则方程(3.1.21) 的解可以理解为一个粒子在能量面φ(x) 上的运动. 如果没有随机干扰, 粒子最终停留 在平衡点处(能量极小). 但是, 由于随机噪声的干扰, 粒子可以跳出某个平衡点, 到达另外一个平衡点. 这个即使随机干扰诱导相变的机制. 如果随机干扰影响基因的转率效率, 则转录效率α 是随机的. 相应地, 方程(3.1.19) 中的α 应该变 而考虑为α + ξ(t). 这时, 我们得到方程 αx2 x2 − γx + 1 + σξ(t) x= ˙ . (3.1.22) {eq:sw11} 1 + (1 + σ1 )x2 + σ2 x4 1 + (1 + σ1 )x2 + σ2 x4 如果随机干扰影响蛋白质的降解率, 则降解率γ 是随机的. 相应地, 有γ → γ + ξ(t). 因此, 有方程 αx2 − γx + 1 − σξ(t)x. x= ˙ (3.1.23) {eq:sw12} 1 + (1 + σ1 )x2 + σ2 x4 0.9 0.7 ’output1.dat’ ’output2.dat’ 0.8 0.6 0.7 0.5 0.6 0.4 0.5 x x 0.4 0.3 0.3 0.2 0.2 0.1 0.1 0 0 0 20 40 60 80 100 0 200 400 600 800 1000 t t (A) (B) 0.9 0.8 ’output3.dat’ ’output4.dat’ 0.8 0.7 0.7 0.6 0.6 0.5 0.5 0.4 x x 0.4 0.3 0.3 0.2 0.2 0.1 0.1 0 0 0 200 400 600 800 1000 0 500 1000 1500 2000 t t (C) (D) 图 3.5: 模拟结果: α = 50, γ = 15, σ1 = 1, σ2 = 5. (A): 确定性系统, γ = 15 (t 20) 和γ = 10 (t 20). (B): 随机系统(3.1.20) (σ = 0.3). (C): 随机系统(3.1.21) (σ = 5). (D): 随机系 统(3.1.23) (σ = 0.5). {fig:sw-sim} § 3.1.4 Noise induce switches–intrinsic noise 上面的例子介绍了外部噪声诱导switches 的例子, 下面介绍内部噪声诱导switches 的例子([26]). 相互抑制的基因调控网络可以用化学反应方程描述为 ˙ gA (1 − [rB ]) − dA [A] − α0 [A](1 − [rA ]) + α1 [rA ], [A] = ˙ gB (1 − [rA ]) − dB [B] − α0 [B](1 − [rB ]) + α1 [rB ], [B] = (3.1.24) {eq:3:brepressor α0 [A](1 − [rA ]) − α1 [rA ], [rA ] ˙ = α0 [B](1 − [rB ]) − α1 [rB ], [rB ] ˙ = 23
  • 29. 系统生物学数学基础 图 3.6: Mutual repression circuit. {fig:brepressor} 这里gX , X = A, B 为蛋白质X 的最大产生率, dX 是相应的降解率. 为简单期间, 我们忽略mRNA 阶 段, 把转录和翻译过程统一看成是蛋白质的合成过程. 我们以[rX ] 表示与蛋白质X 结合的基因的相对 浓度. 则rA 表示与蛋白质A 结合的基因, 控制蛋白质B 的合成, rB 表示与蛋白质B 结合的基因, 控制 蛋白质A 的合成. 假定每个基因都是单拷贝的, 因此0 ≤ [rX ] ≤ 1. 参数α0 表示蛋白质与promoter 的 结合率, α1 表示离解率. 通常地, 结合-离解过程相对于其他过程是很快的, 因此有α0 , α1 ≫ dX , gX . 因此, 可以把[rX ] 的 相对与时间的导数假定为零, 由此可以得到[rX ] 与[X] 的关系, 得以下方程 ˙ gA /(1 + k[B]) − dA [A], [A] = (3.1.25) {eq:3:bre1} ˙= gB /(1 + k[A]) − dB [B], [B] 这里k = α0 /α1 是蛋白质得表达强度. 由常微分方程描述的上述方程只有一个平衡点. 例如, 当gA = gB = g 和dA = dB = d 时, 平衡解 由 1 + 4kg/d − 1 [A] = [B] = 2k 给出. 为了考虑随机效应, 我们使用Master 方程来描述上面系统. 令P (NA , NB , rA , rB ) 表示细胞在时 刻t 有NX 个自由的蛋白质X 和rX 个结合的抑制子的概率, 这里NX = 0, 1, 2, · · · , rX = 0, 1. 则上面 系统可以用Master 方程描述为 ˙ gA δrB ,0 P (NA − 1, NB , rA , rB ) + gB δrA ,0 P (NA , NB − 1, rA , rB ) P (NA , N, rA , rB ) = + dA (NA + 1)P (NA + 1, NB , rA , rB ) + dB (NB + 1)P (NA , NB + 1, rA , rB ) − (gA δrB ,0 + gB δrA ,0 )P (NA , NB , rA , rB ) − (dA NA + dB NB )P (NA , NB , rA , rB ) α0 [(NA + 1)δrA ,1 P (NA + 1, NB , 0, rB ) + (NB + 1)δrB ,1 P (NA , NB + 1, rA , 0)] α1 [δrA ,0 P (NA − 1, NB , 1, rB ) + δrB ,0 P (NA , NB − 1, rA , 1)] − α0 (NA δrA ,0 + NB δrB ,0 P (NA , NB , rA , rB ) − α1 (δrA ,1 + δrB ,1 )P (NA , NB , rA , rB ). (3.1.26) {eq:3:breme} 上述方程可以通过Gillespie 算法求解. 为了分析随机作用的影响, 我们可以计算分布 P (NA , NB ) = P (NA , NB , rA , rB ) rA ,rB 与参数的关系. 在计算模拟中, 选取堆成参数gA = gB = g = 0.05(s−1 ) 和dA = dB = 0.005(s−1 ). 并 且, 我们比较弱抑制作用(α0 = 0.005, α1 = 1.0, k = 0.005) 和强抑制作用(α0 = 1.0, α1 = 0.02, k = 50) 的情况. 计算结果如图3.7 所示. 计算结果表明, 对于若反馈, 系统只有一个稳定平衡态, 不可能发生转 态转移. 对于强反馈, 系统有三个可能的状态, 分别对应于A 占优, B 占优, 和互相抑制. 因此, 在一定 条件下, 可以发生状态之间的转移(Fig. 3.8). 这个就是内部噪声诱导转代转移的机制. 24
  • 30. 系统生物学数学基础 (A) (B) 图 3.7: The probabilities P (NA , NB ) for the switch, under condition of (A) weak repression (k = 0.005) where there is one symmetric peak and (B) strong repression (k = 50) where three peak appear, one dominated by A, the second dominated by B, and the third in which both species are mutually suppressed. [26] {fig:intrinsicsw 25 ’md2.dat’ using 1:2 20 15 [A] 10 5 0 0 50000 100000 150000 200000 250000 Time (t) 25 ’md2.dat’ using 1:3 20 15 [B] 10 5 0 0 50000 100000 150000 200000 250000 Time (t) 图 3.8: The population of unbound A and B proteins vs time, obtain from Gillespie simulations of the switch with parameters g = 0.05, d = 0.005, α0 = 1.0, α2 = 0.02. [26] {fig:intrinsicsw 25
  • 31. 系统生物学数学基础 § 3.2 生物振荡 § 3.2.1 Atkinson Oscillator Atkinson Oscillator 的模型如图3.9 所示. 图 3.9: Modules and connectivity for the genetic clock. The top construct contains the gInAp2 pro- moter fused to gInG. Transcription from gInAp2 requires the phosphorylated form of the enhancer binding protein NRI(gInG product). This promoter is repressed by Lac1 binding to 2 perfect lac operator sites O*. The bottom construct contains the gInK promoter. The gInK ˜ prmoter also requires NRIP for activation, however the enhancer binding sites are less peten that thos at gInAp2 (replotted from [5]). {fig:4:atkoscill 令[lacI], [LacI] 分别为LacI 的mRNA 和蛋白质LacI 的浓度, [nri], [NRI] 分别为NRI 的mRNA 和 蛋白质的浓度, 并记磷酸化NRI-P 的浓度为[NRI − P], 则上述模型可用下面的常微分方程模型描述: d[lacI] f1 ([NRI − P]) − δ1 [lacI] = dt d[LacI] λ2 [lacI] − δ2 [LacI] = dt d[nri] (3.2.27) {eq:4:atk1} f2 ([NRI − P])f3 ([LacI]) − δ3 [nri] = dt d[NRI] λ4 [nri] − δ4 [NRI] − k1 [NRI] + k−1 [NRI − P] = dt d[NRI − P] k1 [NRI] − k−1 [NRI − P] − δ5 [NRI − P]. = dt 这里λi 表示mRNA 翻译成蛋白质的反应速率, δi 表示分子的降解和稀释的速率常数, k1 和k−1 表 示NRI 的磷酸化和去磷酸化的反应速率. 函数fi 表示蛋白质对基因活性的调控, 分别定义如下: ([NRI − P]/K1 )n1 f1 ([NRI − P] = α1,0 + α1,1 1 + ([NRI − P/K1 )n1 ([NRI − P]/K2 )n2 f2 ([NRI − P]) = α2,0 + α2,1 1 + ([NRI − P/K2 )n2 1 f3 ([LacI]) = α3,1 . 1 + (LacI/K3 )n3 这里磷酸化过程相对与mRNA 的转录和翻译是快过程, 可以通过拟平衡假设, 即令 d[NRI − P]/dt = 0 26
  • 32. 系统生物学数学基础 得到关系 k1 [NRI − P] = keq [NRI], keq = . k−1 + δ5 另外, 我们引入下面无量纲化变量: [lacI] [LacI] [nri] [NRI] ˜ x1 = , x2 = , x3 = , x4 = , t = δ2 t (3.2.28) {eq:4:atk2} δ2 K3 /λ2 K3 (δ4 + δ5 keq )(K1 /keq )/λ4 K1 /keq 并且引入参数 δ1 δ3 (δ4 + δ5 keq ) β1 = , β3 = , β4 = δ2 δ2 δ2 α1,1 α2,1 K2 α1 = , α2 = ,a = α1,0 α2,0 K1 α1,0 λ2 λ4 keq α2,0 α3,1 λ1 = , λ3 = , δ1 δ2 K 3 δ3 (δ4 + δ5 keq )K1 可以得到下面的无量纲化方程(这里还以t 记无量纲化时间) xn1 dx1 4 − x1 = β1 λ1 1 + α1 1 + xn1 dt 4 dx2 x1 − x2 = dt (3.2.29) {eq:4:atk3} (x4 /a)n2 dx3 1 − x3 = β3 λ3 1 + α2 1 + xn3 1 + (x4 /a)n2 dt 2 dx4 β4 (x3 − x4 ). = dt 图3.10 给出了模拟结果. 可以看到, 在一定条件下, 我们得到了周期变化蛋白质表达水平. x2 t x4 t 2.5 35 30 2.0 25 1.5 20 15 1.0 10 0.5 5 t t 20 40 60 80 100 20 40 60 80 100 (B) (A) 图 3.10: Atkinson oscillator 计算模拟结果. 这里的无量纲参数为: β1 = β3 = 30.0, β4 = 1.0, λ1 = λ3 = 2.0, α1 = α2 = 20.0, α3 = 1.0, a = 1.0, n1 = 4, n2 = 5, n3 = 1, xi (0) = 0.0. {fig:4:atk1} 为了分析周期解的产生机制, 我们把上述方程进一步简化. 这里mRNA 的转录都是快过程, 因此 上面方程中可以近似认为 dx1 /dt = dx3 /dt = 0. 由此, 可以把方程简化成二阶平面系统 xn1 dx2 4 − x2 = λ1 1 + α1 1 + xn1 dt 4 (3.2.30) {eq:atk:4} (x4 /a)n2 dx3 1 − x4 . = λ3 1 + α2 1 + (x4 /a)n2 1 + xn3 dt 2 为方便起见, 下面去n3 = 1. 上述系统的平衡点由曲线 xn1 4 x2 = λ1 1 + α1 1 + xn1 4 27
  • 33. 系统生物学数学基础 和 (x4 /a)n2 λ3 −1 x2 = 1 + α2 1 + (x4 /a)n2 x4 的交点给出. 根据参数的不同取值, 系统可以有一个, 两个或者三个平衡点. 平衡点的稳定性也和系统 的参数有关. 特别地, 当系统只有一个参数, 平且是不稳定时, 就会出现稳定的周期解. 下面的图3.11 给出了几种情况下的解. x2 t x4 t x2 1.4 40 20 1.2 1.0 30 15 0.8 20 10 0.6 0.4 5 10 0.2 x4 1 2 3 4 5 t t 20 40 60 80 100 20 40 60 80 100 (A) (A”) (A’) x2 t x4 t x2 2.5 35 40 30 2.0 25 30 1.5 20 15 20 1.0 10 0.5 10 5 x4 1 2 3 4 5 t t 20 40 60 80 100 20 40 60 80 100 (B) (B”) (B’) x4 t x2 t x2 4.0 40 3.5 35 30 3.0 2.5 30 20 2.0 x4 t 1.5 1 2 3 4 5 20 40 60 80 100 t 20 40 60 80 100 (C) (C’) (C”) x2 t x4 t x2 2.0 40 0.20 1.5 0.15 30 1.0 0.10 20 0.5 0.05 x4 1 2 3 4 5 t t 20 40 60 80 100 20 40 60 80 100 (D) (D”) (D’) 图 3.11: 不同的参数值所对应的动力学行为. (A): n2 = 4, α2 = 10.5; (B): α2 = 20, n2 = 5; (C) λ3 = 0.5, α2 = 100, n1 = 4, x2 (0) = 30.0, x4 (0) = 4.0, x1 (0)x3 (0) = 0; (D): 参数值同(C), 初值 为xi (0) = 0.0 其他参数同图3.10 所给出. {fig:4:atk2} § 3.2.2 A synthetic gene-metabolic oscillator 基因代谢振子模型如图3.12 所示. 输入代谢物M1 , 则酶E1 可以把M1 转化为M2 . 随着代谢物M2 的增加, 酶E1 被抑制, 另外, 酶E2 被M2 所激活. 因为酶E2 的作用, 代谢物M2 转变M1 . 这样就形成 一个循环. 这个振子可以通过Escherichia coli来实现[15](图3.13). Such a conceptual design was realized using the acetate pathway in E. coli(Fig. 3.13). The M1 pool is acetyl coenzyme A (acetyl-CoA) and the M2 pool consists of acetyl phosphate (AcP), acetate (OAc− ) and the protonated form acetate (HOAc). Acetyl-CoA is a metabolic product of sugar, fatty acids and some amino acids, and is the entry point into the tricarboxylic acid (TCA) cycle (三羧 酸循环). Acetyl-CoA is concerted to acetyl phosphate in E. Coli by phosphate acetyltransferase (Pta), which corresponds to enzyme E1 in Fig. 3.12, and then to acetate by acetate kinase (Ack). 28
  • 34. 系统生物学数学基础 The protonated form of acetate is permeable across the cell membrane. Under aerobic conditions, acetyl-CoA is further oxidized in the TCA cycle. The remaining flux goes to produce either acetate in the TCA cycle. The remaining flux goes to produce either acetate or ethanol. In wild-type E. coli, the enzyme acetyl-CoA synthetase (Acs) is induced in the presence of acetate. However, such induction is under catabolite repression by glucose in the wild-type strain so as to avoid futile cycling. In our design, acetyl-CoA synthetase is used as enzyme E2 in Fig. 3.12. Thus, both phosphate acetyltransferase and acetyl-CoA synthetase need to be re-wired to respond to the M2 pool. (A) (B) 图 3.12: Conceptual diagram of the oscillatory dynamics, highlighting the two metabolite pools (M1 and M2 ) and their controls. Solid lines indicate metabolic fluxes. Dashed lines indicate positive (arrow) and negative (blunt bar) transcriptional or translational regulation(ref. [15]). {fig:4:metabolic 上述模型可以用下面的常微分方程系统来描述. 代谢物(AcCoA, AcP, OAc−1 , HOAc) 的浓度的 变化满足方程 dAcCoA = VAcs − VPta + Vgly − VTCA dt dAcP = VPta − VAck dt (3.2.31) {eq:4:met1} −1 dOAc = VAck − VAcE − VAcs dt dHOAc = VAcE − Vout dt 其中Vi 表示化学反应速率, 如表3.1 所示. 这里glycolytic 速率用常数表示. TCA 循环和EtOH 与HOAc 的输出流都假设为关于AcCoA 和HOAc 是一阶的. 酶催化流Pta, Ack 和Acs 都假定为是Michaelis- Menten 形式的. 另外, 三种关键蛋白质LacI, Pta 和Acs 的浓度的变化由下面方程给出: dLacI RLacI − Rd,LacI = dt dPta (3.2.32) {eq:4:met2} RPta − Rd,Pta = dt dAcs RAcs − Rd,Acs = dt 这里R 表示蛋白质的合成率, Rd 表示降解率. 这里蛋白质的合成包括mRNA 转录和翻译, 通过Hill 方 程描述, 而降解(或者因为细胞生长因此的浓度稀释)用一阶动力学描述(表3.1). 方程的解如图3.14 所 示. 由计算结果可以看到, 代谢物的周期振荡可以由糖醇解率Vgly 的增加而激发. 当Vgly 小时, 系统达 到平衡态, 没有振荡解, 而当Vgly 大时, 系统的平衡态失去稳定性, 出现周期振荡解. § 3.2.3 Mechanisms of noise-resistance in genetic oscillators 这里介绍一种随机激励振子. 振子的模型如图3.15 所示. 这个模型包含激活子和抑制子. 这一基 因调控网络包含两个基因, 一个激活子A 和一个抑制子R. 激活子A 与A 和R 的启动子结合, 提高相应 的基因转率效率. R 可以和A 结合称为复合物, 从而分离激活子A. 这样, R 起抑制的作用. 29
  • 35. 系统生物学数学基础 图 3.13: Biological realization of the conceptual design in Fig. 3.12. The yellow boxes highlight the two metabolic pools, M1 and M2 . Ack, acetate kinase (醋酸盐激酶); Acp, acetyl phosphate (乙酰 磷酸盐); Acs, acetyl-Coa synthetase; OAc− , acetate(乙酰); Pta, phosphate acetyltransferase. (adopt from [15]) {fig:4:ecolisuga Vgly 0.001 Vgly 0.01 Metablite concentrations Metablite concentrations AcP AcP 0.1 0.1 0.001 0.001 AcCoA AcCoA 5 5 10 10 7 7 10 10 t t 500 1000 1500 2000 2500 3000 100 200 300 400 500 Vgly 0.05 Vgly 0.5 Metablite concentrations Metablite concentrations 10 AcP 0.1 1 AcP 0.1 0.001 AcCoA AcCoA 0.01 5 10 0.001 t t 100 200 300 400 500 100 200 300 400 500 图 3.14: Computational characterization of the metabolator. The metabolator is prone to oscillate at increasing glycolytic rates Vgly . Vgly in the four panels (from left to right) are 0.001, 0.01, 0.05 and 0.5.(replot from [15]) {fig:4:meta2} 30
  • 36. 系统生物学数学基础 Rate expression Parameters S0 = 0.001 · · · 0.5 Glycolytic flux, Vgly Vgly = S0 Flux to TCA cycle and VTCA = kTCA AcCoA kTCA = 10 EtOH production, VTCA k1 Pta · AcCoA Pta flux, VPta VPta = k1 = 80, Km,1 = 0.06 Km,1 + AcCoA k2 Acs · OAc−1 Acs flux, VAcs VAcs = k2 = 0.8, Km,2 = 0.1 Km,2 + OAc−1 Flux for the reaction Ack VAck = kAck,f AcP − kAck,r OAc−1 kAck,f = 1, kAck,r = 1 OAc−1 AcP Acid-base equilibrium for VAcE = C(AcP · H+ − Keq OAc− ) C = 100, H+ = 10−7 , Keq = 10−4.5 acetic acid, VAcE HOAc intercellular Vout = k3 (HOAc − HOAcE ) k3 = 0.01, HOAcE = 0 transport rate, Vout n α1 (AcP/Kg,1 ) LacI synthesis rate, RLacI RLacI = + α0 α1 = 0.1, Kg,1 = 10, n = 2, α0 = 0 1 + (AcP/Kg,1 )n n Kg,2 = 10, n = 2, α0 = 0, α2 (AcP/Kg,2 ) Acs synthesis rate, RAcs RAcs = + α0 1 + (AcP/Kg,2 )n α2 = 2 Kg,3 = 0.001, n = 2, α0 = α3 Pat synthesis rate, RPta RPta = + α0 1 + (LacI/Kg,3 )n 0, α3 = 2 Degradation rate Rd,X , Rd,X = kd X kd = 0.06 (X = LacI, Acs, Pta) 表 3.1: Rate expression and values used for parameters[15] {tab:4:met1} 图 3.15: Biochemical network of the circadian oscillator model.(replot from [37]) {fig:4.circadian 31
  • 37. 系统生物学数学基础 上述系统可以用确定性动力学系统描述为 ′ θA DA − γA DA A dDA /dt = ′ θR DR − γR DR A dDR /dt = ′ ′ γA DA A − θA DA dDA /dt = ′ ′ γR DR A − θR DR dDR /dt = ′ ′ αA DA + αA DA − δMA MA dMA /dt = (3.2.33) {eq:4:osc3} ′ ′ dA/dt = βA M A + θ A D A + θ R D R − A(γA DA + γR DR + γC R + δA ) = α′ DR + αR DR − δMR MR ′ dMR /dt R = βR MR − γC AR + δA C − δR R dR/dt = γC AR − δA C. dC/dt ′ DA and DA denote the number of activator genes with and without AA bound to its promoter ′ respectively; similarly, DR and DR refere to the repressor promoter; MA and MR denote mRNA of A and R; A and R correspond to the activator and repressor proteins; and C corresponds to the inactivated complex formed by A and R. The constants α and α′ denote the basal and activated rates of transcription, β the rates of translation, δ the rates of spontaneous degradation, γ the rates of binding of A to other components, and θ denotes the rates of unbinding of A form those components. The cellular volume is assumed to be the unity so that concentration and number of molecules are equivalent. Notice that we assume that the complex breaks into R because of the degradation of A, and therefore, the parameter δA appears twice in the model. 模型的计算模拟结果如图3.16 所示. Concentrations 1500 1000 500 t 100 200 300 400 500 (A) (B) 图 3.16: Oscillations in repressor and activator protein numbers obtained from numerical simulations of the deterministic (A) and stochastic (B) descriptions of the model. The values of reac- tions rates are: αA = 50h−1 , αA = 500h−1, αR = 0.01h−1 , α′ = 50h−1 , βA = 40h−1 , βR = ′ ′ R −1 −1 −1 −1 −1 −1 −1 5h , δMA = 10h , δMR = 0.5h , δA = 1h , δR = 0.2h , γA = 1mol h , γR = 1mol−1 h−1 , γC = 2mol−1 h−1 , θA = 50h−1 , θR = 100h−1 . The initial conditions are ′ DA = DR = 1mol, DA = DR = MA = MR = A = R = C = 0, which require that the cell has ′ ′ single copy of the activator and repressor genes: DA + DA = 1mol and DR + DR = 1mol. [37] {fig:4.circadian 为研究上述振荡现象的形成机理, 下面来把系统简化. 我们所研究的系统包含有快和慢过程. 把 快慢过程分别处理, 并且把快过程用拟平衡态来近似是常用的简化系统的方法. 在本系统中, promoter 的状态改变(通过promoter 与激活子A 的结合和解离)是快过程(θA = 50h−1 , θR = 100h−1). 基因的 转录过程也是快过程(αA = 50h−1 , α′ = 500h−1 , αR = 0.01h−1, α′ = 50h−1 ). 因此, 可以把激活 A R 的promoter 的个数和mRNA 的个数都认为是常数, 即方程(3.2.33)中令 ′ ′ dDA dDR dDA dDR dMA dMR = = = = = = 0. dt dt dt dt dt dt 32
  • 38. 系统生物学数学基础 由此, 可以求解出一下关系: θA θR DA = , DR = θA + γA A θR + γR A γA A γR A ′ ′ DA = , DR = (3.2.34) {eq:4:osc3-equi1 θA + γA A θR + γR A 1 α′ γA A + αA θA 1 α′ γR A + αR θR A R MA = , MR = . δMA θA + γA A δMR θR + γR A 另外, 由于蛋白质A 与promoter 的结合是很快的过程, 也可以认为A 的浓度很快可以达到平衡, 即 dA = 0. dt 由此可以得到 1 α′ γA + αA θA βA A A= . (3.2.35) {eq:4:osc3-equi2 γC R + δA δMA θA + γA A 代入上面的关系, 可以求解出 1 1 ˜ A = A(R) = (α′ ρ(R) − Kd ) + (α′ ρ(R) − Kd )2 + 4αA ρ(R)Kd (3.2.36) {eq:4:osc3-equi3 A A 2 2 其中 βA ρ(R) = , Kd = θA /γA . δMA (γC R + δA ) 最后, 我们可以得到两个慢变量的自治系统  ˜ βR αR θR + α′ γR A(R)  dR ˜ R − γC A(R)R + δA C − δR R =  ˜  dt δMR θR + γR A(R) (3.2.37) {eq:4:osc3-slow}  dC ˜ = γC A(R)R − δA C   dt 图3.17 给出了简化方程的数值解, 其中参数值和前面一样, 我们可以看到, 简化方程的解与原来 的方程是一致的, 除了每个循环的最大值和周期. 因此, 我们可以相信这个简化方程可以帮助我们了解 循环产生的内部机制. Concentrations Concentrations 1500 2000 1500 1000 1000 500 500 t t 50 100 150 200 50 100 150 200 (A) (B) 图 3.17: 计算模拟结果: (A) 完整系统, (B) 简化系统. {fig:4.simplify} 方程(3.2.37) 是一个二阶自治系统. 对该方程的定性分析, 可以使用常微分方程的通用方法. 特别 地, 因为分子个数不可能是负的, 也不可能是无穷大, 上述方程的解一定是有界的(思考: 如果在数学上 严格证明这个结论?). 另外, 二阶自治系统的解曲线在相平面内不可能和自己相交. 因此, 改系统的解 或者收敛到周期解, 或者收敛高不动点. 系统的不动点可以由下面条件给出: dR/dt = dC/dt = 0, 即求解方程 ˜ βR αR θR + α′ γR A(R) ˜ R = δR R, C = (γC /δA )A(R)R. ˜ δMR θR + γR A(R) 33
  • 39. 系统生物学数学基础 在上面参数条件下, 上面的平衡方程有唯一的正解, 记为(R∗ , C ∗ ). 因此, 如果该平衡点不稳定, 则系统 一定有稳定的极限环, 即周期解. 在我们所研究的参数条件下, 平衡解为 (R∗ , C ∗ ) = (66.7491, 363.47). 对应于平衡点的线性化矩阵的特征值为 λ1,2 = 0.405797 ± 0.5565i. 因此, 特征值有正实部, 对应的平衡点是不稳定的. 这样, 我们证明了在一定条件下, 可以出现稳定的振 动状态. 平衡点的稳定性可以通过平衡点处的线性化矩阵的秩来刻划. 特别地, 当线性化矩阵的秩大于零 时, 对应的特征值具有正实部. 对上面的例子, 平衡点处的线性化矩阵所对应的秩为 ˜ ∂ A(R∗ ) βR (α′ − αR )θR γR ˜ R − γC R∗ − (γC A(R∗ ) + δR + δA ). τ= ˜ ∂R δMR (θR + γR A(R))2 当τ 0 时, 相应的平衡点是不稳定的. 对于我们所计算的参数值, 有τ = 0.811594 0. 因此, 平衡点 是不稳定的. 可以证明, 保证平衡点不稳定的参数范围是比较大的. 例如, 如果同时改变θA 和θR : (θA , θR ) → (KθA , θR ) 当0.024 K 10.7 时, 都有τ 0 (图3.18). 所有的转录率(α 和α′ ) 都乘K 0.08 倍, 或者蛋白质 和mRNA 的降解率都乘0.0009 K 3.5 倍时, 都可以保证τ 0. 因此, 在这里所讨论的基因调控网 络中, 允许周期振荡的结果并不限于特殊选择的参数值, 而是对比较大范围内选取的参数值都可以满 足. 系统的动力学行为的向量场分析如图??(A) 所示. 由此可以分析出振荡出现的内部机制. Τ 1.0 0.5 K 2 4 6 8 10 12 14 0.5 1.0 图 3.18: τ 与K 的依赖关系. {fig:4.cirosciro 如果平衡点时稳定的, 不能确定是否存在稳定的极限环. 特别地, 在一定条件下, 确定性方程只有 一个平衡点, 因此不可能出现振荡解. 但是, 当有随机因素时, 平衡态可以因为随机因素的干扰而变得 不稳定. 此时, 平衡态可以被激发到失稳的状态, 而出现由于随机激发所引起的周期振荡(如图3.20). 随 机激发出振荡的机制如图3.19(B) 所示. § 3.2.4 振 荡 的 同 步 前面介绍了几种单细胞基因调控网络引起振荡的例子. 然而, 在生物系统中, 通常需要不同细胞的 振子同步振动, 例如生命节律的周期振动. 这一节介绍振荡同步的机制. 振荡的同步可以通过不同的机制实现, 例如细胞间的通讯, 外界激励等. 细胞间的通讯已经在很多 文献中介绍过. 这一节中, 我们介绍一个通过外界激励引起振荡同步的例子. 34
  • 40. 系统生物学数学基础 (B) (A) 图 3.19: 简化方程的向量场分析图示([37]). {fig:4:cirophase R 2000 1500 1000 500 t 100 200 300 400 500 (A) (B) 图 3.20: 计算模拟结果: (A) 确定性系统, (B) 随机模型. 这里δR = 0.005, 其他参数和前面一样. {fig:4:noise-osc 35
  • 41. 系统生物学数学基础 考虑图3.21 所考虑的例子. 在这个例子中, 每个细胞包含一个由三个抑制子组成的循环抑制调控 网络, 其中蛋白质LacI 抑制基因tetR 的promoter, 而蛋白质TetR 抑制基因cI 的promoter, 蛋白质CI 由抑制lacI 的promoter. 这样的机制可以产生周期振动. 在我们所考虑的系统中, 有N 个细胞, 每个细 胞包含相同的振子(基因调控网络和相应的参数都相同). 所以, 我们有N 个振子. 但是, 这些振子的相 位并不相同. 在这个例子中, 不同的细胞收到公共的外界刺激(AI), 我们将看到, 当外界的刺激满足一 定的条件时, 这些振子可以达到同步振动. 图 3.21: The schematic diagram of a synthetic gene regulatory network. {fig:5:syn1} 以xk , yk , zk 分别表示第k 个细胞中基因lacI, tetR, cI 所转录出来的mRNA 的浓度, Xk , Yk , Zk 第k 个细胞中的蛋白质LacI, TetR 和CI 的浓度. 以A 表示外界刺激AI 物的浓度. 上面的系统可以用 下面方程组表示 dxk α γk A dXk −xk + = β(xk − Xk ), = n + 1 + A, dt 1 + Yk dt dyk α dYk −yk + = β(yk − Yk ), = n, (3.2.38) {eq:4:syn1} dt 1 + Zk dt dzk α dZk −zk + = β(zk − Zk ). = n, dt 1 + Xk dt 在这里, 蛋白质对promoter 的抑制作用都通过Hill 函数表示, 环境的刺激通过Michaels-Menten 函数表 示. 所有mRNA 的降解率都相同, 这里通过选取适当的单位, 可以设为1. 另外, 假定所有蛋白质的生成 率和降解率都相同. 刺激物AI 的浓度的变化包括合成和降解两部分. 另外, 还有细胞外的刺激G(t): dA = λ − kA A + G(t). (3.2.39) {eq:5:syn2} dt 我们考虑三种形式的刺激: • 周期激励: G(t) = σ sin(ωt); • 高斯白噪声激励: G(t) = σξ(t), 满足 ξ(t) = 0, ξ(t)ξ(t′ ) = δ(t − t′ ); ∞ σj δ(t − tj ), 其中tj = jτ , τ 表示脉冲周期, σj 以概率1/2 取值σ 或 • 周期脉冲激励: G(t) = j=1 者−σ. 36
  • 42. 系统生物学数学基础 如果没有外界的刺激, 所有振子以相同的频率振动, 但是振动的相位不相同(图3.22). 为研究同步 性, 我们引入序参数 N 1 R(t) = wk exp (iθk (t)) , (3.2.40) {e33} N k=1 N ˙ ˙ 这里θk 表示第k 个振子的相位, ωk = |θk (t)/ n=1 |θk (t)| 表示第k 个振子的权重, i 为虚数单位. 这里 引入权重因子wk 是因为在数据采样时, 因为振子在不同的相位具有不同的速度, 因此数据并不是在所 有相位上均匀的. 根据上面的定义, R = 1 表示N 个振子完全同步, R = 0 表示完全不同步, 0 R 1 表示部分同步. 在具体计算上面的序参数时, 如何计算相位θ 是关键. 下面给出一个方法. 例如, 我们的 计算结果Z(t) 是周期解, 周期为T = 2π/ω, 则相位可以定义为 ¯ Z(t) = Z + r(t) cos(θ(t)), ¯ ˜ ¯ 其中Z 为Z(t) 的平均值, r(t) 表示振子在时刻t 的振幅. 令Z = Z − Z, 则 ˙ ˜˙ ˙˙ ˜ Z − iZ/θ = r(t) exp(iθ(t)) − i(r/θ) cos θ. ˙ ˙˙ 设θ ∼ ω, 并且假设r(t) 是慢变量, i.e., r ≫ |r/θ|, 则有 ˙ ˜ ˜ r(t) exp(iθ(t)) ∼ Z − iZ/ω, 即有 ˙ ˜ ˜ Z − iZ/ω exp(iθ(t)) ∼ . ˙ ˜ ˜ |Z − iZ/ω| 因此, 序参数可以通过下面公式计算: ˙ N ˜ ˜ Zk (t) − iZk (t)/ωk 1 R= , (3.2.41) {eq:33-1} ˙ N ˜ ˜ k=1 |Zk (t) − iZk (t)/ωk | ˜ ¯ 其中Zk (t) = Zk (t) − Zk , ωk 是第k 个振子的频率. (a) (b) 1000 250 t=100 t=2000 800 200 Number of cells Number of cells 600 150 400 100 200 50 0 0 0.4 0.5 0.6 0.7 −2 0 2 4 6 8 Frequency Phase 图 3.22: When no stimulus is presented, the cells oscillate with the same frequency (a) with different phases (b). Without stimulus, the distribution of the phases of the oscillators is invariant over time (b), and thus the system fail to synchroniszated. The parameters used in the simulation are: N = 1000, α = 216.0, γ = 2.0, β = 2.0, γ = 1.0, λ = 1.0, n = 2.0. The intrinsic frequency for the oscillators with above parameters is estimated as ω0 ≈ 0.54. {fig:4:f9} 当细胞外刺激是周期刺激时, 根据数值模拟结果, 当外界刺激的频率和细胞的内在频率相同时, 系 统可以达到很好的同步性. 并且, 在共振时, 序参数与刺激的强度并没有太大的关系. 当外界刺激的频 率和细胞的内在频率是次谐共振时, 可以达到部分同步(图3.2). 37
  • 43. 系统生物学数学基础 (a) (b) 1000 120 t=20 t=2000 100 800 Number of cells 80 600 TetR 60 400 40 200 20 0 0 −2 0 2 4 6 8 50 100 150 200 Phase t (min) (c) (d) 1 1 σ=0.2 σ=0,4 0.8 0.8 σ=0.6 σ=0.8 0.6 0.6 σ=1.0 R R 0.4 0.4 0.2 0.2 0 0 0.4 0.45 0.5 0.55 0.6 0.65 0 0.2 0.4 0.6 0.8 1 ω ω 图 3.23: The synchronization in the present of sinusoidal periodic stimulus. When the stimulus with resonance frequency is presented (σ = 0.8, ω = 0.54), the initial phase space is reduced to a single phase for all cells and thus the system is completely synchronizated (a). (b) shows the time evolutino of the TetR concentations of 10 cells. The oscillations with different initial phase are synchronizated under stimulus for less than 200 minutes. (c) shows the synchronization effect of the sitmulus with strength vary from 0.2 to 1.0. It’s evident that the strength only have marginaly effect for the synchronization in the case of resonance. (d) shows the synchronization effect for different value of frequency (σ = 0.8 and ω is vary from 0 to 1.2). The result suggest that the system has partly synchronization in the case of subharmonic resonance. Other parameters used in the simulation were given at Figure 3.22. In (c) and (d), the order parameters R are calculated as the average over the time interval 1800 ≤ t ≤ 2000]. {fig:4:syn1} ω/ω0 control 1/3 1/2 2/3 1 2.0 ¯ R 0.1 0.56 0.99 0.41 1.00 0.64 ¯ 表 3.2: The synchronization under subharmonic stimulus. Here the value R is the averge of order parameter over 1800 ≤ t ≤ 2000. The control vaule is taken as order parameter for the system without stimulus. {tab:4:syn1} 38
  • 44. 系统生物学数学基础 在白噪声激励的情况下, 数值模拟的结果显示系统总能达到同步, 达到同步所需的时间与刺激强 度有关. 强度越小, 所需时间越长(图3.24). 在给定的时间t, 序参数关于刺激强度的增加而增加. 通过 与计算数据的模拟, 可以得到关系 1 Rσ (t) = , (3.2.42) {eq:4:fit1} 1 + exp[a(t) − b(t)(1 + σ 2 )] 其中a(t), b(t) 依赖于时间t. 在这里的计算结果中, 有a ≈ 6.10, b(t) 线性依赖与时间t: b(t) ≈ 3.68 + 0.56 × 10−3 t. (3.2.43) {eq:4:fit2} 根据上面的关系, 可以得到序参数参数大于临界值Rc 所需要的刺激时间为 1 − Rc 1 × 103 min. Tσ ≈ 10.89 − 1.79 × ln (3.2.44) {eq:fit3} 1 + σ2 Rc 在周期脉冲刺激的情况下, 当脉冲周期与振子的内部周期一致(共振)时, 系统可以被同步(图3.25). 前面我们考虑了全同振子的同步问题. 下面, 我们看如果振子间的参数有差异时的同步情况. 这 里, 我们令各振子的参数β 是均值为 β , 方差为∆β 的正态分布. 这里考虑周期激励的情况. 序参数和 方差∆β 的关系如图3.26 所示. 我们可以看到, 当∆β 从0 到1.0 变化时, 序参数是单调下降的, 并且在 非全同振子的情况, 只能达到部分同步. § 3.2.5 常 微 分 方 程 定 性 分 析 下面定理是判定稳定极限环的存在性的重要结果: 庞卡莱环域定理 设G 是由内外边界曲线Γ1 和Γ2 围成的环形区域, 当t 增加时, 平面多项式系统 dx1 dx2 = X1 (x1 , x2 ), = X2 (x1 , x2 ) (3.2.45) {eq:4:system} dt dt 的轨线在Γ1 和Γ2 上都是有外向内(或由内向外), 且在G 内没有奇点, 则在G 内至少存在一个外侧稳 定(或不稳定)极限环和一个内侧稳定(或不稳定)极限环. 如果系统中的函数X1 和X2 是解析的, 则至少 存在一个稳定(或不稳定) 极限环. 设方程(3.2.45) 在某平衡点(x∗ , x∗ ) 处的线性化矩阵为 1 2 a11 a12 A= a21 a22 则 ∂Xi (x∗ , x∗ ) 1 2 aij = . ∂xj 另 p = −tr(A) = −(a11 + a22 ), q = det(A) = a11 a22 − a12 a21 , 则矩阵A 的特征值为 p2 − 4q −p ± λ1,2 = . 2 有以下结论: 1. 如果p 0, 则平衡点是不稳定的. 2. 如果p 0 且q 0, 则平衡点是稳定的. 3. 如果p 0 且q 0, 则平衡点是不稳定的. 39
  • 45. 系统生物学数学基础 (a) (b) 0.9 1 0.8 0.8 0.7 0.6 0.6 R R 0.5 0.4 0.4 σ=0.7 0.2 σ=0.8 0.3 σ=0.9 0.2 0 0 0.5 1 1.5 2 0 500 1000 1500 2000 t (min) t (min) 4 x 10 (c) (d) 1 8 a(t) b(t) 0.8 7 0.6 6 R 0.4 5 0.2 4 0 3 0 0.2 0.4 0.6 0.8 1 800 1000 1200 1400 1600 1800 2000 σ t (min) 图 3.24: Synchronization in the present of white noise stimulus. (a) shows the time evlution of order parameter of the system under the white noise stimulus with σ = 0.2. It suggest that a weak weak is able to synchronizate the oscillators. (b) shows the time evlution of order parameters under the white noise stimulus with different values of the variance (σ = 0.7, 0.8, 0.9). It shows that the time it takes the sytem to archive the complete synchronizated depends on the variance σ 2 . For different value of σ that vary from 0 to 1.0, the order parameter of the system at time t = 2000 is shown at (c). In general, the order parameter at a fix time is increase with respect to σ. The dashed line shows that fitting curve by function (??) with a = 6.53, b = 5.03. The order parameter Rσ (t) at any time t can be approximated by function (3.2.42), with coefficients a(t) and b(t) given by (d). When the time t is large, a(t) approach constant limits a ≈ 6.10, and b(t) depends on the time t linearly. The dashed line represent the fitting curve of b(t) by (3.2.43). The parameters used in this simulation are given at Figure 3.22. {fig:4:f5} 40
  • 46. 系统生物学数学基础 1 σ=1000 σ=2000 0.9 0.8 0.7 0.6 R 0.5 0.4 0.3 0.2 0.1 0 5 6 7 8 9 10 11 12 13 14 15 τ 图 3.25: The order parameter for 1000 cells with period τ varies from 5 to 15, and different values of σ (red circles for σ = 1000 and blue squares for σ = 2000). {fig:4:f7} 1 Sinusoidal periodic stimulus White noise stimulus 0.9 0.8 0.7 0.6 R 0.5 0.4 0.3 0.2 0.1 0 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 ∆β 图 3.26: The relation between the order parameter and the variability of the cells (measured by ∆β. The parameter used are σ = 0.54 and ω = 0.8 for the sinusoidal periodic stimulus. {fig:4:f8} 41
  • 47. 系统生物学数学基础 § 3.3 生命节律 节律是生命的普遍现象. 很多器官表现出有规律的生理和行为上的以24 小时为周期的周期现象. 在相同的光照和温度条件下, 这些现象的周期大概为一天, 与日照时间基本同步. 从基因调控的层次 上来看, 这些现象是和体内控制人体对外界光照的响应的时钟基因PER 和TIM 联系起来的. 在这一节 中, 我们从基因调控的角度, 建立节律控制的基因调控网络的数学模型, 并且分析这些模型, 讨论节律 振荡的机制. § 3.3.1 Dimerization and proteolysis of PER and TIM 首先, 我们来讨论果蝇的节律控制的基因调控网络(Fig. 3.27). 在这个模型中, 时钟基因所表达的 蛋白质PER 和TIM 形成稳定的聚合物, 调控他们本身的表达. PER 单体可以迅速被磷酸化并且降解, 而PER/TIM 二聚体比较稳定, 不容易降解. 因此, 当PER 的数量比较少时, 很快被降解. 但是, 当PER 的数量比较多时, 倾向于形成二聚体, 而不容易降解. 这样, PER 的降解率与其数量之间满足非线性的 关系. 这里二聚物的作用相当于对PER 的数量有一个正反馈调控. PER 二聚体进一步和蛋白质TIM 结合形成聚和物. 而后, 这个聚合物被传输到细胞核内, 分别与两个基因的promoter 结合, 负调控这些 基因的表达. 图 3.27: A simple molecular mechanism for the circadian clock in Drosophila, adopted from [35]. PER and TIM proteins are synthesized in the cytoplasm, where they may be destroyed by prote- olysis or they may combine to form relatively stable heterodimers. Heteromeric complexes are transported into the nucleus, where they inhibit transcription of per and tim mRNA. We assume that PER monomers are rapidly phosphorylated by DBT and then degraded. Dimers, we assume, are poorer substrateds for DBT. {fig:4:cir1} 上面的机制可以用微分方程描述如下. 首先, 我们作一些简化. 首先, PER 和TIM 的地位是类似 的, 并且在细胞内的变化也大概是同步的的. 因此, 把他们看成统一的时钟基因蛋白. 另外, 我们假定细 胞核与细胞质内聚合物的浓度很快达到平衡, 而不区分细胞核内外的聚合物浓度之间的差别. 这样, 我 们的模型可以简化为三个变量, 分别是mRNA 的浓度M , 单体的浓度P1 , 和集合物的浓度P2 . 模型可 42
  • 48. 系统生物学数学基础 以用下面给的常微分方程描述 dM vm − km M = (3.3.46) 1 + (P2 /Pcrit )2 dt dP1 kp1 P1 2 vp M − − kp3 P1 − 2ka P1 + 2kd P2 = (3.3.47) dt Jp + P1 + rP2 dP2 kp2 P2 2 ka P1 − kd P2 − − kp3 P2 . = (3.3.48) dt Jp + P1 + rP2 这里, 聚合物对时钟基因的表达的影响是有合作效应的( Hill 系数为2). 这里, 单体和复合体都可以 和DBT 结合并且降解, 但是单体的降解率比复合体的降解率大得多(kp1 ≫ kp2 ). 单体与聚合体除 ′ 了通过和DBT 结合降解外, 还有自己得慢降解过程(通过系数kp3 表现出来). 在这里, 方程(3.3.47) 和(3.3.48) 中得Michaelis-Menten 函数表示DBT 催化得降解过程. 可以通过下面得过程推导出来. 这 个过程可以描述为 P1 + DBT ⇆ DBT − P1 → DBT, P2 + DBT ⇆ DBT − P2 → DBT 因此, 令D 表示DBT 的浓度, D1 表示DBT − P1 的浓度, D2 表示DBT − P2 的浓度, 有 dP1 = −k1 P1 D + k−1 D1 (3.3.49) dt dP2 = −k2 P2 D + k−2 D2 (3.3.50) dt dD1 ′ = k1 P1 D − k−1 D1 − k1 D1 (3.3.51) dt dD2 ′ = k2 P2 D − k−2 D2 − k2 D2 . (3.3.52) dt 另外, 有关系 DT = D + D1 + D2 . 因此, 假定降解过程很快, 有 dD1 /dt = dD2 /dt = 0 即可以得到 DT D1 = keq,1 P1 D, D2 = keq,2 P2 D, D = , 1 + keq,1 P1 + keq,2 P2 其中 k1 k2 keq,1 = ′ , keq,2 = k ′. k−1 + k1 −2 + k2 这样, 我们有 ′ dP1 DT k1 P1 =− (3.3.53) dt 1/keq,1 + P1 + (keq,2 /keq,1 )P2 ′ dP2 DT k2 (keq,2 /keq,1 )P1 =− (3.3.54) dt 1/keq,1 + P1 + (keq,2 /keq,1 )P2 比较上面的Michaelis-Menten 函数, 可以得到关系 ′ ′ ′ kp1 = DT k1 , kp2 = DT k2 (keq,2 /keq,1 ), Jp = 1/keq,1 , r = keq,2 /keq,1 . 因此, 条件kp1 ≫ kp2 即 ′ ′ k1 keq,1 ≫ k2 keq,2 , 也即 ′ ′ k1 k1 k2 k2 ′ ≫k ′. k−1 + k1 −2 + k2 43
  • 49. 系统生物学数学基础 mRNA Protein Level mRNA Protein Level 3.5 Protein 3.0 Protein 3.0 2.5 2.5 2.0 mRNA 2.0 1.5 1.5 1.0 mRNA 1.0 0.5 0.5 Time hr Time hr 20 40 60 80 100 20 40 60 80 100 (A) (B) 图 3.28: 数值模拟结果. 这里的参数为: vm = 1, km = 0.1, vp = 0.5, kp1 = 10, kp2 = 0.03, kp3 = ′ 0.1, Pcrit = 0.1, Jp = 0.05, r = 1.2, ka = 800, kd = 4. (A): 完整模型(3.3.46)-(3.3.48). (B): 简 化模型(3.3.56)-(3.3.57). {fig:4:cirsol1} 当k1 ≫ k2 时且k−1 ≪ k1 , k−2 ≪ k2 , 即单体更加容易和DBT 结合, 并且结合都很容易降解, 上面条件 ′ ′ 是满足的. 这样就证明了上面的方程和假设与模型的一致性. 上述模型的数值解如图(3.28)(A) 所示. 我们看到, 在一定的参数条件下, 可以产生周期为24 小时 的节律振荡. 为了分析节律振荡的机制, 我们进一步简化上述模型. 聚合反应相对于基因的表达和示快速化学反应过程(ka 和kd 都很大), 这时, 可以假设2P1 → P2 总能达到平衡. 因此, 令PT = P1 + 2P2 为蛋白质的总数, 则由平衡条件, 可以得到关系 P2 = Keq PT , Keq = ka /kb . 1 记P1 = qPT , P2 = 2 (1 − q)PT , 则有 2 q= . (3.3.55) {eq:4:cirq} 1+ 1 + 8Keq PT 这样, 上面的方程可以简化为下面的两自由度的平面系统 dM vm − km M = (3.3.56) 1 + (PT (1 − q)/(2Pcrit ))2 dt dPT kp1 PT q + kp2 PT = vp M − − kp3 PT . (3.3.57) Jp + qPT + (r/2)(1 − q)PT dt 这里q 有关系(3.3.55) 给出, 并且kp1 = kp1 − kp2 ≈ kp1 . 该系统的数值模拟结果见图3.28(B). ′ ′ 下面对上述系统进行定性分析. 为此, 令 vm kp1 PT q + kp2 PT f (PT ) = , g(PT ) = + kp3 PT . 2 1 + (PT (1 − q)/(2Pcrit )) Jp + qPT + (r/2)(1 − q)PT 则上述系统的平衡点由方程 km M = f (PT ), vp M = g(PT ) 的解给出, 即两条曲线M = f (PT )/km 和M = g(PT )/vp 的交点. 令(M ∗ , P ∗ ) 为响应的平衡点, 则在平 衡点处的线性化矩阵为 −km −f ′ (P ∗ ) A= −g ′ (P ∗ ) vp 当−tr(A) = km + g ′ (P ∗ ) 0 时, 对应的平衡点是不稳定的. 由此, 可以看到, 要想得到不稳定的平衡 点, 我们需要 g ′ (P ∗ ) −km (3.3.58) {eq:4:cond} 即曲线M = g(PT )/vp 在平衡点处的切线斜率比较小(小于零). 不等式(3.3.58) 给出了平衡点不稳定的 充分条件. 如果平衡点是唯一的(这个条件在很到的参数范围内是成立的), 也给出了存在稳定极限环的 充分条件. 一般地, g ′ (P ∗ ) 依赖于系统的参数, 图3.29(A) 给出了与Keq 的依赖关系. 从这个关系可以 看到, 当参数如图3.28 所给出时, 如果Keq 8.3, 则有关系g ′ (P ∗ ) −km , 因此可以得到周期振荡解. 当Keq = 200 时, 对应的解在相平面上如图3.29 所示. 44
  • 50. 系统生物学数学基础 另外, 参数kp1 的值也影响平衡点的稳定性(图3.30). 周期振荡的周期也和参数有关. 数值模拟的 结果显示, 振荡的周期随参数kp1 的增加而增加, 而与Keq 的依赖关系并不明显. 周期与参数Keq 和kp1 的关系如图3.31 所示. 在实验中, 通常会通过基因突变技术或者环境的改变研究基因或者环境因素对节律振荡的影响. 在模型研究中, 可以通过改变相应参数对节律振荡的影响. 例如, 当温度改变时, 通常会改变化学反应 平衡常数Keq . 对于某些基因突变, 可能会影响蛋白质的降解率kp1, kp2 等. 图3.32 给出了Tyson 等人 的数值模拟结果, 可以看到在某种程度上, 可以通过修改模型参数来模拟基因突变的实验结果[35]. M g' P 4 1.0 0.5 3 Keq 50 100 150 200 2 0.5 1 1.0 1.5 PT 0.5 1.0 1.5 2.0 2.5 3.0 (A) (B) 图 3.29: (A) g ′ (P ∗ ) 与参数Keq 的依赖关系. (B) 相平面图. {fig:4:circond} g' P Protein Level 2 kp1 30 6 kp1 20 5 1 4 kp1 3 kp1 10 10 20 30 40 2 1 1 Time hr 2 20 40 60 80 100 (B) (A) 图 3.30: (A) ′ g ′ (P ∗ ) 与参数kp1 的依赖关系. (B) 解与参数kp1 的关系. 这里kp1 分别取值10, 20, 30, 其 它参数和前面一致. {fig:4:circond2} § 3.3.2 Circadian rhythm generator 这一节介绍一个简单的节律振荡的数学模型. 该模型可以看成是很多生物振荡的产生机制的简化 版本. 节律调控的一般模型如图3.33A 所示. 这里, 参与节律调控的蛋白质在细胞核内被表达出来以后, 进入到细胞质. 在这里, 蛋白质经过一系列的反应, 包括磷酸化, 生物多聚物, 和蛋白质传输等过程, 最后生成所谓的有效蛋白, 参与调控与节律有关的基因的表达. 另一方面, 这些有效蛋白会被传输到 细胞核内, 负调控其基因的表达. 因此, 这个调控环路包括一个负反馈调控. 另一方面, 因为蛋白质的 传输和生化反应等都需要时间, 有时候还是相当长的时间, 因此这个负反馈的环路存在时间上的滞后. 图3.33B 给出了相应的示意图. 这里主要的变化量的mRNA 和有效蛋白质的浓度. 其中, 从mRNA 到 蛋白质的过程有时间的延滞, 并且有非线性的关系. 这里的非线性关系通常表示多聚物的产生等过程. 这里假设有效蛋白对mRNA 的产生的负调控是快速的过程, 没有延滞. 这个调控是通过一个非线性函 数, 通常是Hill 函数来描述的. 45
  • 51. 系统生物学数学基础 图 3.31: Two-parameter bifurcation diagram for the model(adopt from [35]). {fig:4:cirbif} 图 3.32: Period of the endogenous rhythms of wild-type and mutant files. [35] {fig:4:cirmutant 46
  • 52. 系统生物学数学基础 图 3.33: (A). Schematic representation of the biological elements of the protein synthesis cascade, as- sumed to be elementary to the circadian rhythm generator. These include the auto inhibition of the protein at translational or transcriptional level and posttranslational processing such as phosphorylation, dimerization, and transport. Protein∗ denotes the effective protein, be- ing in the molecular state capable of inhibiting mRNA production, as well as expressing the circadian rhythm. (B). Model interpretation of A, emphasizing the delay (τ ) and nonlinearity in the protein production cascade, the nonlinear negative feedback, as well as the mRNA and protein production and degradation. The mRNA and protein production (rM , rP ) and degra- dation (qM , qP ) rate constants, respectively, are also used as targest for external stimulation. (Adopt from [32]) {fig:4:SCN1} 47
  • 53. 系统生物学数学基础 上面的模型可以通过下面时滞微分方程来描述: dM rM − qM M = (3.3.59) 1 + (P/K)n dt dP rP M (t − τ )m − qP P. = (3.3.60) dt 图3.34 给出了上述模型的数值模拟结果. 可以看到, 对于适当的参数, 可以产生24 小时的节律振荡. 图 3.34: 节 律 振 荡 模 型(3.3.59)-(3.3.60) 的 模 拟 结 果. 这 里 的 参 数 值 为: rM = 1.0hr−1 , rP = 1.0hr−1 , qM = 0.21hr−1 , qP = 0.21hr−1 , n = 2.0, m = 3.0, τ = 4.0hr, k = 1(Replot from [32]). {fig:4:scnsim} 为了分析节律振荡的产生机制, 同样地, 我们可以分析平衡点的稳定性. 首先, 我们作无量纲化处 理. 令 x = M/(rM /qM ), y = P/K, ˜ = qM t t 可以得到下面的无量纲化方程 1 x′ −x = (3.3.61) 1 + yn rx(t − τc )m − δy. y′ = (3.3.62) d , 无量纲参数为: 这里′ 表示 ˜ dt r = (1/K)(rP /qM )(rM /qM )m , δ = qP /qM , τc = qM τ. 因此, 平衡点(x∗ , y ∗ ) 由下面代数方程的解给出: x∗ = 1/(1 + y ∗ n ), y ∗ = (r/δ)x∗ m . 容易看到, 该方程有唯一的正平衡点. 然后, 为得到平衡点的稳定性, 可以考虑相应的方程在平衡点处 的变分方程 x′ = −˜ − a˜ ˜ x y (3.3.63) {eq:SCN5} y ′ = −δ y + b˜(t − τc ) ˜ ˜ x 其中 ny ∗ (n−1) , b = mrx∗ (m−1) . a= (1 + y ∗ n )2 设上面的变分方程有形如 x = c1 eλt , y = c2 eλt (c1 , c2 = 0) ˜ ˜ 48
  • 54. 系统生物学数学基础 的解, 则可以得到关系 1+λ a c1 = . −beτc λ δ+λ c2 由此, λ 满足特征方程 f (λ) = (1 + λ)(δ + λ) + abe−τc λ = 0. (3.3.64) {eq:4:cireig} 有下面的结论: 系统(3.3.63) 的零解是稳定的当且仅当特征方程(3.3.64) 的所有(复)根都具有负实部. 因此, 要想得到不稳定的平衡点, 只需要特征方程(3.3.63) 具有正实部的根. 容易看到, 当τc = 0 (没有时滞)时, 上面特征方程的根都具有负实部 (δ + 1)2 − 4(δ + ab) −(δ + 1) ± λ1,2 = . 2 因此, 没有时滞, 不可能得到不稳定的平衡点. 此时, 原系统的解不可能得到稳定的周期振荡解. 为了得到特征方程有正实部的根的条件, 我们来考察具有零实部特征根的条件. 为此, 令λ = iω, 则f (λ) = 0 等价于 −ω 2 + δ + ab cos τc ω = 0, (1 + δ)ω − ab sin τc ω = 0. 由此可以得到, 对给定的δ 0, ab 和τc 满足关系 (ab)2 = ω 4 + (1 + δ 2 )ω 2 + δ 2 , 其中ω ∈ (0, π/τc ) 满足 (ω 2 − δ) tan τc ω = (1 + δ)ω. 上述条件给出了ab − τc a 平面上的曲线(依赖于δ), 该曲线可以把平面分成两个区域, 分别对应于平衡 点的稳定区域和不稳定区域(图3.35). ab 40 30 20 Unstable 10 Stable Τc 0.2 0.4 0.6 0.8 1.0 图 3.35: 节律振荡模型(3.3.59)-(3.3.60) 的分岔图. 三条曲线(从上到下)分别对应于δ = 1.5, 1.0, 0.5. {fig:4:scnstable § 3.4 胚胎发育 生命有机体从单个细胞(受精卵)经过不断分裂、分化、生长和凋亡等形成了各种复合结构, 如眼、鼻、耳、口、心和脑等,并由此成长为一个活生生的有机体。这是一个生命的奇迹。基因调控 在这一奇迹的实现过程中起着至关重要的作用。了解基因调控在胚胎发育过程中的作用是当前发育生 物学领域的研究前沿课题之一。从孟德尔的豌豆实验,摩尔根对果蝇的遗传规律的研究,到Waston 和Crick 发现脱氧核糖核酸(DNA) 的双螺旋结构,以及以后的一系列重大发现,如遗传密码的破译、 中心法则的建立、基因分离和克隆、基因的体外重组和基因工程质粒的构建等等,人们已经初步掌握 了遗传信息在生命体中代代相传的自然规律。以动物为例,保存在DNA 中的遗传信息通过父体和母 体的受精作用传递到受精卵,受精卵发育为成熟的个体,再传递给下一代。在这一过程中,同一个体 49
  • 55. 系统生物学数学基础 的所有细胞所包含的遗传信息都是一样的,都来源于受精卵。然而,这些具有相同遗传信息的细胞在 生物体内却可以分化成上百种诸如骨骼细胞、肌肉细胞、表皮细胞、血细胞和神经细胞等不同类型的 细胞。这些分化的各种类型的细胞并不是随机分布的,而是构成复杂的组织和器官,器官又按照一定 的方式排列。相同的基因组如何产生不同类型的细胞?这些细胞又是如何形成恰当的排列?这些问题 长期困惑发育生物学家。 1978 年,长期在美国加州理工学院从事果蝇遗传和发育研究的Edward B. Lewis 发表了他关于 基因复合体如何控制体节发育的论文[25]。受其影响,欧洲分子生物学实验室两位年轻的发育生物学 家Christiane Nusslein-Volhard 和Eric F. Wieshaus 也以果蝇作为模式生物进行研究,试图搞清楚受 精卵是如何发育成分节的胚胎的。他们鉴定出15 种不同的由于突变引起体节缺陷的基因。当他们的 研究结果在1980 年发表后[31],立即受到一批发育生物学家的关注。很快,人们在其他高等生物和 人类细胞中发现了同样的或类似的基因,并证明这些基因在发育过程中执行了相似的功能。由于他 们的出色工作开创了分子发育生物学研究,Edward B. Lewis,Christiane Nusslein-Volhard 和Eric F. Wieshaus 分享了1995 年诺贝尔生理和医学奖。通过对果蝇体节发育的研究,人们发现了一些能控制 胚胎发育的关键性基因,认识到胚胎发育过程中的分化和形态发生是受基因控制的。因此,为了了解 胚胎发育过程,就必须了解相应的基因调控网络。该研究领域的中心问题是:控制胚胎发育的基因调 控网络是怎么工作的?具体来讲,这个问题包括以下几个方面: 1. 控制胚胎发育的基因网络是如何组成的? 2. 它是如何工作的? 3. 它的可靠性如何得到保证? 这一节以影响果蝇翅膀发育的基因调控网络为例子, 介绍影响胚胎发育得重要因素: 形态生成 素(Morphogen) 再胚胎得作用. 将介绍想光得数学模型, 并且对鲁棒性和稳定性等进行分析. 果蝇因为其生命周期短、染色体简单等原因,一直是从事分子发育生物学研究的常用模式生物 之一。而果蝇翅膀的发育因为和其他器官的发育过程相对独立,也是分子发育生物学家在研究胚胎发 育时经常采用的研究对象。然而,即使是果蝇翅膀这一简单器官,其发育过程也是非常复杂的,涉及 许多基因之间的相互调控。目前,生物学家通过大量的实验,已经初步了解了与果蝇翅膀发育有关的 关键基因,相关信息可以参考果蝇的在线基因信息数据库FlyBase (http://www.flybase.org/)。这些 实验事实使我们有可能深入研究相关的基因网络的工作机制。 动物的发育模式虽然有很多变化,但发育过程中有许多事件带有普遍性。动物发育可细分为受 精(fertilization)、卵裂(cleavage)、原肠形成(gastrulation)、器官发生(organogenesis)、变态(metamorphosis) 和成熟(maturity) 6 个基本阶段,涉及细胞分裂(cell division)、细胞分化(cell differentiation)、模式 形成(pattern formation)、细胞迁移(cell migration)和细胞凋亡(apoptosis)等一系列事件。 果蝇翅膀的发育过程属于胚胎发育中的器官发生阶段。在这一阶段的初始时刻,果蝇胚胎里 已经形成了翅膀成虫盘(wing imaginal disc),使得翅膀在后阶段的发育是一个相对独立的过程。在 随后的发育过程中,细胞通过胚胎的对称轴和体内的形态发生素(morphogen)的浓度分布来确定其 在整个胚胎中的位置信息,然后根据其位置确定其最终发育成的细胞形态。胚胎的对称轴包括前后 轴(anteroposterior axis,A-P 轴)和背腹轴(dorsoventral axis, D-V 轴)。形态发生素是胚胎中通过形 成浓度梯度来影响器官发生阶段细胞的运动和组织形式的物质。果蝇的翅膀成虫盘中的形态发生素包 括Decapentaplegic (简称为Dpp)、Hedgehog (简称为Hh)和Wingless (简称为Wg) 等。Dpp 在成虫盘 的A-P 轴处合成,然后在细胞外沿垂直于A-P 轴方向向两边扩散,形成形态发生素梯度(morphogen gradient)。这些细胞外的Dpp 和相应的受体(例如Thickveins,简称为Tkv )相结合形成复合体。该复 合体被胞吞到细胞内部,作为信号控制目标蛋白Potomotorblind(简称为Omb)和Spalt(简称为Sal)的 表达。通过这种方式,沿形态发生素梯度方向的不同细胞将会感受到不同浓度的信号,而根据不同的 浓度阈值(concentration thresholds)表现出不同的基因表达水平。目标蛋白的不同表达水平将决定相 应细胞的最终命运。 § 3.5 Morphogen gradient Morphogen gradient is an important concept in developmental biology, because it describes a mechanisms by which the emission of a signal from one part of an embryo can determine the location, differentiation and fate of many surrounding cells[20]. 50
  • 56. 系统生物学数学基础 图 3.36: Morphogen gradient {fig:1} Morphogens are secreted signaling molecules that organize a field of surrounding cells into pat- terns. They form a gradient of concentration emanating from a localized source, and determine the arrangement and fate of responding cells according to different concentrations of morphogen per- ceived by the cells. The morphogens associate with the development of drosophila wing are listed at Tab. 3.3. The idea of a morphogen gradient is intimately associated with the concept of positional information[38]. A cell is believed to read its position in a concentration gradient of an extracellular signal factor, and to determine its developmental fate accordingly[20]. Response† Morphogen Response Developmental Anti- Signal source Receptors (concentra- (range)∗ (time, h) process factor tion) Drosophila imagial Dpp Antero-posterior sal(high) Tkv 24-72‡ Brk wing disc[?] (long) boundary omb(low) Punt neur (high) Drosophila imagial Wg Dorso-ventral 24-72 Dill(middle) Fz wing disc[?, ?] (long) boundary vg (low) ∗ Short range, 20 µm; long range, 100 µm or more. † Includes repression as well as activation. ‡ Only after 50h is Omb expression further from the source than sal. 表 3.3: Examples of morphogens {tab:1} The major factors shaping a gradient are not only different for each morphogen, but may differ for the same morphogen in different stages of development. There has been much activity in analysing the mechanism of transmission of a morphogen across its field. There ideas prevail: (1) diffusion in the extracellular matrix; (2) relay by sequential internalization and re-emission from cell to cell; and (3) cytoplasmic contact by threads of cytoplasm connecting distant cells [20]. The timing of gradient formation is likely to be rapid. In later development, as in the Drosophila wing disc, a Dpp gradient is normally formed slowly, extending over 25 cell diameters in 3 days. Nevertheless, the same Dpp gradient can be reformed, after temperature interruption, as the rate of 4 cells in 1 hour[14, 34]. In Xenopus embryos, however, an activin gradient can be formed experimentally over 100 µm in 1 hour[19], and natural gradients are normally formed in Xenopus and Drosophila in 2 hours or less. The cells response to the morphogen through different response thresholds of morphogen concen- tration. According to this idea, each cell would have only a binary choice: respond to the morphogen or not. Some cells can make more sophisticate response than an on/off switch[20]. Another important question concerning the cellular basis of morphogen perception asks whether a cell needs its neighbours to determine its position in a gradient, or whether it can measure concen- tration on its own. The experiments argue that cells interpret position in a concentration gradient independently of their neighbours[20]. A cell may respond to morphogen concentration throug its receptors in two ways. One is to be armed with receptors having different binding characteristics(type I receptor); for example, high- and low- affinity receptors and their transduction pathways could operate at low and high concentrations 51
  • 57. 系统生物学数学基础 of ligand, respectively. The other is to vary the occupancy of one type of receptor(type II receptor), and hence its signaling activity, accoding to ligand concentration. We therefore need to know whether different morphogen responses are transmitted by one or more kinds of receptor. Experimental results show that the choice of gene response depends on the absolute number of occupied receptors, entirely independently of how many unoccupied receptors are present [13, 20]∗ . Here are three ideas on how cells make direct response to morphogen gradients[20] 1. The availability of ligand(morphogen) is the limiting factor in determining the level of response to concentration. 2. Cells respond to ligand concentration according to the absolute number of receptors cooupied at any time. 3. A cell with a particular number of occupied receptors will continue to express the same gene until either the occupancy of receptors goes up or the period of competence terminates. An understanding of morphogen gradients requires answers to two different questions. The first asks how a desired concentration gradient is formed. The second question asks how cells interpret a morphogen concentration[20]. § 3.6 模型 在果蝇的翅膀盘器官芽中, Morphogen Dpp 在A-P 轴上产生, 然后分别向两边扩散, 形成从高到 低的浓度分布(图??). 器官芽的形状如图3.38所示. 图 3.37: Dpp gradient[14]. {fig:21} 在这里, 扩散是主要的机制, 使新合成的Dpp 转移到胚胎的其他地方. 这一机制可以通过扩散方 程描述出来. 下面给出几种模型(图3.39). 模型一: Diffusion and Reversible Binding (Kerszberg Wolpert [22]). ∂ 2 [L] d[L] − kon Rtot [L](1 − [LR]) + koff [LR] =D (3.6.65) dX 2 dt d[LR] = kon Rtot [L](1 − [LR]) − koff [LR]. (3.6.66) dt ∗ The overexpression, by up to tenfold, of the activin type II receptor in Xenopus embryo. 52
  • 58. 系统生物学数学基础 图 3.38: Wing imaginal disc of Drosophila[33]. {fig:dpp21} 这里Rtot 表示自由的受体和结合的受体的总和: Rtot = [R] + [LR]. 在这里和下面的所有模型中, 满足下面的边值条件: ∂[L] = v, [L]|X=Xmax ≡ 0. D (3.6.67) {eq:4:bvc} ∂X X=0 这个边值条件表示在X = 0 处又持续的Dpp 产生, 而在器官芽的边界X = Xmax , 多余的Dpp 会被其 他分子降解掉. 模型二: Diffusion, Reversible Binding, and Degradation(Lander, Nie Wan[23]). ∂ 2 [L] d[L] − kon Rtot [L](1 − [LR]) + koff [LR] = D (3.6.68) dX 2 dT d[LR] kon Rtot [L](1 − [LR]) − koff [LR] − kdeg [LR]. = (3.6.69) dt 模型三: Diffusion, Reversible, Binding, Reversible Internalization, Degradation(Lander, Nie Wan[23]). ∂ 2 [L] ∂[L] − kon [L] [R]out + koff [LR]out = D (3.6.70) ∂X 2 ∂T ∂[LR]out kon [L] [R]out − koff [LR]out − kin [LR]out + kout [LR]in = (3.6.71) ∂T ∂[LR]in kin [LR]out − kout [LR]in − kdeg [LR]in = (3.6.72) ∂T ∂[R]out −kon [L] [R]out + koff [LR]out − kp [R]out + kq [R]in = (3.6.73) ∂T ∂[R]in ωR − kg [R]in + kp [R]out − kq [R]in = (3.6.74) ∂T 模型四: Diffusion, reversible binding with receptor and non-receptor, reversible internalization, degradation(Lander, Nie Wan, 2007[24]). 53
  • 59. 系统生物学数学基础 (A) (B) (C) (D) 图 3.39: Dpp 扩散模型: (A) Diffusion and reversible binding. (B) Diffusion, reversible binding and degradation. (C) Diffusion, reversible binding, reversible internalization, degradation. (D) Diffusion, reversible binding with receptor and non-receptor, reversible internalization, degra- dation. {fig:dppmodels} ∂ 2 [L] ∂[L] − kon [L] [R]out + koff [LR]out = D (3.6.75) ∂X 2 ∂T − jon [L] [N]out + joff [LN]out ∂[LR]out kon [L] [R]out − koff [LR]out − kin [LR]out + kout [LR]in = (3.6.76) ∂T ∂[LR]in kin [LR]out − kout [LR]in − kdeg [LR]in = (3.6.77) ∂T ∂[R]out −kon [L] [R]out + koff [LR]out − kp [R]out + kq [R]in = (3.6.78) ∂T ∂[R]in ωR − kg [R]in + kp [R]out − kq [R]in = (3.6.79) ∂T ∂[LN]out jon [L] [N]out − joff [LN]out − jin [LN]out + jout [LN]in = (3.6.80) ∂T ∂[LN]in jin [LN]out − jout [LN]in − jdeg [LN]in = (3.6.81) ∂T ∂[N]out −jon [L] [N]out + joff [LN]out − jp [N]out + jq [N]in = (3.6.82) ∂T ∂[N]in ωN − jg [N]in + jp [N]out − jq [N]in = (3.6.83) ∂T 对于Dpp, 在其开始合成后, 很快可以形成定态的浓度分布. 而这个定态的浓度分布使确定细胞的 发育的关键信息. 因此, 为了通过数学方法描述上面的定态分布, 我们令上面的方程中所有关于时间T 的微分为零, 从而可以得到一套包含常微分方程和一系列代数方程的系统. 通过简化, 可以得到含边值 54
  • 60. 系统生物学数学基础 条件(3.6.67) 的二阶常微分方程. 然而, 这个方程通常是非线性的, 一般不能求解出精确解, 我们需要 在一定的条件下求出近似解. 下面以模型二为例进行简单的分析. 在模型二中, 令 ∂[L] ∂[R] = =0 ∂T dT 可以得到方程 ∂ 2 [L] − kon Rtot [L](1 − [LR]) + koff [LR] 0= D dX 2 kon Rtot [L](1 − [LR]) − koff [LR] − kdeg [LR]. 0= 从第二个方程可以求解出[LR]: kon Rtot [L] koff + kdeg [LR] = , kon Rtot 1+ [L] koff + kdeg 代入第一个方程, 可以得到边值问题 kon Rtot [L] ∂ 2 [L] koff + kdeg − kdeg D =0 kon Rtot ∂X 2 (3.6.84) 1+ [L] koff + kdeg ∂[L] D = v, [L]|X=Xmax =0. ∂X X=0 令 koff + kdeg [L] X K= ,u = ,x = kon Rtot K Xmax 2 kdeg Xmax v Xmax ψ= ,β = KD KD 可以得到无量纲化的边值问题 u u′′ − ψ = 0, u′ (0) = β, u(1) = 0. (3.6.85) {eq:4:bvp1} 1+u 下面, 我们来求解方程(3.6.85). 两边乘以u′ , 再对x 积分, 可以得到 x x u u′ u′′ dx − u′ dx 0= ψ 1+u 0 0 x x u u′ du′ − ψ = du 1+u 0 0 1 ′2 x u |0 − ψ(u − log(1 + u))|x = 0 2 1 ′2 (u − β 2 ) − ψ(u − log(1 + u) − (u(0) − log(1 + u(0))) = 2 令 β2 a2 = − (u(0) − log(1 + u(0)), 2ψ 可以得到一阶方程 u′ = − 2ψ (u − log(1 + u) + a2 ), u(1) = 0. 因此, 该方程的解u = u(x) 由 u du 2ψ(1 − x) = (3.6.86) {eq:4:bvp2} (u − log(1 + u) + a2 ) 0 55
  • 61. 系统生物学数学基础 给出, 其中u(0) 由超越方程 u(0) du = 2ψ (3.6.87) {eq:4:bvp3} (u − log(1 + u) + a2 ) 0 给出. 上面方程的严格表达式不可能得到, 只能通过数值方法求解. 下面我们在特殊的近似条件下求解上面的方程. 为此, 令 12 u − log(1 + u) ≈ u. 2 这个近似在很多情况下是可以接受的, 特别是当u 1 时. 此时, 上面的方程(3.6.86)-(3.6.87) 变为 w(0) w dw dw √ √ ψ(1 − x) = ψ, = w2 + 1 w2 + 1 0 0 u 其中w = √ . 通过上面的方程, 可以求解出 2a w(x) = sinh( ψ(1 − x)). √ 分布u(x) 和w(x) 指差一个常数倍 2a. 例如, 通过 u(0)2 = w(0)2 = sinh2 ψ 2a2 可以求解出 √ (β 2 /ψ) sinh2 ψ 2 u(0) = . √ 1 + sinh2 ψ 由此, 可以得到 β2 1 a2 = √. 2ψ 1 + sinh2 ψ 因此, 原来方程的解可以近似为 β √ sinh( ψ(1 − x)). u(x) = ψ(1 + sinh2 ψ) √ 这个解, 特别时由sinh( ψ(1 − x)) 所刻划出了的指数衰减, 跟实验观察到的结果是符合的. √ 由上面的解的形式也可以看到, Dpp 的浓度衰减特征长度由 ψ 所刻划出来, 这个参数是和[LR] 的降解率联系起来的, 表征信号分子的衰减速度. 当ψ 比较很大时, 衰减很快, 不能形成长距离 的Morphogen 的分布. 当ψ 很小时, 衰减太慢, 不足以产生多种命运的细胞. 因此, 在生命系统中, ψ 的 值不能太大也不能太小. 根据实验的观察, 一般地, Dpp 在器官芽的边界处的浓度与产生区域的浓度相 比, 大概是3%, 即 [L](Xmax ) ≈ 3% [L](0) 由此可以得到ψ ∼ 5. 前面的近似的条件是u 比较小, 这个可以通过u(0) 来刻划. 一般地, Dpp 的浓度在器官芽的的边 缘处的变化很小, 即u′ (1) = −a ≈ 0. 由此, 要想u 比较小, 只需要β 2 /ψ 很小. 在ψ 固定的情况下, 只需 要β 小, 即Dpp 的合成速度很小. 这里影响细胞发育的信号是符合体[LR] 的浓度, 其无量纲化的值由 √ β √ sinh( ψ(1 − x)) ψ(1 + sinh2 ψ) u(x) y(x) = = √ β 1 + u(x) √ sinh( ψ(1 − x)) 1+ ψ(1 + sinh2 ψ) 56
  • 62. 系统生物学数学基础 表示. 实验发现, 果蝇的翅膀的发育对Dpp 的基因突变是鲁棒型好的, 即使其合成速率明显提到, 也不 影响翅膀的发育. 我们看需要什么样的条件才能满足这样的要求. 如果Dpp 的合成速率很低(β ≪ 1), 则 β y(x) ≈ u(x) = √ sinh( ψ(1 − x)). ψ(1 + sinh2 ψ) 可以看到, y(x) 和β 成线性关系. 即生成率增加一倍(这个通过基因突变是很容易实现的), 信号的强度 也增加一倍, 这个结果和试验现象是不符合的. 从上面的分析, Dpp 的合成速率不应该太低. 但是, 也不能太高. 因为如果Dpp 的浓度太高, 则在 整个器官芽, 信号的浓度都很高, 无法实现调控细胞的不同命运(图3.40). yx yx Β 20 0.8 Β 10 0.4 0.6 0.3 Β2 Β1 0.4 0.2 0.2 0.1 x x 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 (A) (B) 图 3.40: Dpp Morphogen Gradient (ψ = 5). {fig:4:dppgrad} 最近的研究结果表明, 上面的机制不能够同时保证有生物学意义的信号分布和好的鲁棒性. 为 了满足这样的条件, 需要其他的分子的作用. 最近发现, 有一种分子, 主要是分布在细胞表面, 可以 和Morpohgen 结合, 帮助实现Dpp 的浓度分布. 理论研究表明, 这些分子对于实现好的鲁棒性是很关 键的. 这方面的研究工作还在进行中. § 3.7 二阶常微分方程边值问题的数学基础 在讨论Morphogen 的扩散问题时, 经常会遇到微分方程的边值问题. 这一节介绍相关的基础知识, 详细内容可以参考相关的专著. 这里的边值问题的一般形式为 w′′ − f (w, x) = 0 (3.7.88) {eq:4s:bvp1} (aw + bw′ )|x=0 = h0 , (cw + dw′ )|x=1 = h1 . § 3.7.1 解 的 存 在 唯 一 性 对于边值问题, 边界条件的提法非常关键, 如果提得不好, 解不一定存在, 或者存在却并不唯一. 上下解的方法是证明解的存在性的常用方法. 该方法的主要内容如下. 首先, 我们可以把上面的方程改写为更加一般的形式. 定义Hp = C 2 ([0, 1], R) 表示所有p 阶可微 的函数, 定义线性算子Li : H2 → H0 , 把二阶可微函数映射为连续函数. 特别地, 定义 d2 L1 u = u dx2 d ± (a + b L2 u = )u dx x=0 d ± (c + d L3 u = )u dx x=1 57
  • 63. 系统生物学数学基础 则Li 满足上面的条件. 这里L2 和L3 中的符号根据可以根据边界条件来确定, 需要满足一定的条件. 3 3 我们在下面详细讨论. 下面记线性泛函L : H2 → H0 为L = (L1 , L2 , L2 ). 另外定义泛函f : H2 → H0 为 f (u) = (−f (u(x), x), ±h0 , ±h1 ), ∀u ∈ H2 则上面的边值问题变为 Lw + f (w) = 0. 为了求解上面的方程, 我们可以通过迭代运算 w = (L−1 ◦ f )(w) 来求解. 但是, L 通常不可逆. 为此, 我们把上面的方程改写为 (L − Λ)w + (f (w) + Λw) = 0 其中Λ = diag{λ1 , λ2 , λ3 }. 通过选取适当的Λ,可以使(L − Λ) 是可逆的, 并且其逆算子满足一定的单调 性条件, 这样, 就可以通过迭代 w = ((L − Λ)−1 ◦ (f + Λ))w := T (w) 和适当的初始解u0 , v0 来求解上面的方程. 特别地, 如果u0 v0 , 并且算子T 满足单调性, 即u v ⇒ T (u) T (v). 则令ui = T (ui−1 ), vi = T (vi−1 ), 可以得到序列{ui }, {vi }, 满足ui vi . 另外, 如果T 和u0 , v0 还满足ui T (ui ), vi T (vi ), 则可以得到序列 u0 u1 · · · v1 v0 . 这样u = limi→+∞ ui 和v = limi→+∞ vi 都存在, 并且都是原边值问题的解, 这个就是上下解方法的基 本想法. 下面, 我们统一考虑方程 Lu + f (u) = 0 (3.7.89) {eq:4:a1} 如果函数u0 ∈ H2 满足 Lu0 + f (u0 ) ≤ 0. (3.7.90) {eq:4:a2} 则称u0 为问题(3.7.89) 的上解. 类似地, 如果函数v0 ∈ H2 满足 Lv0 + f (v0 ) ≥ 0. (3.7.91) {eq:4:a3} 则称v0 为问题(3.7.89) 的下解. k k 对于算子T : H0 → H0 , 如果对任意α ∈ H0 , 满足α ≥ 0, 都有T α ≤ 0, 则称T 为负算子. 这 里α = (α1 , αk ) ≥ 0 表示每个分量αi 都满足αi ≥ 0. 函数u(x) ≥ 0 即对任意x ∈ [0, 1], 都有u(x) ≥ 0. 定理 假设方程(3.7.89) 满足下面条件: {th:4:a1} 1. 方程(3.7.89) 有上解u0 和下解v0 , 并且满足条件u0 v0 ; 2. 存在常数λi 0(i = 1 · · · , k) 使得对任意满足 u0 ≥ ϕ1 ≥ ϕ2 ≤ v0 的函数ϕ1 , ϕ2 ∈ H2 , fi (ϕ1 ) − fi (ϕ2 ) −λi (ϕ1 − ϕ2 ), 3. 定义算子Λ : H2 → (H2 )k 为Λu = (λ1 u, · · · , λk u). 则其逆算子(L − Λ)−1 是负算子. 则方程(3.7.89) 至少有一个解u(x) ∈ H2 , 并且v0 ≤ u ≤ u0 . 证明: 改写(??) 为 (L − Λ)u + g(u) = 0 其中 g(u) = f (u) + Λu. 58
  • 64. 系统生物学数学基础 则g 是单调的, 即g(ϕ1 ) g(ϕ2 ) 对任意u0 ≥ ϕ1 ≥ ϕ2 ≥ v0 . 这是因为 g(ϕ1 ) − g(ϕ2 ) = f (ϕ1 ) + Λϕ1 − f (ϕ2 ) − Λϕ2 −Λ(ϕ1 − ϕ2 ) + Λ(ϕ1 − ϕ2 ) = 0. 定义影射T : H0 → H2 , 表示β = T α 满足方程 (L − Λ)β + g(α) = 0. 事实上, 我们有T α = −(L − Λ)−1 g(α). 下面证明T 满足下面的单调性条件. 首先, T 是单调的, 即如果v0 ≤ α1 ≤ α2 ≤ u0 , 则T α1 ≤ T α2 . 事实上, 我们有 = −(L − Λ)−1 g(α1 ) + (L − Λ)−1 g(α1 ) T α1 − T α2 = (L − Λ)−1 (g(α2 ) − g(α1 )) ≤ 0. 其次, 如果α 是上解, 则α T α. 为证明, 令β = T α, 则 (L − Λ)(β − α) ≥ 0 因为(L − Λ)−1 是负算子, 可以得到β − α ≤ 0. 类似地, 如果α 是下解, 则α T α. 现在, 我们可以函数的序列{un } 和{vn } 为(un , vn ) = (T un−1 , T vn−1 ) (n ≥ 1). 这样, 我们可以 得到结果 u0 ≥ u1 ≥ · · · ≥ un ≥ · · · ≥ vm ≥ · · · ≥ v1 ≥ v0 . 极限 u = lim un ˜ n 为每一点处均存在, 并且u0 ≥ u ≥ v0 . 这个极限就是˜ 方程(3.7.89) 的解. ˜ u 在应用上面的定理时, 条件1 和2 都比较好满足, 关键是定义合适的算子L, 使得条件3 是满足的. 下面把上面的结果应用到几种特殊的边界条件上. (1). 对于问题 w′′ − f (w, x) = 0, w(0) = h0 , w′ (1) = h1 (3.7.92) {eq:4s:b1} 这里, 定义L 使得 d2 , −u(0), −u(1)). Lu = ( dx2 则对任意 Λ = diag(λ, 0, 0) 算子T = (L − Λ) 映β = T α 为方程 −1 (L − Λ)β = α 3 可以验证上面所定义的算子T 是负算子. 事实上, 上面的方程即 这里α ∈ H0 . β ′′ − λβ = α1 (x), −β(0) = α2 , −β ′ (1) = α3 . 可以证明, 如果α2 , α3 ≥ 0, 并且α1 (x) ≥ 0, (∀0 x 1), 则上面方程的解β满足β(x) ≤ 0, ∀x ∈ [0, 1]. 简单的证明如下: 容易有β(0) ≤ 0, β ′ (1) ≤ 0. 如果在某0 x1 1 处β(x) = 0, 则有β ′ (x1 ) 0. 而β (1) ≤ 0, 因此, 一定存在一点x1 x2 1, 使得β(x2 ) 0, β ′′ (x2 ) = 0. 但是, 这和β ′′ (x2 ) = ′ α(x2 ) + λβ(x2 ) 0 矛盾. (2). 对于问题 w′′ − f (w, x) = 0, w′ (0) = h0 , w′ (1) = h1 (3.7.93) {eq:4s:b1} 这里, 定义L 使得 d2 , −u′ (0), u′ (1)). Lu = ( dx2 则对任意 Λ = diag(λ, 0, 0) 59
  • 65. 系统生物学数学基础 算子T = (L − Λ)−1 映β = T α 为方程 (L − Λ)β = α 3 可以验证上面所定义的算子T 是负算子. 事实上, 上面的方程即 这里α ∈ H0 . β ′′ − λβ = α1 (x), −β(0) = α2 , β ′ (1) = α3 . 可以证明, 如果α2 , α3 ≥ 0, 并且α1 (x) ≥ 0, (∀0 x 1), 则上面方程的解β满足β(x) ≤ 0, ∀x ∈ [0, 1]. 证明的思路和上面类似. 下面, 我们证明解的唯一性. 为此, 先把非齐次边界条件变换为齐次边界条件. 这可以按照下面的 简单变换就可以. 令u = w − (k1 + k2 x), 其中k1 , k2 满足方程 ak1 + bk2 = h0 , c(k1 + k2 ) + dk2 = h1 , 则边值问题(3.7.88) 可以变换为关于未知函数u = u(x) 的具有齐次边界条件的边值问题. 下面的引理, 我们在特殊的边界条件下得到解的唯一性. 引理 考虑边值问题 {le:4:2} u′′ − f (u, x) = 0, u(0)u′ (0) = u(1)u′ (1) = 0. (3.7.94) {eq:4:a4} 如果函数f 关于u 是单调的, 则上面的方程(3.7.94) 至多都一个解. 证明: 否则, 假设我们有两个解u1 和u2 (u1 (x) ≡ u2 (x)). 令ϕ(x) = u1 (x) − u2 (x), 则ϕ(x) 满足 ϕ′′ − q(x)ϕ = 0, ϕ′ (0) = ϕ′ (1) = 0, 其中 f (u1 (x), x) − f (u2 (x), x) ≥ 0. q(x) = u1 (x) − u2 (x) 因此, 可以得到 1 1 q(x)ϕ2 (x)dx = 0. ϕϕ′′ dx − 0 0 通过分布积分和上面的边界条件, 可以得到 1 1 2 q(x)ϕ2 (x)dx − ϕ′ (x)dx, 0=− 0 0 这样, 总有ϕ(x) ≡ 0, 与假设矛盾. § 3.7.2 问 题 的 求 解 数值方法: 打靶法. 解析方法: 能量函数法(可以用于f (w, x) 不显含义x 的情况). 对于方程 w′′ − f (w) = 0, (3.7.95) {eq:4s:bvp3} 定义能量函数 w 1 ′2 w− H(w) = f (u)du 2 0 则 dH(w) |(3.7.95) ≡ 0. dx 因此, 对于满足方程(3.7.95) 的解w(x), 相应的能量H(w(x)) 为常数. 设为 w 1 ′2 w− H(w(x)) = f (u)du = h 2 0 60
  • 66. 系统生物学数学基础 其中h 需要有边值条件确定. 则上面方程可以变为一阶方程 w w′ = ± 2(h + f (u)du) 0 来求解, 即 √ w(x) dv = ± 2x (3.7.96) {eq:4s:bvp4} v (h + f (u)du) w(0) 0 这里正或负号根据具体问题确定. 求解上述方程需要知道w(0), 这可以根据原方程的边值条件确定. Green 函数法: Green 函数法可以把上面的问题变为一个积分方程. 为此, 先把方程(3.7.88) 改写 为 w′′ − λ2 w − g(w, x) = 0 (3.7.97) {eq:4s:bvp5} (aw + bw′ )|x=0 = 0, (cw + dw′ )|x=1 = 0. 其中 g(w, x) = f (w, x) − λ2 w. 我们先求解更简单的方程: w′′ − λ2 w = f (x) (3.7.98) {eq:4s:bvp6} 和相应的边界条件 (aw + bw′ )|x=0 = 0, (cw + dw′ )|x=1 = 0. (3.7.99) {eq:4s:bvp7} 可以用常系数变异法求解上面的方程: 令 w(x) = C1 (x)eλx + C2 (x)e−λx . 则 w′ (x) = C1 (x)eλx + C2 (x)e−λx + λC1 (x)eλx − λC2 (x)e−λx . ′ ′ 令C1 , C2 满足 C1 (x)eλx + C2 (x)e−λx = 0. ′ ′ (3.7.100) {eq:4s:green1} 则有 w′′ (x) = λ2 C1 (x)eλx + λ2 C2 (x)e−λx + λC1 (x)eλx − λC2 (x)e−λx . ′ ′ 代入方程(3.7.98) 可以得到 λC1 (x)eλx − λC2 (x)e−λx = f (x). ′ ′ (3.7.101) {eq:4s:green2} 由(3.7.100), (3.7.101) 可以求解出C1 (x), C2 (x): ′ ′ 1 −λx 1 λx C2 (x) = − C1 (x) = e f (x), e f (x). 2λ 2λ 因此, x x 1 1 eλs f (s)ds + c2 ). e−λs f (s)ds + c1 ), C2 (x) = − C1 (x) = ( ( 2λ 2λ 0 0 这样, 我们得到了方程(3.7.98) 的通解 x x 1 1 e−λs f (s)ds + c1 )eλx − eλs f (s)ds + c2 )e−λx . w(x) = ( ( 2λ 2λ 0 0 这里的常数c1 , c2 由边值条件(3.7.99) 给出. 即满足方程 1 1 (c1 − c2 ) + b (c1 + c2 ) 0 =a 2λ 2 1 1 1 eλ e−λs f (s)ds + eλ c1 − e−λ eλs f (s)ds − e−λ c2 0 =c 2λ 0 0 1 1 1 eλ e−λs f (s)ds + eλ c1 + e−λ eλs f (s)ds + e−λ c2 +d 2 0 0 61
  • 67. 系统生物学数学基础 上面方程即 a b a b c1 − − + c2 = 2λ 2 2λ 2 1 1 c d c d c eλ c1 − e−λ − − sinh(λ(1 − s))f (s)ds − d cosh(λ(1 − s))f (s)ds. + c2 = 2λ 2 2λ 2 λ 0 0 上述方程可以求解出 1 (a − bλ) =− c1 q(λ, s)f (s)ds p(λ) 0 1 (a + bλ) =− c2 q(λ)f (s)ds) p(λ) 0 其中 = (ac − bdλ2 ) sinh(λ) + (adλ − cbλ) cosh(λ) p(λ) = (c sinh(λ(1 − s)) + dλ cosh(λ(1 − s)) q(λ, s) 因此, 原边值问题的解为 x 1 1 (c1 eλx − c2 e−λx ) sinh(λ(x − s))f (s)ds + w(x) = λ 2λ 0 x 1 1 (a − bλ)eλx + (a + bλ)e−λx 1 sinh(λ(x − s))f (s)ds − = q(λ, s)f (s)ds λ λ 2p(λ) 0 0 x 1 1 a cosh(λx) − bλ sinh(λx) 1 sinh(λ(x − s))f (s)ds − = q(λ, s)f (s)ds λ λ p(λ) 0 0 令 1  (p(λ) sinh(λ(x − s)) + (bλ sinh(λx) − a cosh(λx))q(λ, s)) , 0 ≤ s x  p(λ)  G(x, s; λ) = 1 (bλ sinh(λx) − a cosh(λx))q(λ, s), x≤s1   p(λ) 进一步的简化, 可以得到 1 (bλ sinh(λs) − a cosh(λs))(c sinh(λ(1 − x)) + dλ cosh(λ(1 − x))), 0≤sx  p(λ)  G(x, s; λ) =  1 (bλ sinh(λx) − a cosh(λx))(c sinh(λ(1 − s)) + dλ cosh(λ(1 − s))), x≤s1  p(λ) 这个函数就是所谓的Green 函数. 通过Green 函数, 方程(3.7.98)-(3.7.99) 的解可以表示为 1 w(x) = G(x, s; λ)f (s)ds. 0 因为, 原来的边值问题(3.7.97) 的解可以表示为积分方程 1 w(x) = G(x, s; λ)g(w(s), s)ds 0 的解. 62
  • 68. 第四章 神经科学 § 4.1 离子通道与Nernst 方程 Nernst 方程 细胞内外的自由能差定义为 [ion]in ∆G = RT ln + ∆V F z (4.1.1) {eq:nernst1} [ion]out 其中F 为Faraday’s const, ∆V 为电位差, z 为相应离子的价. 在平衡时, 有∆G = 0, 有此可以得到 RT [ion]in 61.5 [ion]in (37o C). ∆V = Vm = ln = log10 (4.1.2) zF [ion]out z [ion]out 这个就是Nernst 方程. 常见离子的浓度. 平衡电压(mV) 细胞内(mM) 细胞外(mM) + Na 50 440 +55 K+ 400 20 -76 Cl− 40 560 -66 Ca2+ 0.4 µM 10 + 145 (A) 平衡电压(mV) 细胞内(mM) 细胞外(mM) + Na 18 145 +56 K+ 140 3 -102 Cl− 7 120 -76 Ca2+ 100 µM 1.2 +125 (B) 表 4.1: 常见离子在细胞内外的浓度(A) 枪乌贼巨轴突(B) 哺乳动物神经细胞. GHK (Goldman-Hodgkin-Katz) equation非(多种离子): PK [K+ ]out + PNa [Na+ ]out + PCl [Cl+ ]out RT Vm = ln (4.1.3) {eq:GHK} PK [K+ ]in + PNa [Na+ ]in + PCl [Cl+ ]in F 其中Pi 为离子的相对渗透率. 对于枪乌贼的巨轴突, PK : PNa : PCl = 1.00 : 0.04 : 0.45. 63
  • 69. 系统生物学数学基础 由上面的方程可以得到常温(20o C) 时的平衡电位为−62mV . § 4.2 细胞膜模型 dV =− gi (V − Vi ) + Im − IL C (4.2.4) {eq:memeq} dt i 其中gi (V − Vi ) 为离子电流, Im 为通过细胞膜的总电流, IL 为泄漏的电流. § 4.3 离子通道的激活与失活 § 4.4 Morris-Lecar 模型 dV −gCa m∞ (V − VCa ) − gK w(V − VK ) − gL (V − VL ) + Im = (4.4.5) dt φ(w∞ − w) dw = (4.4.6) dt τ 其中 0.5(1 + tanh((V − v1 )/v2 )) m∞ (V ) = 0.5(1 + tanh((V − v3 )/v4 )) w∞ (V ) = 1/ cosh((V − v3 )/(2v4 )) τ (V ) = § 4.5 Hodgkin-Huxley 模型 dV −¯Na m3 h(V − VNa ) − gK n4 (V − VK ) C = g ¯ (4.5.7) dt dm −(m − m∞ (V ))/τm (V ) = (4.5.8) dt dh −(h − h∞ (V ))/τh (V ) = (4.5.9) dt dn −(n − n∞ (V ))/τn (V ) = (4.5.10) dt 64
  • 70. 第五章 细胞增生与分化 人体的血液细胞(红细胞,白细胞,血小板)由骨髓中的造血干细胞分化而成. 人体造血系统包含 非常复杂的调节机制, 保证正常人的各种血细胞在血液中的浓度维持在正常值的范围内. 然而, 有 些病人由于造血系统的调节功能缺陷, 血细胞表现出长期明显的超出正常范围的周期性波动. 例 如, 这些疾病包括周期性白细胞减少症(Cyclical neutropenia,CN), 周期慢性骨髓型白血病(Periodic chronic myelogenous leukemia, PCML), 周期性血小板减少症(Cyclical thrombocytopenia), 周期溶血 性贫血(Periodic hemolytic anemia) 等等. 自从人们发现这些病例以来, 造成这些异常的动力学行为的 原因一直是血液病专家所关心的问题. 然而, 由于造血系统的复杂性, 至今还不能对这些病的致病机理 有充分的了解, 因此还未能找到针对这些病的有效的治疗方法. 通过传统的实验和临床检查等手段, 尽 管可以得到病人的各种表现特征, 但是对于了解这些动力学特征背后的机制却是无能为力的. 从上世 纪七十年代开始, 由Michael C. Mackey教授所带领加拿大麦吉尔大学(McGill Univeristy)生理系的非 线性动力学研究小组就开始关注这些生命现象中的有节律的振荡问题. 1978 年, Mackey 首先建立了 用于模拟造血干细胞的数量变化的数学模型, 并且分析了可能导致细胞数目周期变化的内在机制. 在 此后的二十多年里, Mackey 与他的合作者从实验和理论等不同的方面对此问题进行了深入的研究并 且已经取得了一系列的成果, 在国际上确立了他们在该领域的领先地位. 然而, 由于造血系统的复杂性, 在很长的时间内没有办法对整个造血系统所建立的完整的数学模型来研究, 因此也缺乏对整个系统的 宏观了解. 直到1997 年才从实验上了解造血系统中控制红细胞, 白细胞和血小板的负反馈调控过程的 分子机制. 2005 年, Colijn 和Mackey 首次建立了包括造血干细胞/红细胞/白细胞和血小板在内的造 血系统的完整的数学模型. 这个模型是包含四的变元(分别对应于不同种类的细胞的浓度)的非线性时 滞微分方程. 通过他们所建立的数学模型, Colijn 和Mackey通过数值模拟方法研究了CN和PCML 这 两种动态血液病的致病机理, 即系统中什么样的参数的异常变化会导致人们所观察到的异常病变. 从 数学的角度来看, 这些参数的异常变化使原系统的对应于正常状态的平凡解变得不稳定, 从而诱发大 振幅的周期振荡解, 也即系统的分岔现象. 早血干细胞的增生与分化是控制血液细胞的丰度的重要方法. 这一节将介绍使用数学模型表述细 胞的增生与分化的过程, 并且介绍相应的分析方法和参数估计方法. § 5.1 一些数据 成人的白血球的产生率是1.5 × 109 cells/kg day (Dancey et al., 1976 [12]). 因此, 对于正常的体重 为70 kg 寿命为70 岁的人, 总的白细胞产生率(granulocyte production rate, GPR) 是 cells GP R ≈ 2.7 × 1015 lifetime 70×365 days cells cells (GP R = 1.5 ×9 = 2.7 × 1015 lifetime ) × 70kg × kg day lifetime 类似地, 红细胞的密度为5 × 106 cells/mm3 blood, 红细胞的寿命为120 天(Beutler et al., 1995 [7]). 血的体积为71ml/kg 体重(Dancey et al., 1976). 因此, 对于70 kg 的成年人, 红细胞的产生 率(erythrocyte production rate, EPR)是 cells cells EP R ≈ 3.0 × 109 ≈ 5.4 × 1015 kg day lifetime 65
  • 71. 系统生物学数学基础 71×103 mm3 (EP R = 5 × 106 mmcells 1 cells = 3.0 × 106 kg days ) 3 blood × × kg 120day 最后, 血小板的密度是3 × 106 cells/mm3 blood, 寿命为10 天(Beulter et al., 1995), 可以得到血小 板的产生率(platelet production rate, PPR) 为 cells cells P P R ≈ 2.1 × 109 ≈ 3.8 × 1015 . kg day lifetime 因此, 血细胞的产生率(haematopoietic production rate, HPR = GPR + EPR + PPR) 为 cells HP R ≈ 1.2 × 1016 . lifetime 一个红细胞的体积为92fl = 92 × 10−12 cm3 . 假定红细胞的密度和水相当(这是比较好的近似), 则 每个红细胞的重量为92 × 10−12 g. 因此, 一生中所产生的红细胞的总重量为 cells g kg EP R ≈ 5.4 × 1015 × 92 × 10−12 = 497 . lifetime cell lifetime 血小板的体积为8fl, 类似的计算可以得到 cells kg P P R = 2.1 × 109 ≈ 30 . kg day lifetime 最后, 白细胞的体积为60fl, 因此有 kg GP R ≈ 162 . lifetime 最后, 有 kg HP R = 689 , lifetime 即一个70 公斤的成人在70 年内可以产生689 公斤的血, 大概每10 年可以产生与体重相同的血. 对于小鼠, 有下面结果(采用Novak Neˇas (1994) 的数据, 并假定小鼠的寿命为2 年) c g g g EP R ≈ 8.6 , P P R ≈ 4.2 , GP R ≈ 2.6 . lifetime lifetime lifetime 因此, 有 g HP R ≈ 15.4 . lifetime 假定小鼠的体重为25 克, 则小鼠在其一生中可以产生相当于其体重60% 的血细胞. § 5.2 造血干细胞的数学模型与参数估计 § 5.2.1 数 学 模 型 干细胞模型可以用时滞微分方程描述(图5.1) dP −γP + β(N )N − e−γτ β(Nτ )Nτ = (5.2.1) dt dN −(β(N ) + δ)N + 2e−γτ β(Nτ )Nτ = (5.2.2) dt 这里N 表示状态G0 的细胞总数, P 表示处于分裂过程的细胞总数, τ 是细胞分裂所需的时间, β(N ) 表示重新进入更新的比率, δ 表示干细胞的分化比率, γS 表示细胞凋亡率, τ 表示细胞分裂周期, Nτ = N (t − τ ). 66
  • 72. 系统生物学数学基础 图 5.1: Ctem Cell model {fig:5:1} 方程(5.2.1) 比较容易得到, 方程(5.2.2) 的推导过程如下. 在时间间隔∆t 内, 干细胞的静增量 = 干细胞的静增加 − 干细胞静减少. 其中 静减少 = (β(N )N − δN )∆t 静增加 = 2P (t, τ )∆t 这里P (t, τ ) 表示在细胞分裂完成前一时刻的正在分裂过程(状态M)中的细胞个数, 由下面方程给出: ∂P (t, a) = −γP (t, a), P (t, 0) = β(Nτ )Nτ . ∂a 因此, 我们有 P (t, τ ) = e−γτ β(Nτ )Nτ . 综合上面方程, 并令∆t → 0, 我们得到方程(5.2.2). 为了得到函数β(N ) 的形式, 考虑以下事实(参考Bernard et. al.(2003)[6]): 干细胞是否进入下一 轮的细胞分裂过程, 取决于控制细胞分裂过程的启动基因是否被正确表达出来. 因此, 函数β 也可以看 成是这些启动基因正确表达的比率. 记N 为所有干细胞的总数. 基因是否被激活取决于与该基因相关 的启动因子是否正确结合到DNA 的正确位置. 而这些启动因子(受体)本身由细胞所产生, 由细胞外的 配体所激活. 记R 为这些未被激活的启动因子的数量. L 为已经激活的启动因子数量. G 为配体的数 量, 则所有启动因子的总和为 R + L = mN, 其中m 为平均每个细胞所包含的受体数. 假设n 个配体可以激活一个受体, 则 R + nG ⇆ L. 在平衡状态, 我们有关系 RGn = kL. 其中k 为平衡常数. 由 R = mN − L, 可以求解出 mN Gn L= . k + Gn 进入细胞分裂的比率正比与细胞中的激活受体的平均数量, 因此 Gn L β = β0 = β0 . k + Gn mN 67
  • 73. 系统生物学数学基础 在平衡状态, 新产生的配体与受体结合后, 进入干细胞中, 然后在细胞中被降解, 达到平衡. 因此, 配体 的数量[G] 满足方程 dG = P − σN G, dt 其中P 为产生率, σ 为降解率. 因此, 在平衡态, 由 G = P/σN. 代入上面的函数β, 我们可以得到 θn β(N ) = β0 , N n + θn 其中 P √. θ= n σ k § 5.2.2 参 数 估 计 参数估计是建立造血系统的非常关键而有困难的一步. 这是因为系统的参数非常多, 而很多参数 不能直接测量. 即使有些参数可以测量, 也会误差很大, 而且与不同的实验对象的关系非常大, 因此可 能的参数的范围可以非常大. 尽管如此, 我们还是可以得到一些参数的估计. 对于估计参数, 我们接受 下面原则: 没有绝对正确的参数, 只有相对比较合理的参数. 正常状态下的没有分化的干细胞数目N∗ 可以从几个不同的实验结果得到. 猫的每105 个有核骨 髓细胞中有8 个干细胞(Abkowitz et. al. (1988)), 而在小鼠的每105 个有核骨髓细胞中大概有1 ∼ 50 个 干细胞(Boggs et.al., 1982[8], Micklem et. al., 1987[30]). 小鼠每公斤身体质量大概有1.4 × 1010 个有核 骨髓细胞. 有此可以得到小鼠中每公斤身体质量包含1.4×105 ∼ 7×106 个造血干细胞, 或者猫的每公斤 身体质量中包含大约1.1 × 106 的干细胞. 我们接受后一个数据, 取N∗ = 1.1 × 106cells/kg body weight. Mackey (2000 [29]) 估计对于小鼠, 干细胞凋亡率γS ∈ (0.069, 0.228)day−1 而正常状态下的干细 胞的再增生率为β(N∗) ∈ (0.020, 0.053)day−1 , 细胞分裂时间τS ∈ (1.41, 4.25) 天, 而分化成各种其它细 胞的比率为δ ∈ (0.010, 0.024)day−1 . 图 5.2: 细胞分裂过程 {fig:5:2} 上面数据的估计方法如下面给出. 为了估计系统参数β, δ, γ 在正常态时的值, 可以采用以下实验 方案. 把处于DNA 合成阶段的干细胞(S 阶段)进行标记, 这些标记将会传到以后的子代细胞. 通过长时 间测量被标记的干细胞占所有干细胞的比率fL (t), 可以估计出系统的参数. 具体的估计方法如下. 被标记的细胞所占的比率定义为 PL (t) + NL (t) fL (t) = , P (t) + N (t) 68
  • 74. 系统生物学数学基础 Parameter Mouse, Bradford et al. (1997) Mouse, Cheshier et al. (1999) fL 0.01 0.05 fN 0.93 0.94 fP 0.07 0.06 b(day−1 ) 0.0305 0.0768 0.54 ± 0.7 1.14 ± 0.24 tS (day) −1 γ(day ) 0.069(0.200) 0.228(0, 0.599) −1 β(day ) 0.020(0.015, 0.031) 0.053(0.038, 0.077) κ(day−1 ) 0.010(0, 0.015) 0.024(0, 0.038) τ (day) 4.25(3.40, 9.86) 1.41(1.15, 1.67) Bradford et al. (1997)和Cheshier et al. (1999) 分别研究了小鼠的骨髓细胞中 的干细胞数量的随时间的变化进行了12 个星期和6 个月的研究. 这些数据可以 用于定量估计小鼠的造血干细胞的个数等参数. 在他们的研究中, 首先注入一 定数量的带有特殊标记的干细胞, 这些细胞和正常细胞一样, 可以通过增生, 分 化和死亡. 然后观察这些特殊标记的细胞所占的比率随时间的变化fL (t). fL 为初始时刻被表记的细胞所占的比率, fN 表示被标记的细胞中处于G0 状态 的细胞所占的比率, fP = 1 − fN . 参数b 表示把没有被标记的细胞的所占的比 率fU (t) = 1 − fL (t) 用函数fU (t) = ae−bt 拟合所得的参数值b. 表格中的后面部分是分析结果. tS 表示DNA 合成时间, 表示为tS,av = tS,min ± ∆tS 和∆tS = (tS,max − tS,min)/2. 其它的参数均可以用tS 计算出来, 分别为使 用tS,av 计算所得的值, 和通过tS 的取值范围得到的参数范围. γ 是细胞凋亡率, β 是位于G0 状态的细胞再次进入细胞分裂的比率, κ 是分化成其它细胞的干细 胞所占的比率, τ 是细胞分裂的时间周期. 表 5.1: 实验数据与参数估计 {tab:5:1} 这里P (t) 表示正在分裂过程中的细胞个数, N (t) 表示没有处于G0 状态的细胞的个数. 正在分裂过程 中的细胞所占比率为 P (t) fP (t) = , P (t) + N (t) 处于G0 状态的细胞所占比率为 N (t) fN (t) = 1 − fP (t) = . P (t) + N (t) 由方程(5.2.2), 在定态时, 有 δ = β(2e−γτ − 1). (5.2.3) {eq:5:6} 由方程(??) 可以得到定态解 β P∗ = N∗ (1 − e−γτ ). (5.2.4) {eq:5:7} γ Parameter Mouse, Abkowitz et al.(2000) Cat, Abkowitz et al. (1996) γ(day−1 ) 0.07(0, 0.071) (0, 0.034) β(day−1 ) 0.057(0.022, 0.08) 0.018(0.005, 0.047) κ(day−1 ) 0.042(0.011, 0.075) 0.011(0.002, 0.043) 表 5.2: 实验数据 {tab:2} 69
  • 75. 系统生物学数学基础 因此, 定态时的分裂过程的细胞所占比率 (β/γ)(1 − e−γτ ) P∗ fP = = . (5.2.5) {eq:5:8} (β/γ)(1 − e−γτ ) + 1 P∗ + N∗ 在采集数据的开始阶段, 所有被标记的细胞都处于S 状态, 因此有 (β/γ)(1 − e−τ tS ) PS∗ fL ≡ = . (5.2.6) {eq:5:9} (β/γ)(1 − e−γτ ) + 1 P∗ + N∗ 由(5.2.5) 和(5.2.6), 可以由γ 和tS 解出τ 和β 1 fP (1 − e−γtS ) τ = − ln 1 − (5.2.7) {eq:5:10} γ fL 和 fL γ β= . (5.2.8) {eq:5:11} fN 1 − e−γtS 持续标记时, 当时间充分长以后(t τ − tS ), 状态P 中的所有细胞都是被标记的, 因此没有被标记 的细胞都是状态G0 的细胞, 其数目是衰减的, 衰减率为b = β + δ. 由(5.2.3), (5.2.7) 和(5.2.8) 可以得到 2fL γ fP (1 − eγtS ) 1− b= (5.2.9) {eq:5:12} fN 1 − e−γtS fL 由(5.2.9), (5.2.8), (5.2.7), (5.2.3) 可以通过fL , fP , fN = 1 − fN 和tS 计算出γ, β, τ, δ. 下面来估计tS 的范围. 为此, 首先来估计γ 的范围. 显然有γ ≥ 0, 当γ = 0 时, 可以求解出 fL fP β(γ = 0) = δ(γ = 0) = , τ (γ = 0) = tS . (5.2.10) {eq:5:15} tS f N fL 由(5.2.3) 和δ 0, 我们可以得到2eγτ − 1 0, 或者 γτ ln 2. 代入(5.2.7), 有 fP (1 − e−γtS ) ln 2, − ln 1 − fL 即 1 1 ≡ γc . γ ln fL 1 − 1 fP tS 2 当γ = γc , 有 fP fL tS ln 2 β(γc ) = −2 ln 1 − , δ(γc ) = 0, τγc = − . (5.2.11) {eq:5:19} tS f N 2fP f ln 1 − 2fL P 由btS = (β + δ)tS , 有 tS = (β + δ)tS /b. 而 δ(γc ) + δ(γc ) β + δ β(0) + δ(0) 因此, 由(5.2.10), (5.2.11) 可以得到 fP 1 2fL ≤ tS ≤ tS,min = 2 ln = tS,max fL bfN 1 − 2f bfN P 而 tS,av = (tS,min + tS,max )/2. 70
  • 76. 系统生物学数学基础 § 5.3 造血干细胞模型的动力学分析 对于正常人, 单位体积血液中血细胞的个数保持在正常值附近. 而有些病人的血细胞的个数可以 在很大的范围内周期性震荡. 为了研究这种周期性震荡的出现机制, 我们可以研究血细胞模型的动力 学行为. 这里, 我们介绍早学干细胞模型的动力学行为. 前面介绍了造血干细胞的细胞数目变化的数学模型 dP −γP + β(N )N − e−γτ β(Nτ )Nτ = (5.3.12) dt dN −(β(N ) + κ)N + 2e−γτ β(Nτ )Nτ = (5.3.13) dt 其中 θn β(N ) = β0 . Nn + θn 一个有意义的问题是: 上面的系统在什么条件下会出现细胞数目的周期震荡. 为了研究这个问题, 我们需要对上述模型的动力学行为进行分析. 注意到上面的方程中, 关于干细胞的数目N 的方程是独 立的. 因此, 我们只需要研究方程(5.3.13) 就可以了. 首先, 引进无量纲化参数: Q t q = ,t = θ τ b1 = τ β0 , µ1 = 2e−γτ , δ = τ κ. 则方程(5.3.13) 变为 dq b1 b1 =− n q1 − δq. q + µ1 (5.3.14) {eq:5:s3} 1 + qn dt 1 + q1 这里q1 (t) = q(t − 1), 我们还以t 记无量纲化的时间. 对于正常的人, 这些参数的值为: b = 22.4, µ = 1.64. 这里n 没有可以参考的测量值, 一般认为n ≤ 2 ≤ 4. 在下面的分析中, 我们取n = 4. 可以证明, 当δ b(µ − 1) 时, 方程(5.3.14) 存在唯一的正的定态解 1/4 b(µ − 1) q∗ = −1 . δ 这个解对应于正常人的造血干细胞的数目水平. 我们首先来研究这个定态解的稳定性. 为此, 把方程线 性化可以得到线性化方程 dx = ax + bx1 (5.3.15) {eq:5:s4} dt 其中x = q − q ∗ , 并且 δ (−3b1 (µ1 − 1) + b1 (µ1 − 1)2 + 4δ), a=− b1 (µ1 − 1)2 δµ1 (−3b1 (µ1 − 1) + 4δ). b= b1 (µ1 − 1)2 根据时滞微分方程的稳定性理论, 定态解是稳定的, 当且仅当特征方程 λ − a − b−λ = 0 的所有特征值都具有负实部. 特别地, 以S ⊂ R2 表示a − b 平面内使上述定态解是稳定的区域. 可以证 明(图5.3(A)) S = {(a, b) ∈ R2 | − a sec ξ b −a, where ξ = a tan ξ, a 1, ξ ∈ (0, π)}. 71
  • 77. 系统生物学数学基础 b B 4 A 0.5 1 1.5 2 2.5 3 3.5 -1 2 -2 a -4 -3 -2 -1 1 -3 -2 -4 -4 (B) (A) 图 5.3: 参数: 稳定区域 {fig:5:ss} 对于我们这里所研究的造血干细胞系统, 在我们所感兴趣的参数范围: 0.06 δ 0.26, 20 b1 30, 1.1 µ1 2 有关系a 0 和b 0, 并且 b = µ1 (a + δ). 因此, 可以预见, 当δ 越大时, (a, b) 会超出S 的范围, 系统的定态解变得不稳定(图5.3(B)). 系统的分岔 图如图5.4 所示. 可以看到, 当δ 增大(干细胞的死亡率增加)时, 系统可以出现周期解, 并且周期随δ 的 增加而增加. 图 5.4: Bifurcation diagram[11] {fig:5:ss2} § 5.4 整体模型 模型见图5.5 方程: dQ = −β(Q)Q − (κN (N ) + κR (R) + κP (P ))Q + 2e−γS τS β(QτS )QτS (5.4.16) dt dN = −γN N + AN κN (NτN )QτN (5.4.17) dt dR = −γR R + AR {κR (RτRM )QτRM − e−γR τRS κR (RτRM +τRS )QτRM +τRS } (5.4.18) dt dP = −γP P + AP {κP (PτP M )QτP M − e−γP τP S κP (PτP M +τP S )QτP M +τP S } (5.4.19) dt 72
  • 78. 系统生物学数学基础 图 5.5: 造血系统的模型 {fig:5:full} where s n θ2 θ1 β(Q) = k0 κN (N ) = f0 2 n + Qs + Nn θ2 θ1 κp ¯ κr ¯ κP (P ) = κR (R) = 1 + Kp P m 1 + Kr R r 73
  • 79. 第六章 细胞调亡 74
  • 80. 第七章 蛋白质折叠与随机动力学 75
  • 81. 参考文献 [1] Abkowitz, J. L., Holly, R. D., Hammond, W. P. 1988. Cyclic hematopoiesis in dogs: studies of erythroid burst forming cells confirm an early stem cell defect, Exp. Hematol. 16: 941-945. [2] Abkowitz J, Catlin S, Guttorp P. 1996. Evident that haematopoiesis may be a stochastic process in vivo, Nature Med. 2: 190-197. [3] Abkowitz J, Golinelli D, Harrison D, Guttorp P. 2000. The in vivo kinetics of murine hemopoietic stem cells, Blood 96: 3399-3405. [4] Alon, U. 2006. An introduction to systems biology, design principles of biological circuits. Chap- man Hall/CRC. London. [5] Atkinson, M. R., Savageau, M. A., Myers, J. T., Ninfa, A. J. 2003. Development of genetic circuitry exhibiting toggle switch or oscillatory behavior in Escherichia coli. Cell 113: 597-607. [6] Bernard, S., B`lair, J., Mackey, M. C. 2003. Oscillations in cyclical neutropenia: new evidence e based on mathematical modeling, J. Theo. Bio. 223: 283-298. [7] Beutler E, Lichtman MA, Coller BS, Kipps TJ. 1995. Williams hematology, McGraw-Hill, New York, 1995. [8] Boggs, D., Boggs, S., Saxe, D., Gress, L., Canfield, D. 1982. Hematopoietic stem cells with high proliferative potential: assay of their concentration in marrow by the frequency and duration of cure of W/Wv mice, J. Clin. Invest. 70: 242-253. [9] Bradford G, Williams B, Rossi R, Bertoncello I. 1997. Quiescence, cycling, and turnover in the primitive haematopoietic stem cell compartment, Exper. Hematol. 25: 445-453. [10] Cheshier S, Morrison S, Liao X. Weissman I. 1999. In vivo proliferation and cell cycle kinetics of long term self renewing haematopoietic stem cells, Proc. Natl. Acad. Sci. USA 96: 3120-3125. [11] Colijn, C., Mackey, M. C. 2005. Bifurcation and bistability in a model of hematopoietic regulation. preprint submitted. [12] Dancey JT, Deubelbeiss KA, Harker LA, Finch CA, 1976. Neutrophil kinetics in man, J. Clin. Invest 58: 705-715. [13] Dyson, S., Gurdon, J. B. 1998. The interpretation of position in a morphogen gradient as revealed by occupancy of activin receptors. Cell 93: 557-568. [14] Entchev, E. V., Schwabedissen, A., Gonzalez-Gaitan, M. 2000. Gradient formation of the TGF-β homolog Dpp. Cell 103: 981-991. [15] Fung, E., Wong, W. W., Suen, J. K., Bulter, T., Lee, S., Liao, J. C. 2005. A synthetic gene- metabolic oscillator. Nature 435: 118-122. [16] Gillespie, D. T. 1977. Exact stochastic simulation of coupled chemical reactions. J. Phys. Chem. 81:2340-2361. [17] Gillespie, D. T. 2000. The chemical Langevin equation. J. Chem. Phys. 113:297–306. 76
  • 82. 系统生物学数学基础 [18] Gillespie, D. T. 2002. The chemical Langevin and Fokker-Planck equations for the reversible isomerization reaction. J. Phys. Chem. A 106: 5063-5071. [19] Gurdon, J. B., Harger, P., Mitchell, A., Lemaire, P. 1997. Activin has a direct long range signaling activity and can form a concentration gradient by diffusion. Curr. Biol. 7: 671-681. [20] Gurdon, J. B., Bourillot, P. Y. 2001. Morphogen gradient interpretation. Nature 413: 797-803. [21] Hasty, J., Pradines, J., Dolnik, M., Collins, J. J. 2000. Noise-based switches and amplifiers for gene expression. Proc. Natl. Acad. Sci. USA 97: 2075-2080. [22] Kerszberg, M., Wolpert, L. 1998. Mechanisms for positional signalling by morphogen transport: a theoretical study. J. Theor. Biol. 191: 103-114. [23] Lander, A. D., Nie, Q., Wan, F.Y.M. 2002. Do morphogen gradients arise by diffusion? Dev. Cell, 2: 785–796. [24] Lander, A. D., Nie, Q., Wan, F. Y. M. 2007. Membrane-Associated Non-Receptors and Mor- phogen Gradients. Bull. Math. Biol. 69:33-54. [25] Lewis, E. B. 1978. A gene complex controlling segmentation in Drosophila. Nature, 276: 565-570. [26] Lipshtat, A., Loinger, A., Balaban, N. Q., Biham, O. 2006. Genetic toggle switch without coop- erative binding. Phy. Rev. Lett. 96, 188101. [27] Kloeden, P. E., and E. Platen. 1992. Numerical Solution of Stochastic Differential Equations. Springer-Verlag, New York. [28] Huang, G., Wang H., Chou S., Nie, X., Chen, J., Liu, H. P. 2006. Bistable expression of WOR1, a master regulator of white-opaque switching in Candida albicans. Proc. Natl. Acad. Sci. USA, 103, 12813-12818. [29] Mackey, M. C. 2000. Cell kinetic status of haematopoietic stem cells, Cell Prolif. 34: 71-83. [30] Micklem, H., Lennon, J., Ansell, J., Gray, R. A. 1987. Numbers and dispersion of repopulating hematopoietic cell clones in radiation chimeras as functions of injected cell dose, Exp. Hematol 15(3): 251-257. [31] Nusslein-Volhard, C., Wieshaus, E. 1980. Mutations affecting segment number and polarity in Drosophila, Nature, 287: 795–801. [32] olde Scheper T., Klinkenberg, D., Pennartz, C., van Pelt, J. 1999. A mathematical model for the intracellular circadian rhythm generator. J. Neurosci., 19, 40-47. [33] Tabata, T. 2001. Genetics of morphogen gradients. Nat. Rev. Genet. 2: 620-630. [34] Teleman, A. A., Cohen, S. M. 2000. Dpp gradient formation in the Drosophila wing imagianl disc. Cell 103: 971-980. [35] Tyson, J. J., Hong, C. I., Thron, C. D., Novak, B. 1999. A simple model of circadian rhythms based on dimerization and proteolysis of PER and TIM. Biophys. J., 77, 2411-2417. [36] van Kampen, N. G. 1992. Stochastic process in physics and chemistry. North-Holland, Amster- dam, 1992. [37] Vilar, J. M. G., Kueh, H. Y., Barkai, N., Leibler, S. 2002. Mechanisms of noise-resistance in genetic oscillators. Proc. Natl. Acad. Sci. USA, 99, 5988-5992. [38] Wolpert, L. 1989. Positional information revisited. Development 107(Suppl.): 3-12. [39] Zordan, R. E., Galgoczy, D. J., Johnson, A. D. 2006. Epigenetic properties of white-opaque switching in Candida albicans are based on a self-sustaining transcriptional feedback loop. Proc. Natl. Acad. Sci. USA, 103, 12807-12812. [40] http://nobelprize.org/nobel_prizes/medicine/laureates/2001/press.html. 77
  • 83. 插图 中心法则 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 2.1 2.2 Intrinsic and extrinsic noise in gene expression (Elowitz et. al. 2002) . . . . . . . . . . 15 2.3 A model of the expression of a single gene. Each step represents several biochemical reactions, which are associ 模拟结果(Gillespie 算法): [mRNA] vs. Time. . . . . . . . . . . . . . . . . . . . . . . . 16 2.4 模拟结果(求解Langevin 方程): [mRNA] vs. Time. . . . . . . . . . . . . . . . . . . . . 16 2.5 基因表达的正反馈调控. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 3.1 分岔图(λ = 4, a = 4, n = 4) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 3.2 3.3 Dynamical properteis of λ repressor cI. . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 3.4 Bifurcation plots for the variable x and concentration of λ repressor (α = 50, σ1 = 1, σ2 = 5) 22 模拟结果: α = 50, γ = 15, σ1 = 1, σ2 = 5. (A): 确定性系统, γ = 15 (t 20) 和γ = 10 (t 20). (B): 随机系统(3. 3.5 3.6 Mutual repression circuit. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 3.7 The probabilities P (NA , NB ) for the switch, under condition of (A) weak repression (k = 0.005) where there is 3.8 The population of unbound A and B proteins vs time, obtain from Gillespie simulations of the switch with para 3.9 Modules and connectivity for the genetic clock. The top construct contains the gInAp2 promoter fused to gInG Atkinson oscillator 计算模拟结果. 这里的无量纲参数为: β1 = β3 = 30.0, β4 = 1.0, λ1 = λ3 = 2.0, α1 = α2 = 20.0 3.10 不同的参数值所对应的动力学行为. (A): n2 = 4, α2 = 10.5; (B): α2 = 20, n2 = 5; (C) λ3 = 0.5, α2 = 100, n1 = 4, 3.11 3.12 Conceptual diagram of the oscillatory dynamics, highlighting the two metabolite pools (M1 and M2 ) and their 3.13 Biological realization of the conceptual design in Fig. 3.12. The yellow boxes highlight the two metabolic pools 3.14 Computational characterization of the metabolator. The metabolator is prone to oscillate at increasing glycolyt 3.15 Biochemical network of the circadian oscillator model.(replot from [37]) . . . . . . . . 31 3.16 Oscillations in repressor and activator protein numbers obtained from numerical simulations of the deterministi 计算模拟结果: (A) 完整系统, (B) 简化系统. . . . . . . . . . . . . . . . . . . . . . . . . 33 3.17 τ 与K 的依赖关系. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 3.18 简化方程的向量场分析图示([37]). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 3.19 计算模拟结果: (A) 确定性系统, (B) 随机模型. 这里δR = 0.005, 其他参数和前面一样. . 35 3.20 3.21 The schematic diagram of a synthetic gene regulatory network. . . . . . . . . . . . . . 36 3.22 When no stimulus is presented, the cells oscillate with the same frequency (a) with different phases (b). Withou 3.23 The synchronization in the present of sinusoidal periodic stimulus. When the stimulus with resonance frequency 3.24 Synchronization in the present of white noise stimulus. (a) shows the time evlution of order parameter of the sy 3.25 The order parameter for 1000 cells with period τ varies from 5 to 15, and different values of σ (red circles for σ 3.26 The relation between the order parameter and the variability of the cells (measured by ∆β. The parameter use 3.27 A simple molecular mechanism for the circadian clock in Drosophila, adopted from [35]. PER and TIM protein 数值模拟结果. 这里的参数为: vm = 1, km = 0.1, vp = 0.5, kp1 = 10, kp2 = 0.03, kp3 = 0.1, Pcrit = 0.1, Jp = 0.05, r ′ 3.28 (A) g (P ) 与参数Keq 的依赖关系. (B) 相平面图. . . . . . . . . . . . . . . . . . . . . . 45 ′ ∗ 3.29 (A) ′ g ′ (P ∗ ) 与参数kp1 的依赖关系. (B) 解与参数kp1 的关系. 这里kp1 分别取值10, 20, 30, 其它参数和前面一致. 3.30 3.31 Two-parameter bifurcation diagram for the model(adopt from [35]). . . . . . . . . . . 46 3.32 Period of the endogenous rhythms of wild-type and mutant files. [35] . . . . . . . . . . 46 3.33 (A). Schematic representation of the biological elements of the protein synthesis cascade, assumed to be elemen 节律振荡模型(3.3.59)-(3.3.60) 的模拟结果. 这里的参数值为: rM = 1.0hr−1 , rP = 1.0hr−1 , qM = 0.21hr−1 , qP = 0 3.34 节律振荡模型(3.3.59)-(3.3.60) 的分岔图. 三条曲线(从上到下)分别对应于δ = 1.5, 1.0, 0.5. 49 3.35 3.36 Morphogen gradient . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 78
  • 84. 系统生物学数学基础 3.37 Dpp gradient[14]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 3.38 Wing imaginal disc of Drosophila[33]. . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 Dpp 扩散模型: (A) Diffusion and reversible binding. (B) 3.39 Diffusion, reversible binding and degradation. (C) Diff 3.40 Dpp Morphogen Gradient (ψ = 5). . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 5.1 Ctem Cell model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 细胞分裂过程 . . . . . . 5.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 参数: 稳定区域 . . . . . 5.3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 5.4 Bifurcation diagram[11] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 造血系统的模型 . . . . . 5.5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 79