Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

El text.life science6.ikeguchi1911211.

43 views

Published on

http://www.eccse.kobe-u.ac.jp/distance_learning/life_science6/

Published in: Science
  • Be the first to comment

  • Be the first to like this

El text.life science6.ikeguchi1911211.

  1. 1. 2019年12月11日 横浜市立大学 生命医科学研究科 理化学研究所 MIH 池口 満徳
  2. 2. • – – • – • (AI) – LINC – AI
  3. 3. ü MD 1 2 fs 10-15s) ü 1 1 86,400 =86 ps ü 1 1 86,400,000 =86 ns ü 1 MD 12
  4. 4. History of Molecular Dynamics Simulations of Proteins BPTI (3000 atoms) Nature, 267, 585, 1977 in vacuum, 10 ps Lysozyme (20,000 atoms) 1990s in water, several ns Ca2+-ATPase (more than 270,000 atoms including water) 2005 Sugita, Ikeguchi, Kidera, Toyoshima, JACS, 127,6150
  5. 5. Flagship Supercomputer “K”
  6. 6. Ranking of K-Computer Top500スパコンの世界順位 1 3 5 7 9 11 13 15 17 19 21 20116 201111 20126 201211 20136 201311 20146 201411 20156 201511 20166 201611 20176 201711 20186 201811 20196
  7. 7. K-computer 663,552 cores 1.327 PB memory 11.28 PFLOPS Rpeak 10.51 PFLOPS Rmax Shutdown in Aug. 2019 Fugaku
  8. 8. MD DB QM/MM Free Energy MD -
  9. 9. https://postk-web.r-ccs.riken.jp/perf.html RIKEN Sugita Group: GENESIS
  10. 10. 100ns μs ms aggregation 125 1 MP-CAFEE1 MD MD Folding, Ligand Binding, Conformational Changes
  11. 11. 汎用スパコンでの動的機能解析 数十μs/day計算可能な専用計算機(ANTON2等)と違って、 我々が使用可能なのは汎用スパコンである 一つの計算では、汎用計算機だと、現状からの飛躍的向上は、 非常に困難である しかし、汎用スパコンでは、ノード or CPUコアは沢山ある レプリカを沢山用意して、統計的に計算を行うことで、 実質的に、長時間ダイナミクス情報を得る
  12. 12. 汎用スパコンでの動的機能解析 方法① 熱力学的方法 自由エネルギー分布を得る (取りやすい複数の状態と頻度比を得る) e.g. レプリカ交換、アンブレラサンプリング等 方法② 速度論的方法 キネティックス(速度論)を得る (取りやすい複数の状態間遷移を得る) e.g. マルコフ状態遷移モデル(MSM) Weighted Ensemble レプリカ系のMD計算
  13. 13. Hierarchy of Protein Dynamics 10-15 10-12 10-9 10-6 10-3 100 103 106 femto pico nano micro milli second hour day bond vibration methyl rotation loop motion domain motion protein folding slow dynamics side chain rotamers drug binding Conventional MD Simulations Enhanced Sampling, Ensemble Simulations, etc.
  14. 14. MD • – • – • – • – • – • – • – NMR SAXS
  15. 15. MD • –
  16. 16. MD : RMSD, RMSF Root Mean Square Deviation (RMSD) ü ü ü ü RMSD % = ∑( )((%) − )-./,( 1 2
  17. 17. RMSD from crystal structure) Time (ns) RMSD(Å) domain A domain B MD RMSD RCBRCA Oroguchi, MI et al., Biophys. J., 96, 2808 (2009) Root Mean Square Deviation (RMSD) RMSD = ( i xi − xref i) 2 N ü ü MD ü RMSD RMSD
  18. 18. MD : RMSD, RMSF Root Mean Square Deviation (RMSD) ü ü ü ü RMSD % = ∑( )((%) − )-./,( 1 2 Root Mean Square Fluctuation (RMSF) ü ü ü ü ü RMSF 4 = ∑5 )((%) − )67.,( 1 8
  19. 19. Conformational Changes of β subunit upon ATP binding βTPβE βE βTP γ γ
  20. 20. Protein Fluctuation (RMSF) ü Fluctuation of C-terminal domain: βE>βTP>βDP ü Despite fairly similar conformations of βTP and βDP, fluctuations of C-terminal domain are different. Y. Ito & M. Ikeguchi, J. Comp. Chem. 31, 2175 (2010) βE βTP Empty; Open) ATP bound; Closed) ADP bound; Closed)
  21. 21. MD • – • –
  22. 22. MD : , PCA Correlation Matrix Cij = Δri ⋅ Δrj Δri 2 Δrj 2 Cij = 1 Cij = 0 Cij = −1 ü ü ü
  23. 23. Correlated Motion in Protein Y. Ito & M. Ikeguchi, J. Comp. Chem. 31, 2175 (2010) Cij = 1 Cij = 0 Cij = −1
  24. 24. MD : , PCA Correlation Matrix Cij = Δri ⋅ Δrj Δri 2 Δrj 2 Cij = 1 Cij = 0 Cij = −1 ü ü ü Principal Component Analysis (PCA) ∆"#∆"$ % = 1 ⋯ 3* ü ü ü
  25. 25. PCA MD PCA ü PCA ü Computational Biochemistry and Biophysics, Becker et al. eds., 2001. Principal Component Analysis (PCA)
  26. 26. PCA F1-ATPase β ü Top mode 30 % ü Top ten modes 70 % ü 4 ATP Y. Ito & M. Ikeguchi, Chem. Phys. Lett. 490, 80 (2010)
  27. 27. Principal Component Analysis: Mode 1-4 Mode 1: magenta Mode 2: yellow Mode 3: cyan Mode 4: green βE→βDP: red üRelaxation from interactions with adjacent subunits üIntrinsic flexibility is well correlated with structural transition Y. Ito & M. Ikeguchi, Chem. Phys. Lett. 490, 80 (2010)
  28. 28. MD • – • – • –
  29. 29. Interaction between ligand and protein Isobe, YI, MI, Arita, Sci. Rep. 8: 7951 (2018) Interaction between CYP1A2 and EPA
  30. 30. MD • – • – • – • –
  31. 31. MD A B λ=0 λ=1 A B i=0 i=N λ=0.01 λ=0.02 i=1 i=2 ∆" = −%&' ( ) *+, ln exp − 2)3, − 2) %&' ) = 4 5 , 62 67 8 97 Free Energy Perturbation Thermodynamic Integration Bennett Acceptance Ratio (BAR)
  32. 32. ΔGbind ΔGligandΔGcomplex MD FEP, TI, BAR ΔGbind ΔGligandΔGcomplex= − = = ΔGcomplexΔGligand
  33. 33. MD MD MD Replica 1 Replica 2 Replica 3 Replica 0 Replica 0 Replica 3 Replica 2 Replica 1 Replica 3 Replica 0 Replica 2 Replica 1 … … … … Temperature High Low MD Temperature High Low
  34. 34. 17.2 17.6 18 18.4 0 50 100 150 200 MD(REMD) MD: REMD: ΔSClausius[cal/mol/K] Time [ns] Torsionangle[θ] Torsionangle[] Time [ns]Time [ns] MD REMD : Oseltamivir MD Hikiri, MI, et al. J Chem Theory Comput. 2016 12: 5990.
  35. 35. UnfoldFold ΔSc Folding/Unfolding MD(REMD) 0 20 40 60 80 100 250 280 310 340 370 400 Temperature [K] PFold(T)[%] Tm( ) Tm(REMD) • REMD Folding/Unfolding • Folding/Unfolding • REMD (Tm=305K) (315K) RMSD(Å) Simulation time [ns] RMSD (Å) (T=305K) Fold/Unfold (10 ) < > 0 4000 8000 12000 16000 0 1 2 3 4 5 6 7 FoldUnfold : Fold : Unfold REMD (255K-400K)
  36. 36. UnfoldFold ΔSc -30.0 -25.0 -20.0 -15.0 -10.0 -5.0 0.0 250 280 310 340 370 400 Folding ΔSc(T) Temperature [K] -1.0 -0.5 0.0 0.5 1.0 1.5 2.0 250 280 310 340 370 400 Temperature [K] ΔGUnfold(T)[kcal/mol]Fold ΔSUnfold(T)[cal/mol/K]Fold :ΔS :ΔSUnfold Fold Temperature [K] ΔSc(T)[cal/mol/K] -40 -30 -20 -10 0 285 295 305 315 325 335 Hikiri, MI, et al. J Chem Theory Comput. 2016 12: 5990.
  37. 37. MD • – • – • – • – • –
  38. 38. (Generalized) Replica Exchange with Solute Tempering (REST / gREST) gREST: M.Kamiya and Y.Sugita, JCP, 149, 072304 (2018). replica3 time(t) high lowTemperature(T) 300K 450K 600K replica3 replica3 replica3 replica2 replica2 replica2 replica2 replica1 replica1 replica1 replica1 Energy MD (600K) MD (450K) MD (300K) replica3 replica3 replica2 replica2 replica1 replica1 Solute region Charge LJ Bond Angle Dihedral CMAP Conventional REST Solute region Charge LJ Bond Angle Dihedral CMAP gREST REST: Liu et al. PNAS, 102, 13749 (2005).
  39. 39. D1 T1 D2 T1 DN TM D3 T1 D1 T1 D2 T1 D3 T1 DN-1 TM D1 T1 D2 T1 D3 T1 DN-1 TM 1-1 2-1 3-1 N-M D ü ü 2 ü MD →
  40. 40. MD • – • – • – • – • – • –
  41. 41. Basin around open structure eq. MD eq. MD Umbrella Sampling MD µs - ms Method: umbrella sampling simulations Conformations Free energy Basin around closed structure
  42. 42. Method: umbrella sampling simulations Conformations Free energy MD MD Replica Exchange Umbrella Sampling (REUS ) Reaction Coordinate
  43. 43. Method: umbrella sampling simulations Conformations Free energy Reaction Coordinate
  44. 44. Free Energy Simulations open close 1. Initial Path 2. Umbrella Sampling Simulations For each intermediates along path, simulations with restraint, 3. WHAM Weighted Histogram Analysis Method was used for removing restraints and calculating free energy profiles along structural transition between open and closed conformations. C.L. Brooks PNAS (2007)B. Roux JACS (2005) w j = Krmsd (ΔDrmsd − ΔDmin )2 ΔDrmsd = rmsd(X,Xopen ) − rmsd(X,Xclosed ) was carried out. Restraint potential is applied to both main chains and side chains. Nudged Elastic Band
  45. 45. Free Energy Profiles for Open-Close Transition open close blue: open yellow: closed green: ATP ü Meta-stable state is found: ATP-bound open conformation. encounter complex open close Ito, Oroguchi, Ikeguchi, JACS, 133, 3372 (2011)
  46. 46. transition: H-bond in P-loop Open Closed H-bond partner of Asp256 is changed from Lys162 to Thr163 (P-loop). Mutation of Asp256, Lys162, or Thr163 results in remaining open conformation even with ATP bound.
  47. 47. Simulation time … A lot of short MDs … … … … Simulation time … … … … … Markov state modelDefinition of‘State’ Transition matrix Population Network マルコフ状態遷移モデルによるダイナミクス解析
  48. 48. MD All atom (MM) Slow motion High precision Coarse-grained (CG) Fast motion Low precision Coupling force MM CG MM MD MM-CG MD K. Moritsugu, T. Terada, A. Kidera, 2017 Open Closed
  49. 49. Moritsugu et al., JCP 2018 MSES weighted ensemble
  50. 50. MSES weighted ensemble
  51. 51. PC2 open closed energy barrier PC 1 conformational switch open/ helical open/ coiled closed/ helical 4.6 kJ/mol 3.1 kJ/mol 0.30 ms-1 0.0062 ms-1 WE1 0.047 ms-1 0.011 ms-1WE2 k = 1.1 ms-1 3-basin kinetic model: DG+- = -kBT ln (k+ / k- ) MSES weighted ensemble
  52. 52. MD • – • – • – • – • – • – • – NMR SAXS
  53. 53. ライフ系 企業 IT企業 人工知能(AI)技術の活用 89 IT キックオフミーティングの様子 アカデミック 理化学研究所 医薬プロセス最適化プラットフォーム推進グループ 医薬基盤・健康・栄養研究所 10 1. 2. 3. 4. 5. ADMET 6. 7. 8. 9. NLP 10. AI
  54. 54. LINCパンフレットより 池口満徳 WG4代表 本間光貴 WG5代表 LINC
  55. 55. ターゲット探索 ・検証 スクリーニング ヒット to リード リード最適化 前臨床試験 疾病関連遺伝子 創薬標的タンパク質 化合物ライブラリ X線結晶解析 NMR 電子顕微鏡 タンパク質立体構造 スクリーニング ヒット化合物 HTS 候補化合物 in silico 化合物 最適化 疾病動物モデル 薬物動態 毒性 (ADMET) メドケム 薬効 立体構造 PPJJ1111 PPJJ1122 PPJJ1133 PPJJ1144 PPJJ1155 PPJJ1166 PPJJ1177 PPJJ1188 WWGG44 WWGG55
  56. 56. 熟練した技能が必要 X線結晶構造解析 NMR (核磁気共鳴) 電子顕微鏡 コンピュータ 実験データ タンパク質立体構造 人工知能 A. I. PPJJ1111 AI化することで、 これまで、熟練者のみが 可能であった高度な解析が 可能に 立体構造決定法
  57. 57. PJ12:AIによるドッキング計算高度化 これまでの問題点:精度の低さ(1~2%のヒット率) 正解ポーズ、活性化合物群 不正解ポーズ、非活性化合物群 J. Chem. Inf. Model. 2017, 57, 942–957. 学習 AIは、画像認識の ように、正しい結 合を間違った結合 から見出すことが できるか? 画画像像認認識識 結結合合計計算算 2次元 3次元 色(RGB) 原子種 対象(猫等) 結合ポーズ 黄:実験、緑:計算 黄:実験、緑:計算
  58. 58. PJ13:分子動力学計算におけるAI活用 これまでの問題点 時間軸を含む大量のデータ (静止画像 → 動画) 膜タンパク質アクアポリンのMD 全原子数~16万 数千万~数十億ステップの計算 熟練した技術者が長時間かけて解析 AIによって、重要な箇所を発見 動的なタンパク質の制御による 創薬のブレークスルーを目指す
  59. 59. PJ14:AIを用いた高精度分子力場 分子力場 分子軌道 分分子子運運動動 電電子子状状態態 ◯ ☓ 分分子子運運動動 電電子子状状態態 ☓ ◯ MDでよく使われる 反応解析でよく 使われる 分分子子運運動動 電電子子状状態態 ◯ ◯ 人工知能 A.I. 電子状態を学習電子状態を加味した 高精度力場を高速計算
  60. 60. まとめ • 分子動力学シミュレーションの新展開 ‒ スパコン「京」から「富岳」へ ‒ アンサンブル シミュレーションの有効性 • 分子動力学シミュレーションの解析・応用 ‒ 分子動力学シミュレーションの活用例 • 分子シミュレーションと人工知能(AI)の連携 ‒ LINCコンソーシアム:WG4 ‒ 分子子ミューレヨン分野でのAIの活用

×