Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

[All-in-one2016] 文献情報を利用したサービスの活用法

246 views

Published on

All-in-one 合同講習会 2016 ~バイオビッグデータ解析入門~
講師:川端 猛(大阪大学 蛋白質研究所)
日時:2016年7月23日
場所:VisLab OSAKA(グランフロント大阪 北館タワーC 9F、大阪市北区)
YouTube:https://youtu.be/s9YFsGzkFos

Published in: Science
  • Be the first to comment

  • Be the first to like this

[All-in-one2016] 文献情報を利用したサービスの活用法

  1. 1. ホモロジー・モデリングによる 蛋白質の立体構造予測 川端 猛 (大阪大学・蛋白質研究所・寄付研究部門准教授) 2016年7月23日(土) グランフロント・梅田 All‐in‐one合同講習会2016 kawabata@protein.osaka-u.ac.jp 1
  2. 2. 今日の内容 1.タンパク質のアミノ酸配列と立体構造の関係 4.HOMCOSによるヘテロ複合体構造の予測 5.HOMCOSによる化合物‐蛋白質複合体構造の予測 3.HOMCOSによる単量体のホモロジーモデリング 2.アミノ酸配列から立体構造を予測する方法
  3. 3. タンパク質のアミノ酸配列と立体 構造の関係
  4. 4. 三つの重要な高分子:DNA, RNA,蛋白質 これら三つはいずれも重合体(polymer)、 つまりある単位となる分子(monomer)が一列に並んだ形 T T G C AA A U U G C A DNA RNA 蛋白質 4種類 4種類 20種類 •ひもなので、とにかくフレキシブル •原理的にどんな形もとりうる。 •ユニットの並びや環境によってどんな形を好むかが決まる L K M C N G
  5. 5. •極めて多様な構造 •構造はそのアミノ酸配列によって決定される •立体構造の多様性はその分子機能の多様性と関係 タンパク質の立体構造 all-α all-β α/β α+β
  6. 6. 変性状態(D) 天然状態(N) フォールディング(折り畳み)という現象 非常に多種の構造の集合 大きく広がっている ほとんど唯一の構造 小さくコンパクトに折りたたまっている 温度や変性剤濃度 によって可逆に変化 折り畳みは、原則としてその蛋白質以外の分子の介助を必要としない. ・アミノ酸配列の情報だけで、天然状態の立体構造が決定される。 ・天然状態は蛋白質-水の系の自由エネルギーが最小状態。 アンフィンセンのドグマ(Anfinsen’s dogma) ドグマによれば、「あるアミノ酸配列は、ある一つの立体構造に対応する」はず 「似ているアミノ酸配列は、似ている立体構造に対応する」だろうか?
  7. 7. ミオグロビンとヘモグロビン ミオグロビン (myoglobin, human,3rgkA) ヘモグロビン (hemoglobin, human,1bz1) A鎖(鎖) C鎖(鎖) B鎖(鎖) D鎖(鎖) どちらも酸素分子O2と結合 筋肉中で酸素分子を貯蔵 血液中で酸素分子を運搬
  8. 8. ヘムとの結合部位 HBA_HUMAN (1bz1A) hemoglobin alpha chain, human HBA_HUMAN (1yeuA) hemoglobin alpha chain, human His59 His88 His59 His88 OXY (O2) proximal distal proximal distal オキシヘモグロビンデオキシヘモグロビン
  9. 9. アミノ酸配列と立体構造の関係 (1) HBB 4 :LTPEEKSAVTALWGKV--NVDEVGGEALGRLLVVYPWTQRFFESFGDLSTPDAVMGNPKVKAHGKKVLGAFSDGL:76 * * * * * **** * * *** * * * * * *** * ** ***** * HBA 3 :LSPADKTNVKAAWGKVGAHAGEYGAEALERMFLSFPTTKTYFPHF-DLSH-----GSAQVKGHGKKVADALTNAV:71 HBB 77 :AHLDNLKGTFATLSELHCDKLHVDPENFRLLGNVLVCVLAHHFGKEFTPPVQAAYQKVVAGVANALAHKY:146 ** * ** ** ** *** ** ** * ** * **** * * * * * * ** HBA 72 :AHVDDMPNALSALSDLHAHKLRVDPVNFKLLSHCLLVTLAAHLPAEFTPAVHASLDKFLASVSTVLTSKY:141 HBB_HUMAN (1bz1B) hemoglobin beta chain, human HBA_HUMAN (1bz1A) hemoglobin alpha chain, human 配列一致率:46 % HEM HEM 配列が似ていれば 立体構造も似ている 標準的な配列比較法 (BLAST)
  10. 10. アミノ酸配列と立体構造の関係 (2) MYG_HUMAN (3rgkA) hemoglobin beta chain, human HBA_HUMAN (1bz1A) hemoglobin alpha chain, human MYG 1:MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHLKSEDEMKASEDLKKHGATVLTALGG:75 * ** * **** * * * * * * * * * * * * * ** * ** HBA 1:MVLSPADKTNVKAAWGKVGAHAGEYGAEALERMFLSFPTTKTYFPHF------DLSHGSAQVKGHGKKVADALTN:69 MYG 76:ILKKKGHHEAEIKPLAQSHATKHKIPVKYLEFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYK: 148 * ** * * * * * * * * * * HBA 70:AVAHVDDMPNALSALSDLHAHKLRVDPVNFKLLSHCLLVTLAAHLPAEFTPAVHASLDKFLASVSTVLTSKYR: 142 HEM HEM 配列が似ていれば 立体構造も似ている 配列一致率:27 % 標準的な配列比較法 (BLAST)
  11. 11. アミノ酸配列と立体構造の関係 (3) HBA_HUMAN (1bz1A) hemoglobin alpha chain, human GLB1_ANAIN (3g46A) Globin-1, Anadara inaeqequivalivis (二枚貝) 配列一致率:17% HMP_ECOLI (1gvhA) Flavohemoprotein, hmp, Escherichia coli (大腸菌) 配列一致率:17% PHCA_ARTPT (1gh0A) C-phycocyannin alpha chain, cpcA Arthrospira platensis (シアノバクテリア、 藍藻、藍色細菌) 配列一致率:10% プロフィール法 (PSI-BLAST) 立体構造比較 (MATRAS) 10% 17% 17% FAD HEM HEM CYC: phycocyanobilin ヘムから鉄が抜け、開裂した分子 配列類似性がかなり低くても 立体構造が似ている場合がある ⇒立体構造は配列よりも進化的によく保存
  12. 12. 立体構造の変化 アミノ酸配列の変化と立体構造の変化の相関(グロビン族) 立体構造の変化はアミノ酸配列の変化と相関 配列が30%以上一致していれば、RMSDは2Å以下 アミノ酸配列の類似度※アラインメントは立体構造比較 プログラム(MATRAS)で計算
  13. 13. アミノ酸配列と立体構造の関係のまとめ ・アミノ酸配列が有意に似ていれば、立体構造も たいてい似ている ⇒相同(進化的な起源を同じにする)タンパク質の立体 構造は、だいたい似た形をしている ⇒「立体構造はアミノ酸配列より進化的によく保存する」 ⇒タンパク質の機能は、その立体構造をベースとするの で、大きく構造を変化させるアミノ酸置換は進化の過程 で淘汰されてしまうから? ・相同なタンパク質であっても、配列類似性が低く なるほど、立体構造のずれは多くなる。 相同性(ホモロジー; homology): 進化的に共有祖先をもつことに由来すると考えられる類似性。
  14. 14. アミノ酸配列から立体構造を予 測する方法
  15. 15. 立体構造予測法の二つのアプローチ 名称 ホモロジー・モデリング法 比較モデリング法 鋳型ベース予測法 非経験的予測法 Ab initio 予測法 De novo予測法 手法の概要 鋳型立体構造にできるだけ似た形 で、立体構造を予測 鋳型構造を用いずに、物理化学的な 原理(分子シミュレーションの技法) に基づいて立体構造を予測 鋳型立体構造 必要 不要 一般性 低い 高い 計算量 少ない 多い 予測精度 似た鋳型があれば高い 高い精度を得るには大きな 計算量が必要 単体の立体構造予測 MODELLER, SWISS‐MODEL, RosettaCM, 3Dzigzaw ROSETTA, EVfold,… 蛋白質複合体予測 MODELLER, HOMCOS ZDOCK, HADDOCK,… 低分子―タンパク質 複合体予測 MODELLER, HOMCOS,  fkcombu DOCK, AutoDock, sievgene,  Glide,…
  16. 16. Ab initio 予測 / De novo 予測 分子動力学法(Molecular Dynamics; MD) ニュートンの運動方程式に従って原子を動かす。: 原子モデルとポテンシャルエネルギー関数を設定 より低いエネルギー値になるように構造を変形していく ・構造を探索するための手法 ・エネルギー関数 原子を作用単位とした古典力学的なものが多い。量子力学は使わない。 アミノ酸単位の、粗視化モデル(Coarse-grained model) もよく用いられる。 分子力学法(Molecular Mechanics; MM):エネルギーが低くなる方向に原子を動かす。 モンテカルロ法(Monte Carlo; MC):ランダムに原子を動かす。: ⇒ 近年、フラグメント・アセンブリによるモンテカルロ法がよく使われてきている
  17. 17. テンプレート 構造 ステップ1:フォールド認識 ステップ2:モデリング 予測対象配列 (クエリ配列) 立体構造データベース LNVANGKSVIGPALLEEVWGSRD M N I A D G S V V G A L Q E A W F T QD PT R L N V A N G S V I G L L E E V W F S QD PA R K LNVANGKSVIGPALLEEVWFS-RD * * * ** ** * * ** ** MNIADG-SVVGPTALQEAWFTQRD 鋳型(テンプレート)構造とそのアラインメント ホモロジー・モデリングによる3次構造予測 原理 : 立体構造はアミノ酸配列より進化的に保存する. 立体構造データベースの中から、クエリ配列に 最も適合する「鋳型構造(テンプレート構造)」を探す 鋳型(テンプレート)構造に従って全原子を構築 (1)側鎖原子の構築 (2)挿入ループ部を構築 BLAST, プロフィール法, スレディング法…. MODELLER, SWISS-MODEL, RosettaCM, 3Dzigzaw
  18. 18. 相同なタンパク質の発見する方法(フォールド認識) 同一残基率30%以上 BLASTのE-value < 0.0001 PSI-BLASTのE-value < 0.0001 4030100 15 25 355 同一残基率(Sequence Identity)(%) 立体構造比較 1007050 60 80 9020 ・BLASTでヒットしない場合でも、プロフィール法(PSI-BLAST, HMMer, HHsearch, HHBlitsなど)では、ヒットする場合がある。 ・配列類似度が低い場合、鋳型の相同タンパク質が見つかっても、予測精度には限界 があるので、使用目的には注意が必要。 ・立体構造比較は、複合体のホモロジー・モデリングでは役に立つことがある。 配列解析
  19. 19. モデリング 鋳型(テンプレート)構造を元にした全原子の構築 Sequence ALIMSTKGFVS Structure LLLM---GFIT (1)ループの構築 (2)側鎖原子の構築 Sequence AYVIND Structure AFVVTD AFVVTD AYVIND テンプレート モデル テンプレート モデル MODELLER, SWISS-MODEL, RosettaCM, 3Dzigzaw
  20. 20. MODELLERの手続き:空間拘束の充足 A C D EF G H I K Target :-CD-FGHNIKL Template:ACDEFGH-IK- C D F G H I K N L C D F G H N I K L C D F G H IK N L 1. 標的配列を鋳型構造に アラインメントする 2. 空間的拘束(spatial constraint) を抽出する 3. 空間的拘束を満たすような 構造を探す ・空間的拘束 = 相同な鋳型構造から得られる拘束 + 立体化学的な拘束 ・空間的拘束は、CHARM22の力場と似た形式の目的関数(ポテンシャルエネルギー)に変換される ・構造探索は、1) 可変目的関数法+共役勾配法, 2)焼きなまし法+分子動力学法 で行う。 ・ループの構築や側鎖の構築の手続きは、この「空間的拘束の充足」の手続きに含まれる。 B. Webb, A. Sali. Comparative Protein Structure Modeling Using Modeller. Current Protocols in Bioinformatics, John Wiley & Sons, Inc., 5.6.1-5.6.32, 2014. A. Sali & T.L. Blundell. Comparative protein modelling by satisfaction of spatial restraints. J. Mol. Biol. 234, 779- 815, 1993.
  21. 21. 鋳型:2yn1_A LGPCA Thioredoxin 鋳型とのSeqID=52.5% RMSD(C)=1.08 Å モデル結果の例: 予測対象 2trx_A Thioredoxin (Escherichia coli) 鋳型とのSeqID=25.3% RMSD(C)=2.30 Å 鋳型:1fb0_A Thioredoxin M (Spinacia oleracea (spinach)) 鋳型:1x5e_A Thioredoxin domain containing protein ( Homo sapiens) 鋳型とのSeqID=86.5% RMSD(C)=0.64 Å RMSD(heavy atom)=2.83 ÅRMSD(heavy atom)=1.81 ÅRMSD(heavy atom)=1.29 Å 赤:正解構造(2trx_A) 青:予測構造 アラインメント:BLAST, モデリング:MODELLER
  22. 22. CDK3_HUMANのモデリング例 鋳型構造 1oitA (CDK2_HUMAN) 点線は立体構造が 決まっていない部分 鋳型と標的配列のアラインメント 赤線で囲まれた部分は、立体構造 が決まっていない部分
  23. 23. CDK3_HUMANのモデリング例 5つの候補モデル構造 を出力させた場合 鋳型構造とアライメントされない 部分(ループ部、挿入部)は、 候補構造ごとにかなり異なった 構造になる ⇒ 鋳型とのアラインメントされ ていない部分の予測構造は、一 般に一意に構造を決めるのが難 しく、信頼性が低い場合が多い。
  24. 24. モデルの精度とその使い方 鋳型との配列一致率 (Sequence Identity) モデルの精度 CaのRMSD 使い方 ( Applications ) 50 ~ 100 % 1.0 Å 触媒機構の研究 リガンドの設計・改変 高分子のドッキング 結合蛋白質の予測 仮想スクリーニング・低分子のドッキング 30 ~ 50   % 1.5 Å 抗体のエピトープの同定 X線結晶解析の分子置換 キメラ体の設計 より安定で結晶化容易な変異体の設計 部位特異的変異体の解釈 NMR構造の精密化 低解像度電子密度マップへのフィッティング 30 %以下 3.5 Å 疎な実験データからのモデリング 立体構造類似性からの機能推定 保存された表面残基のパッチの同定 3Dモチーフによる機能部位の発見 Baker, D., Sali, A. Science (2001), 294, 93-96
  25. 25. HOMCOSによる 単量体のホモロジー・モデリング
  26. 26. HOMCOS :複合体立体構造の検索・ホモロジーモデリングのサーバ サービス 入力1 入力2 PDB内の 結合分子 の検索 タンパク質に対する 結合分子の検索 アミノ酸 配列 化合物に対する 結合分子の検索 化合物 構造 複合体 立体構造 の ホモロジー モデリング ホモ多量体モデル アミノ酸 配列 ヘテロ多量体モデル アミノ酸 配列A アミノ酸 配列B 化合物ータンパク質 複合体のモデル アミノ酸 配列 化合物 構造 ・PDB内の複合体の立体構造データを検索し、それを鋳型にモデリングする ・配列相同性検索はBLAST、化学構造類似性検索はKCOMBUを使用 MYB HRX Crebbp MYB MRE-1 MRE-1 http://homcos.pdbj.org “HOMCOS”でグーグル検索 アミノ酸配列2本を入力、それぞれ、PDBに 対するBLASTを実行 ヘテロ多量体のモデリング タンパク質に対する結合分子検索 化合物-タンパク質複合体のモデル アミノ酸配列と化合物構造を入力、アミノ酸配列はBLASTで、 化学構造はKCOMBU でPDBに対して検索 BLASTBLAST BLAST KCOMBU 鋳型構造 鋳型構造 予測構造 予測構造 VaProSからの検索では、 3D Interactionに相当
  27. 27. タンパク質に対する結合分子の検索 >1vwg_A >1jsu_B 2g9xA 1w98A 1fq1B : 問い合わせ配列 1vwg_1 A1 B1 2g9x_1 A1 B1 : BLAST検索 TGWVEIEINL… コンタクトしている分子の表 相同なタンパク質のリスト 問い合わせ配列とコンタクトする 分子の予測リスト PDBに登録された アミノ酸配列の データベース ・単量体のホモロジー・モデリングの鋳型構造の検索(フォールド認識) としても使うことができる ・HOMCOSは、「フォールド認識」が主で、モデリングは行わないが、 (1) 簡易モデル(sequence-replaced model)は提供 (2) Modellerの入力ファイルは提供
  28. 28. 標的のアミノ酸配列 標的(予測対象)とするアミノ酸配列: UniProtのID: MYG_CHICK AC:P02197 >sp|P02197|MYG_CHICK Myoglobin OS=Gallus gallus GN=MB PE=1 SV=4 ニワトリのミオグロビンの立体構造を予測を行う CC -!- FUNCTION: Serves as a reserve supply of oxygen and facilitates the CC movement of oxygen within muscles. 2016年7月現在、立体構造は決まっていない。 HBA_HUMAN (1yeuA) ヒトのヘモグロビンα鎖の立体構造 His59 His88 OXY (O2) proximal distal 1 MGLSDQEWQQ VLTIWGKVEA DIAGHGHEVL MRLFHDHPET LDRFDKFKGL 50 51 KTPDQMKGSE DLKKHGATVL TQLGKILKQK GNHESELKPL AQTHATKHKI 100 101 PVKYLEFISE VIIKVIAEKH AADFGADSQA AMKKALELFR NDMASKYKEF 150 151 GFQG 154 問題: ニワトリのミオグロビンには、9つのヒス チジン(His;H)があります。この中で、ヘム(HEM) の鉄原子(FE)の上下に位置する2つのヒスチジ ンの残基番号を、予測した立体構造から推定し てください。
  29. 29. MYG_CHICKのホモロジーモデリング 1) Googleで”HOMCOS“と入力 2) 「タンパク質に対する検索」を選ぶ 3) UniProtIDのフォームに “MYG_CHICK”と入力して、 [SEARCH]をクリックする。 問い合わせ蛋白質の配列は以下の4通りで入力可 (i) PDB_ID+鎖 (ii) PDBファイルのアップロード (iii) UniProt ID (iv) アミノ酸配列
  30. 30. 「タンパク質に対する検索」結果のトップ画面 ・単量体、複合体構造は、デフォルトでは代表構造だけがバー表 示。アライメント領域・相互作用部位によって代表を決めている。 ・相同性のしきい値は、デフォルトではE-value<0.001だけで、同一残 基率は0%に設定してある。よりしきい値を上げれば (30%,40%,…,95%)、候補構造は減るが、予測の信頼性は向上する。・全ての相同な立体構造を表示する場合は、 [Full:Bars] をクリックする。 のアイコンをクリックすると単量体 の立体構造モデルが表示される Identity[%]は、ホモログの立体構 造の配列一致率。Identity=100% があれば、モデリングの必要はな く、そのものの立体構造が検索で きたことになる。
  31. 31. 単量体立体構造の表示(MYG_CHICK) Sequence-replaced 3D model(簡易ホモロジーモデル構造): 鋳型構造と座標は同じ。残基名と残基番号を標的配列と入れ替え てある。側鎖原子や挿入残基は正しくモデリングされていない。 クエリ(MYG_CHICK)と鋳型 (1lhs_A_1)とのアラインメント 簡易ホモロジーモデル 構造のダウンロード 鋳型構造の ダウンロード をクリックすると、 生物学的単位に含まれる 全ての分子が表示される をクリックすると Modellerの入力ファイルを ダウンロード可能。 Modellerをインストールす れば、全原子のモデルが構 築可能 鋳型の1lhs_A(MYG_CARCR)は、 Carretta caretta(海亀)のミオグロビン メニューから 表示される構造 の種類を選ぶこ とができる デフォルトではHTML5(Jsmol)による分子の表示。JAVA実行環境 がインストールしてあるなら、JAVAを用いたほうが表示は速い
  32. 32. 単量体立体構造の表示(MYG_CHICK) 鋳型構造の ダウンロード をクリックすると Modellerの入力ファイルを ダウンロード可能。 メニューから 表示される構造 の種類を選ぶこ とができる 生物学的単位に含まれる全ての分子を表示 この場合、HEM分子 がbとして表示される。 簡易ホモロジーモデル 構造のダウンロード □を☑すると、 結合部位が強調 表示される アライメント上に結合部位が bで示される。 分子表示ウィンドウの 大きさを[small], [medium], [large]の三段階で変えられる
  33. 33. JSmolのマウスの使い方 表示法の変更 マウス操作 分子の回転 左ボタンで画面をドラッグ 分子の並進 Ctrlキーを押しながら、右ボタンで画面を ドラッグ ズームイン・アウト (1)ホイールを回す (2)Shiftキーを押しながら、左ボタンで画 面をドラッグ (3)右ボタンと左ボタンを同時に押して、 画面をドラッグ マウスによる残基名・ 原子名の確認 画面上で、カーソルを原子の上に置き、 しばらく待つと、ポップアップのラベルで 表示される。
  34. 34. 単量体立体構造の表示(MYG_CHICK) (1)□を☑にして、結合部位をボール&スティック表示にする (2)JSmolでは、マウスのポインタを原子の上に置き、しばらく待つと、 [残基名]残基番号:鎖.原子名/モデル番号 #原子番号 が表示される。 このアミノ酸はマウスで確認すると、 と表示されるが、構造は鋳型のまま のAlaである。Sequence-replaced modelなので、側鎖はきちんとモデリ ングされてはいない。
  35. 35. ニワトリのミオグロビンの鉄の結合部位 HBA_HUMAN (1yeuA) ヒトのヘモグロビンα鎖の立体構造 His59 His88 OXY (O2) proximal distal 1 MGLSDQEWQQ VLTIWGKVEA DIAGHGHEVL MRLFHDHPET LDRFDKFKGL 50 51 KTPDQMKGSE DLKKHGATVL TQLGKILKQK GNHESELKPL AQTHATKHKI 100 101 PVKYLEFISE VIIKVIAEKH AADFGADSQA AMKKALELFR NDMASKYKEF 150 151 GFQG 154 His65 His94 MYG_CHICK ニワトリのミオグロビンの予測立体構造 問題: ニワトリのミオグロビンには、9つのヒスチジン(His;H)があります。この中で、ヘム(HEM)の鉄原 子(FE)の上下に位置する2つのヒスチジンの残基番号を、予測した立体構造から推定してください。 答え: His65とHis94がヘムの鉄原子の上下に位置する。アミノ酸配列では以下の位置になる。 His65 His99
  36. 36. 他の分子との相同な複合体 Haptoglobin Na2+ 赤い点は相互作用部位を示す
  37. 37. MYG_CHICKの場合のSite Tableの画面 UniProtの アノテーション 結合分子の サマリー 相同配列群のアミノ酸頻 度。頻度順にソート。出現 したアミノ酸だけ表示 溶媒 露出 度(%) UniProtの 変異体に 関する情報 をクリックすると特定のサイトのまとめのページが表示される (1) 埋もれている部位(溶媒露出度accが 小さい部位)に変異が入ると、天然構造が 不安定になり、機能を失活しやすい。 (2) 相同タンパク質群で観察されるアミノ酸の割合(observed aa)が大きい (よく観察される)アミノ酸に変異した場合、機能への影響は小さい。逆に、稀 にしか観察されないアミノ酸に変異した場合は、機能を失いやすい。
  38. 38. HOMCOSによる 複合体のホモロジー・モデリング
  39. 39. 複合体のホモロジー・モデリング 既知の立体構造 V W E IE I N G T L V L K Q V F T F A T V F E IK I Q G T L I L K E V F T F A G 予測立体構造 タンパク質-タンパク質 複合体 T A L Q A E L L K L K V G W K D T T A L Q L Q L L K L K I G F K D T 化合物-タンパク質 複合体 V F E IK I Q G T L V W E IE I N G T L タンパク質単量体 TGWVEIEINL.. TGWVEIEINL.. QLVVKTFAFT.. IVAWGKTDLQAE.. 既知の立体構造 予測立体構造 既知の立体構造 予測立体構造
  40. 40. 鋳型ベースのドッキング:Template‐based Docking T A L Q L Q L L K L K I G F K D T 化合物-タンパク質複合体 鋳型となる タンパク質の 複合体立体構造 標的タンパク質の 予測複合体立体 構造 を得る V F E IK I Q G T L I L K E V F T F A G 標的タンパク質の 単量体立体構造 V W E IE I Q G T L I L K T V F T F A GD I L K T V F T F A G V W E IE I Q G T L D 標的単量体を 鋳型複合体に重 ね合わせる タンパク質-タンパク質複合体 V F E IK I Q G T L I L K E V F T F A G V W E IE I Q G T L I L K T V F T F A GD S A L Q L Q L L K L K I A S D T 鋳型となる 化合物―タンパク質 の複合体立体構造 標的化合物の立体構造と 標的タンパク質の 単量体立体構造 T A L Q L Q L L K L K I G F K D T S A L Q L Q L L K L K I A S D T S A L Q L Q L L K L K I A S D T 標的単量体を 鋳型複合体に重 ね合わせる 標的化合物-タンパク質 の予測複合体立体構造 を得る
  41. 41. E IK I Q G T L F T I K E V FV L F A G ヘテロ蛋白質複合体のモデリング >1vwg_A >1vwg_B >2g9x_A 1vwgA 2g9xA 8atcA 1fq5A : 1vwg_1 A1 B1 2g9x_1 A1 B1 1jsu_1 A1 B1 8atc_2 A1 B1 2fi5_1 E2 I1 : BLAST 検索 BLAST検索 相同な複合体の一つを 鋳型として取り出す 鋳型構造:1vwg_1 A1 B1 V W E IE I N G T L V L K Q V F T F A T E IK I Q G T L F T I K E V FV L F A G 配列の 置き換え TGWVEIEINL... QLVVKTFAFT... 結合している 分子の表 1vwgB 2g9xB 2fi5I 2eufA : 配列Bと相同な タンパク質のリスト 配列Aと相同な タンパク質のリスト Template-based Model (Sequence-replaced model) 予測モデル構造 V W E I E I N G T L T V K Q V F L F A TV W E I E I N G T L T V K Q V F L F A T 単量体の 重ね合わせ Template-based docking 予測モデル構造 問い合わせタンパク質B 問い合わせタンパク質A 配列 単量体 構造 or 配列 単量体 構造 or or PDB内のアミノ酸配列 のデータベース
  42. 42. グロビン属のタンパク質(ヒト) UniProt ID AC Description 分類 立体構造 HBA_HUMAN P69905 Hemoglobin subunit alpha 系 1bz1A,C  HBAT_HUMAN P09105 Hemoglobin subunit theta‐1 系 未知 HBAZ_HUMAN P02008 Hemoglobin subunit zeta 系 3w4uA HBM_HUMAN Q6B0K9 Hemoglobin subunit mu 未知 HBB_HUMAN P68871  Hemoglobin subunit beta 系 1bz1B,D HBD_HUMAN  P02042  Hemoglobin subunit delta 系 1si4 B,D HBE_HUMAN P02100  Hemoglobin subunit epsilon 系 1a9w E,F HBG1_HUMAN  P69891  Hemoglobin subunit gamma‐1 系 1i3d A、B HBG2_HUMAN  P69892  Hemoglobin subunit gamma‐2 系 1fdh G,H MYG_HUMAN P02144  Myoglobin 3rgk A NGB_HUMAN  Q9NPG2  Neuroglobin 4mpm A、B CYGB_HUMAN  Q8WWM9  Cytoglobin 2dc3 A,B
  43. 43. グロビン属のタンパク質(ヒト) 系 系 ※ClustalW2でアラインメント、 近隣結合法で系統樹を作成
  44. 44. ヘモグロビンの複合体 ヘモグロビンの組み合わせ 名称 立体構造 2 x HBA, 2 x HBB adult hemoglobin A (HbA) 1bz1AC‐BD 2 x HBA, 2 x HBD adult hemoglobin A2 (HbA2)  1si4AC‐BD 2 x HBA, 2 x HBE early embryonic hemologbin Gower‐2 1a9wAC‐EF 2 x HBA, 2 x HBG1 fetal hemoglobin F (HbF) 1fdhAB‐GH 2 x HBAZ, 2 x HBB hemoglobin Portland‐2  3w4uAC‐BD 2 x HBAZ, 2 x HBE hemoglobin Gower‐1  立体構造未知 2 x HBAZ, 2 x HBG1 fetal hemoglobin Portland‐1 立体構造未知 Wikipediaより Hemoglobin Gower 1 (also referred to as ζ2ε2 or HbE Gower-1) is a form of hemoglobin existing only during embryonic life, and is the primary embryonic hemoglobin. It is composed of two zeta chains and two epsilon chains, and is relatively unstable, breaking down easily.[2] ※UniProtに記載されている複合体をまとめた 1bz1 (2x,2x)   
  45. 45. ヘテロ多量体のモデリング(2本の配列から) 1) Googleで”HOMCOS“と入力 2) 「ヘテロ多量体のモデル」を選ぶ HBAZ_HUMAN: Hemoglobin subunit zeta HBE_HUMAN :Hemoglobin subunit epsilon 3) タンパク質AのUNIPROT_IDにHBAZ_HUMANを タンパク質BのUNIPROT_IDにHBE_HUMANを入力 問い合わせ蛋白質の配列は以下の4通りで入力可 (i) PDB_ID+鎖 (ii) PDBファイルのアップロード (iii) UniProt ID (iv) アミノ酸配列
  46. 46. ヘテロ多量体のモデリング(HBAZとHBE) HBAZ_HUMAN HBE_HUMAN 配列Aと配列Bに ついて、対PDBのBLAST 検索が 実行される 複合体のsequence-replaced 3D model
  47. 47. HOMCOSを用いた 化合物-蛋白質複合体の予測
  48. 48. T A L Q L Q L L K L K I G F K D T 化合物ータンパク質複合体のモデリング >1vwg_A 2g9xA 1jsuA 1fq5A 8atcA : PDB内のアミノ酸配列 のデータベース 2g9x A1 B1(SHL) 1jsu A1 B1(C39) 8atc A1 B1(PLP) 2fi5 E2 I2(ATP) : KCOMBU 検索 BLAST検索 鋳型となる 複合体構造の選択 結合している 分子の表 SHL C39 GBC : 問い合わせ化合物と 類似した化合物のリスト 問い合わせ配列 と相同なタンパク質のリスト PDB内の化合物の データベース T A L Q L Q L L K L K I G F K D T ※問い合わせ化合物はfkcombuを用い フレキシブルに鋳型化合物に重ね合わせる SHL GBCC39 SHL TVAWGKTDLQL… 鋳型:2g9x_A1 B1 T A L Q A E L L K L R VG W K D T 問い合わせ 化合物構造 問い合わせタンパク質 配列 単量体 構造 or T A L Q A E L L K L R VG W K D T T A L Q A E L L K L R V G W K D T Template-based Model (Sequence-replaced model) 予測モデル構造 Template-based docking 予測モデル構造 >1vwg_B >2g9x_A 配列の 置き換え 単量体の 重ね合わせ or
  49. 49. 化合物タンパク質複合体モデリング のページ2) 「化合物タンパク質複合体のモデル」を選ぶ 3) PROTEINのUNIPROT_IDにはCDK3_HUMANを COMPOUNDのPDB three letter ligand codeにはIREを入力 Iressa/Gefitinib (IRE) 1) Googleで”HOMCOS“と入力
  50. 50. 化合物ータンパク質複合体のモデリング アミノ酸配列対PDBのBLAST 検索、 化合物 対PDBのKCOMBU検索 が実行される 標的化合物(IRE) 鋳型化合物(DTQ) 複合体のモデル構造が表示される 鋳型化合物(DTQ) 標的化合物(IRE)
  51. 51. 鋳型構造が全く見つからない場合は? 1.剛体ドッキングプログラムを試す。 高分子なら、ZDOCK, HADDOCK、低分子なら、DOCK, AutoDock vina, sievgene, GLIDE などがよく使われる。もちろん、単体の立体構造 が入手できる場合に限る。 ⇒ 予測精度の限界を留意。結合部位などの実験情報をできるだけ 考慮したほうがよい。 2.分子動力学法などの高度なサンプリング法。 結合に伴って大きな構造変化がある場合は、分子動力学法などの分子 変形を伴うサンプリング法が必須なはず。 ⇒ 計算量が膨大。専門家の助言を求めたほうがよい。 3.手作業で組み立てる ⇒ 実験情報がある程度あるなら、全く不可能でもない。 USCF Chimeraの[Favorites]→[Model Panels]でモデルパネルを立ち上げ、 [A]の☑をオン・オフしながら、分子の姿勢を変えていく。
  52. 52. 結合の強さの予測について 2.鋳型ベースで複合体予測ができても、本当に結合する 保証はない ・相同な複合体の鋳型構造があっても、相互作用するとは限らない。 ・特にキナーゼ、GPCRなど多遺伝子族では、その特異性を予測すること は困難 ・「もし結合するとしたら、どのように結合するか」の予測と考えるべき。 ・相互作用に重要そうなアミノ酸の保存の確認まではできる 1.結合の強さの予測は、結合構造の予測より一般に困難 ・物理化学な手法による強さの予測は、正しい結合立体構造が必要。 結合構造に誤りがあると強さは正確に予測できない。 ・生体分子間の相互作用は一般に弱く、1アミノ酸置換でも結合定数が 変わる可能性。精密な見積もりが要求される。
  53. 53. 分子ビューアの操作法が載っている本 見てわかる 構造生命科学 ―生命科学 研究へのタンパク質構造の利用― 中村春木 編 化学同人 税抜5000円 RasMol, UCSF Chimera, PyMOLの 使い方を解説 Part1 構造生命科学《入門編》 Chapter-0 基本的な分子グラフィックソフトの操作法 Part2 構造生命科学《実践編》 Category 1《金属結合タンパク質》 Structure-1 カルモジュリン Structure-2 鉄-硫黄タンパク質 Category 2《核酸結合タンパク質》(複製・組換え・修復に関わるタンパク質) Structure-3 スライディング・クランプ Structure-4 ヌクレオソーム Category 3《シグナル伝達関連因子》 Structure-5 Rasタンパク質 Structure-6 プロテインキナーゼ Category 4《膜タンパク質》 Structure-7 Gタンパク質共役型受容体(GPCR) Structure-8 カリウムチャネル Category 5《免疫系関連因子》 Structure-9 抗 体 Structure-10 主要組織適合抗原(MHA) Category 6《巨大複合体》 Structure-11 リボソーム Structure-12 シャペロニン Structure-13 プロテアソーム Structure-14 ミオシン Structure-15 ダイニン Structure-16 光化学系Ⅱ

×