2014年3月7日
LODチャレンジJapan2013授賞式
◆受賞者◆
込山悠介, 番野雅城, ガル・サード, 鑓水優行,
植木快, 清水謙多郎
◆推薦の言葉◆
創薬における重要課題のひとつであるリガンドの結合部位予測に
向け、構造生物学の成果データをLODとして再構成することで、
更に幅広い用途に利活用できるデータベースを構築しました。
ライフサイエンス分野で現在進められているRDFによるデータ
ベースの統合化推進に大きく貢献することが今後期待されます。
UTProt:
~ LODと機械学習を組み合わせた創薬のパラダイムシフト~
Project UTProt
(込山悠介, 番野雅城, ガル・サード, 鑓水優行, 植木快, 清水謙多郎)
Bioinformation Engineering Laboratory,
Department of Biotechnology,
Graduate School of Agricultural and Life Sciences,
The University of Tokyo
インタラクトーム(網羅的な相互作用)
LOD構築の過程
タンパク質
構造の
公共DB
解析結果
LOD
タンパク質と
化合物の原子
間距離を計算
タンパク質と生体化合物間の
原子間相互作用のスキーマ設計
原子レベルでは
データが大きく
使いづらかった
アミノ酸残基レベルへ軽量化, 配列DB
等の情報も追加したスキーマを設計
軽量版
LODPDB,
PDB-CCD
UniProt,
ChEBI,
SIFTS
PLBSP PLBSPResidue
タンパク質―リガンド相互作用部位の
機械学習予測ツールの自動生成
軽量版
LOD 機械学習
(SVM)
ユーザーが興味のある
既知の化学物質を入力
(薬剤の候補など)
データベース中から
既知の相互作用部位
(アミノ酸残基)を抽出
タンパク質―リガンド相互作用部位予測ツール
SVMのパラメータは
遺伝的アルゴリズム
で最適化
LODから生成された
データセットを基に
機械学習(SVM)
パラメータ
最適化
(GA)
ユーザーの興味に応じた を自動生成
自動生成されたタンパク質―リガンド
相互作用部位予測ツールの実行
タンパク質―リガンド相互作用
部位予測ツール
ESFRSDYVLGEGGFGTVYKGYTDENARVGSKSLPVAVKVLNKDGLQGHREWLTEVNFLGQ
LRHPNLVKLVGYCCEDDHRLLVYEFMFRGSLENHLFRKTAAPLPWATRMMIALGAAKGLA
FLHNAERPVIYRDFKTSNILLDSDYTAKLSDFGLAKAGPHGDETPCVNSSNGHIWICSSR
SMQRLVIRRRGAMSTAFGVVLLQLLTGPGVGGQDPAPATEQSPPRLGPPPSL
ユーザーは生成されたツールに
構造未知のタンパク質の
アミノ酸配列を入力
Webアプリケーション上での予測ツールの実行結果
構造未知のタンパク質のアミノ酸配列の
どこに対象の化合物が結合するかが予測できる
予測結果のデータを解析・可視化した例
DB問合せ→機械学習→予測ツール利用
までをWebアプリケーション化
ポータルサイト http://utprot.net から
UTProt Galaxy へアクセス
インタラクトームLODを用いたことにより, 短期間(4ヶ月間)で
複数の機械学習予測ツールの開発に成功.
パイプラインのモジュールとして実装. 予測精度指標のAUCは75~85%.
タンパク質―リガンド相互作用LODと
機械学習予測で創薬アプリを開発・公開
 i043 UTProt:
 LODと機械学習を組み合わせた創薬のパラダイムシフト
 d064 UTProt RDF Platform:
 タンパク質の機能と構造のためのSPARQLエンドポイント集
 d065 UTProt Image:
 アプリや教材として使える生体高分子画像データベース
 a095 UTProt Galaxy:
 創薬のためのタンパク質のリガンド結合部位予測ツール生成パイプライン
謝辞
 国立情報学研究所
 This work was supported by JSPS KAKENHI Grant
Number 12J07771 and 23300109.
 This research was supported by JST, NBDC.

LODチャレンジ Japan 2013 審査員特別賞 ライフサイエンス賞