RDKitの紹介
iwatobipen
• 今日はきっかけになればってレベルで。
What is RDKit ?
●オープンソースのchemoinfo tool kitです。
-コアの部分はC++だから早いよ。
-Python2.x ラッパーあるよ。
-機械学習用の記述子色々あるよ。
-カートリッジサポートしてるよ。( PostgreSQL )
●扱い
-OS win/mac/linux サポート。
-GitHubでバージョン管理。
-ML結構活発。
Install
Linux: apt-getとか。Yumは調べてないです。
Windows: 32bit/64bit binariesでOK !
Mac: Homebrew
IPython & PANDAS
幸せの形
Macならこの辺が良いかと
Winはバイナリがある。
http://fonnesbeck.github.io/ScipySuperpack/
サンプルデータ
まず読む
114分子読みました。
IPythonConsole使うと分子が
インタラクティブに見えまーす
ここで少しデモ
タイポ、躓きはご容赦を
駆け足でDIY感のある
MMP & Graphics
Test Data
>python rfrag.py < input.txt > frag.txt
>python indexing.py < frag.txt > pair.txt
ある日のメール
やあみんな。
いくつかmmpの機能を追加したよ。
mol_transform.pyはユーザーが
セットしたSmilesにMMPを適用して
変換するんだ。(超適当)
Hi all, I have added some extra parts to the mmpa contrib.
code which has recently been approved for open sourcing by GSK.
Also, I have made some minor changes to the existing code
but it should all work in the same way.
The extra parts are: mol_transform.py This program applies a transform or transforms
(generated by the MMP generation program) and applies it to a user set of smiles.
This final piece completes the circle, so now you can find MMPs,、、、、、
Transform
( ゚∀゚ )キタ━━━!!!)
さっそくデータ準備
無駄にPANDASを使ってみる。
>python mol_transform.py -f only_pair.txt < beore.txt > after.txt
実行スクリプト ペアファイル 入力 出力
劇的 ビフォー アフター?
できた♪
MMP DB
簡単につくれたらいーねー♪
あるよ
create_mmp_db.py
https://github.com/rdkit/rdkit/tree/master/Contrib/mmpa
>python create_mmp_db.py < your_fragment.txt
これでどうだ!
mmp.dbというファイルができる(sqlite3)
テーブルが四つ出来た
化合物情報入ってる
活用部分
はこれから、、、
次はビジュアル系
某社のTool kit 素敵。
原子の寄与を考えて可視化している
あるある!
matplotlibも必要ですが
APIほぼ丸写しでOK。
カラーマップ指定
contourの荒さ
>python mol_viz.py crizotinib.mol
動け!
こんな感じのビューができます。
Similarity mapも最近報告されてます
FingerPrintの類似性を可視化も可能。
まとめ
Pythonベースで色々できる。
PANDAS/matplotlib/Scikit-learnとの四重奏?
機能はかなりリッチ。
開発が活発。
UGRMの資料もオープンです。
その他
配座発生、ROCS的な扱いもOK
何よりOSS。CADDチームのリソースを侵食しない
御礼
つたない発表にお付き合いいただき
ありがとうございました。
追加リファレンス
順不同/全部じゃない
USRCAT: real-time ultrafast shape recognition with pharmacophoric constraints
http://www.jcheminf.com/content/4/1/27/abstract
Similarity maps - a visualization strategy for molecular fingerprints
and machine-learning methods
http://www.jcheminf.com/content/5/1/43/abstract
hERG Me Out
http://pubs.acs.org/doi/abs/10.1021/ci400308z
Freely Available Conformer Generation Methods: How Good Are They?
http://pubs.acs.org/doi/abs/10.1021/ci2004658
Similarity Boosted Quantitative Structure–Activity Relationship—
A Systematic Study of Enhancing Structural Descriptors by Molecular Similarity
http://pubs.acs.org/doi/abs/10.1021/ci300182p
A Collection of Robust Organic Synthesis Reactions for In Silico Molecule Design
http://pubs.acs.org/doi/abs/10.1021/ci200379p
参考URL
APIリファレンス
http://www.rdkit.org/docs/index.html
ユーザーミーティングスライド おすすめ。
http://www.rdkit.org/UGM/2012/
Wiki
http://code.google.com/p/rdkit/w/list

Rdkitの紹介