SlideShare a Scribd company logo
1 of 15
Download to read offline
天然物生合成と
環境物質代謝の
ケモインフォマティクス
東京大学大学院 工学系研究科
化学システム工学専攻
反応プロセス工学講座
船津・小寺研究室
准教授 小寺正明
2018/10/27	ケモインフォマティクス討論会
近くて遠い分野:化学情報学&	生命情報学
• 語彙の標準化を進める国際機関
• 国際純正・応用化学連合(IUPAC)
• 国際生化学・分子生物学連合(IUBMB)
• 命名の “方言”
• 置換反応・転位反応(有機化学)
• 転移反応・異性化反応(酵素化学)
• 機械学習
• 回帰モデルが多い(化学情報学)
• 判別モデルが多い(生命情報学)
2018/10/27	ケモインフォマティクス討論会
ケモインフォマティクス バイオインフォマティクス
インシリコ創薬、IT創薬、AI創薬
• コンピュータ計算により、新薬の候補化合物(リード化
合物)を探索すること
• 化学情報学と生命情報学の境界領域のひとつ
• Ligand-based	approach	(化合物から攻める)
• Structure-based	approach	(タンパク質から攻める)
• Chemogenomics approach	(ゲノム情報から攻める)
• バーチャルスクリーニング
• (まだ)存在しない化合物をコンピュータ上で仮想的に生成し、そ
の薬理活性を予想し選別する作業
2018/10/27	ケモインフォマティクス討論会
天然物生合成、環境物質代謝
• もうひとつの化学情報学と生命情報学の境界領域
• 酵素タンパク質により触媒される反応経路
• 環境物質代謝
• 反応パターンを用いてコンピュータ上で仮想的に生成することで、
ケモインフォ的な解析ができる。
• 天然物生合成
• 存在(化学構造)が明らかだが生合成代謝経路が不明な化合物
が多数存在する。
• 推定化合物数100万以上に対し、既知反応約7,300.
• ケモインフォ的なアプローチは主に2種類(後述)
2018/10/27	ケモインフォマティクス討論会
酵素の分類と命名の歴史
• 1958年、酵素の系統的命名を目的とした659個の酵素リスト
• 現在の酵素リスト(IUBMB	Enzyme	List)による階層分類
• EC	1	酸化還元酵素
• EC	2	転移酵素
• EC	3	加水分解酵素
• EC	4	付加脱離酵素
• 例: EC	4.1.1.31	ホスホエノールピルビン酸カルボキシラーゼ
• EC	5	異性化酵素
• EC	6	合成酵素
• EC	7	輸送酵素(2018年に新設)
• 2018年現在、約7,300種類の酵素
• 見直しは常に行われ、修正・追加・移動・削除は必要に応じ時々起こる。
• 2014年ごろからIUBMB酵素委員会の准委員やってます。
2018/10/27	ケモインフォマティクス討論会
酵素リスト &	EC番号
• EC番号 (Enzyme	Commission	number)	とは
• 酵素タンパク質の構造に基づいた酵素の分類ではない。
• IUBMB	Enzyme	List	において定義された、EC.x.y.z.iの4つの数字からなる、酵
素につけられるID番号のこと。通称であり正式名称ではない。
• x,	y,	z	は酵素反応式に基づいた酵素の階層的命名ルール←ここ重要!!
• i は酵素に与えられた通し番号
• 生命情報学においては
• ゲノム配列上のアノテーション(注釈付け)に用いられる。
• EC番号の類似性を酵素の類似性と見なす研究例が多数
• 実際には、EC番号が似ていても酵素タンパク質が似ていない例、酵素タ
ンパク質が似ていてもEC番号が似ていない例は多数存在する。
2018/10/27	ケモインフォマティクス討論会
参照経路に基づく代謝経路再構築
• 参照経路 (reference	pathway)	とは
• 生物種の区別なく、反応式中に現れる低分子化合物のみを用い
て複数の酵素反応をつないだもの。
• KEGG	データベースで初めて導入された概念(だと思ってる)
• https://www.kegg.jp/kegg/pathway.html
• 参照経路に基づく代謝経路再構築の手順
• 参照経路をあらかじめ用意しておく。
• ゲノム情報を得る。
• ゲノムとは、その生物種が持つ総遺伝情報セットのこと。
• 参照経路中で、対応する遺伝子のある場所に色を塗る。
• 「マッピング」という。
• 色が途切れずにつながった部分が、その生物種が持つ経路。
• 化学構造を取り扱う必要が全くない。
2018/10/27	ケモインフォマティクス討論会
参照経路に基づく代謝経路再構築の限界
• 化学構造変化が不明な場合
• 参照経路が作れない。
• 化学構造変化はわかるが、その化学構造変化を触媒
する酵素がどの生物でも知られていない場合
• 参照経路は作れるが、マッピングできない。
• 取り扱えない例:
• 新規な環境物質の生分解
• 新規な天然物生合成
2018/10/27	ケモインフォマティクス討論会
「代謝経路予測」とは
• ほとんどの研究において、「参照経路に基づく代謝経路再
構築」と同じアプローチである。
• まず定義済みの経路(参照経路)を用意し、与えられた条件を満
たす経路が、その経路の中のどの部分なのかを同定する。
• その条件とは、ゲノム(その生物種が持つ遺伝情報の総体)、トランスク
リプトーム(その瞬間に発現している遺伝子の総体)、メタボローム(その
瞬間に存在している低分子化合物の総体)など。
• 「参照経路に基づかない代謝経路再構築」を「参照経路に
基づく代謝経路再構築」と混同している論文が多い。
• 全く別の問題を混同しながら「先行研究よりも我々の方が優れている」と書い
た論文がいくつか。
2018/10/27	ケモインフォマティクス討論会
Pathway	prediction
参照経路に基づかない代謝経路再構築
1.	新規化合物を生成するアプローチ
• 既知の反応パターンを次々にあてはめて仮想的な分子を次々と
生成していく。
• 基本的には、有機合成戦略における逆合成解析と同じ。
• 用いる反応パターンやその使用頻度が異なる。
• 仮想的な分子を新規に生成していくという点では、インシリコ
創薬とも似ている。
• 例: PathPred
• Moriya	Y	et	al.,	Nucleic Acids Research,	38,	W138-W143	(2010).
• https://www.genome.jp/tools/pathpred/
• KEGGデータベース中の既知化合物と似た仮想分子を優先
2018/10/27	ケモインフォマティクス討論会
参照経路に基づかない代謝経路再構築
2.	既知化合物間をつなぐアプローチ
• 化学構造の明らかな天然物のデータベース利用
• 例:http://kanaya.naist.jp/KNApSAcK_Family/
• 仮想的な分子を新規に生成せず、既存の化合物間を酵素
反応で結べるかを予想する。
• 機械学習による判別問題として扱える
• Kotera M	et	al,	Bioinformatics,	29	(13),	i135-i144	(2013).が世界初
(だと思ってる)
• データベースに未登録の中間体を生成しながらつなぐハイ
ブリッド的な手法
• 開発途上
2018/10/27	ケモインフォマティクス討論会
「酵素予測」とは
• 何を予測するモデルなのか、非常に混同されやすい。
• 酵素分類(EC番号)を予測するのか?
• 酵素タンパク質を予測するのか?
• 何から予測するモデルなのか、非常に混同されやすい。
• タンパク質配列から予測するのか?
• 研究例は非常に多い
• 化学構造(反応式)から予測するのか?
• 研究例は少ない。
• Kotera M	et	al,	Journal	of	American	Chemical	Society,	126	(50):	
16487-16498	(2004).	が世界初(だと思ってる)
• 全く別の問題を混同しながら「先行研究よりも我々の方が優れ
ている」と書いた論文がいくつか。
2018/10/27	ケモインフォマティクス討論会
Enzyme	prediction
化学構造からの酵素予測
1.	化学構造からの酵素分類予測
• 基質・生成物ペアの化学構造変化からECサブサブクラ
ス(EC番号の上位3桁まで)を予測する手法
• Kotera M	et	al,	Journal	of	American	Chemical	Society,	126	
(50):	16487-16498	(2004).が世界初(だと思ってる)
• 2009年に改良版アルゴリズムを発表
• E-zyme:	https://www.genome.jp/tools-bin/predict_reaction
• のちに類似コンセプトの論文がいくつか発表された
2018/10/27	ケモインフォマティクス討論会
化学構造からの酵素予測
2.	化学構造からの酵素タンパク質予測
• 基質・生成物ペアの化学構造変化から酵素タンパク質
(のオーソログ)を予測する手法
• 反応パターンの明示的な切り出しに基づいた方法
• Moriya	Y	et	al.,	J	Chem	Inf	Model.	Mar	28;56(3):510-516	(2016).
• E-zyme2	:	https://www.genome.jp/tools/e-zyme2/
• 反応パターンの抽出に機械学習を用いた方法
• Tabei	Y	et	al.,	Bioinformatics.	Jun	15;32(12):i278-i287	(2016).
• オーソログとは
• 進化的起源が同じであり、タンパク質配列が相同であり、同
じまたは類似した機能を持つとされる、異なる生物種のタン
パク質
2018/10/27	ケモインフォマティクス討論会
おわりに
• 化学情報学と生命情報学の境界領域
• インシリコ創薬、IT創薬、AI創薬
• 参照経路に基づかない代謝経路再構築
• 新規な天然物生合成、新規な環境物質代謝など
• 「代謝予測」という言葉の意味
• 「酵素予測」という言葉の意味
2018/10/27	ケモインフォマティクス討論会

More Related Content

Similar to 天然物生合成と環境物質代謝のケモインフォマティクス

岡山大学平成20年環境報告書
岡山大学平成20年環境報告書岡山大学平成20年環境報告書
岡山大学平成20年環境報告書
env36
 
【国立大学法人電気通信大学】平成18年環境報告書
【国立大学法人電気通信大学】平成18年環境報告書【国立大学法人電気通信大学】平成18年環境報告書
【国立大学法人電気通信大学】平成18年環境報告書
env56
 
計算機
計算機計算機
計算機
Kazuo Ishii
 
勉強会近況報告
勉強会近況報告勉強会近況報告
勉強会近況報告
A_Kobba
 

Similar to 天然物生合成と環境物質代謝のケモインフォマティクス (13)

東工大 物質理工学院 応用化学系(大岡山・化学工学)大学院説明会2020
東工大 物質理工学院 応用化学系(大岡山・化学工学)大学院説明会2020東工大 物質理工学院 応用化学系(大岡山・化学工学)大学院説明会2020
東工大 物質理工学院 応用化学系(大岡山・化学工学)大学院説明会2020
 
シリコンバレー比較20171030小柳
シリコンバレー比較20171030小柳シリコンバレー比較20171030小柳
シリコンバレー比較20171030小柳
 
World IA Day 2017 Tokyo Nobuhiro Minaka
World IA Day 2017 Tokyo Nobuhiro MinakaWorld IA Day 2017 Tokyo Nobuhiro Minaka
World IA Day 2017 Tokyo Nobuhiro Minaka
 
生徒と先生のための研究倫理入門セミナー資料
生徒と先生のための研究倫理入門セミナー資料生徒と先生のための研究倫理入門セミナー資料
生徒と先生のための研究倫理入門セミナー資料
 
生徒に研究倫理を教えるための研究倫理入門
生徒に研究倫理を教えるための研究倫理入門生徒に研究倫理を教えるための研究倫理入門
生徒に研究倫理を教えるための研究倫理入門
 
代謝(メタボリック)ネットワーク解析
代謝(メタボリック)ネットワーク解析代謝(メタボリック)ネットワーク解析
代謝(メタボリック)ネットワーク解析
 
3.11後のインターネット情報発信とソーシャルメディア活用
3.11後のインターネット情報発信とソーシャルメディア活用3.11後のインターネット情報発信とソーシャルメディア活用
3.11後のインターネット情報発信とソーシャルメディア活用
 
岡山大学平成20年環境報告書
岡山大学平成20年環境報告書岡山大学平成20年環境報告書
岡山大学平成20年環境報告書
 
ケモインフォマティクス
ケモインフォマティクスケモインフォマティクス
ケモインフォマティクス
 
【国立大学法人電気通信大学】平成18年環境報告書
【国立大学法人電気通信大学】平成18年環境報告書【国立大学法人電気通信大学】平成18年環境報告書
【国立大学法人電気通信大学】平成18年環境報告書
 
計算機
計算機計算機
計算機
 
東工大 物質理工学院 応用化学系(すずかけ台・境界領域化学)大学院説明会2020
東工大 物質理工学院 応用化学系(すずかけ台・境界領域化学)大学院説明会2020東工大 物質理工学院 応用化学系(すずかけ台・境界領域化学)大学院説明会2020
東工大 物質理工学院 応用化学系(すずかけ台・境界領域化学)大学院説明会2020
 
勉強会近況報告
勉強会近況報告勉強会近況報告
勉強会近況報告
 

More from Mas Kot

More from Mas Kot (14)

階層的クラスタリング入門の入門
階層的クラスタリング入門の入門階層的クラスタリング入門の入門
階層的クラスタリング入門の入門
 
機械学習入門の入門
機械学習入門の入門機械学習入門の入門
機械学習入門の入門
 
生命化学情報学4
生命化学情報学4生命化学情報学4
生命化学情報学4
 
生命化学情報学3
生命化学情報学3生命化学情報学3
生命化学情報学3
 
生命化学情報学2
生命化学情報学2生命化学情報学2
生命化学情報学2
 
生命化学情報学1
生命化学情報学1生命化学情報学1
生命化学情報学1
 
文献データベース Literature Databases
文献データベース Literature Databases文献データベース Literature Databases
文献データベース Literature Databases
 
KNApSAcKデータベースを用いた昆虫・植物間化学的相互作用解析
KNApSAcKデータベースを用いた昆虫・植物間化学的相互作用解析KNApSAcKデータベースを用いた昆虫・植物間化学的相互作用解析
KNApSAcKデータベースを用いた昆虫・植物間化学的相互作用解析
 
バイオインフォ講義4
バイオインフォ講義4バイオインフォ講義4
バイオインフォ講義4
 
バイオインフォ講義3
バイオインフォ講義3バイオインフォ講義3
バイオインフォ講義3
 
バイオインフォ講義2
バイオインフォ講義2バイオインフォ講義2
バイオインフォ講義2
 
バイオインフォ講義1
バイオインフォ講義1バイオインフォ講義1
バイオインフォ講義1
 
Metabolic network and cheminformatics
Metabolic network and cheminformaticsMetabolic network and cheminformatics
Metabolic network and cheminformatics
 
Metabolic Network Analysis
Metabolic Network AnalysisMetabolic Network Analysis
Metabolic Network Analysis
 

天然物生合成と環境物質代謝のケモインフォマティクス