SlideShare a Scribd company logo
1 of 1
Download to read offline
Topological descriptors
• Atom count
• Walk and path count
• Functional group count
• Connectivity index
Electronic descriptors
• Electron density
• Molecular polarizability
• Total dipole moment
• Molecular orbital
Geometric descriptors
• Molecular surface area
• Molecular shadow area
• Molecular volume
10.5
0.67
19.4
23.3
⋮
1
0
1
1.89
The feature vector
G
f(G1)=
a1 =11
f(G2)
a2 =7
f(Gp)
ap =18
...
...
Feature vectors
Chemical
activity values⋮
Edge weight wuv Bias (node weight) wv
Select architecture &
activation function
Input layer Hidden layers Output layer
...input input
f(G)
φ(f(G))
The feature vector
The predicted
chemical
Activity value
⋮
output
input output
G
input
a*
Vectors f*
such that φ(f*)=a*
f*1= ⋮
A Graph Enumeration
Algorithm
G
f(G)
ANN
通常は,ここまでが機械学習による従来の問題解決ですが,
このプロジェクトでは,逆に,所望の活性値を入力として,この
活性値を有するような化合物を予測関数φの原像として構築
する方法を開発しています.
ケモインフォマティクスのテーマとして,有用な化学的活性をもつ
新規化学物質を計算機により探し出す技術を開発しています.
まず,目的とする化学的活性A(生成熱,疎水性,薬効等)を定
め,化合物DBから化学グラフ G1, G2, ..., Gp とこれらの活性値 a1,
a2, ..., apを取り出します.
次に,各グラフGiの構造から活性Aと関係のありそうな特徴
(記述子, descriptor)をいくつか抽出・算出し,これらを成分と
する特徴ベクトル (feature vector) f(Gi)を用意します.
特徴ベクトルと活性値の組(f(G1), a1), (f(G2), a2), ..., (f(Gp), ap)を
教師データとして,ニューラルネットワーク(ANN)で学習させ,特
徴ベクトルと活性値の関係が最もうまく説明されるようなアーキ
テクチャ上の枝重みやノード上のバイアスを決めます.
このためには,まず,指定の値a*を予測値φ(f*)として出力され
るような特徴ベクトル f* を求める『逆問題』を解かなくてはなり
ません.我々は最近,これが混合整数計画問題 (Mixed Integer
Linear Programming Problem)として解けることを発見しました.
最後に,作られた特徴ベクトルf*に対して,f(G*)=f*となるよう
なグラフG*を列挙します.このためのアルゴリズムは分枝限定
法 (branch-and-bound)や動的計画法 (dynamic programming)
に基づき設計します.
得られたANNを用いれば,活性の知られていない化合物G
に対する活性Aの予測値φ(f(G))が得られます.
outputinput
数理工学専攻 離散数理分野
⋮
outputinput
機械学習と離散最適化に基づく新規物質設計技術
京大化学研究所 阿久津研究室との共同プロジェクト
MILP
min cx
Ax≧b
2
3
1
5
6
4
特徴の抽出には,電気的,物理化
学的,構造的なものが知られてい
ます.我々は他にも独自の特徴抽
出法を利用しようとしています.
A chemical graph
A chemical graph
整数計画問題はNP-完全ですが,CPLEXなどの高性能
ソルバーにより100ノード程度のANNの逆問題なら数秒
で解けます.また,MILPにおける目的関数の設定,線
形不等式の付与により,生成したいベクトルf*を調節
することができます.
EnuMol: Enumeration of tree-like chemical graphs
http: //sunflower.kuicr.kyoto-u.ac.jp/tools/enumol2
開発した木状構造グラフの列挙ソルバー
EnuMolを公開しています. G*1
G*2
G*m
...
Chemical graphs G*
such that f(G*)=f*
A vector
G1 a1 =11
G2 a2 =7
Gp
ap =18
...
...
Chemical
activity A
Chemical
graphs
DB: PubChem, ChEMBL
f*2
f*q
...
f*=
T. Akutsu and H. Nagamochi, A Mixed Integer Linear Programming Formulation to Artificial Neural
Networks, Technical Report 2019-001. http://www.amp.i.kyoto-u.ac.jp/tecrep/index.html
Specify a desired
chemical activity
DBに登録されている化合
物の90%は殆ど木の構造
(木に高々4本の枝を加え
た構造)を持っています.
...
... outputinput

More Related Content

More from 京都大学大学院情報学研究科数理工学専攻

混沌を活かす技術と思想の温故知新 -熱機関から携帯電話、そして未来のICTへ-
混沌を活かす技術と思想の温故知新 -熱機関から携帯電話、そして未来のICTへ-混沌を活かす技術と思想の温故知新 -熱機関から携帯電話、そして未来のICTへ-
混沌を活かす技術と思想の温故知新 -熱機関から携帯電話、そして未来のICTへ-京都大学大学院情報学研究科数理工学専攻
 

More from 京都大学大学院情報学研究科数理工学専攻 (18)

1次式とノルムで構成された最適化問題とその双対問題
1次式とノルムで構成された最適化問題とその双対問題1次式とノルムで構成された最適化問題とその双対問題
1次式とノルムで構成された最適化問題とその双対問題
 
物理統計学分野(研究室)の案内
物理統計学分野(研究室)の案内物理統計学分野(研究室)の案内
物理統計学分野(研究室)の案内
 
力学系数理分野(研究室)のご案内
力学系数理分野(研究室)のご案内力学系数理分野(研究室)のご案内
力学系数理分野(研究室)のご案内
 
混沌を活かす技術と思想の温故知新 -熱機関から携帯電話、そして未来のICTへ-
混沌を活かす技術と思想の温故知新 -熱機関から携帯電話、そして未来のICTへ-混沌を活かす技術と思想の温故知新 -熱機関から携帯電話、そして未来のICTへ-
混沌を活かす技術と思想の温故知新 -熱機関から携帯電話、そして未来のICTへ-
 
数理解析分野(研究室)の案内
数理解析分野(研究室)の案内数理解析分野(研究室)の案内
数理解析分野(研究室)の案内
 
リプシッツ連続性に基づく勾配法・ニュートン型手法の計算量解析
リプシッツ連続性に基づく勾配法・ニュートン型手法の計算量解析リプシッツ連続性に基づく勾配法・ニュートン型手法の計算量解析
リプシッツ連続性に基づく勾配法・ニュートン型手法の計算量解析
 
離散数理分野(研究室)の案内
離散数理分野(研究室)の案内離散数理分野(研究室)の案内
離散数理分野(研究室)の案内
 
大規模凸最適化問題に対する勾配法
大規模凸最適化問題に対する勾配法大規模凸最適化問題に対する勾配法
大規模凸最適化問題に対する勾配法
 
ゆらぎの数理 情報処理への応用
ゆらぎの数理 情報処理への応用ゆらぎの数理 情報処理への応用
ゆらぎの数理 情報処理への応用
 
簡単そうで難しい組合せ最適化
簡単そうで難しい組合せ最適化簡単そうで難しい組合せ最適化
簡単そうで難しい組合せ最適化
 
ITと数学で社会に役立つ数理最適化
ITと数学で社会に役立つ数理最適化ITと数学で社会に役立つ数理最適化
ITと数学で社会に役立つ数理最適化
 
A Polynomial-Space Exact Algorithm for TSP in Degree-5 Graphs
A Polynomial-Space Exact Algorithm for TSP in Degree-5 GraphsA Polynomial-Space Exact Algorithm for TSP in Degree-5 Graphs
A Polynomial-Space Exact Algorithm for TSP in Degree-5 Graphs
 
A Method for Generating Colorings over Graph Automophism
A Method for Generating Colorings over Graph AutomophismA Method for Generating Colorings over Graph Automophism
A Method for Generating Colorings over Graph Automophism
 
最適化数理分野(研究室)の案内
最適化数理分野(研究室)の案内最適化数理分野(研究室)の案内
最適化数理分野(研究室)の案内
 
A Forward-Backward Splitting Method with Component-wise Lazy Evaluation for O...
A Forward-Backward Splitting Method with Component-wise Lazy Evaluation for O...A Forward-Backward Splitting Method with Component-wise Lazy Evaluation for O...
A Forward-Backward Splitting Method with Component-wise Lazy Evaluation for O...
 
coordinate descent 法について
coordinate descent 法についてcoordinate descent 法について
coordinate descent 法について
 
Exact Algorithms for Minimum Edge Dominating Set and Lowest Edge Dominating Set
Exact Algorithms for Minimum Edge Dominating Set and Lowest Edge Dominating SetExact Algorithms for Minimum Edge Dominating Set and Lowest Edge Dominating Set
Exact Algorithms for Minimum Edge Dominating Set and Lowest Edge Dominating Set
 
数理工学専攻の入試案内
数理工学専攻の入試案内数理工学専攻の入試案内
数理工学専攻の入試案内
 

離散数理分野・阿久津研究室共同研究プロジェクト

  • 1. Topological descriptors • Atom count • Walk and path count • Functional group count • Connectivity index Electronic descriptors • Electron density • Molecular polarizability • Total dipole moment • Molecular orbital Geometric descriptors • Molecular surface area • Molecular shadow area • Molecular volume 10.5 0.67 19.4 23.3 ⋮ 1 0 1 1.89 The feature vector G f(G1)= a1 =11 f(G2) a2 =7 f(Gp) ap =18 ... ... Feature vectors Chemical activity values⋮ Edge weight wuv Bias (node weight) wv Select architecture & activation function Input layer Hidden layers Output layer ...input input f(G) φ(f(G)) The feature vector The predicted chemical Activity value ⋮ output input output G input a* Vectors f* such that φ(f*)=a* f*1= ⋮ A Graph Enumeration Algorithm G f(G) ANN 通常は,ここまでが機械学習による従来の問題解決ですが, このプロジェクトでは,逆に,所望の活性値を入力として,この 活性値を有するような化合物を予測関数φの原像として構築 する方法を開発しています. ケモインフォマティクスのテーマとして,有用な化学的活性をもつ 新規化学物質を計算機により探し出す技術を開発しています. まず,目的とする化学的活性A(生成熱,疎水性,薬効等)を定 め,化合物DBから化学グラフ G1, G2, ..., Gp とこれらの活性値 a1, a2, ..., apを取り出します. 次に,各グラフGiの構造から活性Aと関係のありそうな特徴 (記述子, descriptor)をいくつか抽出・算出し,これらを成分と する特徴ベクトル (feature vector) f(Gi)を用意します. 特徴ベクトルと活性値の組(f(G1), a1), (f(G2), a2), ..., (f(Gp), ap)を 教師データとして,ニューラルネットワーク(ANN)で学習させ,特 徴ベクトルと活性値の関係が最もうまく説明されるようなアーキ テクチャ上の枝重みやノード上のバイアスを決めます. このためには,まず,指定の値a*を予測値φ(f*)として出力され るような特徴ベクトル f* を求める『逆問題』を解かなくてはなり ません.我々は最近,これが混合整数計画問題 (Mixed Integer Linear Programming Problem)として解けることを発見しました. 最後に,作られた特徴ベクトルf*に対して,f(G*)=f*となるよう なグラフG*を列挙します.このためのアルゴリズムは分枝限定 法 (branch-and-bound)や動的計画法 (dynamic programming) に基づき設計します. 得られたANNを用いれば,活性の知られていない化合物G に対する活性Aの予測値φ(f(G))が得られます. outputinput 数理工学専攻 離散数理分野 ⋮ outputinput 機械学習と離散最適化に基づく新規物質設計技術 京大化学研究所 阿久津研究室との共同プロジェクト MILP min cx Ax≧b 2 3 1 5 6 4 特徴の抽出には,電気的,物理化 学的,構造的なものが知られてい ます.我々は他にも独自の特徴抽 出法を利用しようとしています. A chemical graph A chemical graph 整数計画問題はNP-完全ですが,CPLEXなどの高性能 ソルバーにより100ノード程度のANNの逆問題なら数秒 で解けます.また,MILPにおける目的関数の設定,線 形不等式の付与により,生成したいベクトルf*を調節 することができます. EnuMol: Enumeration of tree-like chemical graphs http: //sunflower.kuicr.kyoto-u.ac.jp/tools/enumol2 開発した木状構造グラフの列挙ソルバー EnuMolを公開しています. G*1 G*2 G*m ... Chemical graphs G* such that f(G*)=f* A vector G1 a1 =11 G2 a2 =7 Gp ap =18 ... ... Chemical activity A Chemical graphs DB: PubChem, ChEMBL f*2 f*q ... f*= T. Akutsu and H. Nagamochi, A Mixed Integer Linear Programming Formulation to Artificial Neural Networks, Technical Report 2019-001. http://www.amp.i.kyoto-u.ac.jp/tecrep/index.html Specify a desired chemical activity DBに登録されている化合 物の90%は殆ど木の構造 (木に高々4本の枝を加え た構造)を持っています. ... ... outputinput