ベイズ最適化によるハイパーパラメータ探索についてざっくりと解説しました。
今回紹介する内容の元となった論文
Bergstra, James, et al. "Algorithms for hyper-parameter optimization." 25th annual conference on neural information processing systems (NIPS 2011). Vol. 24. Neural Information Processing Systems Foundation, 2011.
https://hal.inria.fr/hal-00642998/
ベイズ最適化によるハイパーパラメータ探索についてざっくりと解説しました。
今回紹介する内容の元となった論文
Bergstra, James, et al. "Algorithms for hyper-parameter optimization." 25th annual conference on neural information processing systems (NIPS 2011). Vol. 24. Neural Information Processing Systems Foundation, 2011.
https://hal.inria.fr/hal-00642998/
Structural data analysis based on multilayer networkstm1966
Introduction on data analysis based on multilayer networks (in Japanese). Some references of tools, datasets, conferences and Web sites are also mentioned.
quantum chemistry on quantum computer handson by Q# (2019/8/4@MDR Hongo, Tokyo)Maho Nakata
The document describes the Hamiltonian operator (H) and its application to the Hartree-Fock wavefunction (|ΦHF⟩) to obtain energy eigenvalues (E0, E1, etc.). The Hartree-Fock wavefunction can be expressed as a linear combination of Slater determinants (|Ψ0⟩, |Ψ1⟩, etc.). Applying the exponential of the Hamiltonian operator over time (eiHt) to |ΦHF⟩ yields the time-dependent Hartree-Fock wavefunction.
QIQB(大阪大学先導的学際研究機構量子情報・量子生命研究部門)セミナー でのスライドを加筆したもの。量子コンピュータを用いた量子化学計算の現在の状況と展望を述べた.
伝統的なゲート式位相推定による方法とvariational eigen solverによるものと2つ。ごく最近虚時間発展法の実装もされており、それは別スライドで概観した。
The document discusses the application of the Bravyi-Kitaev transformation to quantum chemistry calculations on a quantum computer. It notes that while quantum computers could perform quantum chemistry simulations much faster than classical computers, actually implementing the calculations requires many unitary circuits. The Bravyi-Kitaev transformation reduces the number of circuits needed by encoding qubits in a different way, making the calculations more efficient for a real quantum computer.
PubChem QC project. In this project we calculate all molecules in the PubChem Project. Currently 1,100,000 molecules are available at http://pubchemqc.riken.jp/ . Results are in public domain.
3. 材料は全て揃っている
• 基礎理論は大体ok
– “the fundamental laws necessary for the
mathematical treatment of a large part of physics
and the whole of chemistry are thus completely
known”
– Hartree Fock, DFT, MP2, … , PM3, PM6, AM1…
• 成熟した実装は多数あり、同じ結果を出す
– GAMESS, Gaussian, Qchem, Molpro….
• コンピューターリソース: 理研の施設
• データベース構築と、サービス提供
– 励起エネルギー、HOMO-LUMOギャップなどによる
「波動関数による」クエリー
• 化学的直感による補完、予測
aka. 機械学習
10. SMILESによる分子の符号化
Encoding molecule
SMILES is a good encoding method for molecules
IUPAC nomenclature
tert-butyl N-[(2S,3S,5S)-5-[[4-[(1-benzyltetrazol-5-yl)
methoxy]phenyl]methyl]-3-hydroxy-6-[[(1S,2R)-
2-hydroxy-2,3-dihydro-1H-inden-1-yl]amino]-
6-oxo-1-phenylhexan-2-yl]carbamate
We can encode molecule
• SMILES
CN(C)CCOC12CCC(C3C1CCCC3)C4=CC=CC=C24
…
11. SMILESとは?
• Simplified Molecular Input Line Entry System
– ASCII文字を使った分子の符号化
– コンフォーマー、幾何異性体なども表現可能
– 人間にもプログラムからも読める
– だいたい「分子」と一対一対応する(universal SMILES
を用いることで)
• SMILESの発明者: David Weininger at USEPA Mid-Continent Ecology Division
Laboratory
15. 色々なフォーマットの違い
InChI SMILES CAS Number QC input file
入手性 Free (IUPAC & InChI Trust) Proprietary Proprietary Free
プログラムが読
めるか?
Yes Yes No No (can be
converted)
人間が読める
か
かなり努力すると読める InChIよりはマシ No No
水素 陰に陽に、浮動的指定可 大抵陰に指定する No 陽に指定する
量子数 No No No Yes, partially
Google 検索 InChI keyで可能 ほぼ無理 運が良ければ No
正規化、標準化 オフィシャルサポート有り 無し(幾つかの可能
性)
No No
互変異性体、光
学異性体
Yes Isomeric SMILES で
可能
No No
曖昧さを入れる Yes Yes Yes No
有機金属 一部可能、標準的ではな
い。
一部可能、標準的
ではない。
Yes Yes
37. Computer Resources
• RICC : Intel Xeon 5570 Westmere, 2.93GHz 8
cores/node) x 1000
– 1000-10000 molecules/day (MW 160)
– Heavily depend on conditions of other users
– Time limit: 8 hours
• Quest : Intel Core2 duo (1.6GHz/node) x 700
– 3000-8000 molecules / day (MW 160)
– 100-1000 molecules / day (MW 200-300)
– Time limit: 20 hours
• Some compounds fail to calculate are ignored for
this time.
38. Molecular weight and Lipinski Rule
• Lipinski’s five rule (Pfizer's rule of five): rule of
thumb for drug discovery
• No more than 5 hydrogen bond donors
• Not more than 10 hydrogen bond acceptors
• A molecular mass less than 500 daltons
• An octanol-water partition coefficient log P not greater than 5
• Molecular weight should be smaller than 500 is
very good for computational chemistry
– For routine calculations without experimental data
other than molecular formula
– If larger than 500, secondary or higher structure
becomes important. E.g., protein