Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

SAR精度70% その先へ

1,375 views

Published on

Deep Learningについて

Published in: Science
  • Be the first to comment

SAR精度70% その先へ

  1. 1. SAR精度70% その先へ @fmkz___
  2. 2. 自己紹介 • 色々やります • インフォマティクスとビジュアライゼー ションに興味がある • 梅雨のエヴァコラボでモンストに飽きた けど最近のエヴァコラボ第二弾で復活w
  3. 3. その先へ☆
  4. 4. Deep Learningの何がアツイか? • 特徴の抽出をやってくれる • (画像認識だとSIFTとか)cLogPとか職人が よく考えて構築した特徴量を使わなくて も、もっとプリミティブなデータからう まく特徴量を学習してくれるのが一番大 きいと思う。
  5. 5. 画像認識だと http://www.slideshare.net/fullscreen/takmin/ building-highlevelfeatures/1
  6. 6. 特徴量抽出を簡単に説明すると 次元の圧縮
  7. 7. 詳しくはこれを読むといい
  8. 8. Merck Molecular Activity Challenge
  9. 9. Kaggleのコンテスト
  10. 10. 特徴量の抽出やってない…
  11. 11. SVMと精度変わらんし、、、
  12. 12. 特徴量抽出で大きく精度改善 するのかな? データ見てみよう
  13. 13. データを見る
  14. 14. 一万次元以上あるけどやたら疎
  15. 15. 多分これ
  16. 16. AP and DP • AP – ペア(下の) – 元素名、隣接した重原子の数、π電子数によ り識別された原子 • DP – カチオンとかアニオンとかドナーとアクセプ ターの7種の識別
  17. 17. 情報結構落ちてるんじゃない の? この状況下で特徴量の抽出したと して精度が向上するかは非常に疑 問
  18. 18. 改めてSARにおける認識とは • 画像認識は画像の画素のベクトル(RGB)が 与えられ認識する • SARにおける認識は、化合物が与えられ た場合にそれを何らかのベクトル表現と して与え、それから認識する • また、ヒトが似ている似ていないを判断 するのではなく認識するのはタンパク質 であるところも異なる
  19. 19. 分子認識 • 分子が認識するための特徴量抽出のため の情報をインプットとして入力する必要 があるんじゃないのか? • グラフ情報でいいのか?
  20. 20. 重ね合わせの問題 • 実際にはタンパク質と化合物の結合状態 を考慮する必要があるが • 学習させる過程で解決するのか • インプットの段階でよろしくやっておく のか • という問題も残る
  21. 21. プリミティブな記述子? • 量子化学計算から出てきた軌道の型とそ の係数をそのまま使うというのはどうだ ろうか? • コンフォメーションの問題は残るが… – 結合空間の静電場が特殊で、真空中では取ら ないコンフォメーションで結合していたりす る
  22. 22. SARでDeepLearningするには • Inputをどうするか? – 重ね合わせの問題 – 効果的な特徴量抽出のできるような • どういうモデルにするか – 深さとか
  23. 23. まとめ • SARにおけるDeepLearningは夢があると 思う • 次回はTensorFlowとかChainerのハンズオ ンでもやりたい • 誰かよろしくw

×