Recommended
PPTX
深層学習の数理:カーネル法, スパース推定との接点
PPTX
PDF
PDF
【基調講演】『深層学習の原理の理解に向けた理論の試み』 今泉 允聡(東大)
PDF
PDF
PPTX
PILCO - 第一回高橋研究室モデルベース強化学習勉強会
PDF
[DL輪読会]Wasserstein GAN/Towards Principled Methods for Training Generative Adv...
PDF
PDF
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
PPTX
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
PDF
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
PDF
SSII2022 [TS1] Transformerの最前線〜 畳込みニューラルネットワークの先へ 〜
PPTX
PDF
【メタサーベイ】Transformerから基盤モデルまでの流れ / From Transformer to Foundation Models
PPTX
【DL輪読会】言語以外でのTransformerのまとめ (ViT, Perceiver, Frozen Pretrained Transformer etc)
PDF
最近のDeep Learning (NLP) 界隈におけるAttention事情
PPTX
[DL輪読会]Set Transformer: A Framework for Attention-based Permutation-Invariant...
PDF
[DL輪読会]Understanding Black-box Predictions via Influence Functions
PDF
PDF
[DL輪読会]Deep Learning 第15章 表現学習
PPTX
【DL輪読会】ViT + Self Supervised Learningまとめ
PPTX
PPTX
PDF
PDF
クラシックな機械学習入門:付録:よく使う線形代数の公式
PPTX
PPTX
PDF
ディープラーニング入門 ~ 画像処理・自然言語処理について ~
PDF
東大大学院 電子情報学特論講義資料「深層学習概論と理論解析の課題」大野健太
More Related Content
PPTX
深層学習の数理:カーネル法, スパース推定との接点
PPTX
PDF
PDF
【基調講演】『深層学習の原理の理解に向けた理論の試み』 今泉 允聡(東大)
PDF
PDF
PPTX
PILCO - 第一回高橋研究室モデルベース強化学習勉強会
PDF
[DL輪読会]Wasserstein GAN/Towards Principled Methods for Training Generative Adv...
What's hot
PDF
PDF
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
PPTX
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
PDF
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
PDF
SSII2022 [TS1] Transformerの最前線〜 畳込みニューラルネットワークの先へ 〜
PPTX
PDF
【メタサーベイ】Transformerから基盤モデルまでの流れ / From Transformer to Foundation Models
PPTX
【DL輪読会】言語以外でのTransformerのまとめ (ViT, Perceiver, Frozen Pretrained Transformer etc)
PDF
最近のDeep Learning (NLP) 界隈におけるAttention事情
PPTX
[DL輪読会]Set Transformer: A Framework for Attention-based Permutation-Invariant...
PDF
[DL輪読会]Understanding Black-box Predictions via Influence Functions
PDF
PDF
[DL輪読会]Deep Learning 第15章 表現学習
PPTX
【DL輪読会】ViT + Self Supervised Learningまとめ
PPTX
PPTX
PDF
PDF
クラシックな機械学習入門:付録:よく使う線形代数の公式
PPTX
PPTX
Similar to 数学で解き明かす深層学習の原理
PDF
ディープラーニング入門 ~ 画像処理・自然言語処理について ~
PDF
東大大学院 電子情報学特論講義資料「深層学習概論と理論解析の課題」大野健太
PDF
PPTX
MIRU2014 tutorial deeplearning
PDF
DEEP LEARNING、トレーニング・インファレンスのGPUによる高速化
PDF
深層学習(岡本孝之 著) - Deep Learning chap.1 and 2
PPTX
PPT
PDF
PDF
PDF
Learning Deep Architectures for AI (第 3 回 Deep Learning 勉強会資料; 松尾)
PPTX
PPTX
令和元年度 実践セミナー - Deep Learning 概論 -
PDF
深層学習(岡本 孝之 著)Deep learning chap.5_1
PDF
深層学習(岡本孝之 著)Deep learning chap.4_1
PDF
PDF
PDF
PDF
深層学習(岡本孝之 著) - Deep Learning chap.3_1
PDF
深層学習(岡本孝之著) Deep learning chap.5_2
More from Taiji Suzuki
PDF
統計的学習理論チュートリアル: 基礎から応用まで (Ibis2012)
PDF
PDF
PDF
Sparse estimation tutorial 2014
PPT
PPTX
[ICLR2021 (spotlight)] Benefit of deep learning with non-convex noisy gradien...
PDF
Minimax optimal alternating minimization \\ for kernel nonparametric tensor l...
PDF
[NeurIPS2020 (spotlight)] Generalization bound of globally optimal non convex...
PDF
PAC-Bayesian Bound for Gaussian Process Regression and Multiple Kernel Additi...
PPTX
Iclr2020: Compression based bound for non-compressed network: unified general...
PDF
Stochastic Alternating Direction Method of Multipliers
PDF
PDF
Recently uploaded
PPTX
socialization in fundamentals of sociology.pptx
PDF
ПОЛОЖЕННЯ_протидія насильству_підписане.pdf
PDF
Bases especialista admen rrhh minedu.pdf
PDF
ПЛАН_навчально_профілактичні_заходи_запобігання_негативним_проявам.pdf
PDF
Seminar midterm presentation by Chihana Usui
PDF
ГРАФІК ГУРТКОВОЇ РОБОТИ 2025 kg72 grafik
PDF
ПЛАН_профілактика правопорушень02.09.25.pdf
数学で解き明かす深層学習の原理 1. 2. 深層学習の広がり 2
[Glow: Generative Flow with Invertible 1x1 Convolutions. Kingma
and Dhariwal, 2018]
AlphaGo/Zero 画像の生成
画像の変換
画像認識
自動翻訳
[Zhu, Park, Isola, and Efros: Unpaired image-to-image translation using
cycle-consistent adversarial networks. ICCV2017.]
様々なタスクで高い精度
[Silver et al. (Google Deep Mind): Mastering the game of Go with
deep neural networks and tree search, Nature, 529, 484—489, 2016]
[Wu et al.: Google's Neural Machine Translation System: Bridging the Gap between Human and Machine Translation. arXiv:1609.08144]
[He, Gkioxari, Dollár, Girshick: Mask R-CNN, ICCV2017]
3. 諸分野への波及 3
[Litjens, et al. (2017)]
医療分野における「深層学習」
を用いた論文数
医療
- 人を超える精度
(FROC73.3% -> 87.3%)
- 悪性腫瘍の場所も特定
[Detecting Cancer Metastases on
Gigapixel Pathology Images: Liu et
al., arXiv:1703.02442, 2017]
[Niepert, Ahmed&Kutzkov: Learning Convolutional Neural Networks
for Graphs, 2016]
[Gilmer et al.: Neural Message Passing for Quantum Chemistry, 2017]
[Faber et al.:Machine learning prediction errors better than DFT
accuracy, 2017.]
量子化学計算,分子の物性予測
[Google AI Blog, “Deep Learning for Robots: Learning from Large-
Scale Interaction,” 2016/5/8]
ロボット
4. 5. 6. 7. 数学の役割 7
物理学
数学現象
• 相対性理論
• 量子力学
• リーマン幾何
• 関数解析
機械学習(情報学)
深層学習 数学
• 確率論
• 関数解析
• Wasserstein幾何
• 熱拡散方程式
• 統計学
• 最適化理論
• 数値計算
数学者・物理学者も参入
8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 「浅い」学習との比較 23
≫
(𝑛𝑛: sample size,𝑝𝑝: uniformity of smoothness,𝑠𝑠: smoothness)
(カーネルリッジ回帰,KNN法,シーブ法など)
深層でない学習方法
最適ではない
深層学習
最適
• 深層学習は“必要最低限”の情報のみを抽出して学習
→学習効率が良い
• 浅い学習は“無駄な”情報も捉えて学習
→学習効率が悪い (無駄な情報に左右されてしまう)
理論上これ以上改善できない精度を達成できている.
推定誤差(平均二乗誤差 E ̂𝑓𝑓 − 𝑓𝑓∗ 2
)がサンプルサイズが増えるにつれどれだけ速く減少するか
[Suzuki, ICLR2019]
24. 25. 数学的に一般化 25
[Satoshi Hayakawa and Taiji Suzuki: On the minimax optimality and superiority of deep neural network
learning over sparse parameter spaces. arXiv:1905.09195.]
「滑らかさの非一様性」「不連続性」「データの低次元性」
凸結合を取って崩れる性質をもった関数の学習は深層学習が強い
→ 様々な性質を“凸性”で統一的に説明
例:ジャンプが3か所の区分定数関数
+ =
0.5x 0.5x
ジャンプ3か所 ジャンプ3か所 ジャンプ6か所
→ さらには「スパース推定」という観点からも説明できる.
深層:1/𝑛𝑛, カーネル: 1/ 𝑛𝑛
26. 27. 28. 29. 30. 31. 圧縮型バウンド 31
「圧縮」できるネットワークは
過学習しない
[Taiji Suzuki: Fast generalization error bound of deep learning from a kernel perspective.
AISTATS2018]
[Jingling Li, Yanchao Sun, Ziyin Liu, Taiji Suzuki and Furong Huang: Understanding of Generalization
in Deep Learning via Tensor Methods. AISTATS2020]
[Taiji Suzuki, Hiroshi Abe, Tomoaki Nishimura: Compression based bound for non-compressed
network: unified generalization error analysis of large compressible deep neural network, ICLR2020]
圧縮
•中間層の分散共分散行列の固有値分布で圧縮率を評価.
•「テンソル分解」の援用によりCNNの詳細な評価も実現.
元サイズ 圧縮可能
サイズ
大 小
実質的自由度
元のサイズ
[実験的観察] 実際に学習した
ネットワークは圧縮しやすい.
32. 33. 34. 35. 36. 37. 38. 39. 40. 粒子勾配降下法 40
• 各ニューロンのパラメータを一つの粒子とみなす.
• 粒子全体の分布が最適化される.
1つの粒子
M個の粒子が移動
𝑀𝑀 → ∞の極限で,最適解への収束が示せる.
[Nitanda&Suzuki, 2017][Chizat&Bach, 2018][Mei, Montanari&Nguyen, 2018]
データへの当てはまりを
良くする方向に変化
(各粒子の移動方向)
(分布の形)
41. 42.