SlideShare a Scribd company logo
Submit Search
Upload
[DL輪読会]Deep Learning 第18章 分配関数との対峙
Report
Deep Learning JP
Deep Learning JP
Follow
•
3 likes
•
1,598 views
1
of
17
[DL輪読会]Deep Learning 第18章 分配関数との対峙
•
3 likes
•
1,598 views
Download Now
Download to read offline
Report
Technology
2018/01/15 Deep Learning JP: http://deeplearning.jp/seminar-2/
Read more
Deep Learning JP
Deep Learning JP
Follow
Recommended
[DL輪読会]Deep Learning 第5章 機械学習の基礎
Deep Learning JP
9K views
•
56 slides
PRML輪読#13
matsuolab
8.2K views
•
35 slides
変分ベイズ法の説明
Haruka Ozaki
41.3K views
•
27 slides
coordinate descent 法について
京都大学大学院情報学研究科数理工学専攻
20.4K views
•
94 slides
PRML上巻勉強会 at 東京大学 資料 第1章前半
Ohsawa Goodfellow
18.5K views
•
43 slides
深層生成モデルと世界モデル
Masahiro Suzuki
16.6K views
•
57 slides
More Related Content
What's hot
最適化超入門
Takami Sato
174.6K views
•
80 slides
PRML輪読#11
matsuolab
6.6K views
•
25 slides
PRML Chapter 14
Masahito Ohue
7.4K views
•
65 slides
[DL輪読会]Neural Ordinary Differential Equations
Deep Learning JP
29.1K views
•
41 slides
[DL輪読会]Deep Learning 第15章 表現学習
Deep Learning JP
9.7K views
•
33 slides
Chapter 8 ボルツマンマシン - 深層学習本読み会
Taikai Takeda
23.4K views
•
37 slides
What's hot
(20)
最適化超入門
Takami Sato
•
174.6K views
PRML輪読#11
matsuolab
•
6.6K views
PRML Chapter 14
Masahito Ohue
•
7.4K views
[DL輪読会]Neural Ordinary Differential Equations
Deep Learning JP
•
29.1K views
[DL輪読会]Deep Learning 第15章 表現学習
Deep Learning JP
•
9.7K views
Chapter 8 ボルツマンマシン - 深層学習本読み会
Taikai Takeda
•
23.4K views
[DL輪読会]近年のエネルギーベースモデルの進展
Deep Learning JP
•
2.6K views
PRML輪読#2
matsuolab
•
11.4K views
[DL輪読会]Deep Learning 第2章 線形代数
Deep Learning JP
•
9.6K views
DeepLearning 14章 自己符号化器
hirono kawashima
•
4.1K views
ベイズ統計学の概論的紹介
Naoki Hayashi
•
78.8K views
最適化計算の概要まとめ
Yuichiro MInato
•
7.6K views
強化学習と逆強化学習を組み合わせた模倣学習
Eiji Uchibe
•
25.2K views
DeepLearning 輪読会 第1章 はじめに
Deep Learning JP
•
8.9K views
[DL輪読会]相互情報量最大化による表現学習
Deep Learning JP
•
7.6K views
猫でも分かるVariational AutoEncoder
Sho Tatsuno
•
131.6K views
PRML輪読#5
matsuolab
•
8K views
グラフィカルモデル入門
Kawamoto_Kazuhiko
•
117.7K views
[DL輪読会]Deep Learning 第16章 深層学習のための構造化確率モデル
Deep Learning JP
•
999 views
線形計画法入門
Shunji Umetani
•
59.2K views
More from Deep Learning JP
【DL輪読会】AdaptDiffuser: Diffusion Models as Adaptive Self-evolving Planners
Deep Learning JP
227 views
•
28 slides
【DL輪読会】事前学習用データセットについて
Deep Learning JP
260 views
•
20 slides
【DL輪読会】 "Learning to render novel views from wide-baseline stereo pairs." CVP...
Deep Learning JP
180 views
•
26 slides
【DL輪読会】AnyLoc: Towards Universal Visual Place Recognition
Deep Learning JP
252 views
•
30 slides
【DL輪読会】Can Neural Network Memorization Be Localized?
Deep Learning JP
514 views
•
15 slides
【DL輪読会】Hopfield network 関連研究について
Deep Learning JP
1.3K views
•
29 slides
More from Deep Learning JP
(20)
【DL輪読会】AdaptDiffuser: Diffusion Models as Adaptive Self-evolving Planners
Deep Learning JP
•
227 views
【DL輪読会】事前学習用データセットについて
Deep Learning JP
•
260 views
【DL輪読会】 "Learning to render novel views from wide-baseline stereo pairs." CVP...
Deep Learning JP
•
180 views
【DL輪読会】AnyLoc: Towards Universal Visual Place Recognition
Deep Learning JP
•
252 views
【DL輪読会】Can Neural Network Memorization Be Localized?
Deep Learning JP
•
514 views
【DL輪読会】Hopfield network 関連研究について
Deep Learning JP
•
1.3K views
【DL輪読会】SimPer: Simple self-supervised learning of periodic targets( ICLR 2023 )
Deep Learning JP
•
330 views
【DL輪読会】RLCD: Reinforcement Learning from Contrast Distillation for Language M...
Deep Learning JP
•
231 views
【DL輪読会】"Secrets of RLHF in Large Language Models Part I: PPO"
Deep Learning JP
•
750 views
【DL輪読会】"Language Instructed Reinforcement Learning for Human-AI Coordination "
Deep Learning JP
•
443 views
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models
Deep Learning JP
•
1.3K views
【DL輪読会】"Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware"
Deep Learning JP
•
410 views
【DL輪読会】Parameter is Not All You Need:Starting from Non-Parametric Networks fo...
Deep Learning JP
•
396 views
【DL輪読会】Drag Your GAN: Interactive Point-based Manipulation on the Generative ...
Deep Learning JP
•
684 views
【DL輪読会】Self-Supervised Learning from Images with a Joint-Embedding Predictive...
Deep Learning JP
•
808 views
【DL輪読会】Towards Understanding Ensemble, Knowledge Distillation and Self-Distil...
Deep Learning JP
•
373 views
【DL輪読会】Deep Transformers without Shortcuts: Modifying Self-attention for Fait...
Deep Learning JP
•
325 views
【DL輪読会】マルチモーダル 基盤モデル
Deep Learning JP
•
1.1K views
【DL輪読会】TrOCR: Transformer-based Optical Character Recognition with Pre-traine...
Deep Learning JP
•
669 views
【DL輪読会】HyperDiffusion: Generating Implicit Neural Fields withWeight-Space Dif...
Deep Learning JP
•
245 views
Recently uploaded
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
harmonylab
41 views
•
30 slides
「概念モデリング自動化に向けた第一歩」 ~ ChatGPT・Open AI 活用による開発対象のモデル化
Knowledge & Experience
6 views
•
34 slides
さくらのひやおろし2023
法林浩之
76 views
•
58 slides
JJUG CCC.pptx
Kanta Sasaki
6 views
•
14 slides
テストコードってすごい.pptx
cistb220msudou
72 views
•
16 slides
01Booster Studio ご紹介資料
ssusere7a2172
209 views
•
19 slides
Recently uploaded
(10)
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
harmonylab
•
41 views
「概念モデリング自動化に向けた第一歩」 ~ ChatGPT・Open AI 活用による開発対象のモデル化
Knowledge & Experience
•
6 views
さくらのひやおろし2023
法林浩之
•
76 views
JJUG CCC.pptx
Kanta Sasaki
•
6 views
テストコードってすごい.pptx
cistb220msudou
•
72 views
01Booster Studio ご紹介資料
ssusere7a2172
•
209 views
概念モデリングワークショップ 基礎編
Knowledge & Experience
•
19 views
マネージドPostgreSQLの実現に向けたPostgreSQL機能向上(PostgreSQL Conference Japan 2023 発表資料)
NTT DATA Technology & Innovation
•
208 views
pgvectorを使ってChatGPTとPostgreSQLを連携してみよう!(PostgreSQL Conference Japan 2023 発表資料)
NTT DATA Technology & Innovation
•
157 views
概念モデリングワークショップ 設計編
Knowledge & Experience
•
10 views
[DL輪読会]Deep Learning 第18章 分配関数との対峙
1.
Deep Learning 輪読会
2017 第18章 分配関数との対峙 理学系研究科附属 天文学教育研究センター 学部4年 吉村勇紀
2.
構成 18.1 対数尤度 18.2 確率的最尤法 18.3
疑似尤度 18.4 スコアマッチングとレシオマッチング 18.5 雑音除去スコアマッチング 18.6 雑音対照推定 (NCE) 18.7 分配関数の推定
3.
18.1 対数尤度 • 非正規化確率分布の正規化 –
正規化定数の計算は多くのモデルで一般に困難である • 対数尤度の勾配 – 分配関数に対応する項が生じる(負項) – 以下負項をMCMCする手法を見る
4.
18.2 確率的最尤法とコントラスティブ・ダイバージェンス • 尤度関数最大化に対するMCMCの単純な適用 –
勾配1ステップ毎に混合を行う
5.
18.2 確率的最尤法とコントラスティブ・ダイバージェンス • CDアルゴリズム –
マルコフ連鎖の初期分布としてデータ分布を用いる
6.
18.2 確率的最尤法とコントラスティブ・ダイバージェンス • CDアルゴリズムの問題点 –
偽モードの出現 – RBMや可視変数ボルツマンマシンでは最尤推定値に収束しない – CDの更新方向はいかなる関数の勾配方向にならない
7.
18.2 確率的最尤法とコントラスティブ・ダイバージェンス • SML(PCD)アルゴリズム –
マルコフ連鎖の初期分布として前の勾配ステップの分布を用いる
8.
18.3 疑似尤度 分配関数• を計算せずに対数尤度を求める方法 条件付–
き確率の和で対数尤度を擬似的に表す 条件付– き確率は確率の比なので分配関数は打ち消して現れない 疑似尤度– 一般化疑似尤度• インデックス– 集合として一般化 密度推定– など完全な同時分布が必要なタスクには向かない 相関– がなるべくないようなインデックス集合が取れれば強力
9.
18.4 スコアマッチングとレシオマッチング スコアマッチング• モデル– 対数密度の入力微分とデータ対数密度の入力微分の二乗誤差を最小にする 分配関数–
はxの関数ではないので、微分を取ることで落ちる L(x,– θ)の最小化は次の期待値の最小化と同じ 対数密度– の微分、二回微分が必要
10.
18.4 スコアマッチングとレシオマッチング • レシオマッチング –
スコアマッチングの離散データへの拡張 – 次の目的関数の事例平均を最小化する – 計算量はSMLのn倍 – 二値データや高次のスパースなデータ(単語など)に適用される
11.
18.5 雑音除去スコアマッチング • スコアマッチングの正則化 –
新のデータ分布ではなく、次の分布に置き換える – 実際には真のデータ分布ではなく経験分布しか使えないから – 一致推定量の漸近的一致性は失われる
12.
18.6 雑音対照推定 (NCE) •
分配関数も同時に推定する – 次の対数尤度からパラメータと分配関数の近似値を同時に推定する – 単純な尤度最大化は不適(cが大きくなるだけ) – ノイズ分布を導入してスイッチ変数で切り替える
13.
18.7 分配関数の推定 • 重点サンプリング –
一般にp_1は高次元の複雑な分布なので質の悪い推定になってしまう
14.
18.7 分配関数の推定 • 焼きなまし重点サンプリング –
が大きい時に中間分布を挟んで隔たりを埋める方法 – 分配関数の比は次のように表せる – 中間分布 -> 加重幾何平均をよく用いる – 中間分布のサンプリングはMCMC
15.
18.7 分配関数の推定 • 焼きなまし重点サンプリング –
手順 – 重要度重み – 分配関数の近似
16.
18.7 分配関数の推定 ブリッジサンプリング• 1つの– 中間分布(ブリッジ)で補間する –
が大きい場合にも適用しうる 最適– なブリッジ分布 – 粗いrから始めて更新していく AIS– とブリッジサンプリングを組み合わせた手法も提案されている
17.
���� �������9�D�D�• 69D�– �����������������9 ��D������9��D���������� ����– ������������9�9��D������������������������������� �������������69D�������������������������