SlideShare a Scribd company logo
Submit Search
Upload
Login
Signup
【DL輪読会】Flow Matching for Generative Modeling
Report
Deep Learning JP
Follow
Deep Learning JP
May. 19, 2023
•
0 likes
•
1,558 views
1
of
16
【DL輪読会】Flow Matching for Generative Modeling
May. 19, 2023
•
0 likes
•
1,558 views
Download Now
Download to read offline
Report
Technology
2023/5/19 Deep Learning JP http://deeplearning.jp/seminar-2/
Deep Learning JP
Follow
Deep Learning JP
Recommended
[DL輪読会]NVAE: A Deep Hierarchical Variational Autoencoder
Deep Learning JP
1.8K views
•
22 slides
【メタサーベイ】数式ドリブン教師あり学習
cvpaper. challenge
5.3K views
•
33 slides
[DL輪読会]GLIDE: Guided Language to Image Diffusion for Generation and Editing
Deep Learning JP
2.9K views
•
21 slides
近年のHierarchical Vision Transformer
Yusuke Uchida
13.3K views
•
46 slides
[DL輪読会]ドメイン転移と不変表現に関するサーベイ
Deep Learning JP
6.7K views
•
54 slides
[DL輪読会]MetaFormer is Actually What You Need for Vision
Deep Learning JP
1.3K views
•
31 slides
More Related Content
What's hot
[DL輪読会]相互情報量最大化による表現学習
Deep Learning JP
7.4K views
•
43 slides
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Yusuke Uchida
15.3K views
•
38 slides
[DL輪読会]Vision Transformer with Deformable Attention (Deformable Attention Tra...
Deep Learning JP
7.7K views
•
26 slides
[DL輪読会]data2vec: A General Framework for Self-supervised Learning in Speech,...
Deep Learning JP
2.4K views
•
15 slides
[DL輪読会]Neural Ordinary Differential Equations
Deep Learning JP
28.8K views
•
41 slides
「世界モデル」と関連研究について
Masahiro Suzuki
12.9K views
•
52 slides
What's hot
(20)
[DL輪読会]相互情報量最大化による表現学習
Deep Learning JP
•
7.4K views
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Yusuke Uchida
•
15.3K views
[DL輪読会]Vision Transformer with Deformable Attention (Deformable Attention Tra...
Deep Learning JP
•
7.7K views
[DL輪読会]data2vec: A General Framework for Self-supervised Learning in Speech,...
Deep Learning JP
•
2.4K views
[DL輪読会]Neural Ordinary Differential Equations
Deep Learning JP
•
28.8K views
「世界モデル」と関連研究について
Masahiro Suzuki
•
12.9K views
【DL輪読会】Is Conditional Generative Modeling All You Need For Decision-Making?
Deep Learning JP
•
369 views
PRML学習者から入る深層生成モデル入門
tmtm otm
•
5.6K views
【DL輪読会】言語以外でのTransformerのまとめ (ViT, Perceiver, Frozen Pretrained Transformer etc)
Deep Learning JP
•
3.6K views
【メタサーベイ】基盤モデル / Foundation Models
cvpaper. challenge
•
16K views
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
SSII
•
3.6K views
[DL輪読会]Flow-based Deep Generative Models
Deep Learning JP
•
14.2K views
モデルではなく、データセットを蒸留する
Takahiro Kubo
•
7.7K views
Deeplearning輪読会
正志 坪坂
•
9.3K views
【DL輪読会】Visual Classification via Description from Large Language Models (ICLR...
Deep Learning JP
•
1.7K views
モデル高速化百選
Yusuke Uchida
•
24.5K views
【DL輪読会】Scaling Laws for Neural Language Models
Deep Learning JP
•
3.3K views
【DL輪読会】SimCSE: Simple Contrastive Learning of Sentence Embeddings (EMNLP 2021)
Deep Learning JP
•
3.5K views
[DL輪読会]GQNと関連研究,世界モデルとの関係について
Deep Learning JP
•
8.7K views
深層学習の不確実性 - Uncertainty in Deep Neural Networks -
tmtm otm
•
11.1K views
Similar to 【DL輪読会】Flow Matching for Generative Modeling
[DL輪読会] Towards an Automatic Turing Test: Learning to Evaluate Dialogue Respo...
Deep Learning JP
1.5K views
•
38 slides
Generating Better Search Engine Text Advertisements with Deep Reinforcement L...
harmonylab
4.2K views
•
26 slides
Learning to summarize from human feedback
harmonylab
3.5K views
•
32 slides
【DL輪読会】Transformers are Sample Efficient World Models
Deep Learning JP
899 views
•
21 slides
Variational Template Machine for Data-to-Text Generation
harmonylab
3.5K views
•
43 slides
ECCV2020 Oral論文 完全読破(1/2)
cvpaper. challenge
4.3K views
•
252 slides
Similar to 【DL輪読会】Flow Matching for Generative Modeling
(20)
[DL輪読会] Towards an Automatic Turing Test: Learning to Evaluate Dialogue Respo...
Deep Learning JP
•
1.5K views
Generating Better Search Engine Text Advertisements with Deep Reinforcement L...
harmonylab
•
4.2K views
Learning to summarize from human feedback
harmonylab
•
3.5K views
【DL輪読会】Transformers are Sample Efficient World Models
Deep Learning JP
•
899 views
Variational Template Machine for Data-to-Text Generation
harmonylab
•
3.5K views
ECCV2020 Oral論文 完全読破(1/2)
cvpaper. challenge
•
4.3K views
【2016.07】cvpaper.challenge2016
cvpaper. challenge
•
2.2K views
ディープラーニング最近の発展とビジネス応用への課題
Kenta Oono
•
18.3K views
効率的学習 / Efficient Training(メタサーベイ)
cvpaper. challenge
•
7.2K views
平成24年度社会知能情報学専攻修士論文中間発表会(予稿)
n-yuki
•
946 views
[DL輪読会]Learning to Adapt: Meta-Learning for Model-Based Control
Deep Learning JP
•
1.5K views
cvpaper.challenge チームラボ講演
cvpaper. challenge
•
780 views
Pattern mining-scrum gatheringtokyo20130115
Hironori Washizaki
•
1.7K views
アジャイルマネジメントとは?
Kiro Harada
•
4.4K views
Deeplearning lt.pdf
Deep Learning JP
•
404 views
【DL輪読会】Data-Efficient Reinforcement Learning with Self-Predictive Representat...
Deep Learning JP
•
941 views
[DL輪読会]AdaShare: Learning What To Share For Efficient Deep Multi-Task Learning
Deep Learning JP
•
1.8K views
2011 splc-a scalable goal-oriented approach to software variability recovery
n-yuki
•
389 views
自己教師学習(Self-Supervised Learning)
cvpaper. challenge
•
12.4K views
2019年12月16日開催「DevOpsの実践 - Terraform EnterpriseとBitbucketで実現するCI/CD」セッション1「Dev...
アトラシアン株式会社
•
222 views
More from Deep Learning JP
【DL輪読会】AdaptDiffuser: Diffusion Models as Adaptive Self-evolving Planners
Deep Learning JP
125 views
•
28 slides
【DL輪読会】事前学習用データセットについて
Deep Learning JP
187 views
•
20 slides
【DL輪読会】 "Learning to render novel views from wide-baseline stereo pairs." CVP...
Deep Learning JP
141 views
•
26 slides
【DL輪読会】AnyLoc: Towards Universal Visual Place Recognition
Deep Learning JP
187 views
•
30 slides
【DL輪読会】Can Neural Network Memorization Be Localized?
Deep Learning JP
445 views
•
15 slides
【DL輪読会】Hopfield network 関連研究について
Deep Learning JP
838 views
•
29 slides
More from Deep Learning JP
(20)
【DL輪読会】AdaptDiffuser: Diffusion Models as Adaptive Self-evolving Planners
Deep Learning JP
•
125 views
【DL輪読会】事前学習用データセットについて
Deep Learning JP
•
187 views
【DL輪読会】 "Learning to render novel views from wide-baseline stereo pairs." CVP...
Deep Learning JP
•
141 views
【DL輪読会】AnyLoc: Towards Universal Visual Place Recognition
Deep Learning JP
•
187 views
【DL輪読会】Can Neural Network Memorization Be Localized?
Deep Learning JP
•
445 views
【DL輪読会】Hopfield network 関連研究について
Deep Learning JP
•
838 views
【DL輪読会】SimPer: Simple self-supervised learning of periodic targets( ICLR 2023 )
Deep Learning JP
•
242 views
【DL輪読会】RLCD: Reinforcement Learning from Contrast Distillation for Language M...
Deep Learning JP
•
182 views
【DL輪読会】"Secrets of RLHF in Large Language Models Part I: PPO"
Deep Learning JP
•
541 views
【DL輪読会】"Language Instructed Reinforcement Learning for Human-AI Coordination "
Deep Learning JP
•
398 views
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models
Deep Learning JP
•
992 views
【DL輪読会】"Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware"
Deep Learning JP
•
365 views
【DL輪読会】Parameter is Not All You Need:Starting from Non-Parametric Networks fo...
Deep Learning JP
•
331 views
【DL輪読会】Drag Your GAN: Interactive Point-based Manipulation on the Generative ...
Deep Learning JP
•
581 views
【DL輪読会】Self-Supervised Learning from Images with a Joint-Embedding Predictive...
Deep Learning JP
•
673 views
【DL輪読会】Towards Understanding Ensemble, Knowledge Distillation and Self-Distil...
Deep Learning JP
•
288 views
【DL輪読会】Deep Transformers without Shortcuts: Modifying Self-attention for Fait...
Deep Learning JP
•
280 views
【DL輪読会】マルチモーダル 基盤モデル
Deep Learning JP
•
784 views
【DL輪読会】TrOCR: Transformer-based Optical Character Recognition with Pre-traine...
Deep Learning JP
•
422 views
【DL輪読会】HyperDiffusion: Generating Implicit Neural Fields withWeight-Space Dif...
Deep Learning JP
•
205 views
Recently uploaded
GraphQLはどんな時に使うか
Yutaka Tachibana
6 views
•
37 slides
遠隔お酌IoTLT2309.pptx
Yoshiaki Ito
57 views
•
12 slides
gtk4_gem_usage.pdf
ssuser0ef4681
11 views
•
6 slides
IGDA Japan SIG Audio #20-1 室内・野外でのマイク収録と整音.pdf
IGDA Japan SIG-Audio
97 views
•
31 slides
20230921_IoTLT_vol103_kitazaki_v1.pdf
Ayachika Kitazaki
81 views
•
16 slides
松下研究室紹介_関西大学高槻キャンパスオープンキャンパス
Matsushita Laboratory
26 views
•
23 slides
Recently uploaded
(8)
GraphQLはどんな時に使うか
Yutaka Tachibana
•
6 views
遠隔お酌IoTLT2309.pptx
Yoshiaki Ito
•
57 views
gtk4_gem_usage.pdf
ssuser0ef4681
•
11 views
IGDA Japan SIG Audio #20-1 室内・野外でのマイク収録と整音.pdf
IGDA Japan SIG-Audio
•
97 views
20230921_IoTLT_vol103_kitazaki_v1.pdf
Ayachika Kitazaki
•
81 views
松下研究室紹介_関西大学高槻キャンパスオープンキャンパス
Matsushita Laboratory
•
26 views
テスト自動化.pdf
ssuserf8ea02
•
16 views
CCoE実践者コミュニティ#1_CCoEが進めるセキュリティカイゼンの旅.pptx
Tomoaki Tada
•
25 views
【DL輪読会】Flow Matching for Generative Modeling
1.
DEEP LEARNING JP [DL
Papers] 論文紹介: Flow Matching for Generative Modeling Ryosuke Ohashi, bestat Inc. http://deeplearning.jp/
2.
書誌情報 2 - ICLR2023 spotlight論文 -
Diffusionモデルよりも効率良く訓練・サンプリングできるモデルを提案
3.
背景:Diffusionモデル 3 - 最近Diffusionモデルがめちゃ活躍している - 2D画像生成,動画生成,モーション生成,3Dモデル生成,… -
Diffusionモデルの良い点・悪い点 - 良い点:安定した訓練,高品質&多様性の高いサンプル生成 - 悪い点:訓練・サンプル生成に時間がかかる ⇒ 訓練・サンプル生成をもっと効率化できないか?
4.
Flow Matching 4 著者らはCNFを訓練する新しい方法「Flow Matching」を提案
5.
補足:CNF 5 CNF (Continuous Normalizing
Flow) [Chen et al. 2018] データ空間の可逆変換のなめらかな列{Φ_t}で,Φ_0=idかつ,Φ_1が事 前確率分布p_0からデータ確率分布p_1への変換を誘導するもののこと p_0 ※p1がΦ_1による確率密度の変数変 換公式に従い与えられる,ということ
6.
補足:CNF 6 実は,{Φ_t}を直接モデリングするより, その時間発展を記述するODEをモデリングしたほうが便利 v_t * Δt
“=” Φ_(t+Δt) - Φ_t - v_tは可逆じゃなくてよい,解Φ_tは自動的に可逆になる - 複雑な変換Φよりも差分vのほうがMLPでフィッティングしやすい(ResNet的な)
7.
Flow Matching 7 Flow Matchingでは,何らかのCNFを定めるu_tを,MLP
v_tにより近似 (推定)することを試みる
8.
Flow Matching 8 著者らは,データ分布qからのサンプルのみが与えられているとき,サンプル 毎の「条件付きベクトル場」の列を使ってCNFを構成&訓練できることを示 した: ①各データ x_1
に対し,次をみたす条件付き確率の列 を考える ②境界確率分布の列を考える 構成により,p_0 = p,p_1はqの良い近似になっている (σ << 1)
9.
Flow Matching 9 ③条件付き確率の列 を誘導する「条件付き」ベクトル場 を考える すると,次のベクトル場(が定めるODEの解)は,②の境界確率分布 の列を誘導する(論文中の定理1) ④u_tへのflow
matchingは,以下のconditional flow matchingと同 値(論文中の定理2)
10.
Flow Matching 10 条件付き確率の列がガウシアンで与えられている場合,条件付きベクトル場 の列も閉じた形で書くことができる: は次のような条件付きベクトル場から誘導される(論文中の定理3)
11.
具体例① 11 拡散条件付きベクトル場 (Diffusion Conditional
Vector Fields) とすると, 実はこれはODE版NCSN [Song et al. 2020]と同じCNFになっている ※ただし,Score MatchingではODEの係数の一部に現れるスコアのみをマッチングで求め,Flow MatchingではODEの係数そのものをマッチングで求める,という違いがある
12.
具体例② 12 最適輸送条件付きベクトル場 (OT Conditional
Vector Fields) とすると, このベクトル場は,最適輸送の理論でdisplacement interpolationと呼ば れる特別な変換になっているらしい
13.
実験結果 13 CIFAR-10,downsampled ImageNetの条件なし生成モデルの性能比較 Flow Matching
w/ OT CVFsにより, 既存研究より高品質なサンプルを半分以下のサンプリングステップ数で生成 できることを実験的に示した
14.
実験結果 14 DDPMよりもFIDスコアが順調に下がる
15.
実験結果 15 サンプリング効率もよい ※Flow Matchingでは,サンプリングはODEを数値的に解いて行う SDEを解くより数値誤差を押さえやすく効率が良くなるらしい
16.
まとめ・感想 16 まとめ - CNFの新しい訓練アルゴリズム「Flow Matching」を提案 -
Diffusionよりも効率的に訓練・サンプリングできるモデルを提案 感想 - Flow Matchingの定式化は幾何的にイメージしやすい点がいいと思った - 今後実際に何かに試してみたい
Editor's Notes
Beyond Reward Based End-to-End RL: Representation Learning and Dataset Optimization Perspective