Uploaded bySony - Neural Network Libraries

PDF, PPTX784 views

【AI論文解説】拡散モデルと自己回帰型モデルの融合～同時に使う手法と使い分ける手法

YouTube nnabla channelの次の動画で利用したスライドです。【AI論文解説】拡散モデルと自己回帰型モデルの融合 Part 1: https://youtu.be/3UdMJwVmUyc Part 2: https://youtu.be/XAyWy6U36j8 以下の論文を紹介しています。 Part 1で紹介: Autoregressive Image Generation without Vector Quantization https://arxiv.org/abs/2406.11838 Part 2で紹介: Transfusion: Predict the Next Token and Diffuse Images with One Multi-Modal Model https://arxiv.org/abs/2408.11039 Show-o: One Single Transformer to Unify Multimodal Understanding and Generation https://arxiv.org/abs/2408.12528

Related topics:

Deep Learning• Generative AI•

•
•
•
•
•
•

𝑦𝑖 ~ 𝑝(𝑦𝑖|𝑦1, …, 𝑦𝑖−1)

𝑝 𝑥𝑖 𝑧𝑖 ≈ 𝑝(𝑥𝑖|𝑥0, …, 𝑥𝑖−1)
𝑥𝑖 ~ 𝑝 𝑥𝑖 𝑧𝑖
𝑧𝑖 = Transformer(𝑥1, … , 𝑥𝑖)

𝜕ℒ
𝜕𝜃
𝜕ℒ
𝜕𝑧

☺
☺

•
•
•
•
•
•
•

⇒
⇒

•
•
•

•
•
•

•
•
•
•
•
•
•
•

𝑝( | )
⇒
⇒
⇒

•
•
•
•
•
•
•
•
•
•

•
•
•

•
•
•

•
•
•

•
•
•
•
•
•
•

•
•
•
•
•
•

•
•

Recommended

PDF

クラシックな機械学習の入門　　9. モデル推定

byHiroshi Nakagawa

PDF

強化学習その2

PDF

オープンワールド認識 (第34回全脳アーキテクチャ若手の会勉強会)

PDF

[DL輪読会] Spectral Norm Regularization for Improving the Generalizability of De...

byDeep Learning JP

PDF

ConvNetの歴史とResNet亜種、ベストプラクティス

byYusuke Uchida

PDF

学位論文の書き方メモ (Tips for writing thesis)

byNobuyuki Umetani

PDF

(DL hacks輪読) Deep Kernel Learning

byMasahiro Suzuki

PDF

OpenOpt の線形計画で圧縮センシング

byToshihiro Kamishima

PDF

[PRML] パターン認識と機械学習（第1章：序論）

byRyosuke Sasaki

PDF

カーネル法:正定値カーネルの理論

PDF

[DL輪読会]Deep Learning 第2章線形代数

byDeep Learning JP

PPTX

PILCO - 第一回高橋研究室モデルベース強化学習勉強会

byShunichi Sekiguchi

PDF

【DL輪読会】NeRF-VAE: A Geometry Aware 3D Scene Generative Model

byDeep Learning JP

PDF

Contrastive learning 20200607

byぱんいちすみもと

PDF

実装レベルで学ぶVQVAE

byぱんいちすみもと

PDF

EPro-PnP: Generalized End-to-End Probabilistic Perspective-n-Points for Monoc...

byKazuyuki Miyazawa

PDF

Deep Learningを用いたロボット制御

byRyosuke Okuta

PDF

強化学習その3

PDF

coordinate descent 法について

by京都大学大学院情報学研究科数理工学専攻

PDF

DQNからRainbowまで〜深層強化学習の最新動向〜

PPTX

EMアルゴリズム

PDF

[DL輪読会]`強化学習のための状態表現学習－より良い「世界モデル」の獲得に向けて－

byDeep Learning JP

PDF

PRML学習者から入る深層生成モデル入門

PDF

人工知能の最新事例 BMI 概要編

byDIVE INTO CODE Corp.

PDF

逐次モンテカルロ法の基礎

byShoutoYonekura

PDF

Optimizer入門＆最新動向

byMotokawa Tetsuya

PDF

Fisher線形判別分析とFisher Weight Maps

byTakao Yamanaka

PPTX

劣モジュラ最適化と機械学習 2.5節

PDF

【AI論文解説】高速・高品質な生成を実現するFlow Map Models（Part 1～3）

bySony - Neural Network Libraries

PDF

【学会聴講報告】CVPR2025からみるVision最先端トレンド / CVPR2025 report

bySony - Neural Network Libraries

More Related Content

PDF

クラシックな機械学習の入門　　9. モデル推定

byHiroshi Nakagawa

PDF

強化学習その2

PDF

オープンワールド認識 (第34回全脳アーキテクチャ若手の会勉強会)

PDF

[DL輪読会] Spectral Norm Regularization for Improving the Generalizability of De...

byDeep Learning JP

PDF

ConvNetの歴史とResNet亜種、ベストプラクティス

byYusuke Uchida

PDF

学位論文の書き方メモ (Tips for writing thesis)

byNobuyuki Umetani

PDF

(DL hacks輪読) Deep Kernel Learning

byMasahiro Suzuki

PDF

OpenOpt の線形計画で圧縮センシング

byToshihiro Kamishima

クラシックな機械学習の入門　　9. モデル推定

byHiroshi Nakagawa

強化学習その2

オープンワールド認識 (第34回全脳アーキテクチャ若手の会勉強会)

[DL輪読会] Spectral Norm Regularization for Improving the Generalizability of De...

byDeep Learning JP

ConvNetの歴史とResNet亜種、ベストプラクティス

byYusuke Uchida

学位論文の書き方メモ (Tips for writing thesis)

byNobuyuki Umetani

(DL hacks輪読) Deep Kernel Learning

byMasahiro Suzuki

OpenOpt の線形計画で圧縮センシング

byToshihiro Kamishima

What's hot

PDF

[PRML] パターン認識と機械学習（第1章：序論）

byRyosuke Sasaki

PDF

カーネル法:正定値カーネルの理論

PDF

[DL輪読会]Deep Learning 第2章線形代数

byDeep Learning JP

PPTX

PILCO - 第一回高橋研究室モデルベース強化学習勉強会

byShunichi Sekiguchi

PDF

【DL輪読会】NeRF-VAE: A Geometry Aware 3D Scene Generative Model

byDeep Learning JP

PDF

Contrastive learning 20200607

byぱんいちすみもと

PDF

実装レベルで学ぶVQVAE

byぱんいちすみもと

PDF

EPro-PnP: Generalized End-to-End Probabilistic Perspective-n-Points for Monoc...

byKazuyuki Miyazawa

PDF

Deep Learningを用いたロボット制御

byRyosuke Okuta

PDF

強化学習その3

PDF

coordinate descent 法について

by京都大学大学院情報学研究科数理工学専攻

PDF

DQNからRainbowまで〜深層強化学習の最新動向〜

PPTX

EMアルゴリズム

PDF

[DL輪読会]`強化学習のための状態表現学習－より良い「世界モデル」の獲得に向けて－

byDeep Learning JP

PDF

PRML学習者から入る深層生成モデル入門

PDF

人工知能の最新事例 BMI 概要編

byDIVE INTO CODE Corp.

PDF

逐次モンテカルロ法の基礎

byShoutoYonekura

PDF

Optimizer入門＆最新動向

byMotokawa Tetsuya

PDF

Fisher線形判別分析とFisher Weight Maps

byTakao Yamanaka

PPTX

劣モジュラ最適化と機械学習 2.5節

[PRML] パターン認識と機械学習（第1章：序論）

byRyosuke Sasaki

カーネル法:正定値カーネルの理論

[DL輪読会]Deep Learning 第2章線形代数

byDeep Learning JP

PILCO - 第一回高橋研究室モデルベース強化学習勉強会

byShunichi Sekiguchi

【DL輪読会】NeRF-VAE: A Geometry Aware 3D Scene Generative Model

byDeep Learning JP

Contrastive learning 20200607

byぱんいちすみもと

実装レベルで学ぶVQVAE

byぱんいちすみもと

EPro-PnP: Generalized End-to-End Probabilistic Perspective-n-Points for Monoc...

byKazuyuki Miyazawa

Deep Learningを用いたロボット制御

byRyosuke Okuta

強化学習その3

coordinate descent 法について

by京都大学大学院情報学研究科数理工学専攻

DQNからRainbowまで〜深層強化学習の最新動向〜

EMアルゴリズム

[DL輪読会]`強化学習のための状態表現学習－より良い「世界モデル」の獲得に向けて－

byDeep Learning JP

PRML学習者から入る深層生成モデル入門

人工知能の最新事例 BMI 概要編

byDIVE INTO CODE Corp.

逐次モンテカルロ法の基礎

byShoutoYonekura

Optimizer入門＆最新動向

byMotokawa Tetsuya

Fisher線形判別分析とFisher Weight Maps

byTakao Yamanaka

劣モジュラ最適化と機械学習 2.5節

More from Sony - Neural Network Libraries

PDF

【AI論文解説】高速・高品質な生成を実現するFlow Map Models（Part 1～3）

bySony - Neural Network Libraries

PDF

【学会聴講報告】CVPR2025からみるVision最先端トレンド / CVPR2025 report

bySony - Neural Network Libraries

PDF

【AI論文解説】 RLHF不要なLLMの強化学習手法: Direct Preference Optimization(+α)

bySony - Neural Network Libraries

PDF

【DeepLearning研修】Transfomerの基礎と応用 --第4回マルチモーダルへの展開

bySony - Neural Network Libraries

PDF

【DeepLearning研修】Transformerの基礎と応用 --第3回 Transformerの画像での応用

bySony - Neural Network Libraries

PDF

【DeepLearning研修】Transformerの基礎と応用 -- 第2回 Transformerの言語での応用

bySony - Neural Network Libraries

PDF

【DeepLearning研修】Transformerの基礎と応用 -- 第1回 Transformerの基本

bySony - Neural Network Libraries

PDF

20240819_NM_LivePortrait_Nnabla_youtube_final.pdf

bySony - Neural Network Libraries

PDF

【学会聴講報告】CVPR2024からみるVision最先端トレンド / CVPR2024 report

bySony - Neural Network Libraries

PPTX

【AI論文解説】クラスタリングベースアプローチによる大規模データセット自動キュレーション

bySony - Neural Network Libraries

PPTX

【AI論文解説】LLMの事前学習をvisionに適用する手法Autoregressive Image Models

bySony - Neural Network Libraries

PDF

【AI論文解説】Consistency ModelとRectified Flow

bySony - Neural Network Libraries

【AI論文解説】高速・高品質な生成を実現するFlow Map Models（Part 1～3）

bySony - Neural Network Libraries

【学会聴講報告】CVPR2025からみるVision最先端トレンド / CVPR2025 report

bySony - Neural Network Libraries

【AI論文解説】 RLHF不要なLLMの強化学習手法: Direct Preference Optimization(+α)

bySony - Neural Network Libraries

【DeepLearning研修】Transfomerの基礎と応用 --第4回マルチモーダルへの展開

bySony - Neural Network Libraries

【DeepLearning研修】Transformerの基礎と応用 --第3回 Transformerの画像での応用

bySony - Neural Network Libraries

【DeepLearning研修】Transformerの基礎と応用 -- 第2回 Transformerの言語での応用

bySony - Neural Network Libraries

【DeepLearning研修】Transformerの基礎と応用 -- 第1回 Transformerの基本

bySony - Neural Network Libraries

20240819_NM_LivePortrait_Nnabla_youtube_final.pdf

bySony - Neural Network Libraries

【学会聴講報告】CVPR2024からみるVision最先端トレンド / CVPR2024 report

bySony - Neural Network Libraries

【AI論文解説】クラスタリングベースアプローチによる大規模データセット自動キュレーション

bySony - Neural Network Libraries

【AI論文解説】LLMの事前学習をvisionに適用する手法Autoregressive Image Models

bySony - Neural Network Libraries

【AI論文解説】Consistency ModelとRectified Flow

bySony - Neural Network Libraries

【AI論文解説】拡散モデルと自己回帰型モデルの融合～同時に使う手法と使い分ける手法

2.
• • • • • •
8.
𝑥𝑡
9.
𝑥𝑡
12.
𝑦𝑖 ~ 𝑝(𝑦𝑖|𝑦1,…, 𝑦𝑖−1)
13.
𝑝 𝑥𝑖 𝑧𝑖≈ 𝑝(𝑥𝑖|𝑥0, …, 𝑥𝑖−1) 𝑥𝑖 ~ 𝑝 𝑥𝑖 𝑧𝑖 𝑧𝑖 = Transformer(𝑥1, … , 𝑥𝑖)
14.
𝜕ℒ 𝜕𝜃 𝜕ℒ 𝜕𝑧
16.
☺ ☺
19.
• • • • • • •
20.
⇒ ⇒
21.
• • •
23.
• • •
24.
• • • • • • • •
28.
𝑝( | ) ⇒ ⇒ ⇒
36.
• • • • • • • • • •
37.
• • •
38.
•
39.
• • •
40.
• • •
41.
•
42.
• • • • • • •
45.
• • • • • •
46.
•
47.
•
48.
• •