Home
Explore
Submit Search
Upload
Login
Signup
Advertisement
Check these out next
【DL輪読会】Reward Design with Language Models
Deep Learning JP
【DL輪読会】Foundation Models for Decision Making: Problems, Methods, and Opportun...
Deep Learning JP
【DL輪読会】One-Shot Domain Adaptive and Generalizable Semantic Segmentation with ...
Deep Learning JP
【DL輪読会】DiffRF: Rendering-guided 3D Radiance Field Diffusion [N. Muller+ CVPR2...
Deep Learning JP
【DL輪読会】Hyena Hierarchy: Towards Larger Convolutional Language Models
Deep Learning JP
【DL輪読会】Visual ChatGPT: Talking, Drawing and Editing with Visual Foundation Mo...
Deep Learning JP
【DL輪読会】Segment Anything
Deep Learning JP
【DL輪読会】Is Conditional Generative Modeling All You Need For Decision-Making?
Deep Learning JP
1
of
14
Top clipped slide
【DL輪読会】Semi-Parametric Neural Image Synthesis
Dec. 16, 2022
•
0 likes
1 likes
×
Be the first to like this
Show More
•
244 views
views
×
Total views
0
On Slideshare
0
From embeds
0
Number of embeds
0
Download Now
Download to read offline
Report
Technology
2022/12/16 Deep Learning JP http://deeplearning.jp/seminar-2/
Deep Learning JP
Follow
Deep Learning JP
Advertisement
Advertisement
Advertisement
Recommended
【DL輪読会】大量API・ツールの扱いに特化したLLM
Deep Learning JP
126 views
•
19 slides
【DL輪読会】DINOv2: Learning Robust Visual Features without Supervision
Deep Learning JP
74 views
•
15 slides
【DL輪読会】Poisoning Language Models During Instruction Tuning Instruction Tuning...
Deep Learning JP
132 views
•
18 slides
【DL輪読会】Egocentric Video Task Translation (CVPR 2023 Highlight)
Deep Learning JP
80 views
•
36 slides
【DL輪読会】Flow Matching for Generative Modeling
Deep Learning JP
787 views
•
16 slides
【DL輪読会】Visual Classification via Description from Large Language Models (ICLR...
Deep Learning JP
1.4K views
•
16 slides
More Related Content
More from Deep Learning JP
(20)
【DL輪読会】Reward Design with Language Models
Deep Learning JP
•
623 views
【DL輪読会】Foundation Models for Decision Making: Problems, Methods, and Opportun...
Deep Learning JP
•
289 views
【DL輪読会】One-Shot Domain Adaptive and Generalizable Semantic Segmentation with ...
Deep Learning JP
•
224 views
【DL輪読会】DiffRF: Rendering-guided 3D Radiance Field Diffusion [N. Muller+ CVPR2...
Deep Learning JP
•
380 views
【DL輪読会】Hyena Hierarchy: Towards Larger Convolutional Language Models
Deep Learning JP
•
863 views
【DL輪読会】Visual ChatGPT: Talking, Drawing and Editing with Visual Foundation Mo...
Deep Learning JP
•
1.1K views
【DL輪読会】Segment Anything
Deep Learning JP
•
1.9K views
【DL輪読会】Is Conditional Generative Modeling All You Need For Decision-Making?
Deep Learning JP
•
250 views
【DL輪読会】Decoupling Human and Camera Motion from Videos in the Wild (CVPR2023)
Deep Learning JP
•
425 views
【DL輪読会】AUTOGT: AUTOMATED GRAPH TRANSFORMER ARCHITECTURE SEARCH
Deep Learning JP
•
248 views
【DL輪読会】Bridge-Prompt: Toward Ordinal Action Understanding in Instructional Vi...
Deep Learning JP
•
325 views
【DL輪読会】SDEdit: Guided Image Synthesis and Editing with Stochastic Differentia...
Deep Learning JP
•
342 views
【DL輪読会】Diffusion Policy: Visuomotor Policy Learning via Action Diffusion
Deep Learning JP
•
467 views
【DL輪読会】Visual ChatGPT: Talking, Drawing and Editing with Visual Foundation Mo...
Deep Learning JP
•
623 views
【DL輪読会】Toolformer: Language Models Can Teach Themselves to Use Tools
Deep Learning JP
•
1.2K views
【DL輪読会】DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Dri...
Deep Learning JP
•
760 views
【DL輪読会】HyperTree Proof Search for Neural Theorem Proving
Deep Learning JP
•
294 views
【DL輪読会】StyleGAN-T: Unlocking the Power of GANs for Fast Large-Scale Text-to-I...
Deep Learning JP
•
409 views
【DL輪読会】HexPlaneとK-Planes
Deep Learning JP
•
1.1K views
【DL輪読会】Scaling laws for single-agent reinforcement learning
Deep Learning JP
•
282 views
Recently uploaded
(20)
点群SegmentationのためのTransformerサーベイ
Takuya Minagawa
•
13 views
コードレビュー改善のためにJenkinsとIntelliJ IDEAのプラグインを自作してみた話
Rakuten Group, Inc.
•
35 views
JSAI2023_企画セッション(仕掛学)資料
Matsushita Laboratory
•
24 views
JSTQB_テストプロセスの概念モデル.pdf
akipii Oga
•
259 views
JSTQB_テストマネジメントとレビュープロセス.pdf
akipii Oga
•
231 views
3Dプリンタって いいね
infinite_loop
•
64 views
CDLEハッカソン2022参加報告.pdf
SHOIWA1
•
10 views
量子論.pdf
hiro150493
•
9 views
Wandb LLM Webinar May 30 2023 (配布用).pdf
Yuya Yamamoto
•
65 views
通信プロトコルについて
iPride Co., Ltd.
•
7 views
統計学の攻略_統計的仮説検定の9パターン.pdf
akipii Oga
•
254 views
Forguncy製品概要.pptx
フォーガンシー
•
127 views
Kubernetes超入門
Takashi Suzuki
•
5 views
ペンタエリスリトール市場.pdf
HinaMiyazu
•
3 views
20230523_IoTLT_vol99_kitazaki_v1.pdf
Ayachika Kitazaki
•
112 views
20230602_enebular_meetup_kitazaki_v1.pdf
Ayachika Kitazaki
•
39 views
HTTPの仕組みについて
iPride Co., Ltd.
•
11 views
統計学の攻略_推測統計学の考え方.pdf
akipii Oga
•
264 views
ネットワークパケットブローカー市場.pdf
HinaMiyazu
•
8 views
Voyager: An Open-Ended Embodied Agent with Large Language Models
harmonylab
•
16 views
Advertisement
【DL輪読会】Semi-Parametric Neural Image Synthesis
1 DEEP LEARNING JP [DL
Papers] http://deeplearning.jp/ Semi-Parametric Neural Image Synthesis Takeru Oba, Ukita Lab
書誌情報 2 タイトル:Semi-Parametric Neural Image
Synthesis 著者:Andreas Blattmann, Robin Rombach, Kaan Oktay, Jonas Müller, Björn Ommer (LMU Munich, MCML & IWR, Heidelberg University, Germany ) 会議:NeurIPS. 2022
概要 モチベ: 生成モデルの学習パラメータ数を減らしたい アイデア: NLPの分野では, RETROなどretrievalを利用した手法がモデルのパラメータと 計算コストを減らしつつ,SOTAと同等の精度を達成 本手法では,retrievalを利用して,データセットを学習しないパラメータとした Semi-Parametricな画像生成モデルを提案 Retrievalによって類似画像を獲得し,それをヒントとすることでモデルの学習パ ラメータを減らし,計算コストを削減 3
概要 Given: • 学習データセット • 検索用データセット •
距離関数(CLIP) – CLIPで得た特徴量間のCosine Similarity • 検索方法 – 距離が近い𝑘個のサンプルを検索用データセット𝐷から選ぶ Target: • 生成モデル 尤度を最大化するようにパラメータ𝜃を最適化 4 学習データとは異なると仮定 推論時に変更することも可能 学習せずに固定 学習データ𝑥に近い𝑘個の サンプルからxを生成 • Diffusion • Autoregressive Model
提案モデル 5
提案モデル 6 学習手順 1. 学習データの画像𝑥 をサンプリング 2.
検索用データセット𝐷𝑡𝑟𝑎𝑖𝑛 から検索方法 あ に従って画像x に近い データ を得る 3. 検索したデータ をエン コーダー𝜙から特徴量ベクトルを得る 4. 得られた特徴量ベクトルを入力として 画像𝑥 を復元するようにモデル𝑝𝜃を 学習
提案モデル 7 推論方法 Class Condition: クラスに対応するデータをランダムサンプリング した後,その近傍データを検索 Unconditional Sampling: データセットからランダムサンプリングした後, 近傍データを検索(少し工夫しているので論文を 参考にしてください) Text
Condition: CLIPを利用しているため,言語をエンコードした ベクトルから直接検索できる
実験結果(画像生成) 8 Unconditionalで検索した画像からの生成結果 検索 結果 生成 結果 学習データの近傍画像とは異なる画像が生成できている 学習 データ の近傍 画像
実験結果(検索数と速度) 9 検索にはScaNNを使用.20の近傍データの検索時間は約0.95 ms 検索するデータの数を増やすとrecallが上がってprecisionが下がると いう結果が得られた.
実験結果(検索数と速度) 10 RecallとPrecisionのイメージ 𝑃 𝑔が生成された画像の分布で𝑃𝑟がデータセットの分布 (参考:Improved Precision and
Recall Metric forAssessing Generative Models https://arxiv.org/pdf/1904.06991.pdf) 生成した画像がどれだけ実 データの分布の中にあるか 実データの画像がどれだけ生 成画像の分布にあるか
実験結果(定量評価) Image Net (IN)の実験結果. RDM-OIは学習検索データをOpen
Imagesにした結果 RDM-INは学習検索データもImage Netにした結果 ADMは比較手法でDiffusion base IC-GANはGANベース 11
実験結果(定量評価) ADMに比べてパラメータ数を減らしつつ様々な指標で高精度を達成 ただし,GANよりはパラメータ数が多い 12
実験結果(データセットの複雑さによる変化) 13 データセットが複雑になると精度がどのように変化するかの検証 Dogs→Mammals→Animalsの順に複雑さを上げる 丸●が提案のsemi-parametricで四角■が従来のfull-parametric 同じ色の丸と四角を比較すると多くの場合において差が広がっている →semi-parametricの効果が大きい
まとめ まとめ データセットを学習しないパラメータとして利用する Semi-parametricな生成モデルを提案した. これにより,従来の手法よりも学習パラメータを少なくすることで計算コス トを削減 また,推論時の検索方法を変更することでクラスでの条件付けなどの 様々なサンプリングが可能であることを示した. 14
Advertisement