Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
EN
Uploaded by
Deep Learning JP
PPTX, PDF
2,701 views
[DL輪読会]Pixel2Mesh: Generating 3D Mesh Models from Single RGB Images
2018/10/12 Deep Learning JP: http://deeplearning.jp/seminar-2/
Technology
◦
Related topics:
Deep Learning
•
Read more
6
Save
Share
Embed
Embed presentation
Download
Downloaded 27 times
1
/ 22
2
/ 22
3
/ 22
4
/ 22
5
/ 22
6
/ 22
7
/ 22
8
/ 22
9
/ 22
10
/ 22
11
/ 22
12
/ 22
13
/ 22
14
/ 22
15
/ 22
16
/ 22
17
/ 22
18
/ 22
19
/ 22
20
/ 22
21
/ 22
22
/ 22
More Related Content
PPTX
[解説スライド] NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
by
Kento Doi
PDF
[DL輪読会]NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
by
Deep Learning JP
PPTX
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
by
Yusuke Uchida
PPTX
近年のHierarchical Vision Transformer
by
Yusuke Uchida
PDF
画像生成・生成モデル メタサーベイ
by
cvpaper. challenge
PDF
GAN(と強化学習との関係)
by
Masahiro Suzuki
PPTX
CVPR2018 pix2pixHD論文紹介 (CV勉強会@関東)
by
Tenki Lee
PDF
実装レベルで学ぶVQVAE
by
ぱんいち すみもと
[解説スライド] NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
by
Kento Doi
[DL輪読会]NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
by
Deep Learning JP
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
by
Yusuke Uchida
近年のHierarchical Vision Transformer
by
Yusuke Uchida
画像生成・生成モデル メタサーベイ
by
cvpaper. challenge
GAN(と強化学習との関係)
by
Masahiro Suzuki
CVPR2018 pix2pixHD論文紹介 (CV勉強会@関東)
by
Tenki Lee
実装レベルで学ぶVQVAE
by
ぱんいち すみもと
What's hot
PDF
動作認識の最前線:手法,タスク,データセット
by
Toru Tamaki
PDF
SSII2022 [TS1] Transformerの最前線〜 畳込みニューラルネットワークの先へ 〜
by
SSII
PPTX
[DLHacks]StyleGANとBigGANのStyle mixing, morphing
by
Deep Learning JP
PDF
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜
by
SSII
PDF
Transformer 動向調査 in 画像認識(修正版)
by
Kazuki Maeno
PDF
[DL輪読会]Learning Transferable Visual Models From Natural Language Supervision
by
Deep Learning JP
PPTX
【DL輪読会】Efficiently Modeling Long Sequences with Structured State Spaces
by
Deep Learning JP
PPTX
【DL輪読会】Flow Matching for Generative Modeling
by
Deep Learning JP
PPTX
【DL輪読会】Transformers are Sample Efficient World Models
by
Deep Learning JP
PDF
【DL輪読会】NeRF-VAE: A Geometry Aware 3D Scene Generative Model
by
Deep Learning JP
PDF
敵対的生成ネットワーク(GAN)
by
cvpaper. challenge
PDF
【DL輪読会】Perceiver io a general architecture for structured inputs & outputs
by
Deep Learning JP
PDF
深層学習によるHuman Pose Estimationの基礎
by
Takumi Ohkuma
PDF
[DL輪読会]Neural Radiance Flow for 4D View Synthesis and Video Processing (NeRF...
by
Deep Learning JP
PDF
動画認識における代表的なモデル・データセット(メタサーベイ)
by
cvpaper. challenge
PDF
SSII2019企画: 点群深層学習の研究動向
by
SSII
PPTX
SSII2020SS: 微分可能レンダリングの最新動向 〜「見比べる」ことによる3次元理解 〜
by
SSII
PPTX
【DL輪読会】"Instant Neural Graphics Primitives with a Multiresolution Hash Encoding"
by
Deep Learning JP
PPTX
[DL輪読会]相互情報量最大化による表現学習
by
Deep Learning JP
PDF
Action Recognitionの歴史と最新動向
by
Ohnishi Katsunori
動作認識の最前線:手法,タスク,データセット
by
Toru Tamaki
SSII2022 [TS1] Transformerの最前線〜 畳込みニューラルネットワークの先へ 〜
by
SSII
[DLHacks]StyleGANとBigGANのStyle mixing, morphing
by
Deep Learning JP
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜
by
SSII
Transformer 動向調査 in 画像認識(修正版)
by
Kazuki Maeno
[DL輪読会]Learning Transferable Visual Models From Natural Language Supervision
by
Deep Learning JP
【DL輪読会】Efficiently Modeling Long Sequences with Structured State Spaces
by
Deep Learning JP
【DL輪読会】Flow Matching for Generative Modeling
by
Deep Learning JP
【DL輪読会】Transformers are Sample Efficient World Models
by
Deep Learning JP
【DL輪読会】NeRF-VAE: A Geometry Aware 3D Scene Generative Model
by
Deep Learning JP
敵対的生成ネットワーク(GAN)
by
cvpaper. challenge
【DL輪読会】Perceiver io a general architecture for structured inputs & outputs
by
Deep Learning JP
深層学習によるHuman Pose Estimationの基礎
by
Takumi Ohkuma
[DL輪読会]Neural Radiance Flow for 4D View Synthesis and Video Processing (NeRF...
by
Deep Learning JP
動画認識における代表的なモデル・データセット(メタサーベイ)
by
cvpaper. challenge
SSII2019企画: 点群深層学習の研究動向
by
SSII
SSII2020SS: 微分可能レンダリングの最新動向 〜「見比べる」ことによる3次元理解 〜
by
SSII
【DL輪読会】"Instant Neural Graphics Primitives with a Multiresolution Hash Encoding"
by
Deep Learning JP
[DL輪読会]相互情報量最大化による表現学習
by
Deep Learning JP
Action Recognitionの歴史と最新動向
by
Ohnishi Katsunori
Similar to [DL輪読会]Pixel2Mesh: Generating 3D Mesh Models from Single RGB Images
PPTX
Soft Rasterizer: A Differentiable Renderer for Image-based 3D Reasoning
by
Kohei Nishimura
PDF
Shusaku Taniguchi Bachelor Thesis
by
pflab
PDF
三次元点群を取り扱うニューラルネットワークのサーベイ
by
Naoya Chiba
PDF
OpenCVとRGB-Dセンサで作ろう壁面タッチパネル
by
Takashi Yoshinaga
PDF
【DL輪読会】Monocular real time volumetric performance capture
by
Deep Learning JP
PDF
論文紹介 Pixel Recurrent Neural Networks
by
Seiya Tokui
PPTX
【DL輪読会】GET3D: A Generative Model of High Quality 3D Textured Shapes Learned f...
by
Deep Learning JP
PDF
Reconstructing the World’s Museums
by
ketsumedo_yarou
PDF
先端技術とメディア表現 第4回レポートまとめ
by
Digital Nature Group
PDF
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
by
Hiroki Ichikura
PDF
【Unity道場 2月】シェーダを書けるプログラマになろう
by
Unity Technologies Japan K.K.
PDF
3DCG(3Dコンピュータグラフィック)をWebGLで始めよう
by
AdvancedTechNight
PPTX
CG2013 11
by
shiozawa_h
PPTX
cvsaisentan20141004 kanezaki
by
kanejaki
PDF
Web GLの話
by
Norihito YAMAKAWA
PDF
introduce to Multimodal Deep Learning for Robust RGB-D Object Recognition
by
WEBFARMER. ltd.
PDF
三次元表現まとめ(深層学習を中心に)
by
Tomohiro Motoda
PDF
文献紹介:BlockGAN: Learning 3D Object-aware Scene Representations from Unlabelled...
by
Toru Tamaki
Soft Rasterizer: A Differentiable Renderer for Image-based 3D Reasoning
by
Kohei Nishimura
Shusaku Taniguchi Bachelor Thesis
by
pflab
三次元点群を取り扱うニューラルネットワークのサーベイ
by
Naoya Chiba
OpenCVとRGB-Dセンサで作ろう壁面タッチパネル
by
Takashi Yoshinaga
【DL輪読会】Monocular real time volumetric performance capture
by
Deep Learning JP
論文紹介 Pixel Recurrent Neural Networks
by
Seiya Tokui
【DL輪読会】GET3D: A Generative Model of High Quality 3D Textured Shapes Learned f...
by
Deep Learning JP
Reconstructing the World’s Museums
by
ketsumedo_yarou
先端技術とメディア表現 第4回レポートまとめ
by
Digital Nature Group
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
by
Hiroki Ichikura
【Unity道場 2月】シェーダを書けるプログラマになろう
by
Unity Technologies Japan K.K.
3DCG(3Dコンピュータグラフィック)をWebGLで始めよう
by
AdvancedTechNight
CG2013 11
by
shiozawa_h
cvsaisentan20141004 kanezaki
by
kanejaki
Web GLの話
by
Norihito YAMAKAWA
introduce to Multimodal Deep Learning for Robust RGB-D Object Recognition
by
WEBFARMER. ltd.
三次元表現まとめ(深層学習を中心に)
by
Tomohiro Motoda
文献紹介:BlockGAN: Learning 3D Object-aware Scene Representations from Unlabelled...
by
Toru Tamaki
More from Deep Learning JP
PPTX
【DL輪読会】AdaptDiffuser: Diffusion Models as Adaptive Self-evolving Planners
by
Deep Learning JP
PPTX
【DL輪読会】事前学習用データセットについて
by
Deep Learning JP
PPTX
【DL輪読会】 "Learning to render novel views from wide-baseline stereo pairs." CVP...
by
Deep Learning JP
PPTX
【DL輪読会】Zero-Shot Dual-Lens Super-Resolution
by
Deep Learning JP
PPTX
【DL輪読会】BloombergGPT: A Large Language Model for Finance arxiv
by
Deep Learning JP
PPTX
【DL輪読会】マルチモーダル LLM
by
Deep Learning JP
PDF
【 DL輪読会】ToolLLM: Facilitating Large Language Models to Master 16000+ Real-wo...
by
Deep Learning JP
PPTX
【DL輪読会】AnyLoc: Towards Universal Visual Place Recognition
by
Deep Learning JP
PDF
【DL輪読会】Can Neural Network Memorization Be Localized?
by
Deep Learning JP
PPTX
【DL輪読会】Hopfield network 関連研究について
by
Deep Learning JP
PPTX
【DL輪読会】SimPer: Simple self-supervised learning of periodic targets( ICLR 2023 )
by
Deep Learning JP
PDF
【DL輪読会】RLCD: Reinforcement Learning from Contrast Distillation for Language M...
by
Deep Learning JP
PDF
【DL輪読会】"Secrets of RLHF in Large Language Models Part I: PPO"
by
Deep Learning JP
PPTX
【DL輪読会】"Language Instructed Reinforcement Learning for Human-AI Coordination "
by
Deep Learning JP
PPTX
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models
by
Deep Learning JP
PDF
【DL輪読会】"Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware"
by
Deep Learning JP
PPTX
【DL輪読会】Parameter is Not All You Need:Starting from Non-Parametric Networks fo...
by
Deep Learning JP
PDF
【DL輪読会】Drag Your GAN: Interactive Point-based Manipulation on the Generative ...
by
Deep Learning JP
PDF
【DL輪読会】Self-Supervised Learning from Images with a Joint-Embedding Predictive...
by
Deep Learning JP
PPTX
【DL輪読会】Towards Understanding Ensemble, Knowledge Distillation and Self-Distil...
by
Deep Learning JP
【DL輪読会】AdaptDiffuser: Diffusion Models as Adaptive Self-evolving Planners
by
Deep Learning JP
【DL輪読会】事前学習用データセットについて
by
Deep Learning JP
【DL輪読会】 "Learning to render novel views from wide-baseline stereo pairs." CVP...
by
Deep Learning JP
【DL輪読会】Zero-Shot Dual-Lens Super-Resolution
by
Deep Learning JP
【DL輪読会】BloombergGPT: A Large Language Model for Finance arxiv
by
Deep Learning JP
【DL輪読会】マルチモーダル LLM
by
Deep Learning JP
【 DL輪読会】ToolLLM: Facilitating Large Language Models to Master 16000+ Real-wo...
by
Deep Learning JP
【DL輪読会】AnyLoc: Towards Universal Visual Place Recognition
by
Deep Learning JP
【DL輪読会】Can Neural Network Memorization Be Localized?
by
Deep Learning JP
【DL輪読会】Hopfield network 関連研究について
by
Deep Learning JP
【DL輪読会】SimPer: Simple self-supervised learning of periodic targets( ICLR 2023 )
by
Deep Learning JP
【DL輪読会】RLCD: Reinforcement Learning from Contrast Distillation for Language M...
by
Deep Learning JP
【DL輪読会】"Secrets of RLHF in Large Language Models Part I: PPO"
by
Deep Learning JP
【DL輪読会】"Language Instructed Reinforcement Learning for Human-AI Coordination "
by
Deep Learning JP
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models
by
Deep Learning JP
【DL輪読会】"Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware"
by
Deep Learning JP
【DL輪読会】Parameter is Not All You Need:Starting from Non-Parametric Networks fo...
by
Deep Learning JP
【DL輪読会】Drag Your GAN: Interactive Point-based Manipulation on the Generative ...
by
Deep Learning JP
【DL輪読会】Self-Supervised Learning from Images with a Joint-Embedding Predictive...
by
Deep Learning JP
【DL輪読会】Towards Understanding Ensemble, Knowledge Distillation and Self-Distil...
by
Deep Learning JP
[DL輪読会]Pixel2Mesh: Generating 3D Mesh Models from Single RGB Images
1.
Pixel2Mesh: Generating 3D
Mesh Models from Single RGB Images PSI B3 近藤生也
2.
余談 - https://www.crowdai.org/c hallenges/marlo- 2018/leaderboards - エントリーまだ受付中だ そう
3.
アジェンダ ● 書誌情報 ● モチベーション ●
データセット ● 既存手法 ● GCN ● コンセプト ● Mesh deformation (graph based ResNet) ● Graph unpooling ● loss4種 ● 評価指標 ● 実験 ● 所感 3
4.
書誌情報 ● Pixel2Mesh: Generating
3D Mesh Models from Single RGB Images (ECCV2018) ←ヨーロッパのCV系 ● Fudan University(中国), Princeton University(米), Intel Labs ● ポイント ○ 単一画像から3Dメッシュを復元する。 ○ 定量定性的にかなりよさそう 4
5.
モチベーション 5 ● 単一の視点から3D形状を推論したい ● ボクセルでもポイントクラウドでもなく、メッシュで。 ●
メッシュだと、テクスチャを貼りやすい レイトレーシングもしやすい。 テクスチャ
6.
モチベーション 6 (メッシュ系って実際何 に使うんだよ……) ● 個人的にはこれを→ one-shotでやりたいの だと思う(やりたい) ● 仮想空間,
オブジェク トを作成するコスト を(劇的に?)下げる, 3D情報を(明示的に)理 解した上でactionを考 える ↑ Google mapの3D機能。 恐らくSLAMをベースにした手法で3Dを復元し、 テクスチャを貼り付けている
7.
データセット ● ShapeNet ● WordNetの構造に従っている ●
数が凄い ● (使わない手はない) 7
8.
既存手法 ● [DL輪読会]MeshとDeep Learning
Surface Networks & AtlasNet ● AtlasNetはsurfaceを分けて生成。枚数はハイパラ。 ● Surface Networksは変形に強い(?)。ShapeNet等で実験をしていない。 どちらかというとsiggraph系(CG系)な気がする(?)。 ● これらとは違うアプローチを提案 8
9.
コンセプト ● GCNベース(メッシュの頂点と辺が、グラフの頂点と辺に対応) ● 徐々に頂点数を増やす(点:
156→618→2466, 面: 308→1232→4928) ○ ~~MH3Gのリオレウスのポリゴン数が約6500~~ ● GCNとは別にCNNを用意し、入力画像から情報を抽出する。 9
10.
GCN 10 ● GCN一層の処理 fp^l: あるレイヤーでの、ノードpの特徴量ベクトル N(p):
pの隣接頂点の集合, m次元→n次元と特徴量数が変化する場合、w0, w1はm*n行列 どの隣接頂点に対して使うw1も共通。 (ほとんど全結合で、自分自身と隣接してるノードの特徴量で次の層が決まる) ● https://colab.research.google.com/drive/1O4SiC5wEZn_98RSdalNJ92fJu1yo chJe#scrollTo=O8lpjeHictaG ● GCN実装の本家様のkerasサンプルコードをさらにシンプルにしてコメント を付けてみました。
11.
Pixel2Mesh ● 入力:156個の頂点座標 ● ⊕各頂点に対するCNNからの特徴量 ●
→Mesh Deformation(GCN) ● →Graph Unpooling(頂点増やす) ● ⊕各頂点に対するCNNからの特徴量 ● →Mesh Deformation(GCN) 11 : : ● →Mesh Deformation(GCN) ● →GCN ● 出力:2466個の頂点座標
12.
Mesh deformation (graph
based ResNet) 12 ● ● CNNの3箇所のfeature mapから、入力画像に頂点を投影した場所の特徴量を とってきて、各頂点の特徴量とする。 ● GCN部分では残差接続を使う。
13.
Graph unpooling 13 ● NN的にはUpsamplingと同じノリで、点の数を増やす。 ●
各面の中心ではなく辺上に点を増やすことで、均一な密度で点を増やせる × ○
14.
Loss1: Chamfer loss
(面取りloss) 14 p: predicted vertex, q: ground truth vertex ● 一番近い頂点が正しいペアだと仮定して、二乗誤差をとる。 ● 片方のΣだけだと、lossに登場しないpまたはqが出現しうる! (ユークリッドノルム)
15.
Loss2: Normal loss
(法線loss) 15 各予測頂点pとすべての隣接頂点kについて、『線分pk』と『点qでの接平面 の垂線』との内積をとる。 ● これは、点qでの接平面上に点pとその隣接頂点が全て存在したときに 0に なる。
16.
Loss3: Laplacian regularization
(ラプラシアンで正規化) 16 ● ラプラシアンδpを定義 δp=「予測頂点p(x,y,z)」と「その隣接頂点の平均」の差 (dx,dy,dz) ● Mesh Deformationの前と後のラプラシアンをδp, δ’p。 ● 隣接頂点との関係性が、G-Resの前と後であまり 変わらないようにする。 ● 特異点みたいな頂点が生成されにくくなる
17.
Loss4: Edge length
regularization (辺の長さで正規化) 17 ● すべての予測頂点pとその隣接頂点kの組み合わせについて、 距離の和をとる。 ● 形の収束が安定しやすくなる。
18.
実験 18 ● それぞれのlossがいい仕事をして いる。
19.
実験 19 ● SOTA
20.
feature work 20 ● 初期入力メッシュと目標物のトポ ロジーが違う場合、この手法は最 適ではないので拡張していきたい
21.
所感 21 ● 暗黙的に3Dを学習する手法が流行ってる気がするけど、明示的に3Dを作れ るほうが強い気がする…? ● いろいろlossを設計していたが、mesh系のGANが出たらあっさりSOTAだっ たりするのでは?
22.
参考 22 ● GCN本家 https://arxiv.org/pdf/1609.02907.pdf
Editor's Notes
#2
zero-shot-GCN 昔のリオレウスがポリゴン数(三角形の数)6500、今32万 VRChatのポリゴン数制限は2万 【ポリゴン数比較】 シン・ゴジラ 1億1000万 ミライアカリ 18万 ACfA アンサラー 15万 FF15 ノクティス 10万 キズナアイ・電脳少女シロ 8万 メギド 4万 にがもん式魔理沙 3万 ミライアカリの胸 2万 ばあちゃる 2万 MGS4 ソリッド・スネーク 1.4万 デレステ 1.1万 かばんちゃん 1万 depthを使うのまあありだけど、屋外、鏡とかに弱いので画像でもできたほうが良い?
#3
マインクラフトを使ったマルチエージェント系のコンペがあって、32位までが世界大会に招待される いろいろわけあって自分9位です 環境構築がまぁまぁめんどくさいけど、それさえクリアすればランクインできてしまうっていうおいしい状態なので紹介してみました
#4
http://imagingsolution.blog.fc2.com/blog-entry-142.html https://ja.wikipedia.org/wiki/Lp%E7%A9%BA%E9%96%93 156/628/2466 正四面体 点4辺6面4 一回増やす 点=辺+点=10 # 辺の数だけ点が増える 辺=辺*2+辺*4/2=辺*4=24 # 分裂, 一つの辺から4本生えるけども、生えた一本一本は他のとこから生えたともとれる 面=面*4=16 156 628 2466 156+点
#5
https://ja.wikipedia.org/wiki/%E4%BD%8D%E7%9B%B8%E5%B9%BE%E4%BD%95%E5%AD%A6
#6
米国のCG系の学会。 シーグラフ
#7
3Dを復元してテクスチャを貼り付ける
#10
たぶん618
#11
# 各頂点について、その頂点と連結している頂点N個の計N+1個について全結合層で新たな特徴量を計算し、# そのN+1個の新たな特徴ベクトルを足し合わせる。
#12
たぶん618 concatnate 156個の頂点にconcatする
#13
赤いところ。 入力画像が一枚だけ遭って、そこにいまの状態を写像する。 表面じゃないってわかってても、無理やり撮ってくる。
#15
GANにすればって思ったけど
#16
垂直のほうが良い
#21
複数視点から的なhogehoge
Download