Submit Search
Upload
Graph R-CNN for Scene Graph Generation
•
Download as PPTX, PDF
•
1 like
•
576 views
kanosawa
Follow
第54回コンピュータビジョン勉強会@関東で発表するスライドです。
Read less
Read more
Technology
Report
Share
Report
Share
1 of 22
Download now
Recommended
第4回 地図の勉強会
第4回 地図の勉強会
Code for SAITAMA
Creative Cloud デザインツールの便利な8つの機能 - ADC MEETUP ROUND 08 SESSION2 -
Creative Cloud デザインツールの便利な8つの機能 - ADC MEETUP ROUND 08 SESSION2 -
Hideki Akiba
Face seek ai edge
Face seek ai edge
PIXELAcorporation
ARラジコン開発中
ARラジコン開発中
Hiro Han
めざせスカウター! HoloLensによる特定個人の 顔認識アプリ制作とその課題
めざせスカウター! HoloLensによる特定個人の 顔認識アプリ制作とその課題
Kenta Iwasaki
Azure IoT Edge で Custom Vision
Azure IoT Edge で Custom Vision
Yoshitaka Seo
構造化データをツールで簡単に分析
構造化データをツールで簡単に分析
Yoshitaka Seo
API ペタペタしただけのお手軽 感情分析アプリ
API ペタペタしただけのお手軽 感情分析アプリ
Yoshitaka Seo
Recommended
第4回 地図の勉強会
第4回 地図の勉強会
Code for SAITAMA
Creative Cloud デザインツールの便利な8つの機能 - ADC MEETUP ROUND 08 SESSION2 -
Creative Cloud デザインツールの便利な8つの機能 - ADC MEETUP ROUND 08 SESSION2 -
Hideki Akiba
Face seek ai edge
Face seek ai edge
PIXELAcorporation
ARラジコン開発中
ARラジコン開発中
Hiro Han
めざせスカウター! HoloLensによる特定個人の 顔認識アプリ制作とその課題
めざせスカウター! HoloLensによる特定個人の 顔認識アプリ制作とその課題
Kenta Iwasaki
Azure IoT Edge で Custom Vision
Azure IoT Edge で Custom Vision
Yoshitaka Seo
構造化データをツールで簡単に分析
構造化データをツールで簡単に分析
Yoshitaka Seo
API ペタペタしただけのお手軽 感情分析アプリ
API ペタペタしただけのお手軽 感情分析アプリ
Yoshitaka Seo
SIGGRAPH 2019レポート
SIGGRAPH 2019レポート
Kenichi Takahashi
GDC ラウンドテーブルで得た情報量 2016 - Demystifying VFX, Art Director & Leadership, RiotGa...
GDC ラウンドテーブルで得た情報量 2016 - Demystifying VFX, Art Director & Leadership, RiotGa...
TARO KOBAYASHI
グラフモデルとSoEとGraphQL データ指向アプリケーションデザインから見るGraphQL
グラフモデルとSoEとGraphQL データ指向アプリケーションデザインから見るGraphQL
Yutaka Tachibana
WWW2017論文読み会 Information Cascades と Graph Algorithms
WWW2017論文読み会 Information Cascades と Graph Algorithms
cyberagent
A practical guide to machine learning on GCP
A practical guide to machine learning on GCP
Hayato Yoshikawa
【HTML5 Conference 2018】あんずフォト:PlayCanvasでリッチアドコンテンツを開発して発信してみた(2018/11/25講演)
【HTML5 Conference 2018】あんずフォト:PlayCanvasでリッチアドコンテンツを開発して発信してみた(2018/11/25講演)
PlayCanvas運営事務局
この3D全盛時代にもう一度考えたい2Dゲームのこと
この3D全盛時代にもう一度考えたい2Dゲームのこと
Kei Nakazawa
映像解析における周辺要素
映像解析における周辺要素
Takashi Kaneda
WebARで作るDukeが飛び出すカード
WebARで作るDukeが飛び出すカード
Hideyuki Fujikawa
AndroidのAR最新動向
AndroidのAR最新動向
Kenichi Takahashi
GraphQLについての5分間
GraphQLについての5分間
Matsuo Obu
CoronaSDKのご紹介
CoronaSDKのご紹介
Takuro Fukamizu
APIを作ってみた
APIを作ってみた
Atsushi Hayakawa
rChartsによるインタラクティブな可視化表現
rChartsによるインタラクティブな可視化表現
Yasuyuki Sugai
Mastering open cv kinectv1 marker based ar
Mastering open cv kinectv1 marker based ar
Satoshi Fujimoto
【CVPR 2020 メタサーベイ】Scene Analysis and Understanding
【CVPR 2020 メタサーベイ】Scene Analysis and Understanding
cvpaper. challenge
ゲームアプリの数学@GREE GameDevelopers' Meetup
ゲームアプリの数学@GREE GameDevelopers' Meetup
gree_tech
ゲームアプリの数学@GREE GameDevelopers' Meetup
ゲームアプリの数学@GREE GameDevelopers' Meetup
Ryuichi Kubuki
CEDEC2015「加算合成コストが0になる!?すぐに使えるP-MAPブレンドテクニック」発表スライド
CEDEC2015「加算合成コストが0になる!?すぐに使えるP-MAPブレンドテクニック」発表スライド
Toshiyasu Miyabe
映像解析クラスタのアプリエンジニアから見たRancher&Kubernetes
映像解析クラスタのアプリエンジニアから見たRancher&Kubernetes
Yuusuke Kounoike
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Daniel
danielhu54
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
Toru Tamaki
More Related Content
Similar to Graph R-CNN for Scene Graph Generation
SIGGRAPH 2019レポート
SIGGRAPH 2019レポート
Kenichi Takahashi
GDC ラウンドテーブルで得た情報量 2016 - Demystifying VFX, Art Director & Leadership, RiotGa...
GDC ラウンドテーブルで得た情報量 2016 - Demystifying VFX, Art Director & Leadership, RiotGa...
TARO KOBAYASHI
グラフモデルとSoEとGraphQL データ指向アプリケーションデザインから見るGraphQL
グラフモデルとSoEとGraphQL データ指向アプリケーションデザインから見るGraphQL
Yutaka Tachibana
WWW2017論文読み会 Information Cascades と Graph Algorithms
WWW2017論文読み会 Information Cascades と Graph Algorithms
cyberagent
A practical guide to machine learning on GCP
A practical guide to machine learning on GCP
Hayato Yoshikawa
【HTML5 Conference 2018】あんずフォト:PlayCanvasでリッチアドコンテンツを開発して発信してみた(2018/11/25講演)
【HTML5 Conference 2018】あんずフォト:PlayCanvasでリッチアドコンテンツを開発して発信してみた(2018/11/25講演)
PlayCanvas運営事務局
この3D全盛時代にもう一度考えたい2Dゲームのこと
この3D全盛時代にもう一度考えたい2Dゲームのこと
Kei Nakazawa
映像解析における周辺要素
映像解析における周辺要素
Takashi Kaneda
WebARで作るDukeが飛び出すカード
WebARで作るDukeが飛び出すカード
Hideyuki Fujikawa
AndroidのAR最新動向
AndroidのAR最新動向
Kenichi Takahashi
GraphQLについての5分間
GraphQLについての5分間
Matsuo Obu
CoronaSDKのご紹介
CoronaSDKのご紹介
Takuro Fukamizu
APIを作ってみた
APIを作ってみた
Atsushi Hayakawa
rChartsによるインタラクティブな可視化表現
rChartsによるインタラクティブな可視化表現
Yasuyuki Sugai
Mastering open cv kinectv1 marker based ar
Mastering open cv kinectv1 marker based ar
Satoshi Fujimoto
【CVPR 2020 メタサーベイ】Scene Analysis and Understanding
【CVPR 2020 メタサーベイ】Scene Analysis and Understanding
cvpaper. challenge
ゲームアプリの数学@GREE GameDevelopers' Meetup
ゲームアプリの数学@GREE GameDevelopers' Meetup
gree_tech
ゲームアプリの数学@GREE GameDevelopers' Meetup
ゲームアプリの数学@GREE GameDevelopers' Meetup
Ryuichi Kubuki
CEDEC2015「加算合成コストが0になる!?すぐに使えるP-MAPブレンドテクニック」発表スライド
CEDEC2015「加算合成コストが0になる!?すぐに使えるP-MAPブレンドテクニック」発表スライド
Toshiyasu Miyabe
映像解析クラスタのアプリエンジニアから見たRancher&Kubernetes
映像解析クラスタのアプリエンジニアから見たRancher&Kubernetes
Yuusuke Kounoike
Similar to Graph R-CNN for Scene Graph Generation
(20)
SIGGRAPH 2019レポート
SIGGRAPH 2019レポート
GDC ラウンドテーブルで得た情報量 2016 - Demystifying VFX, Art Director & Leadership, RiotGa...
GDC ラウンドテーブルで得た情報量 2016 - Demystifying VFX, Art Director & Leadership, RiotGa...
グラフモデルとSoEとGraphQL データ指向アプリケーションデザインから見るGraphQL
グラフモデルとSoEとGraphQL データ指向アプリケーションデザインから見るGraphQL
WWW2017論文読み会 Information Cascades と Graph Algorithms
WWW2017論文読み会 Information Cascades と Graph Algorithms
A practical guide to machine learning on GCP
A practical guide to machine learning on GCP
【HTML5 Conference 2018】あんずフォト:PlayCanvasでリッチアドコンテンツを開発して発信してみた(2018/11/25講演)
【HTML5 Conference 2018】あんずフォト:PlayCanvasでリッチアドコンテンツを開発して発信してみた(2018/11/25講演)
この3D全盛時代にもう一度考えたい2Dゲームのこと
この3D全盛時代にもう一度考えたい2Dゲームのこと
映像解析における周辺要素
映像解析における周辺要素
WebARで作るDukeが飛び出すカード
WebARで作るDukeが飛び出すカード
AndroidのAR最新動向
AndroidのAR最新動向
GraphQLについての5分間
GraphQLについての5分間
CoronaSDKのご紹介
CoronaSDKのご紹介
APIを作ってみた
APIを作ってみた
rChartsによるインタラクティブな可視化表現
rChartsによるインタラクティブな可視化表現
Mastering open cv kinectv1 marker based ar
Mastering open cv kinectv1 marker based ar
【CVPR 2020 メタサーベイ】Scene Analysis and Understanding
【CVPR 2020 メタサーベイ】Scene Analysis and Understanding
ゲームアプリの数学@GREE GameDevelopers' Meetup
ゲームアプリの数学@GREE GameDevelopers' Meetup
ゲームアプリの数学@GREE GameDevelopers' Meetup
ゲームアプリの数学@GREE GameDevelopers' Meetup
CEDEC2015「加算合成コストが0になる!?すぐに使えるP-MAPブレンドテクニック」発表スライド
CEDEC2015「加算合成コストが0になる!?すぐに使えるP-MAPブレンドテクニック」発表スライド
映像解析クラスタのアプリエンジニアから見たRancher&Kubernetes
映像解析クラスタのアプリエンジニアから見たRancher&Kubernetes
Recently uploaded
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Daniel
danielhu54
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
Toru Tamaki
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
taisei2219
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Yuma Ohgami
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
sugiuralab
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
Toru Tamaki
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
Ryo Sasaki
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
Toru Tamaki
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
Hiroki Ichikura
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
iPride Co., Ltd.
Recently uploaded
(10)
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Daniel
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
Graph R-CNN for Scene Graph Generation
1.
Graph R-CNN for
Scene Graph Generation 2019/8/25 かのさわ(@kano_sawa)
2.
自己紹介 • 名前:さわだ、かのさわ • 仕事:メーカー研究開発職 Mixed
Reality型HMD Robot Vision Twitter @kano_sawa 趣味:ノベルゲーム制作 https://novelgame.jp/games/show/2209
3.
紹介する論文 • 論文名 • Graph
R-CNN for Scene Graph Generation • 概要 • Graph Convolutionを使ってScene Graphを生成 • 発表年月 • 2018年8月(arXiv) • 採択 • ECCV 2018
4.
紹介のモチベーション • Scene Graphを広めたい •
Graph Convolutionの画像認識への応用例を知りたい • 1年で引用45件は、Scene Graph分野では多い
5.
Scene Graph Generation(SGG)とは •
画像に写っている”物の位置と種類(ノード)”と”物同士 の関係性(エッジ)”を推定し、グラフ化すること Visual Question Answering Scene Graph Robot Plannning …
6.
SGGの課題と従来手法 課題 1. ノードの個数nに対して、エッジの本数がO(n2)となる 2. 周辺物体のcontextを考慮するのが難しい 従来手法 1.
ランダムサンプリング 2. RNN “Scene Graph Generation by Iterative Message Passing”
7.
SGGの課題と従来手法 課題 1. ノードの個数nに対して、エッジの本数がO(n2)となる 2. 周辺物体のcontextを考慮するのが難しい 従来手法 1.
ランダムサンプリング 2. RNN “Scene Graph Generation by Iterative Message Passing” もっと良い方法 あるのでは
8.
提案手法の流れ ①Faster R-CNN ②RePN ③aGCN 物体の位置と class
probabilityを 推定 Relational Proposal Network attentional Graph Convolutional Network ノード間の関係性の 高さを推定し、 pruning Contextを考慮しながら 物体種類と関係性を推定
9.
②Relational Proposal Network(RePN) Relational
Proposal Network ・output 物体間のrelatedness →上位のエッジを残す ・input 各物体のclass probablity MLP 内積 (主語) (目的語)
10.
Graph Convolutional Network(復習) l層における ノードiの特徴ベクトル (l+1)層における ノードiの特徴ベクトル 隣接ノード 線形変換 (学習重み) 隣接マトリクス(の要素) 非接続:0 接続:正規化係数 まとめると Kipf,
T.N., et. Al, “Semi-supervised classication with graph convolutional
11.
③attentional Graph Convolutional
Network(aGCN) l層における ノードiの特徴ベクトル (l+1)層における ノードiの特徴ベクトル 隣接ノード 線形変換 (学習重み) attention
12.
③attentional Graph Convolutional
Network(aGCN) l層における ノードiの特徴ベクトル (l+1)層における ノードiの特徴ベクトル 隣接ノード 線形変換 (学習重み) attention 重みベクトル (学習重み) 線形変換 (学習重み) concat ノードj ノードi
13.
③aGCNのScene Graph Generationへの適用 •
ノード特徴とエッジ特徴を別々に定義 • 接続の種類が異なると、影響の仕方も異なる zo zo zr zo zr 影響が伝搬 CNNCNN ノード特徴 zo エッジ特徴 zr WroZoαro WrsZoαrs WorZrαor WsrZrαsr o : object s : subject r : relation • ノード特徴とエッジ特徴はお互いに影響を与え合う
14.
③aGCNのScene Graph Generationへの適用 skip
connection (結局)全ノード同士を 直接繋いじゃう ノード S zo O zo zr zo zr zr zr エッジ(関係性)特徴 ノード(物体)特徴
15.
Loss関数 ①Faster R-CNN ②RePN ③aGCN binary
cross entropy multi-class cross entropy エッジ有無の分類 物体種類と関係性のクラス分類
16.
学習データセット • Visual Genome •
訓練画像:75651枚 • テスト画像:32422枚 • 物体数:11.5個/枚 • 関係数:6.2個/枚
17.
評価指標 • SGGen:triplet (subject-predicate-object)による評価 1.
推定tripletのprobability(各probabilityの積)を計算 2. 推定tripletのうちTop K(K=50, 100)を抽出 3. Recall(再現率:正解tripletのうち抽出できた割合)を計算 ※正しそうな推定がfalse positiveになってしまうので、Recallを使う • SGGenの問題点 • subject-predicate-objectのうち、一つでも間違えると評価 値が0になってしまう 正解 全間違い 一部間違い
18.
評価指標 • 新しい評価指標:SGGen+ 物体の位置とクラスが 正解だった数 関係性が 正解だった数 両方が 正解だった数 (SGGen) 全組み合わせ数
19.
評価結果 • 従来手法との比較 RNN手法 提案手法 SGGen, SGGen+の両方の評価指標において 提案手法が最も良い結果となった
20.
評価結果 • 各コンポーネントの効果検証 “RePNによるpruning”で評価値向上 “GCN”で評価値向上 “attention追加”で評価値向上 • RePN,
GCN, attention追加の全てが評価値向上に寄与 • 特にRePNによる評価値向上が大きい
21.
まとめ • RePNとaGCNでScene Graphを生成する手法を紹介した •
RePN : Relational Proposal Network • aGCN : attentional Graph Convolutional Network • 評価指標として、SGGenの改良であるSGGen+を紹介し、 提案手法が両方の評価指標において、従来手法よりも優れ ていることを示した
22.
ご清聴ありがとうございました
Download now