Submit Search
Upload
Real-Time Semantic Stereo Matching
•
0 likes
•
3,866 views
H
harmonylab
Follow
紹介論文 Real-Time Semantic Stereo Matching
Read less
Read more
Technology
Report
Share
Report
Share
1 of 25
Download now
Download to read offline
Recommended
TransPose: Towards Explainable Human Pose Estimation by Transformer
TransPose: Towards Explainable Human Pose Estimation by Transformer
Yasutomo Kawanishi
【メタサーベイ】数式ドリブン教師あり学習
【メタサーベイ】数式ドリブン教師あり学習
cvpaper. challenge
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII
[DL輪読会]GENESIS: Generative Scene Inference and Sampling with Object-Centric L...
[DL輪読会]GENESIS: Generative Scene Inference and Sampling with Object-Centric L...
Deep Learning JP
SfM Learner系単眼深度推定手法について
SfM Learner系単眼深度推定手法について
Ryutaro Yamauchi
3D CNNによる人物行動認識の動向
3D CNNによる人物行動認識の動向
Kensho Hara
Lucas kanade法について
Lucas kanade法について
Hitoshi Nishimura
ELBO型VAEのダメなところ
ELBO型VAEのダメなところ
KCS Keio Computer Society
Recommended
TransPose: Towards Explainable Human Pose Estimation by Transformer
TransPose: Towards Explainable Human Pose Estimation by Transformer
Yasutomo Kawanishi
【メタサーベイ】数式ドリブン教師あり学習
【メタサーベイ】数式ドリブン教師あり学習
cvpaper. challenge
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII
[DL輪読会]GENESIS: Generative Scene Inference and Sampling with Object-Centric L...
[DL輪読会]GENESIS: Generative Scene Inference and Sampling with Object-Centric L...
Deep Learning JP
SfM Learner系単眼深度推定手法について
SfM Learner系単眼深度推定手法について
Ryutaro Yamauchi
3D CNNによる人物行動認識の動向
3D CNNによる人物行動認識の動向
Kensho Hara
Lucas kanade法について
Lucas kanade法について
Hitoshi Nishimura
ELBO型VAEのダメなところ
ELBO型VAEのダメなところ
KCS Keio Computer Society
深層学習によるHuman Pose Estimationの基礎
深層学習によるHuman Pose Estimationの基礎
Takumi Ohkuma
[DL輪読会]Pyramid Stereo Matching Network
[DL輪読会]Pyramid Stereo Matching Network
Deep Learning JP
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜
SSII
【DL輪読会】ViT + Self Supervised Learningまとめ
【DL輪読会】ViT + Self Supervised Learningまとめ
Deep Learning JP
[DL輪読会]NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
[DL輪読会]NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
Deep Learning JP
[DL輪読会]ICLR2020の分布外検知速報
[DL輪読会]ICLR2020の分布外検知速報
Deep Learning JP
動画像を用いた経路予測手法の分類
動画像を用いた経路予測手法の分類
Tsubasa Hirakawa
畳み込みニューラルネットワークの研究動向
畳み込みニューラルネットワークの研究動向
Yusuke Uchida
ResNetの仕組み
ResNetの仕組み
Kota Nagasato
[DL輪読会]Life-Long Disentangled Representation Learning with Cross-Domain Laten...
[DL輪読会]Life-Long Disentangled Representation Learning with Cross-Domain Laten...
Deep Learning JP
[DL輪読会]Real-Time Semantic Stereo Matching
[DL輪読会]Real-Time Semantic Stereo Matching
Deep Learning JP
【DL輪読会】Efficiently Modeling Long Sequences with Structured State Spaces
【DL輪読会】Efficiently Modeling Long Sequences with Structured State Spaces
Deep Learning JP
Transformer メタサーベイ
Transformer メタサーベイ
cvpaper. challenge
畳み込みニューラルネットワークの高精度化と高速化
畳み込みニューラルネットワークの高精度化と高速化
Yusuke Uchida
MS COCO Dataset Introduction
MS COCO Dataset Introduction
Shinagawa Seitaro
[解説スライド] NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
[解説スライド] NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
Kento Doi
夏のトップカンファレンス論文読み会 / Realtime Multi-Person 2D Pose Estimation using Part Affin...
夏のトップカンファレンス論文読み会 / Realtime Multi-Person 2D Pose Estimation using Part Affin...
Shunsuke Ono
【メタサーベイ】Video Transformer
【メタサーベイ】Video Transformer
cvpaper. challenge
【メタサーベイ】Neural Fields
【メタサーベイ】Neural Fields
cvpaper. challenge
【チュートリアル】コンピュータビジョンによる動画認識 v2
【チュートリアル】コンピュータビジョンによる動画認識 v2
Hirokatsu Kataoka
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
harmonylab
WebにおけるHuman Dynamics 武内慎
WebにおけるHuman Dynamics 武内慎
cyberagent
More Related Content
What's hot
深層学習によるHuman Pose Estimationの基礎
深層学習によるHuman Pose Estimationの基礎
Takumi Ohkuma
[DL輪読会]Pyramid Stereo Matching Network
[DL輪読会]Pyramid Stereo Matching Network
Deep Learning JP
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜
SSII
【DL輪読会】ViT + Self Supervised Learningまとめ
【DL輪読会】ViT + Self Supervised Learningまとめ
Deep Learning JP
[DL輪読会]NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
[DL輪読会]NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
Deep Learning JP
[DL輪読会]ICLR2020の分布外検知速報
[DL輪読会]ICLR2020の分布外検知速報
Deep Learning JP
動画像を用いた経路予測手法の分類
動画像を用いた経路予測手法の分類
Tsubasa Hirakawa
畳み込みニューラルネットワークの研究動向
畳み込みニューラルネットワークの研究動向
Yusuke Uchida
ResNetの仕組み
ResNetの仕組み
Kota Nagasato
[DL輪読会]Life-Long Disentangled Representation Learning with Cross-Domain Laten...
[DL輪読会]Life-Long Disentangled Representation Learning with Cross-Domain Laten...
Deep Learning JP
[DL輪読会]Real-Time Semantic Stereo Matching
[DL輪読会]Real-Time Semantic Stereo Matching
Deep Learning JP
【DL輪読会】Efficiently Modeling Long Sequences with Structured State Spaces
【DL輪読会】Efficiently Modeling Long Sequences with Structured State Spaces
Deep Learning JP
Transformer メタサーベイ
Transformer メタサーベイ
cvpaper. challenge
畳み込みニューラルネットワークの高精度化と高速化
畳み込みニューラルネットワークの高精度化と高速化
Yusuke Uchida
MS COCO Dataset Introduction
MS COCO Dataset Introduction
Shinagawa Seitaro
[解説スライド] NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
[解説スライド] NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
Kento Doi
夏のトップカンファレンス論文読み会 / Realtime Multi-Person 2D Pose Estimation using Part Affin...
夏のトップカンファレンス論文読み会 / Realtime Multi-Person 2D Pose Estimation using Part Affin...
Shunsuke Ono
【メタサーベイ】Video Transformer
【メタサーベイ】Video Transformer
cvpaper. challenge
【メタサーベイ】Neural Fields
【メタサーベイ】Neural Fields
cvpaper. challenge
【チュートリアル】コンピュータビジョンによる動画認識 v2
【チュートリアル】コンピュータビジョンによる動画認識 v2
Hirokatsu Kataoka
What's hot
(20)
深層学習によるHuman Pose Estimationの基礎
深層学習によるHuman Pose Estimationの基礎
[DL輪読会]Pyramid Stereo Matching Network
[DL輪読会]Pyramid Stereo Matching Network
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜
【DL輪読会】ViT + Self Supervised Learningまとめ
【DL輪読会】ViT + Self Supervised Learningまとめ
[DL輪読会]NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
[DL輪読会]NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
[DL輪読会]ICLR2020の分布外検知速報
[DL輪読会]ICLR2020の分布外検知速報
動画像を用いた経路予測手法の分類
動画像を用いた経路予測手法の分類
畳み込みニューラルネットワークの研究動向
畳み込みニューラルネットワークの研究動向
ResNetの仕組み
ResNetの仕組み
[DL輪読会]Life-Long Disentangled Representation Learning with Cross-Domain Laten...
[DL輪読会]Life-Long Disentangled Representation Learning with Cross-Domain Laten...
[DL輪読会]Real-Time Semantic Stereo Matching
[DL輪読会]Real-Time Semantic Stereo Matching
【DL輪読会】Efficiently Modeling Long Sequences with Structured State Spaces
【DL輪読会】Efficiently Modeling Long Sequences with Structured State Spaces
Transformer メタサーベイ
Transformer メタサーベイ
畳み込みニューラルネットワークの高精度化と高速化
畳み込みニューラルネットワークの高精度化と高速化
MS COCO Dataset Introduction
MS COCO Dataset Introduction
[解説スライド] NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
[解説スライド] NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
夏のトップカンファレンス論文読み会 / Realtime Multi-Person 2D Pose Estimation using Part Affin...
夏のトップカンファレンス論文読み会 / Realtime Multi-Person 2D Pose Estimation using Part Affin...
【メタサーベイ】Video Transformer
【メタサーベイ】Video Transformer
【メタサーベイ】Neural Fields
【メタサーベイ】Neural Fields
【チュートリアル】コンピュータビジョンによる動画認識 v2
【チュートリアル】コンピュータビジョンによる動画認識 v2
Similar to Real-Time Semantic Stereo Matching
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
harmonylab
WebにおけるHuman Dynamics 武内慎
WebにおけるHuman Dynamics 武内慎
cyberagent
Towards Faster and Stabilized GAN Training for High-fidelity Few-shot Image S...
Towards Faster and Stabilized GAN Training for High-fidelity Few-shot Image S...
harmonylab
Convolutional Neural Networks のトレンド @WBAFLカジュアルトーク#2
Convolutional Neural Networks のトレンド @WBAFLカジュアルトーク#2
Daiki Shimada
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
harmonylab
民法教科書総選挙
民法教科書総選挙
Hatsuru Morita
画像処理分野における研究事例紹介
画像処理分野における研究事例紹介
nlab_utokyo
20160601画像電子学会
20160601画像電子学会
nlab_utokyo
20150803.山口大学講演
20150803.山口大学講演
Hayaru SHOUNO
ReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language Models
harmonylab
第7回WBAシンポジウム:全脳確率的生成モデル(WB-PGM)〜世界モデルと推論に基づく汎用人工知能に向けて
第7回WBAシンポジウム:全脳確率的生成モデル(WB-PGM)〜世界モデルと推論に基づく汎用人工知能に向けて
The Whole Brain Architecture Initiative
All That’s ‘Human’ Is Not Gold Evaluating Human Evaluation of Generated Text
All That’s ‘Human’ Is Not Gold Evaluating Human Evaluation of Generated Text
harmonylab
20150414seminar
20150414seminar
nlab_utokyo
自動化の先にあるもの ースマート技術のアプローチと選択
自動化の先にあるもの ースマート技術のアプローチと選択
Takuro Yonezawa
cnnstudy
cnnstudy
AsukaYagami
DLフレームワークChainerの紹介と分散深層強化学習によるロボット制御
DLフレームワークChainerの紹介と分散深層強化学習によるロボット制御
Ryosuke Okuta
ネットワーク科学 ネットワークが社会を支える
ネットワーク科学 ネットワークが社会を支える
hayashiresearchlab
NeurIPS2021から見るメタ学習の研究動向 - 第83回人工知能セミナー (2022.3.7)「AIトレンド・トップカンファレンス報告会(NeurI...
NeurIPS2021から見るメタ学習の研究動向 - 第83回人工知能セミナー (2022.3.7)「AIトレンド・トップカンファレンス報告会(NeurI...
DeepEyeVision, Inc.
【第一回Linked Open Data勉強会】LODの基礎技術と公開までの取り組み
【第一回Linked Open Data勉強会】LODの基礎技術と公開までの取り組み
Shusaku Egami
Abstract touya g
Abstract touya g
harmonylab
Similar to Real-Time Semantic Stereo Matching
(20)
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
WebにおけるHuman Dynamics 武内慎
WebにおけるHuman Dynamics 武内慎
Towards Faster and Stabilized GAN Training for High-fidelity Few-shot Image S...
Towards Faster and Stabilized GAN Training for High-fidelity Few-shot Image S...
Convolutional Neural Networks のトレンド @WBAFLカジュアルトーク#2
Convolutional Neural Networks のトレンド @WBAFLカジュアルトーク#2
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
民法教科書総選挙
民法教科書総選挙
画像処理分野における研究事例紹介
画像処理分野における研究事例紹介
20160601画像電子学会
20160601画像電子学会
20150803.山口大学講演
20150803.山口大学講演
ReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language Models
第7回WBAシンポジウム:全脳確率的生成モデル(WB-PGM)〜世界モデルと推論に基づく汎用人工知能に向けて
第7回WBAシンポジウム:全脳確率的生成モデル(WB-PGM)〜世界モデルと推論に基づく汎用人工知能に向けて
All That’s ‘Human’ Is Not Gold Evaluating Human Evaluation of Generated Text
All That’s ‘Human’ Is Not Gold Evaluating Human Evaluation of Generated Text
20150414seminar
20150414seminar
自動化の先にあるもの ースマート技術のアプローチと選択
自動化の先にあるもの ースマート技術のアプローチと選択
cnnstudy
cnnstudy
DLフレームワークChainerの紹介と分散深層強化学習によるロボット制御
DLフレームワークChainerの紹介と分散深層強化学習によるロボット制御
ネットワーク科学 ネットワークが社会を支える
ネットワーク科学 ネットワークが社会を支える
NeurIPS2021から見るメタ学習の研究動向 - 第83回人工知能セミナー (2022.3.7)「AIトレンド・トップカンファレンス報告会(NeurI...
NeurIPS2021から見るメタ学習の研究動向 - 第83回人工知能セミナー (2022.3.7)「AIトレンド・トップカンファレンス報告会(NeurI...
【第一回Linked Open Data勉強会】LODの基礎技術と公開までの取り組み
【第一回Linked Open Data勉強会】LODの基礎技術と公開までの取り組み
Abstract touya g
Abstract touya g
More from harmonylab
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究 千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究 千坂知也
harmonylab
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
harmonylab
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
harmonylab
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
harmonylab
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
harmonylab
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
harmonylab
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
harmonylab
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
harmonylab
Voyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language Models
harmonylab
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
harmonylab
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
harmonylab
灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究
harmonylab
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
harmonylab
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
harmonylab
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
harmonylab
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
harmonylab
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
harmonylab
A Study on Generation of Deformed Route Maps using Octilinear Grid
A Study on Generation of Deformed Route Maps using Octilinear Grid
harmonylab
A Study on the Generation of Clothing Captions Highlighting the Differences b...
A Study on the Generation of Clothing Captions Highlighting the Differences b...
harmonylab
A Study on Clothing Recommendation Information Presentation System Based on C...
A Study on Clothing Recommendation Information Presentation System Based on C...
harmonylab
More from harmonylab
(20)
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究 千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究 千坂知也
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
Voyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language Models
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
A Study on Generation of Deformed Route Maps using Octilinear Grid
A Study on Generation of Deformed Route Maps using Octilinear Grid
A Study on the Generation of Clothing Captions Highlighting the Differences b...
A Study on the Generation of Clothing Captions Highlighting the Differences b...
A Study on Clothing Recommendation Information Presentation System Based on C...
A Study on Clothing Recommendation Information Presentation System Based on C...
Recently uploaded
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Daniel
danielhu54
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
Toru Tamaki
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
Toru Tamaki
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
iPride Co., Ltd.
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Yuma Ohgami
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
Toru Tamaki
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
sugiuralab
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
taisei2219
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
Ryo Sasaki
Recently uploaded
(9)
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Daniel
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
Real-Time Semantic Stereo Matching
1.
北海道大学 大学院情報科学院 情報科学専攻 情報理工学コース
調和系工学研究室 修士2年 柳 公人 Real-Time Semantic Stereo Matching nDLゼミ
2.
論⽂情報 n URL – https://arxiv.org/pdf/1910.00541.pdf n
学会 – ICRA 2020(ロボティクス分野のトップカンファレンス) n 著者 – Pier Luigi Dovesi, Matteo Poggi, Lorenzo Andraghetti, Miquel Martı 2
3.
背景 n 未知の環境で⾃動運転⾞のような完全⾃⽴型シス テムを動かすためにはシーン理解が不可⽋ – 周囲の物体を認識するために深度推定とセマンティック セグメンテーションの2つの問題を解決する必要がある. –
それぞれのタスク同⼠には相乗効果(後述)があるのに, ス タンドアローンのネットワークがSOTA – 相乗効果を利⽤している研究もあるがリアルタイム性に 乏しく実⽤性はない. 本論では軽量でかつ相乗効果を利⽤したモデルを提案 3
4.
セマンティックセグメンテーション(補⾜) n 画像に含まれる物体の領域と物体名をピクセル単 位で出⼒ – 例えば,
⼊⼒画像のサイズが200 * 300、2クラス分類の場 合, 出⼒は200 * 300の配列で各要素には0か1が含まれる. n 簡単なモデル例(FCN) • ⼀般的なCNNの全結合 層部分を畳み込み層に置 き換える. • 特徴マップはプーリング を⾏うごとに⼩さくなる から, アップサンプリン グして⼊⼒画像と同じサ イズにする. 4
5.
深度推定 n 深度推定にはステレオカメラを使ったステレオ マッチングが精度が⾼く, 昔から利⽤されてきた. n
ステレオマッチングとセマンティックセグメン テーション は相性がいい. – 光が当たったりして深度推定が困難な画像にセグメン テーションを⾏うことで, 精度が上がる. – 植⽣や地形など曖昧な画像に対してのセグメンテーショ ンには深度推定をすることで曖昧性を取り除ける. 5
6.
ステレオマッチング(補⾜) n 左右それぞれのレンズの中⼼から物体へ直線を引 く. n 直線と像⾯の交点をそれぞれ𝑅!,
𝑅"とする. n 視差𝑑 = 𝑅! − 𝑅" n 視差が⼤きいほど物体は⼿前 6
7.
RTS2Net n ステレオマッチングとセマンティックセグメン テーションの2つのタスクを組み合わせて, リアル タイム性を持つモデル,「リアルタイムセマン ティックステレオネットワーク(RTS2Net)」を提案 7
8.
RTS2モデルの全体像 ⻘ 特徴量抽出器 ⻩ 視差ネットワーク 緑
セマンティックセグメンテーションネットワーク 紫 洗練モジュール Cはハイパー パラメーター 8
9.
特徴量抽出器 n 5個のブロックから構成される. – 1つ⽬のブロックでは,
c個の特徴量抽出を⾏い, 解像度を 1/2にする. – 2つ⽬のブロックでは, 2c個の特徴量抽出を⾏い, 解像度を 1/4にする. – 3つ⽬のブロックでは, 4c個の特徴量抽出を⾏い, 解像度を 1/8にする. – 4つ⽬のブロックでは, 8c個の特徴量抽出を⾏い, 解像度を 1/16にする. – 5つ⽬のブロックでは, 16c個の特徴量抽出を⾏い, 解像度 を1/32にする. 9
10.
特徴量抽出器 n 解像度別に分割して次のモジュールの⼊⼒にする. n 各ブロックの構成 1ブロック⽬ 2層の3×3の畳み込み +バッチ正規化+ReLU 2~5ブロック⽬ 2×2のマックスプーリング+
2層の3×3の畳み込み +バッチ正規化+ReLU 10
11.
視差ネットワーク n 視差を計算する際, 元画像ではなく,
初めは粗い解 像度の画像を⽤いることで処理速度が上がる(解像 度1/16の画像なら視差の最⼤値も1/16となるため) – 特徴量抽出器1/32の画像は精度が下がりすぎて, 結果とし て処理速度も遅くなるため n 低解像度から⾼解像度へ, ボトムアップで視差map を作る. 11
12.
n まず初めの層で追加の畳み込みを⾏う. n 右画像を視差となりえる最⼩値𝑑#$%から𝑑#&'まで 少しずつずらして,
それぞれの類似度を計算する – この計算により類似度を格納したコストボリュームと呼 ばれる𝑊×𝐻×𝑑!"#次元の3次テンソルが得られる. n コストボリュームを3次元畳み込み+バッチ正規化 +ReLUで処理する. n アップサンプリングして上の階層で同様の処理を ⾏い, より精度の⾼いコストボリュームを計算する. 視差ネットワーク 12
13.
n 視差ネットワークと同様に低解像度のものからボ トムアップでセグメンテーションマップを作る. – 1/32解像度の画像はより広い範囲を利⽤してセグメン テーションするために使⽤する. n
視差ネットワークと同様に追加の畳み込みを⾏う. n 解像度の低いセグメンテーションマップをアップ サンプリングして, より解像度の⾼いマップに⾜し 合わせる. セマンティックセグメンテーションネットワーク 13
14.
洗練モジュール n 視差mapをセグメンテーションマップを⽤いて洗 練する. – セグメンテーションマップに対して計算コストを削減し, 視差マップと似た次元性を持つように畳み込みをして圧 縮する. –
セグメンテーション特徴量と視差マップを連結 – アップサンプリングしながら3つの畳み込み層で処理 14
15.
損失関数 n 損失関数 – 𝐿
= ∑$%&' ( 𝑊$% ) (𝑊) ) 𝐿)!" + 𝑊$ ) 𝐿$!" + 𝑊)# ) 𝐿)!" # ) • 𝑑$%は視差ネットワークで予測した視差 • 𝑠$%はセマンティックセグメンテーションネットワーク で予測したセグメンテーション • 𝑑$% * は洗練モジュールで予測した視差 • 𝑠𝑡 ∈ [1, 2, 3] n 𝐿(!" と𝐿(!" # はsmooth L1 loss – 𝐿1$!++%, = 7 0.5 𝑑- − <𝑑- . , ( 𝑑- − <𝑑- < 1) 𝑑- − <𝑑- − 0.5, ( 𝑑- − <𝑑- ≥ 1) 15
16.
損失関数 n 𝑊) = * +,-(/$01)
∑%&' ( ' )*+(-$./) – Nはクラス数 – 𝑃/はクラスがjである確率 – Kは制御パラメーター(データセットによって異なる) n 𝐿4 ∗ = 𝐿4(1 + 𝛾 , 512345 5"6"6512345 ) – 𝐿$はステージごとに更新される(最も低解像度のステージ ではクロスエントロピー誤差) – 𝛾 = 0.1をセットするとベストな結果が得られる – 𝐴012"3はラベルのない領域のピクセル数 – 𝐴%+%は全体の総ピクセル数 16
17.
実験 n 精度と実⾏時間の両⽅の観点からRTS2Netの性能に 関する実験を⾏う. n データセット –
KITTI 2015 • validation 40枚, training 160枚 KITTI 2015 200のトレーニングシーンと200のテストシーンで構成されるデータ セット 17
18.
実験 n CityScapes datasetを⽤いて作ったモデルでファイ ンチューニングする. –
Semi-Global Matchingというアルゴリズム を⽤いて視差 マップを作る n 256×512サイズの画像をバッチサイズ8で学習する. CityScapes dataset 50箇所の都市の道路のシーンをステレオカメラで記録したビ デオを含むデータセット. セグメンテーション⽤のアノテー ションが5000フレームある. 18
19.
モデルについての実験 n Anynetと⽐較を⾏う. – Anynetは本研究の深度推定部分の元となったモデル. n
パラメータcを⾊々な値に変更して各モデルの性能 を⽐較する. n Cの値を⼤きくしてもD1-allはそこまで Anynetと変わらない 評価指標 【EPE】視差の誤差 が3ピクセル以上 【D1-all%】 視差の誤差の割合 【mIOU】平均IOU IOU = 正しく物体を推定されたピクセル / (正しい物体のピクセル+正しいと 推定したピクセル-正しく物体を推定されたピクセル ) 【pAcc%】ピクセルあたりの精度 【TX2】NVIDIA Jetson TX2. 低電⼒で実⾏できるアーキテクチャ 19
20.
相乗効果についての実験 n C=8に固定して, RTS2Net
の3つのモデル間での⽐ 較を⾏う. – 視差ネットワークのみ – 視差ネットワーク+セマンティックセグメンテーション ネットワーク – 視差ネットワーク+セマンティックセグメンテーション ネットワーク+洗練モジュール 20
21.
相乗効果についての実験 n Disp.+Sem.+Ref.カッコ内の数値は今回の構成での 洗練モジュールを⽤いた結果 – カッコ外はSegStereoという先⾏研究の洗練モジュール構 成 n
洗練モジュールに通さなくても, 単にセグメンテー ションと深度推定を組み合わせるだけでも, EPEと D1-all%は減少する. 21
22.
相乗効果についての実験 n C=8, 完全なモデルでAnynetと⽐較を⾏う. n
NVIDIA Jetson TX2で測定 n どのステージにおいても視差の誤差を改善できて いる. n RTS2NetではStage2で推論を早期に停⽌すること で, 最⼩フレームレート10FPSを達成することがで きる. 22
23.
KITTIオンラインベンチマークとの⽐較 n その他のモデルとの⽐較 – 特に,
リアルタイムフレームワークの最先端である MADNetやStereoNetに注⽬ – Anynetはオンラインベンチマークに提出できなかった – NVIDIA 2080ti上で実⾏ n 他のリアルタイム系モデルと⽐べても視差の誤差 が低い. 評価指標 【D1-bg%】 背景の視差誤差 【D1-fg%】 前⾯の視差誤差 23
24.
KITTIオンラインベンチマークとの⽐較 n その他のモデルとの⽐較 – 特に,
セマンティックステレオマッチングの先⾏研究であ るSegStereoに注⽬ n SegStereoの30倍の速度が出る. n クラスレベルではSegStereoに劣るが, カテゴリレ ベル(⾐服と体を分けるなど)ではやや勝る. 24
25.
結論 n 深度推定とセマンティックセグメンテーションの 相乗効果を利⽤したモデルを提案した. n NVIDIA
Jetson TX2のような低消費電⼒で動く機器 の上でも, リアルタイムでセマンティックステレオ マッチングを⾏うことができる最初のモデル. 25
Download now