SlideShare a Scribd company logo
岡本大和
CVPR’19 SURVEY
Domain Adaptation
on Segmentation Task
自己紹介 岡本大和(おかもとやまと)
 京都大学でパターン認識を研究して修士課程修了
 オムロンで技術起点のBusiness Developmentを担当
 夢は京都をポスト・シリコンバレーにすること
⇒ 京都の学生と変人が持つパワーを世界に知らしめたい
@ICDM’18
Banquet
Twitter : RoadRoller_DESU
調査方針
CVPR’19の論文を対象に
Domain Adaptation を Segmentation Task に適用した論文を抽出
・Strong-Weak Distribution Alignment for Adaptive Object Detection
・Sliced Wasserstein Discrepancy for Unsupervised Domain Adaptation
・Taking A Closer Look at Domain Shift: Category-level Adversaries for Semantics Consistent Domain Adaptation
巻末では、
予備知識として近年ポピュラーなMask-R-CNNとRoI-Alignを解説
所感:
・segmentationタスクはpixel単位でClassificationする点が特徴的
・Domain-LOSSをどの段階で,どの部分に,どの強度でかけるかが主要論点
Strong-Weak Distribution Alignment for Adaptive Object Detection
Kuniaki Saito, Yoshitaka Ushiku, Tatsuya Harada, Kate Saenko
Boston University, The University of Tokyo, RIKEN
pdf: https://arxiv.org/pdf/1812.04798.pdf (CVPR’2019)
Git: https://github.com/VisionLearningGroup/DA_Detection
Sliced Wasserstein Discrepancy for Unsupervised Domain Adaptation
Chen-Yu Lee, Tanmay Batra, Mohammad Haris Baig, Daniel Ulbricht
Apple Inc
pdf: ttps://arxiv.org/pdf/1903.04064.pdf (CVPR’2019)
Taking A Closer Look at Domain Shift: Category-level Adversaries for Semantics Consistent Domain Adaptation
Yawei Luo, Liang Zheng, Tao Guan, Junqing Yu, Yi Yang
Huazhong University, Baidu Research, Australian National University
pdf: https://arxiv.org/pdf/1809.09478.pdf (CVPR’2019)
Git: https://github.com/RoyalVane/CLAN (Coming soon....)
(巻末付録)CyCADA: Cycle-Consistent Adversarial Domain Adaptation
Judy Hoffman, Eric Tzeng, Taesung Park, Jun-Yan Zhu, Phillip Isola, Kate Saenko, Alexei A. Efros, Trevor Darrell
EECS and BAIR, UC Berkeley, Openai, Boston University
pdf: http://proceedings.mlr.press/v80/hoffman18a/hoffman18a.pdf (ICML’2018)
Git: https://github.com/jhoffman/cycada_release
(巻末付録)Mask R-CNN、RoI-Align
Kaiming He Georgia Gkioxari Piotr Dollar Ross Girshick
Facebook AI Research
pdf: https://arxiv.org/pdf/1703.06870.pdf
Git: https://github.com/matterport/Mask_RCNN
Strong-Weak Distribution Alignment
for Adaptive Object Detection (CVPR’19)
Experiment:
Task Domain Adaptation on Semantic Segmentation
Model Faster RCNN + ROI-alignment + Domain Prediction Brunch
DataSet ・Adaptation between dissimilar domain(PASCAL⇒Clipart, Watercolor)
・Adaptation between similar domain(Cityscapes⇒Foggy Cityscapes)
・Adaptation from synthetic to real images(GTA ⇒ Cityscapes)
Key Idea:
• Feature MapのH*W個の局所特徴それぞれに強めのAdversarial lossをかける
• Feature Mapの全体に対しては弱めのAdversarial lossをかける
Sliced Wasserstein Discrepancy
for Unsupervised Domain Adaptation (CVPR’19)
Experiment:
Task Domain Adaptation on
Image Classification, Semantic Segmentation and Object Detection
Model VGG-16 + PSPNet, ResNet-101 + PSPNet (*for segmentation task)
DataSet GTA5 -> Cityscape, Synthia -> Cityscape (*for segmentation task)
Key Idea:
• 2つのClassifierでXtargetの予測結果が異なるようにClassifierを学習、重なるようにGeneratorを学習
• このとき予測結果の相違尺度にWasserstein-Distanceを用いるよう改良した
• 距離計算を簡易化するためにradial projectionとlinear projectionを導入したらしいが理解追い付かず
余談ですが Future Workに
・domain randomization
・open set adaptation
・zero-shot domain adaptation
とありました、期待!
Taking A Closer Look at Domain Shift: Category-level Adversaries for
Semantics Consistent Domain Adaptation (CVPR’19)
Experiment:
Task Domain Adaptation on Semantic Segmentation
Model DeepLab-v2 with ResNet-101
DataSet GTA5 -> Cityscape, Synthia -> Cityscape
Key Idea:
• Source-Dataにて、識別器C1とC2の判定結果の和が正しいSegmentationとなるようにLOSSをかける
• 識別器C1とC2が異なる観点を持つ(特徴量の多様性を確保する)ようにLOSSをかける
• 識別器C1とC2の出力から、Discriminatorがドメイン識別できないようにAdversarial-LOSSをかける
• Adversarial-LOSSは判定不一致度合(C1とC2の出力のコサイン距離平均)で重み付けする
(巻末付録)2018年の関連論文
CyCADA: Cycle-Consistent Adversarial Domain Adaptation(ICML’18)
Experiment:
Task Domain Adaptation on Semantic Segmentation
Model VGG16-FCN8s base, and DRN-26
DataSet GTA5 -> Cityscape, Cityscape -> GTA5
Key Idea:
• ドメイン変換する過程で情報損失が起きないように、Cycle lossを導入した
• S->T->Sとドメイン変換したときに元データと一致すれば、変換過程で情報損失がないという考え
(巻末付録)Mask R-CNN
画像中から物体を検出して識別する手法
R-CNN (CVPR’14)
・画像から物体候補領域であるRoI(Region of Interest)を抽出後、各RoIをCNNにかけて物体を検出
Faster-R-CNN (NIPS’15)
・FeatureMAPからRoIを抽出してからCNNで物体検出、R-CNNをEnd-To-Endで学習可能にした。
MASK-R-CNN(ICCV’17)
・Faster-R-CNNにmask-brunchを追加した。mask生成とClassificationのタスクを分離した点が特徴。
参考、画像引用:
・Mask R-CNN Slide Share https://www.slideshare.net/windmdk/mask-rcnn
・Fast R-CNN(Microsoft Research) https://arxiv.org/pdf/1504.08083.pdf
K種類のClassを想定してK個のmaskを出力
誤差逆伝播はClassifier-Brunchの出力クラスkのmaskにのみ適用
(巻末付録)RoI-Align
検出したRoIから固定サイズのFeature MAPを取得するための手法
RoI-Pooling(ICCV’15でMicrosoft Research が提案)
・RoI座標を整数値に丸めて領域を切出す(例:[(6.4, 2.8), (9.8, 4.2)] ⇒ [(6, 2), (9, 4)] )
・出力したいFeatureMAPサイズ(HxW)に領域分割して、それぞれでMaxやAverageでPoolingする
・整数値に丸めたり、HxWに領域分割するときに位置ずれが起きることが問題点
RoI-Align(ICCV’17でFacebook AI Research が提案)
・RoIを(整数値に丸めずに)そのまま出力したいFeatureMAPサイズ(HxW)に領域分割する
・RoIの内部にあるグリッド点の座標を(整数値に丸めずに)算出
・グリッド点の値を近傍4ピクセルからbilinear interpolationで算出
・それぞれMaxやAverageでPoolingする
参考、画像引用:
・最新の物体検出手法Mask R-CNNのRoI AlignとFast(er) R-CNNのRoI Poolingの違いを正しく理解する(@yu4u) https://qiita.com/yu4u/items/5cbe9db166a5d72f9eb8
・Mask R-CNN Slide Share https://www.slideshare.net/windmdk/mask-rcnn
RoI-Pooling RoI-Align

More Related Content

Similar to CVPR2019 survey Domain Adaptation on Semantic Segmentation

WWW2017論文読み会 Information Cascades と Graph Algorithms
WWW2017論文読み会 Information Cascades と Graph AlgorithmsWWW2017論文読み会 Information Cascades と Graph Algorithms
WWW2017論文読み会 Information Cascades と Graph Algorithms
cyberagent
 
CVPR2019 読み会「Understanding the Limitations of CNN-based Absolute Camera Pose ...
CVPR2019 読み会「Understanding the Limitations of CNN-based Absolute Camera Pose ...CVPR2019 読み会「Understanding the Limitations of CNN-based Absolute Camera Pose ...
CVPR2019 読み会「Understanding the Limitations of CNN-based Absolute Camera Pose ...
Sho Kagami
 
(文献紹介)深層学習による動被写体ロバストなカメラの動き推定
(文献紹介)深層学習による動被写体ロバストなカメラの動き推定(文献紹介)深層学習による動被写体ロバストなカメラの動き推定
(文献紹介)深層学習による動被写体ロバストなカメラの動き推定
Morpho, Inc.
 
When NAS Meets Robustness: In Search of Robust Architectures against Adversar...
When NAS Meets Robustness:In Search of Robust Architectures againstAdversar...When NAS Meets Robustness:In Search of Robust Architectures againstAdversar...
When NAS Meets Robustness: In Search of Robust Architectures against Adversar...
MasanoriSuganuma
 
CMSI計算科学技術特論B(4) アプリケーションの性能最適化の実例1
CMSI計算科学技術特論B(4) アプリケーションの性能最適化の実例1CMSI計算科学技術特論B(4) アプリケーションの性能最適化の実例1
CMSI計算科学技術特論B(4) アプリケーションの性能最適化の実例1Computational Materials Science Initiative
 
2012-03-08 MSS研究会
2012-03-08 MSS研究会2012-03-08 MSS研究会
2012-03-08 MSS研究会
Kimikazu Kato
 
When NAS Meets Robustness: In Search of Robust Architectures against Adversar...
When NAS Meets Robustness:In Search of Robust Architectures againstAdversar...When NAS Meets Robustness:In Search of Robust Architectures againstAdversar...
When NAS Meets Robustness: In Search of Robust Architectures against Adversar...
MasanoriSuganuma
 
ADVENTUREの他のモジュール・関連プロジェクトの紹介
ADVENTUREの他のモジュール・関連プロジェクトの紹介ADVENTUREの他のモジュール・関連プロジェクトの紹介
ADVENTUREの他のモジュール・関連プロジェクトの紹介
ADVENTURE Project
 
Cedec2012 ai-contest-design-patterns-principles
Cedec2012 ai-contest-design-patterns-principlesCedec2012 ai-contest-design-patterns-principles
Cedec2012 ai-contest-design-patterns-principles
Hironori Washizaki
 
KDDCUP2020 ML Track2
KDDCUP2020 ML Track2KDDCUP2020 ML Track2
KDDCUP2020 ML Track2
NTTDOCOMO-ServiceInnovation
 
20190227 第51回CV勉強会@関東
20190227 第51回CV勉強会@関東 20190227 第51回CV勉強会@関東
20190227 第51回CV勉強会@関東
Kyohei Unno
 
CVPR 2011 ImageNet Challenge 文献紹介
CVPR 2011 ImageNet Challenge 文献紹介CVPR 2011 ImageNet Challenge 文献紹介
CVPR 2011 ImageNet Challenge 文献紹介
Narihira Takuya
 
ICCV 2019 論文紹介 (26 papers)
ICCV 2019 論文紹介 (26 papers)ICCV 2019 論文紹介 (26 papers)
ICCV 2019 論文紹介 (26 papers)
Hideki Okada
 
NAPA 3次元モデルを用いたフロントローディングによる生産性向上
NAPA 3次元モデルを用いたフロントローディングによる生産性向上NAPA 3次元モデルを用いたフロントローディングによる生産性向上
NAPA 3次元モデルを用いたフロントローディングによる生産性向上
Takayoshi Masui
 
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
cvpaper. challenge
 
CNNの構造最適化手法(第3回3D勉強会)
CNNの構造最適化手法(第3回3D勉強会)CNNの構造最適化手法(第3回3D勉強会)
CNNの構造最適化手法(第3回3D勉強会)
MasanoriSuganuma
 
[豆ナイト]Java small object programming
[豆ナイト]Java small object programming[豆ナイト]Java small object programming
[豆ナイト]Java small object programming
Yuichi Hasegawa
 
20210531 ora jam_stackgan
20210531 ora jam_stackgan20210531 ora jam_stackgan
20210531 ora jam_stackgan
Kenichi Sonoda
 
End-to-end learning of keypoint detector and descriptor for pose invariant 3D...
End-to-end learning of keypoint detector and descriptor for pose invariant 3D...End-to-end learning of keypoint detector and descriptor for pose invariant 3D...
End-to-end learning of keypoint detector and descriptor for pose invariant 3D...
YasuakiMori2
 
BA-Net: Dense Bundle Adjustment Network (3D勉強会@関東)
BA-Net: Dense Bundle Adjustment Network (3D勉強会@関東) BA-Net: Dense Bundle Adjustment Network (3D勉強会@関東)
BA-Net: Dense Bundle Adjustment Network (3D勉強会@関東)
Mai Nishimura
 

Similar to CVPR2019 survey Domain Adaptation on Semantic Segmentation (20)

WWW2017論文読み会 Information Cascades と Graph Algorithms
WWW2017論文読み会 Information Cascades と Graph AlgorithmsWWW2017論文読み会 Information Cascades と Graph Algorithms
WWW2017論文読み会 Information Cascades と Graph Algorithms
 
CVPR2019 読み会「Understanding the Limitations of CNN-based Absolute Camera Pose ...
CVPR2019 読み会「Understanding the Limitations of CNN-based Absolute Camera Pose ...CVPR2019 読み会「Understanding the Limitations of CNN-based Absolute Camera Pose ...
CVPR2019 読み会「Understanding the Limitations of CNN-based Absolute Camera Pose ...
 
(文献紹介)深層学習による動被写体ロバストなカメラの動き推定
(文献紹介)深層学習による動被写体ロバストなカメラの動き推定(文献紹介)深層学習による動被写体ロバストなカメラの動き推定
(文献紹介)深層学習による動被写体ロバストなカメラの動き推定
 
When NAS Meets Robustness: In Search of Robust Architectures against Adversar...
When NAS Meets Robustness:In Search of Robust Architectures againstAdversar...When NAS Meets Robustness:In Search of Robust Architectures againstAdversar...
When NAS Meets Robustness: In Search of Robust Architectures against Adversar...
 
CMSI計算科学技術特論B(4) アプリケーションの性能最適化の実例1
CMSI計算科学技術特論B(4) アプリケーションの性能最適化の実例1CMSI計算科学技術特論B(4) アプリケーションの性能最適化の実例1
CMSI計算科学技術特論B(4) アプリケーションの性能最適化の実例1
 
2012-03-08 MSS研究会
2012-03-08 MSS研究会2012-03-08 MSS研究会
2012-03-08 MSS研究会
 
When NAS Meets Robustness: In Search of Robust Architectures against Adversar...
When NAS Meets Robustness:In Search of Robust Architectures againstAdversar...When NAS Meets Robustness:In Search of Robust Architectures againstAdversar...
When NAS Meets Robustness: In Search of Robust Architectures against Adversar...
 
ADVENTUREの他のモジュール・関連プロジェクトの紹介
ADVENTUREの他のモジュール・関連プロジェクトの紹介ADVENTUREの他のモジュール・関連プロジェクトの紹介
ADVENTUREの他のモジュール・関連プロジェクトの紹介
 
Cedec2012 ai-contest-design-patterns-principles
Cedec2012 ai-contest-design-patterns-principlesCedec2012 ai-contest-design-patterns-principles
Cedec2012 ai-contest-design-patterns-principles
 
KDDCUP2020 ML Track2
KDDCUP2020 ML Track2KDDCUP2020 ML Track2
KDDCUP2020 ML Track2
 
20190227 第51回CV勉強会@関東
20190227 第51回CV勉強会@関東 20190227 第51回CV勉強会@関東
20190227 第51回CV勉強会@関東
 
CVPR 2011 ImageNet Challenge 文献紹介
CVPR 2011 ImageNet Challenge 文献紹介CVPR 2011 ImageNet Challenge 文献紹介
CVPR 2011 ImageNet Challenge 文献紹介
 
ICCV 2019 論文紹介 (26 papers)
ICCV 2019 論文紹介 (26 papers)ICCV 2019 論文紹介 (26 papers)
ICCV 2019 論文紹介 (26 papers)
 
NAPA 3次元モデルを用いたフロントローディングによる生産性向上
NAPA 3次元モデルを用いたフロントローディングによる生産性向上NAPA 3次元モデルを用いたフロントローディングによる生産性向上
NAPA 3次元モデルを用いたフロントローディングによる生産性向上
 
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
 
CNNの構造最適化手法(第3回3D勉強会)
CNNの構造最適化手法(第3回3D勉強会)CNNの構造最適化手法(第3回3D勉強会)
CNNの構造最適化手法(第3回3D勉強会)
 
[豆ナイト]Java small object programming
[豆ナイト]Java small object programming[豆ナイト]Java small object programming
[豆ナイト]Java small object programming
 
20210531 ora jam_stackgan
20210531 ora jam_stackgan20210531 ora jam_stackgan
20210531 ora jam_stackgan
 
End-to-end learning of keypoint detector and descriptor for pose invariant 3D...
End-to-end learning of keypoint detector and descriptor for pose invariant 3D...End-to-end learning of keypoint detector and descriptor for pose invariant 3D...
End-to-end learning of keypoint detector and descriptor for pose invariant 3D...
 
BA-Net: Dense Bundle Adjustment Network (3D勉強会@関東)
BA-Net: Dense Bundle Adjustment Network (3D勉強会@関東) BA-Net: Dense Bundle Adjustment Network (3D勉強会@関東)
BA-Net: Dense Bundle Adjustment Network (3D勉強会@関東)
 

More from Yamato OKAMOTO

第七回全日本コンピュータビジョン勉強会 A Multiplexed Network for End-to-End, Multilingual OCR
第七回全日本コンピュータビジョン勉強会 A Multiplexed Network for End-to-End, Multilingual OCR第七回全日本コンピュータビジョン勉強会 A Multiplexed Network for End-to-End, Multilingual OCR
第七回全日本コンピュータビジョン勉強会 A Multiplexed Network for End-to-End, Multilingual OCR
Yamato OKAMOTO
 
部下のマネジメントはAI開発に学べ
部下のマネジメントはAI開発に学べ部下のマネジメントはAI開発に学べ
部下のマネジメントはAI開発に学べ
Yamato OKAMOTO
 
ICLR2020 オンライン読み会 Deep Semi-Supervised Anomaly Detection
ICLR2020 オンライン読み会 Deep Semi-Supervised Anomaly DetectionICLR2020 オンライン読み会 Deep Semi-Supervised Anomaly Detection
ICLR2020 オンライン読み会 Deep Semi-Supervised Anomaly Detection
Yamato OKAMOTO
 
ICLR'2020 参加速報
ICLR'2020 参加速報ICLR'2020 参加速報
ICLR'2020 参加速報
Yamato OKAMOTO
 
Domain Generalization via Model-Agnostic Learning of Semantic Features
Domain Generalization via Model-Agnostic Learning of Semantic FeaturesDomain Generalization via Model-Agnostic Learning of Semantic Features
Domain Generalization via Model-Agnostic Learning of Semantic Features
Yamato OKAMOTO
 
(SURVEY) Active Learning
(SURVEY) Active Learning(SURVEY) Active Learning
(SURVEY) Active Learning
Yamato OKAMOTO
 
(SURVEY) Semi Supervised Learning
(SURVEY) Semi Supervised Learning(SURVEY) Semi Supervised Learning
(SURVEY) Semi Supervised Learning
Yamato OKAMOTO
 
[ICML2019読み会in京都] (LT)Bayesian Nonparametric Federated Learning of Neural Net...
[ICML2019読み会in京都] (LT)Bayesian Nonparametric Federated Learning of Neural Net...[ICML2019読み会in京都] (LT)Bayesian Nonparametric Federated Learning of Neural Net...
[ICML2019読み会in京都] (LT)Bayesian Nonparametric Federated Learning of Neural Net...
Yamato OKAMOTO
 
[ICML2019読み会in京都] Agnostic Federated Learning
[ICML2019読み会in京都] Agnostic Federated Learning[ICML2019読み会in京都] Agnostic Federated Learning
[ICML2019読み会in京都] Agnostic Federated Learning
Yamato OKAMOTO
 
CVPR2019@ロングビーチ参加速報(後編 ~本会議~)
CVPR2019@ロングビーチ参加速報(後編 ~本会議~)CVPR2019@ロングビーチ参加速報(後編 ~本会議~)
CVPR2019@ロングビーチ参加速報(後編 ~本会議~)
Yamato OKAMOTO
 
CVPR2019@ロングビーチ参加速報(前編~Tutorial&Workshop~)
CVPR2019@ロングビーチ参加速報(前編~Tutorial&Workshop~)CVPR2019@ロングビーチ参加速報(前編~Tutorial&Workshop~)
CVPR2019@ロングビーチ参加速報(前編~Tutorial&Workshop~)
Yamato OKAMOTO
 
ICML2019@Long Beach 参加速報(5~6日目 Workshop)
ICML2019@Long Beach 参加速報(5~6日目 Workshop)ICML2019@Long Beach 参加速報(5~6日目 Workshop)
ICML2019@Long Beach 参加速報(5~6日目 Workshop)
Yamato OKAMOTO
 
ICML2019@Long Beach 参加速報(最終日 Workshop)
ICML2019@Long Beach 参加速報(最終日 Workshop)ICML2019@Long Beach 参加速報(最終日 Workshop)
ICML2019@Long Beach 参加速報(最終日 Workshop)
Yamato OKAMOTO
 
ICML2019@Long Beach 参加速報(4日目)
ICML2019@Long Beach 参加速報(4日目)ICML2019@Long Beach 参加速報(4日目)
ICML2019@Long Beach 参加速報(4日目)
Yamato OKAMOTO
 
ICML2019@Long Beach 参加速報(3日目)
ICML2019@Long Beach 参加速報(3日目)ICML2019@Long Beach 参加速報(3日目)
ICML2019@Long Beach 参加速報(3日目)
Yamato OKAMOTO
 
ICML2019@Long Beach 参加速報(2日目)
ICML2019@Long Beach 参加速報(2日目) ICML2019@Long Beach 参加速報(2日目)
ICML2019@Long Beach 参加速報(2日目)
Yamato OKAMOTO
 
ICML2019@Long Beach 参加速報(1日目)
ICML2019@Long Beach 参加速報(1日目)ICML2019@Long Beach 参加速報(1日目)
ICML2019@Long Beach 参加速報(1日目)
Yamato OKAMOTO
 
ICLR2019 読み会in京都 ICLRから読み取るFeature Disentangleの研究動向
ICLR2019 読み会in京都 ICLRから読み取るFeature Disentangleの研究動向ICLR2019 読み会in京都 ICLRから読み取るFeature Disentangleの研究動向
ICLR2019 読み会in京都 ICLRから読み取るFeature Disentangleの研究動向
Yamato OKAMOTO
 
ICLR'19 読み会 in 京都 [LT枠] Domain Adaptationの研究動向
ICLR'19 読み会 in 京都 [LT枠] Domain Adaptationの研究動向ICLR'19 読み会 in 京都 [LT枠] Domain Adaptationの研究動向
ICLR'19 読み会 in 京都 [LT枠] Domain Adaptationの研究動向
Yamato OKAMOTO
 
ICLR'19 研究動向まとめ 『Domain Adaptation』『Feature Disentangle』
ICLR'19 研究動向まとめ 『Domain Adaptation』『Feature Disentangle』ICLR'19 研究動向まとめ 『Domain Adaptation』『Feature Disentangle』
ICLR'19 研究動向まとめ 『Domain Adaptation』『Feature Disentangle』
Yamato OKAMOTO
 

More from Yamato OKAMOTO (20)

第七回全日本コンピュータビジョン勉強会 A Multiplexed Network for End-to-End, Multilingual OCR
第七回全日本コンピュータビジョン勉強会 A Multiplexed Network for End-to-End, Multilingual OCR第七回全日本コンピュータビジョン勉強会 A Multiplexed Network for End-to-End, Multilingual OCR
第七回全日本コンピュータビジョン勉強会 A Multiplexed Network for End-to-End, Multilingual OCR
 
部下のマネジメントはAI開発に学べ
部下のマネジメントはAI開発に学べ部下のマネジメントはAI開発に学べ
部下のマネジメントはAI開発に学べ
 
ICLR2020 オンライン読み会 Deep Semi-Supervised Anomaly Detection
ICLR2020 オンライン読み会 Deep Semi-Supervised Anomaly DetectionICLR2020 オンライン読み会 Deep Semi-Supervised Anomaly Detection
ICLR2020 オンライン読み会 Deep Semi-Supervised Anomaly Detection
 
ICLR'2020 参加速報
ICLR'2020 参加速報ICLR'2020 参加速報
ICLR'2020 参加速報
 
Domain Generalization via Model-Agnostic Learning of Semantic Features
Domain Generalization via Model-Agnostic Learning of Semantic FeaturesDomain Generalization via Model-Agnostic Learning of Semantic Features
Domain Generalization via Model-Agnostic Learning of Semantic Features
 
(SURVEY) Active Learning
(SURVEY) Active Learning(SURVEY) Active Learning
(SURVEY) Active Learning
 
(SURVEY) Semi Supervised Learning
(SURVEY) Semi Supervised Learning(SURVEY) Semi Supervised Learning
(SURVEY) Semi Supervised Learning
 
[ICML2019読み会in京都] (LT)Bayesian Nonparametric Federated Learning of Neural Net...
[ICML2019読み会in京都] (LT)Bayesian Nonparametric Federated Learning of Neural Net...[ICML2019読み会in京都] (LT)Bayesian Nonparametric Federated Learning of Neural Net...
[ICML2019読み会in京都] (LT)Bayesian Nonparametric Federated Learning of Neural Net...
 
[ICML2019読み会in京都] Agnostic Federated Learning
[ICML2019読み会in京都] Agnostic Federated Learning[ICML2019読み会in京都] Agnostic Federated Learning
[ICML2019読み会in京都] Agnostic Federated Learning
 
CVPR2019@ロングビーチ参加速報(後編 ~本会議~)
CVPR2019@ロングビーチ参加速報(後編 ~本会議~)CVPR2019@ロングビーチ参加速報(後編 ~本会議~)
CVPR2019@ロングビーチ参加速報(後編 ~本会議~)
 
CVPR2019@ロングビーチ参加速報(前編~Tutorial&Workshop~)
CVPR2019@ロングビーチ参加速報(前編~Tutorial&Workshop~)CVPR2019@ロングビーチ参加速報(前編~Tutorial&Workshop~)
CVPR2019@ロングビーチ参加速報(前編~Tutorial&Workshop~)
 
ICML2019@Long Beach 参加速報(5~6日目 Workshop)
ICML2019@Long Beach 参加速報(5~6日目 Workshop)ICML2019@Long Beach 参加速報(5~6日目 Workshop)
ICML2019@Long Beach 参加速報(5~6日目 Workshop)
 
ICML2019@Long Beach 参加速報(最終日 Workshop)
ICML2019@Long Beach 参加速報(最終日 Workshop)ICML2019@Long Beach 参加速報(最終日 Workshop)
ICML2019@Long Beach 参加速報(最終日 Workshop)
 
ICML2019@Long Beach 参加速報(4日目)
ICML2019@Long Beach 参加速報(4日目)ICML2019@Long Beach 参加速報(4日目)
ICML2019@Long Beach 参加速報(4日目)
 
ICML2019@Long Beach 参加速報(3日目)
ICML2019@Long Beach 参加速報(3日目)ICML2019@Long Beach 参加速報(3日目)
ICML2019@Long Beach 参加速報(3日目)
 
ICML2019@Long Beach 参加速報(2日目)
ICML2019@Long Beach 参加速報(2日目) ICML2019@Long Beach 参加速報(2日目)
ICML2019@Long Beach 参加速報(2日目)
 
ICML2019@Long Beach 参加速報(1日目)
ICML2019@Long Beach 参加速報(1日目)ICML2019@Long Beach 参加速報(1日目)
ICML2019@Long Beach 参加速報(1日目)
 
ICLR2019 読み会in京都 ICLRから読み取るFeature Disentangleの研究動向
ICLR2019 読み会in京都 ICLRから読み取るFeature Disentangleの研究動向ICLR2019 読み会in京都 ICLRから読み取るFeature Disentangleの研究動向
ICLR2019 読み会in京都 ICLRから読み取るFeature Disentangleの研究動向
 
ICLR'19 読み会 in 京都 [LT枠] Domain Adaptationの研究動向
ICLR'19 読み会 in 京都 [LT枠] Domain Adaptationの研究動向ICLR'19 読み会 in 京都 [LT枠] Domain Adaptationの研究動向
ICLR'19 読み会 in 京都 [LT枠] Domain Adaptationの研究動向
 
ICLR'19 研究動向まとめ 『Domain Adaptation』『Feature Disentangle』
ICLR'19 研究動向まとめ 『Domain Adaptation』『Feature Disentangle』ICLR'19 研究動向まとめ 『Domain Adaptation』『Feature Disentangle』
ICLR'19 研究動向まとめ 『Domain Adaptation』『Feature Disentangle』
 

Recently uploaded

FIDO Alliance Osaka Seminar: Welcome Slides.pdf
FIDO Alliance Osaka Seminar: Welcome Slides.pdfFIDO Alliance Osaka Seminar: Welcome Slides.pdf
FIDO Alliance Osaka Seminar: Welcome Slides.pdf
FIDO Alliance
 
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
harmonylab
 
CS集会#13_なるほどわからん通信技術 発表資料
CS集会#13_なるほどわからん通信技術 発表資料CS集会#13_なるほどわからん通信技術 発表資料
CS集会#13_なるほどわからん通信技術 発表資料
Yuuitirou528 default
 
FIDO Alliance Osaka Seminar: CloudGate.pdf
FIDO Alliance Osaka Seminar: CloudGate.pdfFIDO Alliance Osaka Seminar: CloudGate.pdf
FIDO Alliance Osaka Seminar: CloudGate.pdf
FIDO Alliance
 
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdfFIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
FIDO Alliance
 
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
Toru Tamaki
 
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
Fukuoka Institute of Technology
 
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdfFIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
FIDO Alliance
 
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdfFIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
FIDO Alliance
 
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアルLoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
CRI Japan, Inc.
 
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
Matsushita Laboratory
 
ReonHata_便利の副作用に気づかせるための発想支援手法の評価---行為の増減の提示による気づきへの影響---
ReonHata_便利の副作用に気づかせるための発想支援手法の評価---行為の増減の提示による気づきへの影響---ReonHata_便利の副作用に気づかせるための発想支援手法の評価---行為の増減の提示による気づきへの影響---
ReonHata_便利の副作用に気づかせるための発想支援手法の評価---行為の増減の提示による気づきへの影響---
Matsushita Laboratory
 
This is the company presentation material of RIZAP Technologies, Inc.
This is the company presentation material of RIZAP Technologies, Inc.This is the company presentation material of RIZAP Technologies, Inc.
This is the company presentation material of RIZAP Technologies, Inc.
chiefujita1
 
JSAI_類似画像マッチングによる器への印象付与手法の妥当性検証_ver.3_高橋りさ
JSAI_類似画像マッチングによる器への印象付与手法の妥当性検証_ver.3_高橋りさJSAI_類似画像マッチングによる器への印象付与手法の妥当性検証_ver.3_高橋りさ
JSAI_類似画像マッチングによる器への印象付与手法の妥当性検証_ver.3_高橋りさ
0207sukipio
 

Recently uploaded (14)

FIDO Alliance Osaka Seminar: Welcome Slides.pdf
FIDO Alliance Osaka Seminar: Welcome Slides.pdfFIDO Alliance Osaka Seminar: Welcome Slides.pdf
FIDO Alliance Osaka Seminar: Welcome Slides.pdf
 
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
 
CS集会#13_なるほどわからん通信技術 発表資料
CS集会#13_なるほどわからん通信技術 発表資料CS集会#13_なるほどわからん通信技術 発表資料
CS集会#13_なるほどわからん通信技術 発表資料
 
FIDO Alliance Osaka Seminar: CloudGate.pdf
FIDO Alliance Osaka Seminar: CloudGate.pdfFIDO Alliance Osaka Seminar: CloudGate.pdf
FIDO Alliance Osaka Seminar: CloudGate.pdf
 
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdfFIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
 
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
 
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
 
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdfFIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
 
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdfFIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
 
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアルLoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
 
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
 
ReonHata_便利の副作用に気づかせるための発想支援手法の評価---行為の増減の提示による気づきへの影響---
ReonHata_便利の副作用に気づかせるための発想支援手法の評価---行為の増減の提示による気づきへの影響---ReonHata_便利の副作用に気づかせるための発想支援手法の評価---行為の増減の提示による気づきへの影響---
ReonHata_便利の副作用に気づかせるための発想支援手法の評価---行為の増減の提示による気づきへの影響---
 
This is the company presentation material of RIZAP Technologies, Inc.
This is the company presentation material of RIZAP Technologies, Inc.This is the company presentation material of RIZAP Technologies, Inc.
This is the company presentation material of RIZAP Technologies, Inc.
 
JSAI_類似画像マッチングによる器への印象付与手法の妥当性検証_ver.3_高橋りさ
JSAI_類似画像マッチングによる器への印象付与手法の妥当性検証_ver.3_高橋りさJSAI_類似画像マッチングによる器への印象付与手法の妥当性検証_ver.3_高橋りさ
JSAI_類似画像マッチングによる器への印象付与手法の妥当性検証_ver.3_高橋りさ
 

CVPR2019 survey Domain Adaptation on Semantic Segmentation

  • 2. 自己紹介 岡本大和(おかもとやまと)  京都大学でパターン認識を研究して修士課程修了  オムロンで技術起点のBusiness Developmentを担当  夢は京都をポスト・シリコンバレーにすること ⇒ 京都の学生と変人が持つパワーを世界に知らしめたい @ICDM’18 Banquet Twitter : RoadRoller_DESU
  • 3. 調査方針 CVPR’19の論文を対象に Domain Adaptation を Segmentation Task に適用した論文を抽出 ・Strong-Weak Distribution Alignment for Adaptive Object Detection ・Sliced Wasserstein Discrepancy for Unsupervised Domain Adaptation ・Taking A Closer Look at Domain Shift: Category-level Adversaries for Semantics Consistent Domain Adaptation 巻末では、 予備知識として近年ポピュラーなMask-R-CNNとRoI-Alignを解説 所感: ・segmentationタスクはpixel単位でClassificationする点が特徴的 ・Domain-LOSSをどの段階で,どの部分に,どの強度でかけるかが主要論点
  • 4. Strong-Weak Distribution Alignment for Adaptive Object Detection Kuniaki Saito, Yoshitaka Ushiku, Tatsuya Harada, Kate Saenko Boston University, The University of Tokyo, RIKEN pdf: https://arxiv.org/pdf/1812.04798.pdf (CVPR’2019) Git: https://github.com/VisionLearningGroup/DA_Detection Sliced Wasserstein Discrepancy for Unsupervised Domain Adaptation Chen-Yu Lee, Tanmay Batra, Mohammad Haris Baig, Daniel Ulbricht Apple Inc pdf: ttps://arxiv.org/pdf/1903.04064.pdf (CVPR’2019) Taking A Closer Look at Domain Shift: Category-level Adversaries for Semantics Consistent Domain Adaptation Yawei Luo, Liang Zheng, Tao Guan, Junqing Yu, Yi Yang Huazhong University, Baidu Research, Australian National University pdf: https://arxiv.org/pdf/1809.09478.pdf (CVPR’2019) Git: https://github.com/RoyalVane/CLAN (Coming soon....) (巻末付録)CyCADA: Cycle-Consistent Adversarial Domain Adaptation Judy Hoffman, Eric Tzeng, Taesung Park, Jun-Yan Zhu, Phillip Isola, Kate Saenko, Alexei A. Efros, Trevor Darrell EECS and BAIR, UC Berkeley, Openai, Boston University pdf: http://proceedings.mlr.press/v80/hoffman18a/hoffman18a.pdf (ICML’2018) Git: https://github.com/jhoffman/cycada_release (巻末付録)Mask R-CNN、RoI-Align Kaiming He Georgia Gkioxari Piotr Dollar Ross Girshick Facebook AI Research pdf: https://arxiv.org/pdf/1703.06870.pdf Git: https://github.com/matterport/Mask_RCNN
  • 5. Strong-Weak Distribution Alignment for Adaptive Object Detection (CVPR’19) Experiment: Task Domain Adaptation on Semantic Segmentation Model Faster RCNN + ROI-alignment + Domain Prediction Brunch DataSet ・Adaptation between dissimilar domain(PASCAL⇒Clipart, Watercolor) ・Adaptation between similar domain(Cityscapes⇒Foggy Cityscapes) ・Adaptation from synthetic to real images(GTA ⇒ Cityscapes) Key Idea: • Feature MapのH*W個の局所特徴それぞれに強めのAdversarial lossをかける • Feature Mapの全体に対しては弱めのAdversarial lossをかける
  • 6. Sliced Wasserstein Discrepancy for Unsupervised Domain Adaptation (CVPR’19) Experiment: Task Domain Adaptation on Image Classification, Semantic Segmentation and Object Detection Model VGG-16 + PSPNet, ResNet-101 + PSPNet (*for segmentation task) DataSet GTA5 -> Cityscape, Synthia -> Cityscape (*for segmentation task) Key Idea: • 2つのClassifierでXtargetの予測結果が異なるようにClassifierを学習、重なるようにGeneratorを学習 • このとき予測結果の相違尺度にWasserstein-Distanceを用いるよう改良した • 距離計算を簡易化するためにradial projectionとlinear projectionを導入したらしいが理解追い付かず 余談ですが Future Workに ・domain randomization ・open set adaptation ・zero-shot domain adaptation とありました、期待!
  • 7. Taking A Closer Look at Domain Shift: Category-level Adversaries for Semantics Consistent Domain Adaptation (CVPR’19) Experiment: Task Domain Adaptation on Semantic Segmentation Model DeepLab-v2 with ResNet-101 DataSet GTA5 -> Cityscape, Synthia -> Cityscape Key Idea: • Source-Dataにて、識別器C1とC2の判定結果の和が正しいSegmentationとなるようにLOSSをかける • 識別器C1とC2が異なる観点を持つ(特徴量の多様性を確保する)ようにLOSSをかける • 識別器C1とC2の出力から、Discriminatorがドメイン識別できないようにAdversarial-LOSSをかける • Adversarial-LOSSは判定不一致度合(C1とC2の出力のコサイン距離平均)で重み付けする
  • 8. (巻末付録)2018年の関連論文 CyCADA: Cycle-Consistent Adversarial Domain Adaptation(ICML’18) Experiment: Task Domain Adaptation on Semantic Segmentation Model VGG16-FCN8s base, and DRN-26 DataSet GTA5 -> Cityscape, Cityscape -> GTA5 Key Idea: • ドメイン変換する過程で情報損失が起きないように、Cycle lossを導入した • S->T->Sとドメイン変換したときに元データと一致すれば、変換過程で情報損失がないという考え
  • 9. (巻末付録)Mask R-CNN 画像中から物体を検出して識別する手法 R-CNN (CVPR’14) ・画像から物体候補領域であるRoI(Region of Interest)を抽出後、各RoIをCNNにかけて物体を検出 Faster-R-CNN (NIPS’15) ・FeatureMAPからRoIを抽出してからCNNで物体検出、R-CNNをEnd-To-Endで学習可能にした。 MASK-R-CNN(ICCV’17) ・Faster-R-CNNにmask-brunchを追加した。mask生成とClassificationのタスクを分離した点が特徴。 参考、画像引用: ・Mask R-CNN Slide Share https://www.slideshare.net/windmdk/mask-rcnn ・Fast R-CNN(Microsoft Research) https://arxiv.org/pdf/1504.08083.pdf K種類のClassを想定してK個のmaskを出力 誤差逆伝播はClassifier-Brunchの出力クラスkのmaskにのみ適用
  • 10. (巻末付録)RoI-Align 検出したRoIから固定サイズのFeature MAPを取得するための手法 RoI-Pooling(ICCV’15でMicrosoft Research が提案) ・RoI座標を整数値に丸めて領域を切出す(例:[(6.4, 2.8), (9.8, 4.2)] ⇒ [(6, 2), (9, 4)] ) ・出力したいFeatureMAPサイズ(HxW)に領域分割して、それぞれでMaxやAverageでPoolingする ・整数値に丸めたり、HxWに領域分割するときに位置ずれが起きることが問題点 RoI-Align(ICCV’17でFacebook AI Research が提案) ・RoIを(整数値に丸めずに)そのまま出力したいFeatureMAPサイズ(HxW)に領域分割する ・RoIの内部にあるグリッド点の座標を(整数値に丸めずに)算出 ・グリッド点の値を近傍4ピクセルからbilinear interpolationで算出 ・それぞれMaxやAverageでPoolingする 参考、画像引用: ・最新の物体検出手法Mask R-CNNのRoI AlignとFast(er) R-CNNのRoI Poolingの違いを正しく理解する(@yu4u) https://qiita.com/yu4u/items/5cbe9db166a5d72f9eb8 ・Mask R-CNN Slide Share https://www.slideshare.net/windmdk/mask-rcnn RoI-Pooling RoI-Align