SlideShare a Scribd company logo
1 of 24
Detection Transformerのための
教師なしドメイン適応 サーベイ
2023/9/6 1
2
Background (1/4)
DEtection TRansformer とは?
物体検出にViTを取り入れたモデル
2023/9/6
CNNで特徴量を獲得 TRで特徴量を物体の情報に 物体を検出
2023/9/6 3
学習データセット 検出データセット
ソースドメイン
(CityScapes)
ターゲットドメイン
(Foggy CityScapes)
ドメインシフト
正解を用意している 正解を用意できていない
Background (2/4)
ドメインが変わると精度が低下する
2023/9/6 4
Background (3/4)
ドメイン間のGAPを無くしたい
UDABP [MLR’15]
ドメインを識別する
ドメインを識別しにくくする
ドメイン不変な特徴を獲得
2023/9/6 5
Background
SFA
41.3
[ACM ICM’22]
date
mAP
Cityscapes to Foggy Cityscapes の検出精度
DA-DETR
43.5
[CVPR’23]
SR-SFA
43.1
[IJCNN’22]
O2-Net
46.8
[ACM ICM’22]
CA-DINO
50.5
[MDPI’22]
SSTA
44.9
[arXiv’22]
Paper with CodeでのSoTA
論文調査でのSoTA
DA-DETR: Domain Adaptive Detection Transformer with Information
Fusion,
Jingyi Zhang+ (S-lab, Nanyang Technological University) [CVPR’23]
2023/9/6 6
💡POINT
CNNで得た特徴とTransformerからの特徴を融合して敵対的訓練
局所的な特徴 意味的な特徴
DA-DETR: Domain Adaptive Detection Transformer with Information
Fusion,
Jingyi Zhang+ (S-lab, Nanyang Technological University) [CVPR’23]
2023/9/6 7
• Spatial-wise fusion
• Channel-wise fusion
𝑝𝑘𝑠と𝑝𝑘𝑐から𝑓𝑘を生成.
• Scale Aggregation Fusion
DA-DETR: Domain Adaptive Detection Transformer with Information
Fusion,
Jingyi Zhang+ (S-lab, Nanyang Technological University) [CVPR’23]
2023/9/6 8
得られた特徴𝑉𝑎を元に敵対的訓練
DA-DETR: Domain Adaptive Detection Transformer with Information
Fusion,
Jingyi Zhang+ (S-lab, Nanyang Technological University) [CVPR’23]
2023/9/6 9
Cityscapes → Foggy Cityscapesのデータセットにおいて
2021年の段階でSoTAを達成
2023/9/6 10
Background
SFA
41.3
[ACM ICM’22]
date
mAP
Cityscapes to Foggy Cityscapes の検出精度
DA-DETR
43.5
[CVPR’23]
SR-SFA
43.1
[IJCNN’22]
O2-Net
46.8
[ACM ICM’22]
CA-DINO
50.5
[MDPI’22]
SSTA
44.9
[arXiv’22]
Paper with CodeでのSoTA
論文調査でのSoTA
2023/9/6 11
TransformerのEncoder, Decoderから出力された特徴に着目
Exploring Sequence Feature Alignment for Domain Adaptive Detection
Transformers (SFA),
Wen Wang+ (University of Science and Technology of China) [ACM International Conference on
Multimedia’21]
2023/9/6 12
TransformerのEncoder, Decoderから出力された特徴に着目
• ドメインクエリを用いて識別器に
大域的な特徴におけるドメイン差の緩和
• トークンを用いて識別器に
局所的な特徴におけるドメイン差の緩和
→両方の観点からドメインの差を埋める
Exploring Sequence Feature Alignment for Domain Adaptive Detection
Transformers (SFA),
Wen Wang+ (University of Science and Technology of China) [ACM International Conference on
Multimedia’21]
2023/9/6 13
Encoder+Decoderの特徴でドメイン適応することは最適ではないと主張
❌ Encoder → ◎ Backbone
Improving Transferability for Domain Adaptive Detection Transformers
(O2 Net),
Kaixiong Gong+ (Beijing Institute of Technology) [ACM International Conference on Multimedia’22]
2023/9/6 14
BackboneとDecoderの出力をドメイン適応に用いる
💡技術の肝は
Backbone (Object-Aware Alignment)
前景に着目されるように重みづけ
Decoder (Optimal Transport based Alignment)
敵対的手法では位置情報が消失
→Wasserstain距離の最小化により位置情報も考慮
Improving Transferability for Domain Adaptive Detection Transformers
(O2 Net),
Kaixiong Gong+ (Beijing Institute of Technology) [ACM International Conference on Multimedia’22]
2023/9/6 15
Backbone (Object-Aware Alignment)
信頼度の高い擬似ラベルで重みを設定
敵対的学習に重みづけ
Improving Transferability for Domain Adaptive Detection Transformers
(O2 Net),
Kaixiong Gong+ (Beijing Institute of Technology) [ACM International Conference on Multimedia’22]
2023/9/6 16
Decoder (Optimal Transport based Alignment)
Sliced Wasserstain距離を用いてDecoderにおけるソースとターゲットの
特徴分布の距離を近づける
Improving Transferability for Domain Adaptive Detection Transformers
(O2 Net),
Kaixiong Gong+ (Beijing Institute of Technology) [ACM International Conference on Multimedia’22]
位置情報を保持したままドメイン差を埋められる
※Wasserstain距離は分布を別の分布に輸送する最小のコストを測る
2023/9/6 17
Cityscapes → Foggy CityscapesのデータセットにおいてSoTA
Improving Transferability for Domain Adaptive Detection Transformers
(O2 Net),
Kaixiong Gong+ (Beijing Institute of Technology) [ACM International Conference on Multimedia’22]
2023/9/6 18
Cityscapes → Foggy CityscapesのデータセットにおいてSoTA
Improving Transferability for Domain Adaptive Detection Transformers
(O2 Net),
Kaixiong Gong+ (Beijing Institute of Technology) [ACM International Conference on Multimedia’22]
2023/9/6 19
Background
SFA
41.3
[ACM ICM’22]
date
mAP
Cityscapes to Foggy Cityscapes の検出精度
DA-DETR
43.5
[CVPR’23]
SR-SFA
43.1
[IJCNN’22]
O2-Net
46.8
[ACM ICM’22]
CA-DINO
50.5
[MDPI’22]
SSTA
44.9
[arXiv’22]
Paper with CodeでのSoTA
論文調査でのSoTA
2023/9/6 20
BackboneとTransformerのそれぞれにドメイン適応を施す
💡技術の肝は
Backbone
AEDDによりドメイン不変
Transformer
WROTによりギャップを
埋める
Cascading Alignment for Unsupervised Domain-Adaptive DETR with
Improved DeNoising Anchor Boxes (CA-DINO),
Huantong Geng+ (Nanjing University of Information Science and Technology) [MDPI’22]
2023/9/6 21
Cascading Alignment for Unsupervised Domain-Adaptive DETR with
Improved DeNoising Anchor Boxes (CA-DINO),
Huantong Geng+ (Nanjing University of Information Science and Technology) [MDPI’22]
Backbone
AEDD (Attention Enhanced Double Discriminator)
によりドメイン不変な特徴
CBAM [ECCV’18]
(Convolutional block attention module)
による強いドメイン識別器を導入
2023/9/6 22
Cascading Alignment for Unsupervised Domain-Adaptive DETR with
Improved DeNoising Anchor Boxes (CA-DINO),
Huantong Geng+ (Nanjing University of Information Science and Technology) [MDPI’22]
Transformer
WROT (Weak Restraints on Category-Level Token)
𝑧:EncoderとDecoderの出力を平坦化
Frobenius normを計算し最小化
2023/9/6 23
Cascading Alignment for Unsupervised Domain-Adaptive DETR with
Improved DeNoising Anchor Boxes (CA-DINO),
Huantong Geng+ (Nanjing University of Information Science and Technology) [MDPI’22]
Cityscapes → Foggy CityscapesのデータセットでSoTA
Summary
2023/9/6 24
• 概要
• Detection Transformer のための教師なしドメイン適応
• 技術的な構成
• BackboneやTransformerの特徴を使ってドメイン不変な特徴を獲得,
または分布距離の最小化を行うことでドメインギャップを埋めて
いる
• 傾向と今後
• シンプルなアイディアに基づく手法ばかりだった.
• 計算量がとても多い課題があるようなので,そちらに着目した手法も出てくる.
• 擬似ラベルを生成することやスタイルを変換し,特徴をターゲットに寄せる方
法も現れるのではないか.

More Related Content

Similar to Survey on Unsupervised Domain Adaptation for DETR.pptx

SORACOM Conference Discovery 2017 | E3. デバイスからのクラウド連携パターン
SORACOM Conference Discovery 2017 | E3. デバイスからのクラウド連携パターンSORACOM Conference Discovery 2017 | E3. デバイスからのクラウド連携パターン
SORACOM Conference Discovery 2017 | E3. デバイスからのクラウド連携パターンSORACOM,INC
 
PARSEC翼型表現性能の改良と
PARSEC翼型表現性能の改良とPARSEC翼型表現性能の改良と
PARSEC翼型表現性能の改良とMasahiro Kanazaki
 
オープンクラウドカンファレンス2017 | クラウドネイティブなIoT通信プラットフォームと その活用事例
オープンクラウドカンファレンス2017 | クラウドネイティブなIoT通信プラットフォームと その活用事例オープンクラウドカンファレンス2017 | クラウドネイティブなIoT通信プラットフォームと その活用事例
オープンクラウドカンファレンス2017 | クラウドネイティブなIoT通信プラットフォームと その活用事例SORACOM,INC
 
object detection with lidar-camera fusion: survey (updated)
object detection with lidar-camera fusion: survey (updated)object detection with lidar-camera fusion: survey (updated)
object detection with lidar-camera fusion: survey (updated)Takuya Minagawa
 
SORACOM Technology Camp 2018 ベーシックトラック3 | 今日から始めるセンサーデータの可視化
SORACOM Technology Camp 2018 ベーシックトラック3 | 今日から始めるセンサーデータの可視化SORACOM Technology Camp 2018 ベーシックトラック3 | 今日から始めるセンサーデータの可視化
SORACOM Technology Camp 2018 ベーシックトラック3 | 今日から始めるセンサーデータの可視化SORACOM,INC
 
Interop2019 Toyota Netcope P4
Interop2019 Toyota Netcope P4Interop2019 Toyota Netcope P4
Interop2019 Toyota Netcope P4Kentaro Ebisawa
 
WindowsAzureの長所を活かすクラウド アプリ開発(PDF版)
WindowsAzureの長所を活かすクラウド アプリ開発(PDF版)WindowsAzureの長所を活かすクラウド アプリ開発(PDF版)
WindowsAzureの長所を活かすクラウド アプリ開発(PDF版)Shinichiro Isago
 
Advnet2011 ruo ando
Advnet2011 ruo andoAdvnet2011 ruo ando
Advnet2011 ruo andoRuo Ando
 
kibayos ieice 090915
kibayos ieice 090915kibayos ieice 090915
kibayos ieice 090915Mikio Yoshida
 
WebブラウザでP2Pを実現する、WebRTCのAPIと周辺技術
WebブラウザでP2Pを実現する、WebRTCのAPIと周辺技術WebブラウザでP2Pを実現する、WebRTCのAPIと周辺技術
WebブラウザでP2Pを実現する、WebRTCのAPIと周辺技術Yoshiaki Sugimoto
 
object detection with lidar-camera fusion: survey
object detection with lidar-camera fusion: surveyobject detection with lidar-camera fusion: survey
object detection with lidar-camera fusion: surveyTakuya Minagawa
 
[社内共有会]AWS NAT-GW導入と構成変化 2年運用して 同時接続数 秒間100->10万へ成長
[社内共有会]AWS NAT-GW導入と構成変化 2年運用して 同時接続数 秒間100->10万へ成長[社内共有会]AWS NAT-GW導入と構成変化 2年運用して 同時接続数 秒間100->10万へ成長
[社内共有会]AWS NAT-GW導入と構成変化 2年運用して 同時接続数 秒間100->10万へ成長Takahiro Moteki
 
第6回インターネットと運用技術シンポジウム WIPセッション
第6回インターネットと運用技術シンポジウム WIPセッション第6回インターネットと運用技術シンポジウム WIPセッション
第6回インターネットと運用技術シンポジウム WIPセッションHiroki Kashiwazaki
 
ICCV 2019 論文紹介 (26 papers)
ICCV 2019 論文紹介 (26 papers)ICCV 2019 論文紹介 (26 papers)
ICCV 2019 論文紹介 (26 papers)Hideki Okada
 
semantic segmentation サーベイ
semantic segmentation サーベイsemantic segmentation サーベイ
semantic segmentation サーベイyohei okawa
 
[Cloud OnAir] Google Cloud で実践するマイクロサービスアーキテクチャ 2019年2月21日 放送
 [Cloud OnAir] Google Cloud で実践するマイクロサービスアーキテクチャ 2019年2月21日 放送 [Cloud OnAir] Google Cloud で実践するマイクロサービスアーキテクチャ 2019年2月21日 放送
[Cloud OnAir] Google Cloud で実践するマイクロサービスアーキテクチャ 2019年2月21日 放送Google Cloud Platform - Japan
 
インターネット上の高品質な 遠隔コラボレーションに関する研究
インターネット上の高品質な遠隔コラボレーションに関する研究インターネット上の高品質な遠隔コラボレーションに関する研究
インターネット上の高品質な 遠隔コラボレーションに関する研究Takashi Kishida
 
OpenStack Summit November 2014 Paris出張報告
OpenStack Summit November 2014 Paris出張報告OpenStack Summit November 2014 Paris出張報告
OpenStack Summit November 2014 Paris出張報告Mitsuhiro SHIGEMATSU
 

Similar to Survey on Unsupervised Domain Adaptation for DETR.pptx (20)

SORACOM Conference Discovery 2017 | E3. デバイスからのクラウド連携パターン
SORACOM Conference Discovery 2017 | E3. デバイスからのクラウド連携パターンSORACOM Conference Discovery 2017 | E3. デバイスからのクラウド連携パターン
SORACOM Conference Discovery 2017 | E3. デバイスからのクラウド連携パターン
 
PARSEC翼型表現性能の改良と
PARSEC翼型表現性能の改良とPARSEC翼型表現性能の改良と
PARSEC翼型表現性能の改良と
 
オープンクラウドカンファレンス2017 | クラウドネイティブなIoT通信プラットフォームと その活用事例
オープンクラウドカンファレンス2017 | クラウドネイティブなIoT通信プラットフォームと その活用事例オープンクラウドカンファレンス2017 | クラウドネイティブなIoT通信プラットフォームと その活用事例
オープンクラウドカンファレンス2017 | クラウドネイティブなIoT通信プラットフォームと その活用事例
 
object detection with lidar-camera fusion: survey (updated)
object detection with lidar-camera fusion: survey (updated)object detection with lidar-camera fusion: survey (updated)
object detection with lidar-camera fusion: survey (updated)
 
SORACOM Technology Camp 2018 ベーシックトラック3 | 今日から始めるセンサーデータの可視化
SORACOM Technology Camp 2018 ベーシックトラック3 | 今日から始めるセンサーデータの可視化SORACOM Technology Camp 2018 ベーシックトラック3 | 今日から始めるセンサーデータの可視化
SORACOM Technology Camp 2018 ベーシックトラック3 | 今日から始めるセンサーデータの可視化
 
Interop2019 Toyota Netcope P4
Interop2019 Toyota Netcope P4Interop2019 Toyota Netcope P4
Interop2019 Toyota Netcope P4
 
WindowsAzureの長所を活かすクラウド アプリ開発(PDF版)
WindowsAzureの長所を活かすクラウド アプリ開発(PDF版)WindowsAzureの長所を活かすクラウド アプリ開発(PDF版)
WindowsAzureの長所を活かすクラウド アプリ開発(PDF版)
 
CCGrid2012 参加報告
CCGrid2012 参加報告CCGrid2012 参加報告
CCGrid2012 参加報告
 
Advnet2011 ruo ando
Advnet2011 ruo andoAdvnet2011 ruo ando
Advnet2011 ruo ando
 
kibayos ieice 090915
kibayos ieice 090915kibayos ieice 090915
kibayos ieice 090915
 
WebブラウザでP2Pを実現する、WebRTCのAPIと周辺技術
WebブラウザでP2Pを実現する、WebRTCのAPIと周辺技術WebブラウザでP2Pを実現する、WebRTCのAPIと周辺技術
WebブラウザでP2Pを実現する、WebRTCのAPIと周辺技術
 
object detection with lidar-camera fusion: survey
object detection with lidar-camera fusion: surveyobject detection with lidar-camera fusion: survey
object detection with lidar-camera fusion: survey
 
[社内共有会]AWS NAT-GW導入と構成変化 2年運用して 同時接続数 秒間100->10万へ成長
[社内共有会]AWS NAT-GW導入と構成変化 2年運用して 同時接続数 秒間100->10万へ成長[社内共有会]AWS NAT-GW導入と構成変化 2年運用して 同時接続数 秒間100->10万へ成長
[社内共有会]AWS NAT-GW導入と構成変化 2年運用して 同時接続数 秒間100->10万へ成長
 
第6回インターネットと運用技術シンポジウム WIPセッション
第6回インターネットと運用技術シンポジウム WIPセッション第6回インターネットと運用技術シンポジウム WIPセッション
第6回インターネットと運用技術シンポジウム WIPセッション
 
ICCV 2019 論文紹介 (26 papers)
ICCV 2019 論文紹介 (26 papers)ICCV 2019 論文紹介 (26 papers)
ICCV 2019 論文紹介 (26 papers)
 
semantic segmentation サーベイ
semantic segmentation サーベイsemantic segmentation サーベイ
semantic segmentation サーベイ
 
Juniper Festa @ Interop Tokyo 2021
Juniper Festa @ Interop Tokyo 2021Juniper Festa @ Interop Tokyo 2021
Juniper Festa @ Interop Tokyo 2021
 
[Cloud OnAir] Google Cloud で実践するマイクロサービスアーキテクチャ 2019年2月21日 放送
 [Cloud OnAir] Google Cloud で実践するマイクロサービスアーキテクチャ 2019年2月21日 放送 [Cloud OnAir] Google Cloud で実践するマイクロサービスアーキテクチャ 2019年2月21日 放送
[Cloud OnAir] Google Cloud で実践するマイクロサービスアーキテクチャ 2019年2月21日 放送
 
インターネット上の高品質な 遠隔コラボレーションに関する研究
インターネット上の高品質な遠隔コラボレーションに関する研究インターネット上の高品質な遠隔コラボレーションに関する研究
インターネット上の高品質な 遠隔コラボレーションに関する研究
 
OpenStack Summit November 2014 Paris出張報告
OpenStack Summit November 2014 Paris出張報告OpenStack Summit November 2014 Paris出張報告
OpenStack Summit November 2014 Paris出張報告
 

Survey on Unsupervised Domain Adaptation for DETR.pptx

  • 2. 2 Background (1/4) DEtection TRansformer とは? 物体検出にViTを取り入れたモデル 2023/9/6 CNNで特徴量を獲得 TRで特徴量を物体の情報に 物体を検出
  • 3. 2023/9/6 3 学習データセット 検出データセット ソースドメイン (CityScapes) ターゲットドメイン (Foggy CityScapes) ドメインシフト 正解を用意している 正解を用意できていない Background (2/4) ドメインが変わると精度が低下する
  • 4. 2023/9/6 4 Background (3/4) ドメイン間のGAPを無くしたい UDABP [MLR’15] ドメインを識別する ドメインを識別しにくくする ドメイン不変な特徴を獲得
  • 5. 2023/9/6 5 Background SFA 41.3 [ACM ICM’22] date mAP Cityscapes to Foggy Cityscapes の検出精度 DA-DETR 43.5 [CVPR’23] SR-SFA 43.1 [IJCNN’22] O2-Net 46.8 [ACM ICM’22] CA-DINO 50.5 [MDPI’22] SSTA 44.9 [arXiv’22] Paper with CodeでのSoTA 論文調査でのSoTA
  • 6. DA-DETR: Domain Adaptive Detection Transformer with Information Fusion, Jingyi Zhang+ (S-lab, Nanyang Technological University) [CVPR’23] 2023/9/6 6 💡POINT CNNで得た特徴とTransformerからの特徴を融合して敵対的訓練 局所的な特徴 意味的な特徴
  • 7. DA-DETR: Domain Adaptive Detection Transformer with Information Fusion, Jingyi Zhang+ (S-lab, Nanyang Technological University) [CVPR’23] 2023/9/6 7 • Spatial-wise fusion • Channel-wise fusion 𝑝𝑘𝑠と𝑝𝑘𝑐から𝑓𝑘を生成. • Scale Aggregation Fusion
  • 8. DA-DETR: Domain Adaptive Detection Transformer with Information Fusion, Jingyi Zhang+ (S-lab, Nanyang Technological University) [CVPR’23] 2023/9/6 8 得られた特徴𝑉𝑎を元に敵対的訓練
  • 9. DA-DETR: Domain Adaptive Detection Transformer with Information Fusion, Jingyi Zhang+ (S-lab, Nanyang Technological University) [CVPR’23] 2023/9/6 9 Cityscapes → Foggy Cityscapesのデータセットにおいて 2021年の段階でSoTAを達成
  • 10. 2023/9/6 10 Background SFA 41.3 [ACM ICM’22] date mAP Cityscapes to Foggy Cityscapes の検出精度 DA-DETR 43.5 [CVPR’23] SR-SFA 43.1 [IJCNN’22] O2-Net 46.8 [ACM ICM’22] CA-DINO 50.5 [MDPI’22] SSTA 44.9 [arXiv’22] Paper with CodeでのSoTA 論文調査でのSoTA
  • 11. 2023/9/6 11 TransformerのEncoder, Decoderから出力された特徴に着目 Exploring Sequence Feature Alignment for Domain Adaptive Detection Transformers (SFA), Wen Wang+ (University of Science and Technology of China) [ACM International Conference on Multimedia’21]
  • 12. 2023/9/6 12 TransformerのEncoder, Decoderから出力された特徴に着目 • ドメインクエリを用いて識別器に 大域的な特徴におけるドメイン差の緩和 • トークンを用いて識別器に 局所的な特徴におけるドメイン差の緩和 →両方の観点からドメインの差を埋める Exploring Sequence Feature Alignment for Domain Adaptive Detection Transformers (SFA), Wen Wang+ (University of Science and Technology of China) [ACM International Conference on Multimedia’21]
  • 13. 2023/9/6 13 Encoder+Decoderの特徴でドメイン適応することは最適ではないと主張 ❌ Encoder → ◎ Backbone Improving Transferability for Domain Adaptive Detection Transformers (O2 Net), Kaixiong Gong+ (Beijing Institute of Technology) [ACM International Conference on Multimedia’22]
  • 14. 2023/9/6 14 BackboneとDecoderの出力をドメイン適応に用いる 💡技術の肝は Backbone (Object-Aware Alignment) 前景に着目されるように重みづけ Decoder (Optimal Transport based Alignment) 敵対的手法では位置情報が消失 →Wasserstain距離の最小化により位置情報も考慮 Improving Transferability for Domain Adaptive Detection Transformers (O2 Net), Kaixiong Gong+ (Beijing Institute of Technology) [ACM International Conference on Multimedia’22]
  • 15. 2023/9/6 15 Backbone (Object-Aware Alignment) 信頼度の高い擬似ラベルで重みを設定 敵対的学習に重みづけ Improving Transferability for Domain Adaptive Detection Transformers (O2 Net), Kaixiong Gong+ (Beijing Institute of Technology) [ACM International Conference on Multimedia’22]
  • 16. 2023/9/6 16 Decoder (Optimal Transport based Alignment) Sliced Wasserstain距離を用いてDecoderにおけるソースとターゲットの 特徴分布の距離を近づける Improving Transferability for Domain Adaptive Detection Transformers (O2 Net), Kaixiong Gong+ (Beijing Institute of Technology) [ACM International Conference on Multimedia’22] 位置情報を保持したままドメイン差を埋められる ※Wasserstain距離は分布を別の分布に輸送する最小のコストを測る
  • 17. 2023/9/6 17 Cityscapes → Foggy CityscapesのデータセットにおいてSoTA Improving Transferability for Domain Adaptive Detection Transformers (O2 Net), Kaixiong Gong+ (Beijing Institute of Technology) [ACM International Conference on Multimedia’22]
  • 18. 2023/9/6 18 Cityscapes → Foggy CityscapesのデータセットにおいてSoTA Improving Transferability for Domain Adaptive Detection Transformers (O2 Net), Kaixiong Gong+ (Beijing Institute of Technology) [ACM International Conference on Multimedia’22]
  • 19. 2023/9/6 19 Background SFA 41.3 [ACM ICM’22] date mAP Cityscapes to Foggy Cityscapes の検出精度 DA-DETR 43.5 [CVPR’23] SR-SFA 43.1 [IJCNN’22] O2-Net 46.8 [ACM ICM’22] CA-DINO 50.5 [MDPI’22] SSTA 44.9 [arXiv’22] Paper with CodeでのSoTA 論文調査でのSoTA
  • 20. 2023/9/6 20 BackboneとTransformerのそれぞれにドメイン適応を施す 💡技術の肝は Backbone AEDDによりドメイン不変 Transformer WROTによりギャップを 埋める Cascading Alignment for Unsupervised Domain-Adaptive DETR with Improved DeNoising Anchor Boxes (CA-DINO), Huantong Geng+ (Nanjing University of Information Science and Technology) [MDPI’22]
  • 21. 2023/9/6 21 Cascading Alignment for Unsupervised Domain-Adaptive DETR with Improved DeNoising Anchor Boxes (CA-DINO), Huantong Geng+ (Nanjing University of Information Science and Technology) [MDPI’22] Backbone AEDD (Attention Enhanced Double Discriminator) によりドメイン不変な特徴 CBAM [ECCV’18] (Convolutional block attention module) による強いドメイン識別器を導入
  • 22. 2023/9/6 22 Cascading Alignment for Unsupervised Domain-Adaptive DETR with Improved DeNoising Anchor Boxes (CA-DINO), Huantong Geng+ (Nanjing University of Information Science and Technology) [MDPI’22] Transformer WROT (Weak Restraints on Category-Level Token) 𝑧:EncoderとDecoderの出力を平坦化 Frobenius normを計算し最小化
  • 23. 2023/9/6 23 Cascading Alignment for Unsupervised Domain-Adaptive DETR with Improved DeNoising Anchor Boxes (CA-DINO), Huantong Geng+ (Nanjing University of Information Science and Technology) [MDPI’22] Cityscapes → Foggy CityscapesのデータセットでSoTA
  • 24. Summary 2023/9/6 24 • 概要 • Detection Transformer のための教師なしドメイン適応 • 技術的な構成 • BackboneやTransformerの特徴を使ってドメイン不変な特徴を獲得, または分布距離の最小化を行うことでドメインギャップを埋めて いる • 傾向と今後 • シンプルなアイディアに基づく手法ばかりだった. • 計算量がとても多い課題があるようなので,そちらに着目した手法も出てくる. • 擬似ラベルを生成することやスタイルを変換し,特徴をターゲットに寄せる方 法も現れるのではないか.