안녕하세요! 딥러닝 논문읽기 모임 입니다! 오늘 소개할 논문은 MIC 입니다.
발표자료 :
오늘은 비지도 도메인 적응(UDA) 분야에서의 중요한 진전을 소개하려고 합니다. UDA는 소스 데이터(예: 합성 데이터)에서 훈련된 모델을 타겟 데이터(예: 실제 세계 데이터)에 적응시키는 과정인데요, 이번에 'Masked Image Consistency (MIC)'라는 새로운 모듈이 제안되었습니다.
1. 비지도 도메인 적응의 도전
기존 UDA 방법들은 타겟 도메인에서 비슷한 시각적 외관을 가진 클래스들을 구분하는 데 어려움을 겪어왔습니다. 그 이유는 타겟 어노테이션에 대한 접근 없이 미묘한 외관 차이를 학습하기 어렵기 때문입니다.
2. MIC 모듈의 혁신
MIC 모듈은 타겟 도메인의 공간적 컨텍스트 관계를 추가 단서로 학습하여 UDA를 강화합니다. MIC는 무작위 패치가 제외된 마스크된 타겟 이미지의 예측과 완전한 이미지를 기반으로 생성된 지수 이동 평균 교사에 의한 의사 라벨 간의 일관성을 강제합니다.
3. 네트워크의 학습 방식
일관성 손실을 최소화하기 위해, 네트워크는 주변 컨텍스트에서 마스크된 영역의 예측을 추론하는 방법을 배워야 합니다. MIC의 단순하고 보편적인 개념으로 인해 다양한 UDA 방법과 시각 인식 태스크에 통합될 수 있습니다.
4. 성능 개선
MIC는 합성-실제, 낮-밤, 맑은 날씨-악천후 등 다양한 UDA 시나리오에서 기존 방법들을 크게 능가하는 성능을 보여줍니다. 예를 들어, GTA-to-Cityscapes와 VisDA-2017에서 각각 75.9 mIoU와 92.8%의 성과를 달성했으며, 이는 기존 최고 성능보다 각각 +2.1과 +3.0 퍼센트 포인트의 개선입니다.
MIC의 도입은 UDA 분야에서 중요한 발전을 의미하며, 이미지 분류, 의미적 분할, 객체 탐지 등 다양한 시각 인식 작업에서의 적용 가능성을 보여줍니다.
오늘 논문 리뷰를 위해 이미지처리 안종식님이 자세한 리뷰를 도와주셨습니다 많은 관심 미리 감사드립니다!
https://youtu.be/IgwpPkSpwUg