안녕하세요 딥러닝 논문읽기 모임입니다 오늘 업로드된 논문 리뷰 영상은 2021 WACB 에서 발표된 Adversarial Reinforced Learning for Unsupervised Domain Adaptation 라는 제목의 논문입니다. 데이터 분류의 자동화를 위해서는 많은양의 학습데이터가 필요합니다. 그렇기에 레이블이 존재하는 데이터로 학습이 끝난 모델을 재활용해서 새로운 도메인에 적용하는 연구인 도메인 어뎁션 분야는 많은 각광을 받고 있습니다. 논문의 특징으로는 크게 세가지를 둘 수 있습니다. 첫 번째로 본 논문에서는 GAN을 이용하여 비지도 방식으로 도메인 어뎁션이 가능한 프레임워크를 제안하였습니다 여기서 이제 강화학습 모델은 소스와 타겟 도메인간 가장 최적의 피처쌍을 선택하는데 사용됩니다 두 번째로 레이블링 되지않은 타겟 도메인에서 가장 적합한 피처를 찾아내기 위해 소스와 타겟간 상관관계를 보상으로 적용하는 정책을 개발하였습니다 마지막으로 제안된 적대적 강화학습 모델을 소스와 타겟 도메인간 최소화하는 피처쌍의 탐색과 각 도메인의 거리 분포상태의 Alignment 학습을 통해 소타대비 이제 성능을 향상 하였습니다 논문에 대한 디테일한 리뷰를 펀디멘탈팀 이근배님이 많은 도움 주셨습니다!