SlideShare a Scribd company logo
위성 이미지 객체 검출
{green669, sbson0621, rnans33, karma1002, ohhs}@koreatech.ac.kr
DICE Lab
KOREATECH
1
박주찬 손성빈 정준욱 오흥선이선훈
DICE Lab
• Deep Intelligence for Cognitive Environment (DICE) Lab
• in School of Computer Science and Engineering, KOREATECH
• Focus on deep intelligence systems by understanding various cognitive
environments based on language and vision technologies.
• https://sites.google.com/view/dice-lab/home
• Looking for self-motivated graduate students!
2
목차
• Problem Definition
• Challenges in Aerial Object Detection
• The Approaches to Challenges
• Model
• Experiments
• Conclusion
3
Problem Definition
4
Problem Definition
• 인공위성 영상의 선박 종류 인식 및 위치를 검출 알고리즘 개발
5
• Object Detection
• Classification
• Localization
• Horizontal bounding boxes
• Oriented bounding boxes
Problem Definition
• 인공위성 영상의 선박 종류 인식 및 위치를 검출 알고리즘 개발
6
• Object Detection
• Classification
• Localization
• Horizontal bounding boxes
• Oriented bounding boxes
Problem Definition – Object Detection
Classification
7
Cat ( x, y, w, h )
Object Detection
Classification + Localization(Horizontal bounding box)
Localization
Horizontal
bounding box
Problem Definition
• 인공위성 영상의 선박 종류 인식 및 위치를 검출 알고리즘 개발
8
• Object Detection
• Classification
• Localization
• Horizontal bounding boxes
• Oriented bounding boxes
Problem Definition – Aerial Object Detection
Classification
9
Ship[1] ( x1, y1, x2, y2, x3, y3, x4, y4 )
Aerial Object Detection
Classification + Localization(Oriented bounding box)
Localization
Oriented
bounding box
Problem Definition – Aerial Detection
Classification
10
Ship ( x1, y1, x2, y2, x3, y3, x4, y4 )
Aerial Object Detection
Classification + Localization(Oriented bounding box)
Localization
Oriented
bounding box
Aerial Object Detection Task
Challenges
in Aerial Object Detection
11
Challenges
12
1. 데이터 수의 부족
2. 항공뷰의 특징
3. 데이터의 불균형
Challenge 1
13
Dataset Classes Images
ILSVRC 2014 200 516,840
COCO2017 80 163,957
PASCAL VOC 2012 20 22,531
Aerial Data 4 2,676
<Aerial Data vs 일반 OD데이터 셋 비교>
데이터 수의 부족
Challenge 2
14
항공뷰의 특징
고 해상도 배경 및 물체의 복잡도
↕
Aerial image 해상도 : 3000 x 3000
일반 사진에 비해서 배경, 물체
의 복잡도가 높음
항공 이미지 일반 이미지
높은 해상도로 인해 원본 이미지를
바로 처리하기 어려움
데이터셋 평균 해상도
ImageNet 482 x 415
COCO 480 x 640
VOC2012 469 x 387
Challenge 2
15
물체의 밀집
밀집된 물체의 검출이 어려움
다양한 회전각도
모든 각도를 고려하기 어려움
항공뷰의 특징
Class Images Ratio
Maritime vessels 12,018 67.3 %
Container 3,986 22.3 %
Oil tanker 1,807 10.2 %
Aircraft carrier 39 0.20 %
데이터의 불균형
Challenge 3
16
<Aerial Data Class 별 객체 수 비교>
Approaches to the Challenges
17
Our Approaches
18
• 항공뷰의 특징
• 고해상도 처리 → Image patches
• 다양한 회전 각도 및 물체의 밀집 → RoI Transformer
• 데이터 수의 부족
→ Multi-scale augmentation
→ Appearance augmentation
• 데이터의 불균형
→ Data uncertainty approach
+ 데이터의 noise 및 model uncertainty에 강한 모델
→ Bayesian deep learning approach
Our Approaches
19
• 항공뷰의 특징
• 고해상도 처리 → Image patches
• 다양한 회전 각도 및 물체의 밀집 → RoI Transformer
• 데이터 수의 부족
→ Multi-scale augmentation
→ Appearance augmentation
• 데이터의 불균형
→ Data uncertainty approach
+ 데이터의 noise 및 model uncertainty에 강한 모델
→ Bayesian deep learning approach
Image Patches
20
1024
1024
3000 x 3000
0
0
• 하나의 3000 x 3000 이미지
→ 모델의 input size인 1024 x 1024 크기의 패치로 나눔, Stride : 512
→ 총 25장의 이미지 패치가 됨
Our Approaches
21
• 항공뷰의 특징
• 고해상도 처리 → Image patches
• 다양한 회전 각도 및 물체의 밀집 → RoI Transformer
• 데이터 수의 부족
→ Multi-scale augmentation
→ Appearance augmentation
• 데이터의 불균형
→ Data uncertainty approach
+ 데이터의 noise 및 model uncertainty에 강한 모델
→ Bayesian deep learning approach
Data Augmentation
22
고양이
형상정보 변환
데이터 속성 변환
Augmentation에는 크게 형상정보 변환과 데이터 속성 변환이 있음
Data Augmentation
23
• 형상 정보 변환
• Multi-scale augmentation
• 데이터 속성 변환 (Appearance augmentation)
• 색감 변환
• 안개 적용
• 밝기 변화
• 가우시안 블러링
Data Augmentation
• Multi-scale augmentation
• 학습데이터의 크기를 다양한 스케일로 학습시키는 것
• 장점
• 다양한 크기의 object에 강건한 모델을 만들 수 있음
• Ours
• Image patch를 1024 x 1024, 1500 x 1500, 3000 x 3000의 스케일로 생성
24
Data Augmentation
• Multi-scale augmentation
• Ex) 한 장의 3000 x 3000 크기의 이미지
-> 1024 x 1024 크기의 이미지 25장, stride : 512
25
1024
1024
3000 x 3000
0
0
Data Augmentation
• Multi-scale augmentation
• Ex) 한 장의 3000 x 3000 크기의 이미지
-> 1024 x 1024 크기의 이미지 25장, stride : 512
26
3000 x 3000
1536
1024
512
0
Data Augmentation
• Multi-scale augmentation
• Ex) 한 장의 3000 x 3000 크기의 이미지
-> 1500 x 1500 크기의 이미지 16장, stride : 700
27
3000 x 3000
1500
1500
0
0
Data Augmentation
• Multi-scale augmentation
• Ex) 한 장의 3000 x 3000 크기의 이미지
-> 1500 x 1500 크기의 이미지 16장, stride : 700
28
3000 x 3000
2200
1500
0
700
Data Augmentation
• Multi-scale augmentation
• Ex) 한 장의 3000 x 3000 크기의 이미지
-> 1024 x 1024 크기의 이미지 패치 25장, stride : 512
-> 1500 x 1500 크기의 이미지 패치 16장, stride : 700
-> 3000 x 3000 크기의 이미지 패치 1장
• 한 장당 총 42장의 이미지 패치가 만들어짐
• 총 학습 이미지의 개수 : 2,646 x 42 = 111,132장
• 학습 이미지 사이즈가 다양함
• 1024 x 1024 고정된 사이즈로 resize한 후, 모델의 input으로 들어가게 됨
29
Data Augmentation
30
• 형상 정보 변환
• Multi-scale augmentation
• 데이터 속성 변환(Appearance augmentation)
• 색감 변환
• 안개 적용
• 밝기 변화
• 가우시안 블러링
Data Augmentation
• Aerial 데이터 속성 분석
• 시간대(해의 위치 변화에 따른 조명 변화)
• 인공 위성의 성능(성능이 높을 수록 깨끗한 사진, 낮을 수록 blur한 사진)
• 안개, 구름
• 인공 위성이 받아들이는 전자기파 영역(적외선, 가시광선)
DICE Lab@KOREATECH 31
Data Augmentation
색감 안개 가우시안 블러링 밝기
일반 (65%)
Cool(15%)
Warm(15%)
적외선(5%)
일반(76%)
1~5 옵션(24%)
일반(76%)
Blurring(24%):
-필터 범위 (5,5),
표준편차 (1~10)
일반(38%)
Bright(62%):
-20 ~ 50
DICE Lab@KOREATECH 32
<Appearance augmentation 조합 비율>
Image = 색감 × 안개 × 가우시안 블러링 × 밝기
Data Augmentation
33
좌 : 원본 사진, 우 : Appearance augmentation 변환 이미지(비율에 맞게 sampling해서 뽑음)
Example 1
Data Augmentation
34
좌 : 원본 사진, 우 : Appearance augmentation 변환 이미지(비율에 맞게 sampling해서 뽑음)
Example 2
Our Approaches
35
• 항공뷰의 특징
• 고해상도 처리 → Image patches
• 다양한 회전 각도 및 물체의 밀집 → RoI Transformer
• 데이터 수의 부족
→ Multi-scale augmentation
→ Appearance augmentation
• 데이터의 불균형
→ Data uncertainty approach
+ 데이터의 noise 및 model uncertainty에 강한 모델
→ Bayesian deep learning approach
RoI Transformer
DICE Lab@KOREATECH 36
• HRoI(Horizontal Region of Interest)
• 버스의 방향에 상관없이 RoI를 잡
는 방식
• RRoI(Rotated Region of Interest)
• 버스의 방향을 고려하여 RoI 자체
를 rotate해서 잡음으로써 밀집한
이미지에 강건해짐
<HRoI vs RRoI [2]>
RoI Transformer
37Feature map
Anchor scale : 3
Anchor ratio : 1:1
Anchor angle : 0
Anchor scale : 3
Anchor ratio : 1:2
Anchor angle : 0
Anchor scale : 3
Anchor ratio : 1:1
Anchor angle :
𝜋
6
1
1
• Anchor란?
• RRoI를 선택하기 위해 필요한 후보
• RRoI를 계산하기 위해서는 Anchor를 구해야함
• Scale, Ratio, Angle이 존재
• Scale은 anchor의 크기를 조절
• Ratio는 anchor의 가로세로 비율을 조절
• Angle은 anchor의 각도를 조절
• Anchor의 개수를 구하는 공식
→ (num_scales × num_aspect_ratios × num_angles)[1,2,3,4]
RoI Transformer
• 기존 RRoI(Rotated Region of Interest)의 문제점
• Anchor의 개수를 구하는 공식
→ (num_scales × num_aspect_ratios × num_angles)[3,4,5,6]
• Anchor의 각도가 n배 세밀해진다면
• 연산량 n배 증가
• 메모리 n배 증가
• Proposal간의 match efficiency도 같이 떨어짐
38
RoI Transformer
• RoI transformer[2]
• Angle 자체를 추론함으로써 연산량을 극적으로 줄임
• anchor의 개수 = (num_scale * num_aspect_ratio * num_angles)
→ anchor의 개수 = (num_scale * num_aspect_ratio * 1)
• 표현 가능한 angle의 종류를 무한개로 늘림
• num_angles ∈ {
π
2
,
π
3
,
𝜋
4
, … ,
𝜋
𝑛
}, finite set
→ num_angles ∈ 𝑅 , infinite set
39
Our Approaches
40
• 항공뷰의 특징
• 고해상도 처리 → Image patches
• 다양한 회전 각도 및 물체의 밀집 → RoI Transformer
• 데이터 수의 부족
→ Multi-scale augmentation
→ Appearance augmentation
• 데이터의 불균형
→ Data uncertainty approach
+ 데이터의 noise 및 model uncertainty에 강한 모델
→ Bayesian deep learning approach
Data Uncertainty
41
<Balanced data vs Imbalanced data class feature space view[7]>
• Imbalanced Data의 문제점
• Balanced data 경우는 class
간의 경계선이 이상적임
• Imbalanced data는 class간
경계가 데이터가 부족한 쪽
으로 치우쳐짐(false positive
증가)
Data Uncertainty
42
<Regression and classification uncertainty with data frequency[7]>
• Imbalanced Data와 Uncertainty간의 상관관계
• 데이터의 수가 적을 수록 uncertainty가 증가
• Uncertainty 측정방법
• Aleatoric uncertainty, Epistemic uncertainty를 동시에 잡는 기법 사용 [7]
→ 기존 uncertainty 측정보다 향상된 기법
• Data imbalance 해결방법
• Category-level 해결[7]
43
Data Uncertainty
uncertainty를 측정하여 0.5 × 𝑢𝑛𝑐𝑒𝑟𝑡𝑎𝑖𝑛𝑡𝑦
만큼 rare class에 margin 을 부여함으로써
rare class 영역 회복
Our Approaches
44
• 항공뷰의 특징
• 고해상도 처리 → Image patches
• 다양한 회전 각도 및 물체의 밀집 → RoI Transformer
• 데이터 수의 부족
→ Multi-scale augmentation
→ Appearance augmentation
• 데이터의 불균형
→ Data uncertainty approach
+ 데이터의 noise 및 overfitting에 강한 모델
→ Bayesian deep learning approach
Bayesian deep learning inference[8]
DICE Lab@KOREATECH 45
y∗
~ p y∗
x∗
, X, Y y∗
= 𝑓(x∗
; 𝜃)
Bayesian deep learning 일반 deep learning
predict distribution predict point
• data의 noise를 처리하는 기법이 있음
• predict point를 추론하는 것이 아닌 predict distribution을 추론하기 때문에 model의 overfitting에 강함
목차
• Problem Definition
• Challenges in Aerial Object Detection
• The Approaches to Challenges
• Model
• Experiments
• Conclusion
46
Overall Process
47
Image patches
3x1024x1024
I 𝑛
3x3000x3000
⋯
Output image
3x3000x3000
Model
patch 1
patch 2
patch N
𝒇 𝒎𝒆𝒓𝒈𝒆(
[patch 1,
…
patch N])
Box regression,
Classification
patch K
⋯
⋯
patch 1
patch 2
patch N
patch K
⋯
oil tanker
oil tanker
𝒇 𝒂𝒖𝒈 𝐼 𝑛
Augmentation Merge
Overall Process
48
Image patches
3x1024x1024
I 𝑛
3x3000x3000
⋯
Output image
3x3000x3000
Model
patch 1
patch 2
patch N
𝒇 𝒎𝒆𝒓𝒈𝒆(
[patch 1,
…
patch N])
Box regression,
Classification
patch K
⋯
⋯
patch 1
patch 2
patch N
patch K
⋯
oil tanker
oil tanker
𝒇 𝒂𝒖𝒈 𝐼 𝑛
Augmentation Merge
Model
49
Our Model
oil tanker
oil tanker
oil tanker
Deep
features
FPN
+
BFN
Backbone
Image patch
3x1024x1024
ResNetXt101
oil tanker
merge
Feature
pyramids
Deep
features
RPN:4
RPN:3
RPN:2
RPN:1
RPN:0
50
목차
• Problem Definition
• Challenges in Aerial Object Detection
• The Approaches to Challenges
• Model
• Experiments
• Conclusion
51
Experiments
52
Result Analysis
53
Model Public mAP
ResNet50 + FPN 0.561
ResNet101 + FPN 0.608
ResNeXt101 + FPN 0.706
Model Public mAP
ResNeXt101 + FPN 0.706
ResNeXt101 + FPN+ BFN 0.734
ResNeXt101 + BiFPN[9]+ BFN 0.687
Backbone이 큰 모델일수록 성능 향상을 보임.
BFN 모듈을 추가했을 때 성능 향상을 보임
BiFPN[9] 모듈은 오히려 성능이 감소함.
Result Analysis
Model Appearance
Multi-scale
training
Uncertainty Public mAP Private mAP
ResNeXt101 + FPN+ BFN 0.762 -
ResNeXt101 + FPN+ BFN 0.812 -
ResNeXt101 + FPN+ BFN* 0.840 -
ResNeXt101 + FPN+ BFN* 0.849 0.824
Cascaded[10] ResNeXt101 + FPN+ BFN* 0.861 -
Cascaded[10] ResNeXt152 + FPN+ BFN* 0.838 -
54
* : multi-scale test 적용
Multi-scale test 적용 시 성능 향상을 보임
Bayesian model과 data imbalance 처리를 했을 시 성능 향상을 보임
Cascaded[10] ResNeXt101 + FPN+ BFN은 Public mAP는 높았으나 Private mAP는 오히려 떨어짐
Cascaded[10] ResNeXt152 + FPN+ BFN은 시간 부족으로 인해 완전한 성능을 내지 못함
Result Analysis
55
팀 이름(순위) 가채점 점수 최종 점수 점수 변위폭
DICE(1위) 0.849 0.825 -0.024
Top secret(2위) 0.844 0.815 -0.029
박태현_1579495977001(3위) 0.813 0.765 -0.048
상위 3개팀 중 모델 결과의 variance가 가장 낮음
➔ overfitting 및 noise에 강한 모델
Result Analysis
• Multi-scale을 적용하면, 큰 배들에 대해 더 잘 찾는 것을 볼 수 있음
56
Multi-scale 전 Multi-scale 후
Result Analysis
57
• 작은 배들은 대부분 검출이 잘 되는 것을 볼 수 있음
Conclusion
• Challenges 해결 방법
• 항공뷰의 특징
➔ 이미지 패치로 나누는 것과 RoI Transformer을 통해 해결했음
• 데이터 수의 부족
➔ Multi-scale augmentation과 Appearance augmentation을 통해 해결했음
• 데이터의 불균형
➔uncertainty 측정을 통한 category별 margin을 줌을 통해 해결했음
• noise 및 overfitting에 강건한 모델
➔ Bayesian model을 통해 noise와 overfitting에 강건한 모델을 만듬
58
Further Discussion
• CBNet: A Novel Composite Backbone Network Architecture for Object
Detection[10]
59
• CBNet: Multiple backbone을 조합
• COCO object detection state-of-the-art model
(2020-04-09 기준)
• COCO dataset에서 기존 ResNeXt 보다 높은 성능
References
[1] https://commons.wikimedia.org/wiki/File:Aerial_photograph_of_a_cargo_ship.jpg
[2] Ding, J., Xue, N., Long, Y., Xia, G. S., & Lu, Q. (2019). Learning roi transformer for oriented object
detection in aerial images. Proceedings of the IEEE Computer Society Conference on Computer Vision and
Pattern Recognition, 2019-June, 2844–2853. https://doi.org/10.1109/CVPR.2019.00296
[3] Seyed Majid Azimi, Eleonora Vig, Reza Bahmanyar, Marco K¨orner, and Peter Reinartz. Towards multi-
class object detection in unconstrained remote sensing imagery. arXiv:1807.02700, 2018
[4] Jianqi Ma, Weiyuan Shao, Hao Ye, Li Wang, Hong Wang, Yingbin Zheng, and Xiangyang Xue. Arbitrary-
oriented scene text detection via rotation proposals. TMM, 2018. 4321, 4322, 4327, 4328
[5] Zenghui Zhang, Weiwei Guo, Shengnan Zhu, and Wenxian Yu. Toward arbitrary-oriented ship detection
with rotated region proposal and discrimination networks. IEEE Geosci. Remote Sensing Lett., (99):1–5,
2018. 4322, 4326
[6] Xue Yang, Hao Sun, Kun Fu, Jirui Yang, Xian Sun, Menglong Yan, and Zhi Guo. Automatic ship detection
in remotesensing images from google earth of complex scenes based on multiscale rotation dense feature
pyramid networks. Re-mote Sensing, 10(1):132, 2018. 4322, 4327
[7]Khan, S., Hayat, M., Zamir, S. W., Shen, J., & Shao, L. (2019). Striking the right balance with uncertainty.
Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition, 2019-
June, 103–112. https://doi.org/10.1109/CVPR.2019.00019
60
References
[8] Yarin Gal. (2017). Uncertainty in Deep Learning. Phd Thesis, 1(1), 1–11.
https://doi.org/10.1371/journal.pcbi.1005062
[9] Tan, M., Pang, R., & Le, Q. V. (2019). EfficientDet: Scalable and Efficient Object Detection.
http://arxiv.org/abs/1911.09070
[10] Liu, Y., Wang, Y., Wang, S., Liang, T., Zhao, Q., Tang, Z., & Ling, H. (2019). CBNet: A Novel Composite
Backbone Network Architecture for Object Detection. http://arxiv.org/abs/1909.03625
61

More Related Content

What's hot

딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기 DEVIEW 2016
딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기 DEVIEW 2016딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기 DEVIEW 2016
딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기 DEVIEW 2016
Taehoon Kim
 
[DL輪読会]YOLOv4: Optimal Speed and Accuracy of Object Detection
[DL輪読会]YOLOv4: Optimal Speed and Accuracy of Object Detection[DL輪読会]YOLOv4: Optimal Speed and Accuracy of Object Detection
[DL輪読会]YOLOv4: Optimal Speed and Accuracy of Object Detection
Deep Learning JP
 
[DevGround] 린하게 구축하는 스타트업 데이터파이프라인
[DevGround] 린하게 구축하는 스타트업 데이터파이프라인[DevGround] 린하게 구축하는 스타트업 데이터파이프라인
[DevGround] 린하게 구축하는 스타트업 데이터파이프라인
Jae Young Park
 
1시간만에 GAN(Generative Adversarial Network) 완전 정복하기
1시간만에 GAN(Generative Adversarial Network) 완전 정복하기1시간만에 GAN(Generative Adversarial Network) 완전 정복하기
1시간만에 GAN(Generative Adversarial Network) 완전 정복하기
NAVER Engineering
 
Data pipeline and data lake
Data pipeline and data lakeData pipeline and data lake
Data pipeline and data lake
DaeMyung Kang
 
모두가 성장하는 스터디 만들기
모두가 성장하는 스터디 만들기모두가 성장하는 스터디 만들기
모두가 성장하는 스터디 만들기
BYUNGHOKIM10
 
그림 그리는 AI
그림 그리는 AI그림 그리는 AI
그림 그리는 AI
NAVER Engineering
 
사회인의 휴학, Gap Year 이야기
사회인의 휴학, Gap Year 이야기사회인의 휴학, Gap Year 이야기
사회인의 휴학, Gap Year 이야기
Seongyun Byeon
 
[D2]java 성능에 대한 오해와 편견
[D2]java 성능에 대한 오해와 편견[D2]java 성능에 대한 오해와 편견
[D2]java 성능에 대한 오해와 편견
NAVER D2
 
楽しいShaderToy
楽しいShaderToy楽しいShaderToy
楽しいShaderToy
Masaki Sasaki
 
Object as Points
Object as PointsObject as Points
Object as Points
harmonylab
 
Little Big Data #1. 바닥부터 시작하는 데이터 인프라
Little Big Data #1. 바닥부터 시작하는 데이터 인프라Little Big Data #1. 바닥부터 시작하는 데이터 인프라
Little Big Data #1. 바닥부터 시작하는 데이터 인프라
Seongyun Byeon
 
파이썬 플라스크 이해하기
파이썬 플라스크 이해하기 파이썬 플라스크 이해하기
파이썬 플라스크 이해하기
Yong Joon Moon
 
RLCode와 A3C 쉽고 깊게 이해하기
RLCode와 A3C 쉽고 깊게 이해하기RLCode와 A3C 쉽고 깊게 이해하기
RLCode와 A3C 쉽고 깊게 이해하기
Woong won Lee
 
글쓰는 개발자 모임, 글또
글쓰는 개발자 모임, 글또글쓰는 개발자 모임, 글또
글쓰는 개발자 모임, 글또
Seongyun Byeon
 
[데이터야놀자2107] 강남 출근길에 판교/정자역에 내릴 사람 예측하기
[데이터야놀자2107] 강남 출근길에 판교/정자역에 내릴 사람 예측하기 [데이터야놀자2107] 강남 출근길에 판교/정자역에 내릴 사람 예측하기
[데이터야놀자2107] 강남 출근길에 판교/정자역에 내릴 사람 예측하기
choi kyumin
 
딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기
딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기
딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기
NAVER D2
 
지적 대화를 위한 깊고 넓은 딥러닝 PyCon APAC 2016
지적 대화를 위한 깊고 넓은 딥러닝 PyCon APAC 2016지적 대화를 위한 깊고 넓은 딥러닝 PyCon APAC 2016
지적 대화를 위한 깊고 넓은 딥러닝 PyCon APAC 2016
Taehoon Kim
 
[2017 PYCON 튜토리얼]OpenAI Gym을 이용한 강화학습 에이전트 만들기
[2017 PYCON 튜토리얼]OpenAI Gym을 이용한 강화학습 에이전트 만들기[2017 PYCON 튜토리얼]OpenAI Gym을 이용한 강화학습 에이전트 만들기
[2017 PYCON 튜토리얼]OpenAI Gym을 이용한 강화학습 에이전트 만들기
이 의령
 
오토인코더의 모든 것
오토인코더의 모든 것오토인코더의 모든 것
오토인코더의 모든 것
NAVER Engineering
 

What's hot (20)

딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기 DEVIEW 2016
딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기 DEVIEW 2016딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기 DEVIEW 2016
딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기 DEVIEW 2016
 
[DL輪読会]YOLOv4: Optimal Speed and Accuracy of Object Detection
[DL輪読会]YOLOv4: Optimal Speed and Accuracy of Object Detection[DL輪読会]YOLOv4: Optimal Speed and Accuracy of Object Detection
[DL輪読会]YOLOv4: Optimal Speed and Accuracy of Object Detection
 
[DevGround] 린하게 구축하는 스타트업 데이터파이프라인
[DevGround] 린하게 구축하는 스타트업 데이터파이프라인[DevGround] 린하게 구축하는 스타트업 데이터파이프라인
[DevGround] 린하게 구축하는 스타트업 데이터파이프라인
 
1시간만에 GAN(Generative Adversarial Network) 완전 정복하기
1시간만에 GAN(Generative Adversarial Network) 완전 정복하기1시간만에 GAN(Generative Adversarial Network) 완전 정복하기
1시간만에 GAN(Generative Adversarial Network) 완전 정복하기
 
Data pipeline and data lake
Data pipeline and data lakeData pipeline and data lake
Data pipeline and data lake
 
모두가 성장하는 스터디 만들기
모두가 성장하는 스터디 만들기모두가 성장하는 스터디 만들기
모두가 성장하는 스터디 만들기
 
그림 그리는 AI
그림 그리는 AI그림 그리는 AI
그림 그리는 AI
 
사회인의 휴학, Gap Year 이야기
사회인의 휴학, Gap Year 이야기사회인의 휴학, Gap Year 이야기
사회인의 휴학, Gap Year 이야기
 
[D2]java 성능에 대한 오해와 편견
[D2]java 성능에 대한 오해와 편견[D2]java 성능에 대한 오해와 편견
[D2]java 성능에 대한 오해와 편견
 
楽しいShaderToy
楽しいShaderToy楽しいShaderToy
楽しいShaderToy
 
Object as Points
Object as PointsObject as Points
Object as Points
 
Little Big Data #1. 바닥부터 시작하는 데이터 인프라
Little Big Data #1. 바닥부터 시작하는 데이터 인프라Little Big Data #1. 바닥부터 시작하는 데이터 인프라
Little Big Data #1. 바닥부터 시작하는 데이터 인프라
 
파이썬 플라스크 이해하기
파이썬 플라스크 이해하기 파이썬 플라스크 이해하기
파이썬 플라스크 이해하기
 
RLCode와 A3C 쉽고 깊게 이해하기
RLCode와 A3C 쉽고 깊게 이해하기RLCode와 A3C 쉽고 깊게 이해하기
RLCode와 A3C 쉽고 깊게 이해하기
 
글쓰는 개발자 모임, 글또
글쓰는 개발자 모임, 글또글쓰는 개발자 모임, 글또
글쓰는 개발자 모임, 글또
 
[데이터야놀자2107] 강남 출근길에 판교/정자역에 내릴 사람 예측하기
[데이터야놀자2107] 강남 출근길에 판교/정자역에 내릴 사람 예측하기 [데이터야놀자2107] 강남 출근길에 판교/정자역에 내릴 사람 예측하기
[데이터야놀자2107] 강남 출근길에 판교/정자역에 내릴 사람 예측하기
 
딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기
딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기
딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기
 
지적 대화를 위한 깊고 넓은 딥러닝 PyCon APAC 2016
지적 대화를 위한 깊고 넓은 딥러닝 PyCon APAC 2016지적 대화를 위한 깊고 넓은 딥러닝 PyCon APAC 2016
지적 대화를 위한 깊고 넓은 딥러닝 PyCon APAC 2016
 
[2017 PYCON 튜토리얼]OpenAI Gym을 이용한 강화학습 에이전트 만들기
[2017 PYCON 튜토리얼]OpenAI Gym을 이용한 강화학습 에이전트 만들기[2017 PYCON 튜토리얼]OpenAI Gym을 이용한 강화학습 에이전트 만들기
[2017 PYCON 튜토리얼]OpenAI Gym을 이용한 강화학습 에이전트 만들기
 
오토인코더의 모든 것
오토인코더의 모든 것오토인코더의 모든 것
오토인코더의 모든 것
 

Similar to 위성이미지 객체 검출 대회 - 1등

Deep Learning Into Advance - 1. Image, ConvNet
Deep Learning Into Advance - 1. Image, ConvNetDeep Learning Into Advance - 1. Image, ConvNet
Deep Learning Into Advance - 1. Image, ConvNet
Hyojun Kim
 
"Dataset and metrics for predicting local visible differences" Paper Review
"Dataset and metrics for predicting local visible differences" Paper Review"Dataset and metrics for predicting local visible differences" Paper Review
"Dataset and metrics for predicting local visible differences" Paper Review
LEE HOSEONG
 
247 deview 2013 이미지 분석 - 민재식
247 deview 2013 이미지 분석 - 민재식247 deview 2013 이미지 분석 - 민재식
247 deview 2013 이미지 분석 - 민재식NAVER D2
 
MOODv2 : Masked Image Modeling for Out-of-Distribution Detection
MOODv2 : Masked Image Modeling for Out-of-Distribution DetectionMOODv2 : Masked Image Modeling for Out-of-Distribution Detection
MOODv2 : Masked Image Modeling for Out-of-Distribution Detection
Kim Daeun
 
관측 임무스케줄링 (Selecting and scheduling observations of agile satellites)
관측 임무스케줄링 (Selecting and scheduling observations of agile satellites)관측 임무스케줄링 (Selecting and scheduling observations of agile satellites)
관측 임무스케줄링 (Selecting and scheduling observations of agile satellites)
Hansol Kang
 
Deep learning super resolution
Deep learning super resolutionDeep learning super resolution
Deep learning super resolution
NAVER Engineering
 
Detecting fake jpeg images
Detecting fake jpeg imagesDetecting fake jpeg images
Detecting fake jpeg images
NAVER Engineering
 
Naive ML Overview
Naive ML OverviewNaive ML Overview
Naive ML Overview
Chul Ju Hong
 
[공간정보시스템 개론] L11 공간정보의 구축
[공간정보시스템 개론] L11 공간정보의 구축[공간정보시스템 개론] L11 공간정보의 구축
[공간정보시스템 개론] L11 공간정보의 구축
Kwang Woo NAM
 
Learning Less is More - 6D Camera Localization via 3D Surface Regression
Learning Less is More - 6D Camera Localization via 3D Surface RegressionLearning Less is More - 6D Camera Localization via 3D Surface Regression
Learning Less is More - 6D Camera Localization via 3D Surface Regression
Brian Younggun Cho
 
OpenCV preview
OpenCV previewOpenCV preview
OpenCV preview
Daniel Shin
 
[PR12] image super resolution using deep convolutional networks
[PR12] image super resolution using deep convolutional networks[PR12] image super resolution using deep convolutional networks
[PR12] image super resolution using deep convolutional networks
Taegyun Jeon
 
9강 camera advanced light2
9강 camera advanced light29강 camera advanced light2
9강 camera advanced light2JP Jung
 
"Learning From Noisy Large-Scale Datasets With Minimal Supervision" Paper Review
"Learning From Noisy Large-Scale Datasets With Minimal Supervision" Paper Review"Learning From Noisy Large-Scale Datasets With Minimal Supervision" Paper Review
"Learning From Noisy Large-Scale Datasets With Minimal Supervision" Paper Review
LEE HOSEONG
 
Denoising auto encoders(d a)
Denoising auto encoders(d a)Denoising auto encoders(d a)
Denoising auto encoders(d a)
Tae Young Lee
 
PiCANet, Pytorch Implementation (Korean)
PiCANet, Pytorch Implementation (Korean)PiCANet, Pytorch Implementation (Korean)
PiCANet, Pytorch Implementation (Korean)
JaehoonYoo5
 
[GEG1] 3.volumetric representation of virtual environments
[GEG1] 3.volumetric representation of virtual environments[GEG1] 3.volumetric representation of virtual environments
[GEG1] 3.volumetric representation of virtual environments종빈 오
 
Introduction toDQN
Introduction toDQNIntroduction toDQN
Introduction toDQN
Curt Park
 
Motion blur
Motion blurMotion blur
Motion blur
changehee lee
 
이원, 절차적 지형 생성과 하이트필드의 사원, NDC2011
이원, 절차적 지형 생성과 하이트필드의 사원, NDC2011이원, 절차적 지형 생성과 하이트필드의 사원, NDC2011
이원, 절차적 지형 생성과 하이트필드의 사원, NDC2011
devCAT Studio, NEXON
 

Similar to 위성이미지 객체 검출 대회 - 1등 (20)

Deep Learning Into Advance - 1. Image, ConvNet
Deep Learning Into Advance - 1. Image, ConvNetDeep Learning Into Advance - 1. Image, ConvNet
Deep Learning Into Advance - 1. Image, ConvNet
 
"Dataset and metrics for predicting local visible differences" Paper Review
"Dataset and metrics for predicting local visible differences" Paper Review"Dataset and metrics for predicting local visible differences" Paper Review
"Dataset and metrics for predicting local visible differences" Paper Review
 
247 deview 2013 이미지 분석 - 민재식
247 deview 2013 이미지 분석 - 민재식247 deview 2013 이미지 분석 - 민재식
247 deview 2013 이미지 분석 - 민재식
 
MOODv2 : Masked Image Modeling for Out-of-Distribution Detection
MOODv2 : Masked Image Modeling for Out-of-Distribution DetectionMOODv2 : Masked Image Modeling for Out-of-Distribution Detection
MOODv2 : Masked Image Modeling for Out-of-Distribution Detection
 
관측 임무스케줄링 (Selecting and scheduling observations of agile satellites)
관측 임무스케줄링 (Selecting and scheduling observations of agile satellites)관측 임무스케줄링 (Selecting and scheduling observations of agile satellites)
관측 임무스케줄링 (Selecting and scheduling observations of agile satellites)
 
Deep learning super resolution
Deep learning super resolutionDeep learning super resolution
Deep learning super resolution
 
Detecting fake jpeg images
Detecting fake jpeg imagesDetecting fake jpeg images
Detecting fake jpeg images
 
Naive ML Overview
Naive ML OverviewNaive ML Overview
Naive ML Overview
 
[공간정보시스템 개론] L11 공간정보의 구축
[공간정보시스템 개론] L11 공간정보의 구축[공간정보시스템 개론] L11 공간정보의 구축
[공간정보시스템 개론] L11 공간정보의 구축
 
Learning Less is More - 6D Camera Localization via 3D Surface Regression
Learning Less is More - 6D Camera Localization via 3D Surface RegressionLearning Less is More - 6D Camera Localization via 3D Surface Regression
Learning Less is More - 6D Camera Localization via 3D Surface Regression
 
OpenCV preview
OpenCV previewOpenCV preview
OpenCV preview
 
[PR12] image super resolution using deep convolutional networks
[PR12] image super resolution using deep convolutional networks[PR12] image super resolution using deep convolutional networks
[PR12] image super resolution using deep convolutional networks
 
9강 camera advanced light2
9강 camera advanced light29강 camera advanced light2
9강 camera advanced light2
 
"Learning From Noisy Large-Scale Datasets With Minimal Supervision" Paper Review
"Learning From Noisy Large-Scale Datasets With Minimal Supervision" Paper Review"Learning From Noisy Large-Scale Datasets With Minimal Supervision" Paper Review
"Learning From Noisy Large-Scale Datasets With Minimal Supervision" Paper Review
 
Denoising auto encoders(d a)
Denoising auto encoders(d a)Denoising auto encoders(d a)
Denoising auto encoders(d a)
 
PiCANet, Pytorch Implementation (Korean)
PiCANet, Pytorch Implementation (Korean)PiCANet, Pytorch Implementation (Korean)
PiCANet, Pytorch Implementation (Korean)
 
[GEG1] 3.volumetric representation of virtual environments
[GEG1] 3.volumetric representation of virtual environments[GEG1] 3.volumetric representation of virtual environments
[GEG1] 3.volumetric representation of virtual environments
 
Introduction toDQN
Introduction toDQNIntroduction toDQN
Introduction toDQN
 
Motion blur
Motion blurMotion blur
Motion blur
 
이원, 절차적 지형 생성과 하이트필드의 사원, NDC2011
이원, 절차적 지형 생성과 하이트필드의 사원, NDC2011이원, 절차적 지형 생성과 하이트필드의 사원, NDC2011
이원, 절차적 지형 생성과 하이트필드의 사원, NDC2011
 

More from DACON AI 데이콘

Introduction to e tapr for hai con -eng
Introduction to e tapr for hai con -engIntroduction to e tapr for hai con -eng
Introduction to e tapr for hai con -eng
DACON AI 데이콘
 
Introduction to e tapr for hai con -kor
Introduction to e tapr for hai con -korIntroduction to e tapr for hai con -kor
Introduction to e tapr for hai con -kor
DACON AI 데이콘
 
20210728 대회주최 문의
20210728 대회주최 문의20210728 대회주최 문의
20210728 대회주최 문의
DACON AI 데이콘
 
데이콘 뽀개기
데이콘 뽀개기데이콘 뽀개기
데이콘 뽀개기
DACON AI 데이콘
 
Bittrader competition (1)
Bittrader competition (1)Bittrader competition (1)
Bittrader competition (1)
DACON AI 데이콘
 
Bittrader competition
Bittrader competitionBittrader competition
Bittrader competition
DACON AI 데이콘
 
Superbai
SuperbaiSuperbai
K-Fashion 경진대회 1등 수상자 솔루션
K-Fashion 경진대회 1등 수상자 솔루션K-Fashion 경진대회 1등 수상자 솔루션
K-Fashion 경진대회 1등 수상자 솔루션
DACON AI 데이콘
 
K-Fashion 경진대회 2등 수상자 솔루션
K-Fashion 경진대회 2등 수상자 솔루션K-Fashion 경진대회 2등 수상자 솔루션
K-Fashion 경진대회 2등 수상자 솔루션
DACON AI 데이콘
 
K-Fashion 경진대회 3등 수상자 솔루션
K-Fashion 경진대회 3등 수상자 솔루션K-Fashion 경진대회 3등 수상자 솔루션
K-Fashion 경진대회 3등 수상자 솔루션
DACON AI 데이콘
 
진동데이터 활용 충돌체 탐지 AI 경진대회 2등
진동데이터 활용 충돌체 탐지 AI 경진대회 2등진동데이터 활용 충돌체 탐지 AI 경진대회 2등
진동데이터 활용 충돌체 탐지 AI 경진대회 2등
DACON AI 데이콘
 
진동데이터 활용 충돌체 탐지 AI 경진대회 1등
진동데이터 활용 충돌체 탐지 AI 경진대회 1등진동데이터 활용 충돌체 탐지 AI 경진대회 1등
진동데이터 활용 충돌체 탐지 AI 경진대회 1등
DACON AI 데이콘
 
20200923
2020092320200923
포스트 코로나 데이터 시각화 경진대회 - 대상
포스트 코로나 데이터 시각화 경진대회 - 대상포스트 코로나 데이터 시각화 경진대회 - 대상
포스트 코로나 데이터 시각화 경진대회 - 대상
DACON AI 데이콘
 
포스트 코로나 데이터 시각화 경진대회 - 최우수상
포스트 코로나 데이터 시각화 경진대회 - 최우수상포스트 코로나 데이터 시각화 경진대회 - 최우수상
포스트 코로나 데이터 시각화 경진대회 - 최우수상
DACON AI 데이콘
 
포스트 코로나 데이터 시각화 경진대회 - 우수상
포스트 코로나 데이터 시각화 경진대회 - 우수상포스트 코로나 데이터 시각화 경진대회 - 우수상
포스트 코로나 데이터 시각화 경진대회 - 우수상
DACON AI 데이콘
 
포스트 코로나 데이터 시각화 경진대회 - 장려상2
포스트 코로나 데이터 시각화 경진대회 - 장려상2포스트 코로나 데이터 시각화 경진대회 - 장려상2
포스트 코로나 데이터 시각화 경진대회 - 장려상2
DACON AI 데이콘
 
포스트 코로나 데이터 시각화 경진대회 - 장려상
포스트 코로나 데이터 시각화 경진대회 - 장려상포스트 코로나 데이터 시각화 경진대회 - 장려상
포스트 코로나 데이터 시각화 경진대회 - 장려상
DACON AI 데이콘
 
생체 광학 데이터 분석 AI 경진대회 10위 수상작
생체 광학 데이터 분석 AI 경진대회 10위 수상작생체 광학 데이터 분석 AI 경진대회 10위 수상작
생체 광학 데이터 분석 AI 경진대회 10위 수상작
DACON AI 데이콘
 
생체 광학 데이터 분석 AI 경진대회 9위 수상작
생체 광학 데이터 분석 AI 경진대회 9위 수상작생체 광학 데이터 분석 AI 경진대회 9위 수상작
생체 광학 데이터 분석 AI 경진대회 9위 수상작
DACON AI 데이콘
 

More from DACON AI 데이콘 (20)

Introduction to e tapr for hai con -eng
Introduction to e tapr for hai con -engIntroduction to e tapr for hai con -eng
Introduction to e tapr for hai con -eng
 
Introduction to e tapr for hai con -kor
Introduction to e tapr for hai con -korIntroduction to e tapr for hai con -kor
Introduction to e tapr for hai con -kor
 
20210728 대회주최 문의
20210728 대회주최 문의20210728 대회주최 문의
20210728 대회주최 문의
 
데이콘 뽀개기
데이콘 뽀개기데이콘 뽀개기
데이콘 뽀개기
 
Bittrader competition (1)
Bittrader competition (1)Bittrader competition (1)
Bittrader competition (1)
 
Bittrader competition
Bittrader competitionBittrader competition
Bittrader competition
 
Superbai
SuperbaiSuperbai
Superbai
 
K-Fashion 경진대회 1등 수상자 솔루션
K-Fashion 경진대회 1등 수상자 솔루션K-Fashion 경진대회 1등 수상자 솔루션
K-Fashion 경진대회 1등 수상자 솔루션
 
K-Fashion 경진대회 2등 수상자 솔루션
K-Fashion 경진대회 2등 수상자 솔루션K-Fashion 경진대회 2등 수상자 솔루션
K-Fashion 경진대회 2등 수상자 솔루션
 
K-Fashion 경진대회 3등 수상자 솔루션
K-Fashion 경진대회 3등 수상자 솔루션K-Fashion 경진대회 3등 수상자 솔루션
K-Fashion 경진대회 3등 수상자 솔루션
 
진동데이터 활용 충돌체 탐지 AI 경진대회 2등
진동데이터 활용 충돌체 탐지 AI 경진대회 2등진동데이터 활용 충돌체 탐지 AI 경진대회 2등
진동데이터 활용 충돌체 탐지 AI 경진대회 2등
 
진동데이터 활용 충돌체 탐지 AI 경진대회 1등
진동데이터 활용 충돌체 탐지 AI 경진대회 1등진동데이터 활용 충돌체 탐지 AI 경진대회 1등
진동데이터 활용 충돌체 탐지 AI 경진대회 1등
 
20200923
2020092320200923
20200923
 
포스트 코로나 데이터 시각화 경진대회 - 대상
포스트 코로나 데이터 시각화 경진대회 - 대상포스트 코로나 데이터 시각화 경진대회 - 대상
포스트 코로나 데이터 시각화 경진대회 - 대상
 
포스트 코로나 데이터 시각화 경진대회 - 최우수상
포스트 코로나 데이터 시각화 경진대회 - 최우수상포스트 코로나 데이터 시각화 경진대회 - 최우수상
포스트 코로나 데이터 시각화 경진대회 - 최우수상
 
포스트 코로나 데이터 시각화 경진대회 - 우수상
포스트 코로나 데이터 시각화 경진대회 - 우수상포스트 코로나 데이터 시각화 경진대회 - 우수상
포스트 코로나 데이터 시각화 경진대회 - 우수상
 
포스트 코로나 데이터 시각화 경진대회 - 장려상2
포스트 코로나 데이터 시각화 경진대회 - 장려상2포스트 코로나 데이터 시각화 경진대회 - 장려상2
포스트 코로나 데이터 시각화 경진대회 - 장려상2
 
포스트 코로나 데이터 시각화 경진대회 - 장려상
포스트 코로나 데이터 시각화 경진대회 - 장려상포스트 코로나 데이터 시각화 경진대회 - 장려상
포스트 코로나 데이터 시각화 경진대회 - 장려상
 
생체 광학 데이터 분석 AI 경진대회 10위 수상작
생체 광학 데이터 분석 AI 경진대회 10위 수상작생체 광학 데이터 분석 AI 경진대회 10위 수상작
생체 광학 데이터 분석 AI 경진대회 10위 수상작
 
생체 광학 데이터 분석 AI 경진대회 9위 수상작
생체 광학 데이터 분석 AI 경진대회 9위 수상작생체 광학 데이터 분석 AI 경진대회 9위 수상작
생체 광학 데이터 분석 AI 경진대회 9위 수상작
 

위성이미지 객체 검출 대회 - 1등

  • 1. 위성 이미지 객체 검출 {green669, sbson0621, rnans33, karma1002, ohhs}@koreatech.ac.kr DICE Lab KOREATECH 1 박주찬 손성빈 정준욱 오흥선이선훈
  • 2. DICE Lab • Deep Intelligence for Cognitive Environment (DICE) Lab • in School of Computer Science and Engineering, KOREATECH • Focus on deep intelligence systems by understanding various cognitive environments based on language and vision technologies. • https://sites.google.com/view/dice-lab/home • Looking for self-motivated graduate students! 2
  • 3. 목차 • Problem Definition • Challenges in Aerial Object Detection • The Approaches to Challenges • Model • Experiments • Conclusion 3
  • 5. Problem Definition • 인공위성 영상의 선박 종류 인식 및 위치를 검출 알고리즘 개발 5 • Object Detection • Classification • Localization • Horizontal bounding boxes • Oriented bounding boxes
  • 6. Problem Definition • 인공위성 영상의 선박 종류 인식 및 위치를 검출 알고리즘 개발 6 • Object Detection • Classification • Localization • Horizontal bounding boxes • Oriented bounding boxes
  • 7. Problem Definition – Object Detection Classification 7 Cat ( x, y, w, h ) Object Detection Classification + Localization(Horizontal bounding box) Localization Horizontal bounding box
  • 8. Problem Definition • 인공위성 영상의 선박 종류 인식 및 위치를 검출 알고리즘 개발 8 • Object Detection • Classification • Localization • Horizontal bounding boxes • Oriented bounding boxes
  • 9. Problem Definition – Aerial Object Detection Classification 9 Ship[1] ( x1, y1, x2, y2, x3, y3, x4, y4 ) Aerial Object Detection Classification + Localization(Oriented bounding box) Localization Oriented bounding box
  • 10. Problem Definition – Aerial Detection Classification 10 Ship ( x1, y1, x2, y2, x3, y3, x4, y4 ) Aerial Object Detection Classification + Localization(Oriented bounding box) Localization Oriented bounding box Aerial Object Detection Task
  • 12. Challenges 12 1. 데이터 수의 부족 2. 항공뷰의 특징 3. 데이터의 불균형
  • 13. Challenge 1 13 Dataset Classes Images ILSVRC 2014 200 516,840 COCO2017 80 163,957 PASCAL VOC 2012 20 22,531 Aerial Data 4 2,676 <Aerial Data vs 일반 OD데이터 셋 비교> 데이터 수의 부족
  • 14. Challenge 2 14 항공뷰의 특징 고 해상도 배경 및 물체의 복잡도 ↕ Aerial image 해상도 : 3000 x 3000 일반 사진에 비해서 배경, 물체 의 복잡도가 높음 항공 이미지 일반 이미지 높은 해상도로 인해 원본 이미지를 바로 처리하기 어려움 데이터셋 평균 해상도 ImageNet 482 x 415 COCO 480 x 640 VOC2012 469 x 387
  • 15. Challenge 2 15 물체의 밀집 밀집된 물체의 검출이 어려움 다양한 회전각도 모든 각도를 고려하기 어려움 항공뷰의 특징
  • 16. Class Images Ratio Maritime vessels 12,018 67.3 % Container 3,986 22.3 % Oil tanker 1,807 10.2 % Aircraft carrier 39 0.20 % 데이터의 불균형 Challenge 3 16 <Aerial Data Class 별 객체 수 비교>
  • 17. Approaches to the Challenges 17
  • 18. Our Approaches 18 • 항공뷰의 특징 • 고해상도 처리 → Image patches • 다양한 회전 각도 및 물체의 밀집 → RoI Transformer • 데이터 수의 부족 → Multi-scale augmentation → Appearance augmentation • 데이터의 불균형 → Data uncertainty approach + 데이터의 noise 및 model uncertainty에 강한 모델 → Bayesian deep learning approach
  • 19. Our Approaches 19 • 항공뷰의 특징 • 고해상도 처리 → Image patches • 다양한 회전 각도 및 물체의 밀집 → RoI Transformer • 데이터 수의 부족 → Multi-scale augmentation → Appearance augmentation • 데이터의 불균형 → Data uncertainty approach + 데이터의 noise 및 model uncertainty에 강한 모델 → Bayesian deep learning approach
  • 20. Image Patches 20 1024 1024 3000 x 3000 0 0 • 하나의 3000 x 3000 이미지 → 모델의 input size인 1024 x 1024 크기의 패치로 나눔, Stride : 512 → 총 25장의 이미지 패치가 됨
  • 21. Our Approaches 21 • 항공뷰의 특징 • 고해상도 처리 → Image patches • 다양한 회전 각도 및 물체의 밀집 → RoI Transformer • 데이터 수의 부족 → Multi-scale augmentation → Appearance augmentation • 데이터의 불균형 → Data uncertainty approach + 데이터의 noise 및 model uncertainty에 강한 모델 → Bayesian deep learning approach
  • 22. Data Augmentation 22 고양이 형상정보 변환 데이터 속성 변환 Augmentation에는 크게 형상정보 변환과 데이터 속성 변환이 있음
  • 23. Data Augmentation 23 • 형상 정보 변환 • Multi-scale augmentation • 데이터 속성 변환 (Appearance augmentation) • 색감 변환 • 안개 적용 • 밝기 변화 • 가우시안 블러링
  • 24. Data Augmentation • Multi-scale augmentation • 학습데이터의 크기를 다양한 스케일로 학습시키는 것 • 장점 • 다양한 크기의 object에 강건한 모델을 만들 수 있음 • Ours • Image patch를 1024 x 1024, 1500 x 1500, 3000 x 3000의 스케일로 생성 24
  • 25. Data Augmentation • Multi-scale augmentation • Ex) 한 장의 3000 x 3000 크기의 이미지 -> 1024 x 1024 크기의 이미지 25장, stride : 512 25 1024 1024 3000 x 3000 0 0
  • 26. Data Augmentation • Multi-scale augmentation • Ex) 한 장의 3000 x 3000 크기의 이미지 -> 1024 x 1024 크기의 이미지 25장, stride : 512 26 3000 x 3000 1536 1024 512 0
  • 27. Data Augmentation • Multi-scale augmentation • Ex) 한 장의 3000 x 3000 크기의 이미지 -> 1500 x 1500 크기의 이미지 16장, stride : 700 27 3000 x 3000 1500 1500 0 0
  • 28. Data Augmentation • Multi-scale augmentation • Ex) 한 장의 3000 x 3000 크기의 이미지 -> 1500 x 1500 크기의 이미지 16장, stride : 700 28 3000 x 3000 2200 1500 0 700
  • 29. Data Augmentation • Multi-scale augmentation • Ex) 한 장의 3000 x 3000 크기의 이미지 -> 1024 x 1024 크기의 이미지 패치 25장, stride : 512 -> 1500 x 1500 크기의 이미지 패치 16장, stride : 700 -> 3000 x 3000 크기의 이미지 패치 1장 • 한 장당 총 42장의 이미지 패치가 만들어짐 • 총 학습 이미지의 개수 : 2,646 x 42 = 111,132장 • 학습 이미지 사이즈가 다양함 • 1024 x 1024 고정된 사이즈로 resize한 후, 모델의 input으로 들어가게 됨 29
  • 30. Data Augmentation 30 • 형상 정보 변환 • Multi-scale augmentation • 데이터 속성 변환(Appearance augmentation) • 색감 변환 • 안개 적용 • 밝기 변화 • 가우시안 블러링
  • 31. Data Augmentation • Aerial 데이터 속성 분석 • 시간대(해의 위치 변화에 따른 조명 변화) • 인공 위성의 성능(성능이 높을 수록 깨끗한 사진, 낮을 수록 blur한 사진) • 안개, 구름 • 인공 위성이 받아들이는 전자기파 영역(적외선, 가시광선) DICE Lab@KOREATECH 31
  • 32. Data Augmentation 색감 안개 가우시안 블러링 밝기 일반 (65%) Cool(15%) Warm(15%) 적외선(5%) 일반(76%) 1~5 옵션(24%) 일반(76%) Blurring(24%): -필터 범위 (5,5), 표준편차 (1~10) 일반(38%) Bright(62%): -20 ~ 50 DICE Lab@KOREATECH 32 <Appearance augmentation 조합 비율> Image = 색감 × 안개 × 가우시안 블러링 × 밝기
  • 33. Data Augmentation 33 좌 : 원본 사진, 우 : Appearance augmentation 변환 이미지(비율에 맞게 sampling해서 뽑음) Example 1
  • 34. Data Augmentation 34 좌 : 원본 사진, 우 : Appearance augmentation 변환 이미지(비율에 맞게 sampling해서 뽑음) Example 2
  • 35. Our Approaches 35 • 항공뷰의 특징 • 고해상도 처리 → Image patches • 다양한 회전 각도 및 물체의 밀집 → RoI Transformer • 데이터 수의 부족 → Multi-scale augmentation → Appearance augmentation • 데이터의 불균형 → Data uncertainty approach + 데이터의 noise 및 model uncertainty에 강한 모델 → Bayesian deep learning approach
  • 36. RoI Transformer DICE Lab@KOREATECH 36 • HRoI(Horizontal Region of Interest) • 버스의 방향에 상관없이 RoI를 잡 는 방식 • RRoI(Rotated Region of Interest) • 버스의 방향을 고려하여 RoI 자체 를 rotate해서 잡음으로써 밀집한 이미지에 강건해짐 <HRoI vs RRoI [2]>
  • 37. RoI Transformer 37Feature map Anchor scale : 3 Anchor ratio : 1:1 Anchor angle : 0 Anchor scale : 3 Anchor ratio : 1:2 Anchor angle : 0 Anchor scale : 3 Anchor ratio : 1:1 Anchor angle : 𝜋 6 1 1 • Anchor란? • RRoI를 선택하기 위해 필요한 후보 • RRoI를 계산하기 위해서는 Anchor를 구해야함 • Scale, Ratio, Angle이 존재 • Scale은 anchor의 크기를 조절 • Ratio는 anchor의 가로세로 비율을 조절 • Angle은 anchor의 각도를 조절 • Anchor의 개수를 구하는 공식 → (num_scales × num_aspect_ratios × num_angles)[1,2,3,4]
  • 38. RoI Transformer • 기존 RRoI(Rotated Region of Interest)의 문제점 • Anchor의 개수를 구하는 공식 → (num_scales × num_aspect_ratios × num_angles)[3,4,5,6] • Anchor의 각도가 n배 세밀해진다면 • 연산량 n배 증가 • 메모리 n배 증가 • Proposal간의 match efficiency도 같이 떨어짐 38
  • 39. RoI Transformer • RoI transformer[2] • Angle 자체를 추론함으로써 연산량을 극적으로 줄임 • anchor의 개수 = (num_scale * num_aspect_ratio * num_angles) → anchor의 개수 = (num_scale * num_aspect_ratio * 1) • 표현 가능한 angle의 종류를 무한개로 늘림 • num_angles ∈ { π 2 , π 3 , 𝜋 4 , … , 𝜋 𝑛 }, finite set → num_angles ∈ 𝑅 , infinite set 39
  • 40. Our Approaches 40 • 항공뷰의 특징 • 고해상도 처리 → Image patches • 다양한 회전 각도 및 물체의 밀집 → RoI Transformer • 데이터 수의 부족 → Multi-scale augmentation → Appearance augmentation • 데이터의 불균형 → Data uncertainty approach + 데이터의 noise 및 model uncertainty에 강한 모델 → Bayesian deep learning approach
  • 41. Data Uncertainty 41 <Balanced data vs Imbalanced data class feature space view[7]> • Imbalanced Data의 문제점 • Balanced data 경우는 class 간의 경계선이 이상적임 • Imbalanced data는 class간 경계가 데이터가 부족한 쪽 으로 치우쳐짐(false positive 증가)
  • 42. Data Uncertainty 42 <Regression and classification uncertainty with data frequency[7]> • Imbalanced Data와 Uncertainty간의 상관관계 • 데이터의 수가 적을 수록 uncertainty가 증가
  • 43. • Uncertainty 측정방법 • Aleatoric uncertainty, Epistemic uncertainty를 동시에 잡는 기법 사용 [7] → 기존 uncertainty 측정보다 향상된 기법 • Data imbalance 해결방법 • Category-level 해결[7] 43 Data Uncertainty uncertainty를 측정하여 0.5 × 𝑢𝑛𝑐𝑒𝑟𝑡𝑎𝑖𝑛𝑡𝑦 만큼 rare class에 margin 을 부여함으로써 rare class 영역 회복
  • 44. Our Approaches 44 • 항공뷰의 특징 • 고해상도 처리 → Image patches • 다양한 회전 각도 및 물체의 밀집 → RoI Transformer • 데이터 수의 부족 → Multi-scale augmentation → Appearance augmentation • 데이터의 불균형 → Data uncertainty approach + 데이터의 noise 및 overfitting에 강한 모델 → Bayesian deep learning approach
  • 45. Bayesian deep learning inference[8] DICE Lab@KOREATECH 45 y∗ ~ p y∗ x∗ , X, Y y∗ = 𝑓(x∗ ; 𝜃) Bayesian deep learning 일반 deep learning predict distribution predict point • data의 noise를 처리하는 기법이 있음 • predict point를 추론하는 것이 아닌 predict distribution을 추론하기 때문에 model의 overfitting에 강함
  • 46. 목차 • Problem Definition • Challenges in Aerial Object Detection • The Approaches to Challenges • Model • Experiments • Conclusion 46
  • 47. Overall Process 47 Image patches 3x1024x1024 I 𝑛 3x3000x3000 ⋯ Output image 3x3000x3000 Model patch 1 patch 2 patch N 𝒇 𝒎𝒆𝒓𝒈𝒆( [patch 1, … patch N]) Box regression, Classification patch K ⋯ ⋯ patch 1 patch 2 patch N patch K ⋯ oil tanker oil tanker 𝒇 𝒂𝒖𝒈 𝐼 𝑛 Augmentation Merge
  • 48. Overall Process 48 Image patches 3x1024x1024 I 𝑛 3x3000x3000 ⋯ Output image 3x3000x3000 Model patch 1 patch 2 patch N 𝒇 𝒎𝒆𝒓𝒈𝒆( [patch 1, … patch N]) Box regression, Classification patch K ⋯ ⋯ patch 1 patch 2 patch N patch K ⋯ oil tanker oil tanker 𝒇 𝒂𝒖𝒈 𝐼 𝑛 Augmentation Merge
  • 50. Our Model oil tanker oil tanker oil tanker Deep features FPN + BFN Backbone Image patch 3x1024x1024 ResNetXt101 oil tanker merge Feature pyramids Deep features RPN:4 RPN:3 RPN:2 RPN:1 RPN:0 50
  • 51. 목차 • Problem Definition • Challenges in Aerial Object Detection • The Approaches to Challenges • Model • Experiments • Conclusion 51
  • 53. Result Analysis 53 Model Public mAP ResNet50 + FPN 0.561 ResNet101 + FPN 0.608 ResNeXt101 + FPN 0.706 Model Public mAP ResNeXt101 + FPN 0.706 ResNeXt101 + FPN+ BFN 0.734 ResNeXt101 + BiFPN[9]+ BFN 0.687 Backbone이 큰 모델일수록 성능 향상을 보임. BFN 모듈을 추가했을 때 성능 향상을 보임 BiFPN[9] 모듈은 오히려 성능이 감소함.
  • 54. Result Analysis Model Appearance Multi-scale training Uncertainty Public mAP Private mAP ResNeXt101 + FPN+ BFN 0.762 - ResNeXt101 + FPN+ BFN 0.812 - ResNeXt101 + FPN+ BFN* 0.840 - ResNeXt101 + FPN+ BFN* 0.849 0.824 Cascaded[10] ResNeXt101 + FPN+ BFN* 0.861 - Cascaded[10] ResNeXt152 + FPN+ BFN* 0.838 - 54 * : multi-scale test 적용 Multi-scale test 적용 시 성능 향상을 보임 Bayesian model과 data imbalance 처리를 했을 시 성능 향상을 보임 Cascaded[10] ResNeXt101 + FPN+ BFN은 Public mAP는 높았으나 Private mAP는 오히려 떨어짐 Cascaded[10] ResNeXt152 + FPN+ BFN은 시간 부족으로 인해 완전한 성능을 내지 못함
  • 55. Result Analysis 55 팀 이름(순위) 가채점 점수 최종 점수 점수 변위폭 DICE(1위) 0.849 0.825 -0.024 Top secret(2위) 0.844 0.815 -0.029 박태현_1579495977001(3위) 0.813 0.765 -0.048 상위 3개팀 중 모델 결과의 variance가 가장 낮음 ➔ overfitting 및 noise에 강한 모델
  • 56. Result Analysis • Multi-scale을 적용하면, 큰 배들에 대해 더 잘 찾는 것을 볼 수 있음 56 Multi-scale 전 Multi-scale 후
  • 57. Result Analysis 57 • 작은 배들은 대부분 검출이 잘 되는 것을 볼 수 있음
  • 58. Conclusion • Challenges 해결 방법 • 항공뷰의 특징 ➔ 이미지 패치로 나누는 것과 RoI Transformer을 통해 해결했음 • 데이터 수의 부족 ➔ Multi-scale augmentation과 Appearance augmentation을 통해 해결했음 • 데이터의 불균형 ➔uncertainty 측정을 통한 category별 margin을 줌을 통해 해결했음 • noise 및 overfitting에 강건한 모델 ➔ Bayesian model을 통해 noise와 overfitting에 강건한 모델을 만듬 58
  • 59. Further Discussion • CBNet: A Novel Composite Backbone Network Architecture for Object Detection[10] 59 • CBNet: Multiple backbone을 조합 • COCO object detection state-of-the-art model (2020-04-09 기준) • COCO dataset에서 기존 ResNeXt 보다 높은 성능
  • 60. References [1] https://commons.wikimedia.org/wiki/File:Aerial_photograph_of_a_cargo_ship.jpg [2] Ding, J., Xue, N., Long, Y., Xia, G. S., & Lu, Q. (2019). Learning roi transformer for oriented object detection in aerial images. Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition, 2019-June, 2844–2853. https://doi.org/10.1109/CVPR.2019.00296 [3] Seyed Majid Azimi, Eleonora Vig, Reza Bahmanyar, Marco K¨orner, and Peter Reinartz. Towards multi- class object detection in unconstrained remote sensing imagery. arXiv:1807.02700, 2018 [4] Jianqi Ma, Weiyuan Shao, Hao Ye, Li Wang, Hong Wang, Yingbin Zheng, and Xiangyang Xue. Arbitrary- oriented scene text detection via rotation proposals. TMM, 2018. 4321, 4322, 4327, 4328 [5] Zenghui Zhang, Weiwei Guo, Shengnan Zhu, and Wenxian Yu. Toward arbitrary-oriented ship detection with rotated region proposal and discrimination networks. IEEE Geosci. Remote Sensing Lett., (99):1–5, 2018. 4322, 4326 [6] Xue Yang, Hao Sun, Kun Fu, Jirui Yang, Xian Sun, Menglong Yan, and Zhi Guo. Automatic ship detection in remotesensing images from google earth of complex scenes based on multiscale rotation dense feature pyramid networks. Re-mote Sensing, 10(1):132, 2018. 4322, 4327 [7]Khan, S., Hayat, M., Zamir, S. W., Shen, J., & Shao, L. (2019). Striking the right balance with uncertainty. Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition, 2019- June, 103–112. https://doi.org/10.1109/CVPR.2019.00019 60
  • 61. References [8] Yarin Gal. (2017). Uncertainty in Deep Learning. Phd Thesis, 1(1), 1–11. https://doi.org/10.1371/journal.pcbi.1005062 [9] Tan, M., Pang, R., & Le, Q. V. (2019). EfficientDet: Scalable and Efficient Object Detection. http://arxiv.org/abs/1911.09070 [10] Liu, Y., Wang, Y., Wang, S., Liang, T., Zhao, Q., Tang, Z., & Ling, H. (2019). CBNet: A Novel Composite Backbone Network Architecture for Object Detection. http://arxiv.org/abs/1909.03625 61