SlideShare a Scribd company logo
https://dacon.io
아리랑 위성영상 AI 객체 검출
경진대회
{green669, sbson0621, rnans33, karma1002, ohhs}@koreatech.ac.kr
DICE Lab
KOREATECH
DICE Lab
Deep Intelligence for Cognitive Environment (DICE) Lab
- School of Computer Science and Engineering, KOREATECH
- Focus on deep intelligence systems by understanding various
cognitive environments based on language and vision
technologies.
- https://www.dicelab.kr
- Looking for self-motivated graduate students!
2
목차
https://dacon.io 3
1 문제 정의
2 위성영상 도전 과제
3 접근 방법
4 모델
5 실험 결과
6 결론
문제 정의
4
https://dacon.io 5
1. 문제 정의
아리랑 위성영상에 내재된 다수의 객체를 신속, 정확하게 탐지 가능한 인공지능
알고리즘 개발
• Object Detection
• Classification
• Localization
• Horizontal bounding boxes
• Oriented bounding boxes
https://dacon.io 6
1. 문제 정의
Classification
Cat ( x, y, w, h )
Localization
Horizontal
bounding box
Object Detection
Classification + Localization(Horizontal bounding box)
https://dacon.io 7
1. 문제 정의
Classification Localization
Aerial Object Detection
Classification + Localization(Oriented bounding box)
Ship[1] ( x1, y1, x2, y2, x3, y3, x4, y4 )
Oriented
bounding box
https://dacon.io 8
1. 문제 정의
Classification Localization
Aerial Object Detection
Classification + Localization(Oriented bounding box)
Ship[1] ( x1, y1, x2, y2, x3, y3, x4, y4 )
Oriented
bounding box
Aerial Object Detection Task
위성영상 도전 과제
9
https://dacon.io 10
2. 위성영상 도전 과제
1. 데이터 수의 부족
2. 항공뷰의 특징
3. 데이터의 불균형
4. 데이터 레이블링 노이즈
https://dacon.io 11
2. 위성영상 도전 과제1
Dataset Classes Images
ILSVRC 2014 200 516,840
COCO2017 80 163,957
PASCAL VOC 2012 20 22,531
Aerial Data 15 1,200
<Aerial Data vs 일반 OD데이터 셋 비교>
데이터 수의 부족
https://dacon.io 12
2. 위성영상 도전 과제2
다양한 회전각도
모든 각도를 고려하기 어려움
물체의 밀집
밀집된 물체의 검출이 어려움
항공뷰의 특징
https://dacon.io 13
2. 위성영상 도전 과제3
<Aerial Data Class 별 객체 수 비교>
데이터의 개수 불균형
Class Images Ratio
Car 154,348 75.658 %
Truck 20,931 10.259 %
Small ship 13,533 6.633 %
Train 5,648 2.768 %
Bus 5,429 2.661 %
Oil tank 1,093 0.535 %
Military aircraft 1,031 0.505 %
Civilian aircraft 550 0.269 %
Large ship 348 0.170 %
Crane 315 0.154 %
Roundabout 219 0.107 %
Dam 184 0.090 %
Helipad 155 0.075 %
Bridge 136 0.066 %
Athletic field 87 0.042 %
https://dacon.io 14
2. 위성영상 도전 과제3
Class length height
Dam 259.96 241.30
Athletic field 241.14 257.71
Bridge 173.66 158.53
Large ship 102.95 117.03
Roundabout 98.00 95.06
Crane 73.14 60.51
Civilian aircraft 58.27 58.61
Oil tank 39.36 35.54
Military aircraft 33.77 32.39
Train 26.80 16.80
Helipad 21.70 17.77
Small ship 15.91 15.88
Bus 13.93 16.05
Truck 12.47 13.16
Car 6.96 7.27
<Aerial Data Class 별 크기 비교>
데이터의 크기 불균형
https://dacon.io 15
2. 위성영상 도전 과제4
자동차?
학습 데이터 예시(빨강은 실제 어노테이션, 초록은 사람이봐도 애매한 부분)
데이터 레이블링 노이즈
접근 방법
16
https://dacon.io 17
3. 접근 방법
• 데이터 수의 부족
 Multi-scale data augmentation - training step
• 항공뷰의 특징
 RoI Transformer
 𝐒 𝟐
A-Nets
 Ensemble
• 데이터의 불균형
 Class-dependent IoU thresholding
 Multi-scale augmentation - inference step
 Few shot learning
• 데이터 레이블링 노이즈
 heteroscedastic uncertainty를 활용한 노이즈 캔슬링
https://dacon.io 18
3. 접근 방법
• 데이터 수의 부족
 Multi-scale data augmentation - training step
• 항공뷰의 특징
 RoI Transformer
 𝐒 𝟐
A-Nets
 Ensemble
• 데이터의 불균형
 Class-dependent IoU thresholding
 Multi-scale augmentation - inference step
 Few shot learning
• 데이터 레이블링 노이즈
 Heteroscedastic uncertainty를 활용한 노이즈 캔슬링
https://dacon.io 19
3. 접근 방법 - Multi-scale data augmentation
• 학습데이터의 크기를 다양한 스케일로 학습[2]시키는 것
• 장점
• 다양한 크기의 object에 강건한 모델을 만들 수 있음
• Ours
• 이미지를 1.0배, 1.5배, 2배, 4배의 스케일로 생성
https://dacon.io 20
3. 접근 방법
• 데이터 수의 부족
 Multi-scale data augmentation - training step
• 항공뷰의 특징
 RoI Transformer
 𝐒 𝟐
A-Nets
 Ensemble
• 데이터의 불균형
 Class-dependent IoU thresholding
 Multi-scale augmentation - inference step
 Few shot learning
• 데이터 레이블링 노이즈
 Heteroscedastic uncertainty를 활용한 노이즈 캔슬링
https://dacon.io 21
3. 접근 방법 - RoI Transformer
• RoI transformer[3]
• Angle 자체를 추론함으로써 연산량을 극적으로 줄임
• anchor의 개수 = (num_scale * num_aspect_ratio * num_angles
 anchor의 개수 = (num_scale * num_aspect_ratio * 1)
• 표현 가능한 angle의 종류를 무한개로 늘림
• num_angles ∈ {
π
2
,
π
3
,
𝜋
4
, … ,
𝜋
𝑛
}, finite set
 num_angles ∈ 𝑅 , infinite set
https://dacon.io 22
3. 접근 방법 - 𝐒 𝟐
A-Nets
S2
A-Nets(Single-shot Alignment Network)[4]
• Feature Alignment Module(FAM)
 고품질 anchor를 생성하고, alignment convolution을 통해 anchor 위
치에 맞는 convolution을 수행함.
• Oriented Detection Module(ODM)
 Active Rotating Filters(ARF)를 사용해 방향 정보를 인코딩하여
orientation-sensitive feature를 제공함.
https://dacon.io 23
3. 접근 방법 - Ensemble
• Ensemble
• RoI Transformer 장점
• 2-stage 모델로 정확한 regression이 가능함.
• S2
A-Nets 장점
• Alignment covolution을 이용해 정확한 객체의 위치에 대한 연산이
가능한 모델로 classification성능이 우수함.
• RoI Transformer결과와 S2
A-Nets결과를 합하여 NMS를 해줌.
 RoI Transformer의 장점과 S2
A-Nets장점이 모두 드러난 앙상블 효과를 냄.
https://dacon.io 24
3. 접근 방법
• 데이터 수의 부족
 Multi-scale data augmentation - training step
• 항공뷰의 특징
 RoI Transformer
 𝐒 𝟐
A-Nets
 Ensemble
• 데이터의 불균형
 Class-dependent IoU thresholding
 Multi-scale augmentation - inference step
 Few shot learning
• 데이터 레이블링 노이즈
 Heteroscedastic uncertainty를 활용한 노이즈 캔슬링
https://dacon.io 25
3. 접근 방법 - Class-dependent IoU thresholding
개수가 많은 객체에 높은 threshold를 적용
Class Images Ratio Threshold
Car 154,348 75.658 % 0.75
Truck 20,931 10.259 % 0.26
Small ship 13,533 6.633 % 0.15
Train 5,648 2.768 % 0.01
Bus 5,429 2.661 % 0.15
Oil tank 1,093 0.535 % 0.01
Military aircraft 1,031 0.505 % 0.01
Civilian aircraft 550 0.269 % 0.01
Large ship 348 0.170 % 0.01
Crane 315 0.154 % 0.01
Roundabout 219 0.107 % 0.01
Dam 184 0.090 % 0.01
Helipad 155 0.075 % 0.01
Bridge 136 0.066 % 0.01
Athletic field 87 0.042 % 0.01
https://dacon.io 26
3. 접근 방법 - Multi-scale augmentation - inference step
Class length height
Dam 259.96 241.30
Athletic field 241.14 257.71
Bridge 173.66 158.53
Large ship 102.95 117.03
Roundabout 98.00 95.06
Crane 73.14 60.51
Civilian aircraft 58.27 58.61
Oil tank 39.36 35.54
Military aircraft 33.77 32.39
Train 26.80 16.80
Helipad 21.70 17.77
Small ship 15.91 15.88
Bus 13.93 16.05
Truck 12.47 13.16
Car 6.96 7.27
클래스별 객체의 크기 차이가 있기 때문에 Inference step에서 다양한
크기의 이미지를 보고 추론하도록 함
https://dacon.io 27
3. 접근 방법 – Few shot learning
개수가 적은 10개의 객체에 대하여 따로 학습을 진행함
Class Images Ratio
Car 154,348 75.658 %
Truck 20,931 10.259 %
Small ship 13,533 6.633 %
Train 5,648 2.768 %
Bus 5,429 2.661 %
Oil tank 1,093 0.535 %
Military aircraft 1,031 0.505 %
Civilian aircraft 550 0.269 %
Large ship 348 0.170 %
Crane 315 0.154 %
Roundabout 219 0.107 %
Dam 184 0.090 %
Helipad 155 0.075 %
Bridge 136 0.066 %
Athletic field 87 0.042 %
https://dacon.io 28
3. 접근 방법
• 데이터 수의 부족
 Multi-scale data augmentation - training step
• 항공뷰의 특징
 RoI Transformer
 𝐒 𝟐
A-Nets
 Ensemble
• 데이터의 불균형
 Class-dependent IoU thresholding
 Multi-scale augmentation - inference step
 Few shot learning
• 데이터 레이블링 노이즈
 Heteroscedastic uncertainty를 활용한 노이즈 캔슬링
https://dacon.io 29
3. 접근 방법 – 노이즈 캔슬링
p y|f 𝜔
x = N 𝑓 x; 𝜔 , 𝝉−𝟏
𝑰 𝑫
prediction f 𝜔
x 가 주어졌을 때
f 𝜔
x 에 가우시안 노이즈를 섞어서 최종적인 y값을 만들 수 있음
https://dacon.io 30
3. 접근 방법 – 노이즈 캔슬링
p y|f 𝜔
x = N 𝑓 x; 𝜔 , 𝝉−𝟏
𝑰 𝑫
f 𝜔
x 는 이상적으로 존재할 거라 믿는 값으로
실제값에서 노이즈를 덜어낸 값
https://dacon.io 31
3. 접근 방법 – 노이즈 캔슬링
p y|f 𝜔
x = N 𝑓 x; 𝜔 , 𝝉−𝟏
𝑰 𝑫
종래에는 𝝉−𝟏로 레이블링 데이터 자체의 노이즈에 대한 믿음을
사람이 하이퍼파라미터로 주었음
https://dacon.io 32
3. 접근 방법 – 노이즈 캔슬링
p y|f 𝜔
x = N 𝑓 x; 𝜔 , 𝝈 𝟐
(𝐱)
데이터로부터 노이즈를 학습시켜 노이즈 추론도 가능
https://dacon.io 33
3. 접근 방법 – 노이즈 캔슬링
p y|f 𝜔
x = N 𝑓 x; 𝜔 , 𝝉−𝟏
𝑰 𝑫 : homoscedastic uncertainty
p y|f 𝜔 x = N 𝑓 x; 𝜔 , 𝝈 𝟐(𝐱) : heteroscedastic uncertainty
기존에 homoscedastic(하이퍼파라미터 느낌)으로 주던 노이즈 캔
슬을 heteroscedastic(파라미터) 데이터별로 추론가능하게 줌[2]
https://dacon.io 34
3. 접근 방법 – 노이즈 캔슬링
p y|f 𝜔
x = N 𝑓 x; 𝜔 , 𝝉−𝟏
𝑰 𝑫 : homoscedastic uncertainty
p y|f 𝜔 x = N 𝑓 x; 𝜔 , 𝝈 𝟐(𝐱) : heteroscedastic uncertainty
노이즈 캔슬링노이즈 캔슬링된
output
모델
35
https://dacon.io 36
4. 전체 프로세스
I 𝑛
3x1024x1024
𝒇 𝒂𝒖𝒈 𝐼 𝑛
Multi-scale
Augmentation
patch 1
⋯patch 2
patch k
⋯
patch N
RoI Transformer
S2A-Nets
Box Regression
Classification
𝒇 𝒎𝒆𝒓𝒈𝒆(
[patch 1,
…
patch N])
Merge Output image
3x1024x1024
Ship
patch 1
⋯
patch 2
patch k
⋯
patch N
Ensemble
실험 결과
37
https://dacon.io 38
5. 실험 셋업
Train(RoI Transformer)
• Pretrained backbone model : ResNetXt[5]
• GPU : Tesla V100 8대
• Epochs : 7
• Optimzer : SGD
• Time : 2.5 days
Hyper-parameter Value
Learning rate 0.01
Learning rate decay 0.1
Weight decay 0.0001
Warm up iteration 500
Warm up ratio 1.0 / 3​
Milestones​ [6]​
Momentum 0.9
<Train parameter setting>
Train(S2aNet)
• Pretrained backbone model : ResNetXt[5]
• GPU : Tesla V100 8대
• Epochs : 3, 12
• Optimzer : SGD
• Time : 1 day
Hyper-parameter Value
Learning rate 0.01
Learning rate decay 0.1
Weight decay 0.0001
Warm up iteration 500
Warm up ratio 1.0 / 3​
Milestones​ [8,11]
Momentum 0.9
<Train parameter setting>
https://dacon.io 39
5. 실험 결과 - RoI Tranformer
Model Multi-scale training Multi-scale test
Pulblic
(mAP)
Resnet101 (700x700), (1024x1024) (700x700), (1024x1024) 0.4730
Resnext101 (700x700), (1024x1024) (700x700), (1024x1024) 0.5020
Resnext101 (700x700), (1024x1024) (600x600), (800x800), (1024x1024)
0.5350
(+0.0330)
Resnext101 (x1.0, x1.5, x2.0) (600x600), (800x800), (1024x1024), (2048x2048)
0.5543
(+0.0523)
Resnext101* (x1.0, x1.5, x2.0) (600x600), (800x800), (1024x1024), (2048x2048)
0.5701
(+0.0681)
Uncertainty
+ resnext101*
(x1.0, x1.5, x2.0) (600x600), (800x800), (1024x1024), (2048x2048)
0.5890
(+0.0870)
* : 클래스별 다른 threshold 적용
_ : Baseline
https://dacon.io 40
5. 실험 결과 - S2
A-Nets
Model Multi-scale training Multi-scale test
Pulblic
(mAP)
resnet50 (x1.0, x2.0, x4.0) (x0.5, x1.0, x2.0, x4.0)
0.527
(+0.0250)
resnet50* (x4.0, x4.0, x4.0) (x0.5, x1.0, x2.0, x4.0)
0.559
(+0.0570)
* : 클래스별 다른 threshold 적용
https://dacon.io 41
5. 실험 결과 - RoI Tranformer + S2
A-Nets (Ensemble)
모델명 Multi-scale training Multi-scale test
Pulblic
(mAP)
RoI Transformer
+ S2A-Net
RoI Transformer : (x1.0, x1.5, x2.0)
S2A-Net : (x1.0, x1.5, x2.0, x4.0)
RoI Transformer : ((600x600), (800x800),
(1024x1024), (2048x2048))
S2A-Net : (x0.5, x1.0, x2.0, x4.0)
0.6034
(+0.1014)
RoI Transformer*
+ S2A-Net*
RoI Transformer : (x1.0, x1.5, x2.0)
S2A-Net : (x1.0, x1.5, x2.0, x4.0)
RoI Transformer : ((600x600), (800x800),
(1024x1024), (2048x2048))
S2A-Net : (x0.5, x1.0, x2.0, x4.0)
0.6179
(+0.1159)
Uncertainty based
RoI Transformer*
+ S2A-Net*
RoI Transformer : (x1.0, x1.5, x2.0)
S2A-Net : (x1.0, x1.5, x2.0, x4.0)
RoI Transformer : ((600x600), (800x800),
(1024x1024), (2048x2048))
S2A-Net : (x0.5, x1.0, x2.0, x4.0)
0.6261
(+0.1241)
* : 클래스별 다른 threshold 적용
https://dacon.io 42
5. 실험 결과 - RoI Tranformer + S2
A-Nets (Ensemble)
모델명 Multi-scale training Multi-scale test
Pulblic
(mAP)
Uncertainty based
RoI Transformer* +
S2A-Net* +
Few_shot_S2A-Net*
RoI Transformer : (x1.0, x1.5, x2.0)
S2A-Net :
(x1.0, x1.5, x2.0, x4.0)
Few_shot_S2A-Net :
(x1.0, x1.5, x2.0, x4.0)
RoI Transformer : ((600x600), (800x800),
(1024x1024), (2048x2048))
S2A-Net :
(x0.5, x1.0, x2.0, x4.0)
Few_shot_S2A-Net :
(x0.5, x1.0, x2.0, x4.0)
0.6285
(+0.1265)
Uncertainty based
RoI Transformer* +
S2A-Net* +
Few_shot_S2A-
Net*
RoI Transformer : (x1.0, x1.5, x2.0)
S2A-Net :
(x1.0, x1.5, x2.0, x4.0)
Few_shot_S2A-Net :
(x1.0, x1.5, x2.0, x4.0)
RoI Transformer : ((500x500), (600x600),
(800x800), (1024x1024), (1200x1200),
(1536x1536), (2048x2048))
S2A-Net :
(x0.5, x1.0, x2.0, x4.0)
Few_shot_S2A-Net :
(x0.5, x1.0, x1.5, x2.0, x3.0, x4.0)
0.6438
(+0.1418)
* : 클래스별 다른 threshold 적용
https://dacon.io 43
5. 실험 결과 - RoI Tranformer + S2
A-Nets (Ensemble)
모델명 Multi-scale training Multi-scale test
Public
(mAP)
Private
(mAP)
Uncertainty based RoI
Transformer*
+ S2A-Net*
+ Few_shot_S2A-Net*
RoI Transformer :
(x1.0, x1.5, x2.0)
S2A-Net :
(x1.0, x1.5, x2.0, x4.0)
Few_shot_S2A-Net :
(x1.0, x1.5, x2.0, x4.0)
RoI Transformer :
((500x500), (600x600), (800x800), (1024x1024),
(1200x1200), (1536x1536), (2048x2048))
S2A-Net :
(x0.5, x1.0, x2.0, x4.0)
Few_shot_S2A-Net :
(x0.5, x1.0, x1.5, x2.0, x3.0, x4.0)
0.6438 0.6206
* : 클래스별 다른 threshold 적용
https://dacon.io 44
5. 실험 결과 분석 - ensemble 효과
RoI Transformer 결과 S2
A-Nets 결과
S2
A-Nets 에서는 helipad 부분을 잘 잡지만, RoI Transformer에서는 잘
잡지 못하는것을 볼 수 있음.
https://dacon.io 45
5. 실험 결과 분석 - ensemble 효과
RoI Transformer에서는 잘 잡지 못하던 helipad을 잘 잡게됨.
Ensemble(RoI Transformer + S2A-Nets) 결과
결론
46
https://dacon.io 47
6. 결론
• 데이터 수의 부족
 Multi-scale data augmentation - training step을 통해 해결했음.
• 항공뷰의 특징
 RoI Transformer, 𝐒 𝟐
A-Nets을 ensemble하여 해결했음.
• 데이터의 불균형
 Different class threshold을 통해 데이터 수 간의 불균형을 완화했음.
 Multi-scale augmentation – inference step을 통해 객체 크기
불균형을 완화했음.
 Few shot learning을 통해 데이터 수 간의 불균형을 완화했음.
• 데이터 레이블링 노이즈
 Heteroscedastic uncertainty를 활용한 노이즈 캔슬링을 통해 노이즈
레이블링 문제를 완화했음.
https://dacon.io 48
Reference
[1] https://commons.wikimedia.org/wiki/File:Aerial_photograph_of_a_cargo_ship.jpg
[2] J. C. Park, S. H. Lee, J. U. Jung, S. B. Son, H. S. Oh, Y. C. Jung, “Uncertainty-based Deep Object
Detection from Aerial Images”, Journal of Institute of Control, Robotics and Systems, (2020).
[3] J. Ding, N. Xue, Y. Long, G.-S. Xia, and Q. Lu, “Learning RoI transformer for oriented object
detection in aerial images,” Proceedings of the IEEE Conference on Computer Vision and Pattern
Recognition, pp. 2844-2853, (2019).
[4] Han, Jiaming, et al. "Align Deep Features for Oriented Object Detection." arXiv preprint
arXiv:2008.09397 (2020).
[5] 'open-mmlab://resnext101_64x4d'
THANK YOU
THANK YOU
https://dacon.io 49

More Related Content

What's hot

Yol ov2
Yol ov2Yol ov2
딥 러닝 자연어 처리를 학습을 위한 파워포인트. (Deep Learning for Natural Language Processing)
딥 러닝 자연어 처리를 학습을 위한 파워포인트. (Deep Learning for Natural Language Processing)딥 러닝 자연어 처리를 학습을 위한 파워포인트. (Deep Learning for Natural Language Processing)
딥 러닝 자연어 처리를 학습을 위한 파워포인트. (Deep Learning for Natural Language Processing)
WON JOON YOO
 
画像キャプションと動作認識の最前線 〜データセットに注目して〜(第17回ステアラボ人工知能セミナー)
画像キャプションと動作認識の最前線 〜データセットに注目して〜(第17回ステアラボ人工知能セミナー)画像キャプションと動作認識の最前線 〜データセットに注目して〜(第17回ステアラボ人工知能セミナー)
画像キャプションと動作認識の最前線 〜データセットに注目して〜(第17回ステアラボ人工知能セミナー)
STAIR Lab, Chiba Institute of Technology
 
[DL輪読会]YOLOv4: Optimal Speed and Accuracy of Object Detection
[DL輪読会]YOLOv4: Optimal Speed and Accuracy of Object Detection[DL輪読会]YOLOv4: Optimal Speed and Accuracy of Object Detection
[DL輪読会]YOLOv4: Optimal Speed and Accuracy of Object Detection
Deep Learning JP
 
개인화 추천은 어디로 가고 있는가?
개인화 추천은 어디로 가고 있는가?개인화 추천은 어디로 가고 있는가?
개인화 추천은 어디로 가고 있는가?
choi kyumin
 
Real-time Object Detection with YOLO v5, Hands-on-Lab
Real-time Object Detection with YOLO v5, Hands-on-LabReal-time Object Detection with YOLO v5, Hands-on-Lab
Real-time Object Detection with YOLO v5, Hands-on-Lab
JongHyunKim78
 
[DL輪読会]Hindsight Experience Replay
[DL輪読会]Hindsight Experience Replay[DL輪読会]Hindsight Experience Replay
[DL輪読会]Hindsight Experience Replay
Deep Learning JP
 
Time series classification
Time series classificationTime series classification
Time series classification
Sung Kim
 
You only look once
You only look onceYou only look once
You only look once
Gin Kyeng Lee
 
PR-207: YOLOv3: An Incremental Improvement
PR-207: YOLOv3: An Incremental ImprovementPR-207: YOLOv3: An Incremental Improvement
PR-207: YOLOv3: An Incremental Improvement
Jinwon Lee
 
[DL輪読会]DropBlock: A regularization method for convolutional networks
[DL輪読会]DropBlock: A regularization method for convolutional networks[DL輪読会]DropBlock: A regularization method for convolutional networks
[DL輪読会]DropBlock: A regularization method for convolutional networks
Deep Learning JP
 
딥 러닝 자연어 처리 학습을 위한 PPT! (Deep Learning for Natural Language Processing)
딥 러닝 자연어 처리 학습을 위한 PPT! (Deep Learning for Natural Language Processing)딥 러닝 자연어 처리 학습을 위한 PPT! (Deep Learning for Natural Language Processing)
딥 러닝 자연어 처리 학습을 위한 PPT! (Deep Learning for Natural Language Processing)
WON JOON YOO
 
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Hands-on 팀] : 수어 번역을 통한 위험 상황 속 의사소통 시스템 구축
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Hands-on 팀] : 수어 번역을 통한 위험 상황 속 의사소통 시스템 구축제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Hands-on 팀] : 수어 번역을 통한 위험 상황 속 의사소통 시스템 구축
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Hands-on 팀] : 수어 번역을 통한 위험 상황 속 의사소통 시스템 구축
BOAZ Bigdata
 
Object Detection with Transformers
Object Detection with TransformersObject Detection with Transformers
Object Detection with Transformers
Databricks
 
Deformable Convolutional Network (2017)
Deformable Convolutional Network (2017)Deformable Convolutional Network (2017)
Deformable Convolutional Network (2017)
Terry Taewoong Um
 
YOLO v1
YOLO v1YOLO v1
YOLO v1
오 혜린
 
物体検出の歴史まとめ(1) 20180417
物体検出の歴史まとめ(1) 20180417物体検出の歴史まとめ(1) 20180417
物体検出の歴史まとめ(1) 20180417
Masakazu Shinoda
 
2020 08 05_dl_DETR
2020 08 05_dl_DETR2020 08 05_dl_DETR
2020 08 05_dl_DETR
harmonylab
 
오토인코더의 모든 것
오토인코더의 모든 것오토인코더의 모든 것
오토인코더의 모든 것
NAVER Engineering
 
1시간만에 GAN(Generative Adversarial Network) 완전 정복하기
1시간만에 GAN(Generative Adversarial Network) 완전 정복하기1시간만에 GAN(Generative Adversarial Network) 완전 정복하기
1시간만에 GAN(Generative Adversarial Network) 완전 정복하기
NAVER Engineering
 

What's hot (20)

Yol ov2
Yol ov2Yol ov2
Yol ov2
 
딥 러닝 자연어 처리를 학습을 위한 파워포인트. (Deep Learning for Natural Language Processing)
딥 러닝 자연어 처리를 학습을 위한 파워포인트. (Deep Learning for Natural Language Processing)딥 러닝 자연어 처리를 학습을 위한 파워포인트. (Deep Learning for Natural Language Processing)
딥 러닝 자연어 처리를 학습을 위한 파워포인트. (Deep Learning for Natural Language Processing)
 
画像キャプションと動作認識の最前線 〜データセットに注目して〜(第17回ステアラボ人工知能セミナー)
画像キャプションと動作認識の最前線 〜データセットに注目して〜(第17回ステアラボ人工知能セミナー)画像キャプションと動作認識の最前線 〜データセットに注目して〜(第17回ステアラボ人工知能セミナー)
画像キャプションと動作認識の最前線 〜データセットに注目して〜(第17回ステアラボ人工知能セミナー)
 
[DL輪読会]YOLOv4: Optimal Speed and Accuracy of Object Detection
[DL輪読会]YOLOv4: Optimal Speed and Accuracy of Object Detection[DL輪読会]YOLOv4: Optimal Speed and Accuracy of Object Detection
[DL輪読会]YOLOv4: Optimal Speed and Accuracy of Object Detection
 
개인화 추천은 어디로 가고 있는가?
개인화 추천은 어디로 가고 있는가?개인화 추천은 어디로 가고 있는가?
개인화 추천은 어디로 가고 있는가?
 
Real-time Object Detection with YOLO v5, Hands-on-Lab
Real-time Object Detection with YOLO v5, Hands-on-LabReal-time Object Detection with YOLO v5, Hands-on-Lab
Real-time Object Detection with YOLO v5, Hands-on-Lab
 
[DL輪読会]Hindsight Experience Replay
[DL輪読会]Hindsight Experience Replay[DL輪読会]Hindsight Experience Replay
[DL輪読会]Hindsight Experience Replay
 
Time series classification
Time series classificationTime series classification
Time series classification
 
You only look once
You only look onceYou only look once
You only look once
 
PR-207: YOLOv3: An Incremental Improvement
PR-207: YOLOv3: An Incremental ImprovementPR-207: YOLOv3: An Incremental Improvement
PR-207: YOLOv3: An Incremental Improvement
 
[DL輪読会]DropBlock: A regularization method for convolutional networks
[DL輪読会]DropBlock: A regularization method for convolutional networks[DL輪読会]DropBlock: A regularization method for convolutional networks
[DL輪読会]DropBlock: A regularization method for convolutional networks
 
딥 러닝 자연어 처리 학습을 위한 PPT! (Deep Learning for Natural Language Processing)
딥 러닝 자연어 처리 학습을 위한 PPT! (Deep Learning for Natural Language Processing)딥 러닝 자연어 처리 학습을 위한 PPT! (Deep Learning for Natural Language Processing)
딥 러닝 자연어 처리 학습을 위한 PPT! (Deep Learning for Natural Language Processing)
 
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Hands-on 팀] : 수어 번역을 통한 위험 상황 속 의사소통 시스템 구축
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Hands-on 팀] : 수어 번역을 통한 위험 상황 속 의사소통 시스템 구축제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Hands-on 팀] : 수어 번역을 통한 위험 상황 속 의사소통 시스템 구축
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Hands-on 팀] : 수어 번역을 통한 위험 상황 속 의사소통 시스템 구축
 
Object Detection with Transformers
Object Detection with TransformersObject Detection with Transformers
Object Detection with Transformers
 
Deformable Convolutional Network (2017)
Deformable Convolutional Network (2017)Deformable Convolutional Network (2017)
Deformable Convolutional Network (2017)
 
YOLO v1
YOLO v1YOLO v1
YOLO v1
 
物体検出の歴史まとめ(1) 20180417
物体検出の歴史まとめ(1) 20180417物体検出の歴史まとめ(1) 20180417
物体検出の歴史まとめ(1) 20180417
 
2020 08 05_dl_DETR
2020 08 05_dl_DETR2020 08 05_dl_DETR
2020 08 05_dl_DETR
 
오토인코더의 모든 것
오토인코더의 모든 것오토인코더의 모든 것
오토인코더의 모든 것
 
1시간만에 GAN(Generative Adversarial Network) 완전 정복하기
1시간만에 GAN(Generative Adversarial Network) 완전 정복하기1시간만에 GAN(Generative Adversarial Network) 완전 정복하기
1시간만에 GAN(Generative Adversarial Network) 완전 정복하기
 

Similar to 아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션

Revolutions The Appendix
Revolutions The AppendixRevolutions The Appendix
Revolutions The Appendix
Shunsaku Kudo
 
Richard Databoard
Richard DataboardRichard Databoard
Richard Databoard巍 陆
 
Silent Running Side E Appendix
Silent Running Side E AppendixSilent Running Side E Appendix
Silent Running Side E Appendix
Shunsaku Kudo
 
20090904 Future Web Camp2009
20090904 Future Web Camp200920090904 Future Web Camp2009
20090904 Future Web Camp2009
Seo Jinho
 
다양한 업무에 적합한 AWS의 스토리지 서비스 알아보기 – 김상현, AWS 솔루션즈 아키텍트:: AWS Builders Online Ser...
다양한 업무에 적합한 AWS의 스토리지 서비스 알아보기 – 김상현, AWS 솔루션즈 아키텍트:: AWS Builders Online Ser...다양한 업무에 적합한 AWS의 스토리지 서비스 알아보기 – 김상현, AWS 솔루션즈 아키텍트:: AWS Builders Online Ser...
다양한 업무에 적합한 AWS의 스토리지 서비스 알아보기 – 김상현, AWS 솔루션즈 아키텍트:: AWS Builders Online Ser...
Amazon Web Services Korea
 
Making Mobile Sites Faster
Making Mobile Sites FasterMaking Mobile Sites Faster
Making Mobile Sites Faster
Andy Davies
 
[Regional Scrum Gathering Tokyo 2021] Scrum with OODA loop
[Regional Scrum Gathering Tokyo 2021] Scrum with OODA loop[Regional Scrum Gathering Tokyo 2021] Scrum with OODA loop
[Regional Scrum Gathering Tokyo 2021] Scrum with OODA loop
Woohyeok Kim
 
Heap overflow
Heap overflowHeap overflow
Heap overflow
@x0mg
 
IPV9人类共同的理想/IPv9 - The common ideal for human being
IPV9人类共同的理想/IPv9 - The common ideal for human beingIPV9人类共同的理想/IPv9 - The common ideal for human being
IPV9人类共同的理想/IPv9 - The common ideal for human being
shizhao
 
Seize The Cloud
Seize The CloudSeize The Cloud
Seize The Cloud
Keiichi Daiba
 
Rongjun Mu Blog & Microblogging
Rongjun Mu Blog & MicrobloggingRongjun Mu Blog & Microblogging
Rongjun Mu Blog & MicrobloggingYuancheng Yang
 
20090418 イケテルRails勉強会 第2部Air編
20090418 イケテルRails勉強会 第2部Air編20090418 イケテルRails勉強会 第2部Air編
20090418 イケテルRails勉強会 第2部Air編
mochiko AsTech
 
Cloud era -『クラウド時代』マッシュアップ技術による地方からの世界発信
Cloud era -『クラウド時代』マッシュアップ技術による地方からの世界発信Cloud era -『クラウド時代』マッシュアップ技術による地方からの世界発信
Cloud era -『クラウド時代』マッシュアップ技術による地方からの世界発信
Yusuke Kawasaki
 
Making Mobile Sites Faster
Making Mobile Sites FasterMaking Mobile Sites Faster
Making Mobile Sites Faster
Andy Davies
 
GTALUG Presentation on CouchDB
GTALUG Presentation on CouchDBGTALUG Presentation on CouchDB
GTALUG Presentation on CouchDBMyles Braithwaite
 
HCI: Design Process
HCI: Design ProcessHCI: Design Process
HCI: Design Process
Charles (XXC) Chen
 
좌충우돌 디지털트윈 구축기
좌충우돌 디지털트윈 구축기좌충우돌 디지털트윈 구축기
좌충우돌 디지털트윈 구축기
SANGHEE SHIN
 
ZOZOTOWNのマルチクラウドへの挑戦と挫折、そして未来
ZOZOTOWNのマルチクラウドへの挑戦と挫折、そして未来ZOZOTOWNのマルチクラウドへの挑戦と挫折、そして未来
ZOZOTOWNのマルチクラウドへの挑戦と挫折、そして未来
Hiromasa Oka
 

Similar to 아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션 (20)

Revolutions The Appendix
Revolutions The AppendixRevolutions The Appendix
Revolutions The Appendix
 
Richard Databoard
Richard DataboardRichard Databoard
Richard Databoard
 
Silent Running Side E Appendix
Silent Running Side E AppendixSilent Running Side E Appendix
Silent Running Side E Appendix
 
Install Moodle
Install MoodleInstall Moodle
Install Moodle
 
20090904 Future Web Camp2009
20090904 Future Web Camp200920090904 Future Web Camp2009
20090904 Future Web Camp2009
 
다양한 업무에 적합한 AWS의 스토리지 서비스 알아보기 – 김상현, AWS 솔루션즈 아키텍트:: AWS Builders Online Ser...
다양한 업무에 적합한 AWS의 스토리지 서비스 알아보기 – 김상현, AWS 솔루션즈 아키텍트:: AWS Builders Online Ser...다양한 업무에 적합한 AWS의 스토리지 서비스 알아보기 – 김상현, AWS 솔루션즈 아키텍트:: AWS Builders Online Ser...
다양한 업무에 적합한 AWS의 스토리지 서비스 알아보기 – 김상현, AWS 솔루션즈 아키텍트:: AWS Builders Online Ser...
 
Making Mobile Sites Faster
Making Mobile Sites FasterMaking Mobile Sites Faster
Making Mobile Sites Faster
 
[Regional Scrum Gathering Tokyo 2021] Scrum with OODA loop
[Regional Scrum Gathering Tokyo 2021] Scrum with OODA loop[Regional Scrum Gathering Tokyo 2021] Scrum with OODA loop
[Regional Scrum Gathering Tokyo 2021] Scrum with OODA loop
 
Heap overflow
Heap overflowHeap overflow
Heap overflow
 
IPV9人类共同的理想/IPv9 - The common ideal for human being
IPV9人类共同的理想/IPv9 - The common ideal for human beingIPV9人类共同的理想/IPv9 - The common ideal for human being
IPV9人类共同的理想/IPv9 - The common ideal for human being
 
Seize The Cloud
Seize The CloudSeize The Cloud
Seize The Cloud
 
Rongjun Mu Blog & Microblogging
Rongjun Mu Blog & MicrobloggingRongjun Mu Blog & Microblogging
Rongjun Mu Blog & Microblogging
 
20090418 イケテルRails勉強会 第2部Air編
20090418 イケテルRails勉強会 第2部Air編20090418 イケテルRails勉強会 第2部Air編
20090418 イケテルRails勉強会 第2部Air編
 
Cloud era -『クラウド時代』マッシュアップ技術による地方からの世界発信
Cloud era -『クラウド時代』マッシュアップ技術による地方からの世界発信Cloud era -『クラウド時代』マッシュアップ技術による地方からの世界発信
Cloud era -『クラウド時代』マッシュアップ技術による地方からの世界発信
 
20081123-web2.0class
20081123-web2.0class20081123-web2.0class
20081123-web2.0class
 
Making Mobile Sites Faster
Making Mobile Sites FasterMaking Mobile Sites Faster
Making Mobile Sites Faster
 
GTALUG Presentation on CouchDB
GTALUG Presentation on CouchDBGTALUG Presentation on CouchDB
GTALUG Presentation on CouchDB
 
HCI: Design Process
HCI: Design ProcessHCI: Design Process
HCI: Design Process
 
좌충우돌 디지털트윈 구축기
좌충우돌 디지털트윈 구축기좌충우돌 디지털트윈 구축기
좌충우돌 디지털트윈 구축기
 
ZOZOTOWNのマルチクラウドへの挑戦と挫折、そして未来
ZOZOTOWNのマルチクラウドへの挑戦と挫折、そして未来ZOZOTOWNのマルチクラウドへの挑戦と挫折、そして未来
ZOZOTOWNのマルチクラウドへの挑戦と挫折、そして未来
 

More from DACON AI 데이콘

Introduction to e tapr for hai con -eng
Introduction to e tapr for hai con -engIntroduction to e tapr for hai con -eng
Introduction to e tapr for hai con -eng
DACON AI 데이콘
 
Introduction to e tapr for hai con -kor
Introduction to e tapr for hai con -korIntroduction to e tapr for hai con -kor
Introduction to e tapr for hai con -kor
DACON AI 데이콘
 
20210728 대회주최 문의
20210728 대회주최 문의20210728 대회주최 문의
20210728 대회주최 문의
DACON AI 데이콘
 
데이콘 뽀개기
데이콘 뽀개기데이콘 뽀개기
데이콘 뽀개기
DACON AI 데이콘
 
Bittrader competition (1)
Bittrader competition (1)Bittrader competition (1)
Bittrader competition (1)
DACON AI 데이콘
 
Bittrader competition
Bittrader competitionBittrader competition
Bittrader competition
DACON AI 데이콘
 
Superbai
SuperbaiSuperbai
K-Fashion 경진대회 1등 수상자 솔루션
K-Fashion 경진대회 1등 수상자 솔루션K-Fashion 경진대회 1등 수상자 솔루션
K-Fashion 경진대회 1등 수상자 솔루션
DACON AI 데이콘
 
K-Fashion 경진대회 2등 수상자 솔루션
K-Fashion 경진대회 2등 수상자 솔루션K-Fashion 경진대회 2등 수상자 솔루션
K-Fashion 경진대회 2등 수상자 솔루션
DACON AI 데이콘
 
K-Fashion 경진대회 3등 수상자 솔루션
K-Fashion 경진대회 3등 수상자 솔루션K-Fashion 경진대회 3등 수상자 솔루션
K-Fashion 경진대회 3등 수상자 솔루션
DACON AI 데이콘
 
진동데이터 활용 충돌체 탐지 AI 경진대회 2등
진동데이터 활용 충돌체 탐지 AI 경진대회 2등진동데이터 활용 충돌체 탐지 AI 경진대회 2등
진동데이터 활용 충돌체 탐지 AI 경진대회 2등
DACON AI 데이콘
 
진동데이터 활용 충돌체 탐지 AI 경진대회 1등
진동데이터 활용 충돌체 탐지 AI 경진대회 1등진동데이터 활용 충돌체 탐지 AI 경진대회 1등
진동데이터 활용 충돌체 탐지 AI 경진대회 1등
DACON AI 데이콘
 
20200923
2020092320200923
포스트 코로나 데이터 시각화 경진대회 - 대상
포스트 코로나 데이터 시각화 경진대회 - 대상포스트 코로나 데이터 시각화 경진대회 - 대상
포스트 코로나 데이터 시각화 경진대회 - 대상
DACON AI 데이콘
 
포스트 코로나 데이터 시각화 경진대회 - 최우수상
포스트 코로나 데이터 시각화 경진대회 - 최우수상포스트 코로나 데이터 시각화 경진대회 - 최우수상
포스트 코로나 데이터 시각화 경진대회 - 최우수상
DACON AI 데이콘
 
포스트 코로나 데이터 시각화 경진대회 - 우수상
포스트 코로나 데이터 시각화 경진대회 - 우수상포스트 코로나 데이터 시각화 경진대회 - 우수상
포스트 코로나 데이터 시각화 경진대회 - 우수상
DACON AI 데이콘
 
포스트 코로나 데이터 시각화 경진대회 - 장려상2
포스트 코로나 데이터 시각화 경진대회 - 장려상2포스트 코로나 데이터 시각화 경진대회 - 장려상2
포스트 코로나 데이터 시각화 경진대회 - 장려상2
DACON AI 데이콘
 
포스트 코로나 데이터 시각화 경진대회 - 장려상
포스트 코로나 데이터 시각화 경진대회 - 장려상포스트 코로나 데이터 시각화 경진대회 - 장려상
포스트 코로나 데이터 시각화 경진대회 - 장려상
DACON AI 데이콘
 
생체 광학 데이터 분석 AI 경진대회 10위 수상작
생체 광학 데이터 분석 AI 경진대회 10위 수상작생체 광학 데이터 분석 AI 경진대회 10위 수상작
생체 광학 데이터 분석 AI 경진대회 10위 수상작
DACON AI 데이콘
 
생체 광학 데이터 분석 AI 경진대회 9위 수상작
생체 광학 데이터 분석 AI 경진대회 9위 수상작생체 광학 데이터 분석 AI 경진대회 9위 수상작
생체 광학 데이터 분석 AI 경진대회 9위 수상작
DACON AI 데이콘
 

More from DACON AI 데이콘 (20)

Introduction to e tapr for hai con -eng
Introduction to e tapr for hai con -engIntroduction to e tapr for hai con -eng
Introduction to e tapr for hai con -eng
 
Introduction to e tapr for hai con -kor
Introduction to e tapr for hai con -korIntroduction to e tapr for hai con -kor
Introduction to e tapr for hai con -kor
 
20210728 대회주최 문의
20210728 대회주최 문의20210728 대회주최 문의
20210728 대회주최 문의
 
데이콘 뽀개기
데이콘 뽀개기데이콘 뽀개기
데이콘 뽀개기
 
Bittrader competition (1)
Bittrader competition (1)Bittrader competition (1)
Bittrader competition (1)
 
Bittrader competition
Bittrader competitionBittrader competition
Bittrader competition
 
Superbai
SuperbaiSuperbai
Superbai
 
K-Fashion 경진대회 1등 수상자 솔루션
K-Fashion 경진대회 1등 수상자 솔루션K-Fashion 경진대회 1등 수상자 솔루션
K-Fashion 경진대회 1등 수상자 솔루션
 
K-Fashion 경진대회 2등 수상자 솔루션
K-Fashion 경진대회 2등 수상자 솔루션K-Fashion 경진대회 2등 수상자 솔루션
K-Fashion 경진대회 2등 수상자 솔루션
 
K-Fashion 경진대회 3등 수상자 솔루션
K-Fashion 경진대회 3등 수상자 솔루션K-Fashion 경진대회 3등 수상자 솔루션
K-Fashion 경진대회 3등 수상자 솔루션
 
진동데이터 활용 충돌체 탐지 AI 경진대회 2등
진동데이터 활용 충돌체 탐지 AI 경진대회 2등진동데이터 활용 충돌체 탐지 AI 경진대회 2등
진동데이터 활용 충돌체 탐지 AI 경진대회 2등
 
진동데이터 활용 충돌체 탐지 AI 경진대회 1등
진동데이터 활용 충돌체 탐지 AI 경진대회 1등진동데이터 활용 충돌체 탐지 AI 경진대회 1등
진동데이터 활용 충돌체 탐지 AI 경진대회 1등
 
20200923
2020092320200923
20200923
 
포스트 코로나 데이터 시각화 경진대회 - 대상
포스트 코로나 데이터 시각화 경진대회 - 대상포스트 코로나 데이터 시각화 경진대회 - 대상
포스트 코로나 데이터 시각화 경진대회 - 대상
 
포스트 코로나 데이터 시각화 경진대회 - 최우수상
포스트 코로나 데이터 시각화 경진대회 - 최우수상포스트 코로나 데이터 시각화 경진대회 - 최우수상
포스트 코로나 데이터 시각화 경진대회 - 최우수상
 
포스트 코로나 데이터 시각화 경진대회 - 우수상
포스트 코로나 데이터 시각화 경진대회 - 우수상포스트 코로나 데이터 시각화 경진대회 - 우수상
포스트 코로나 데이터 시각화 경진대회 - 우수상
 
포스트 코로나 데이터 시각화 경진대회 - 장려상2
포스트 코로나 데이터 시각화 경진대회 - 장려상2포스트 코로나 데이터 시각화 경진대회 - 장려상2
포스트 코로나 데이터 시각화 경진대회 - 장려상2
 
포스트 코로나 데이터 시각화 경진대회 - 장려상
포스트 코로나 데이터 시각화 경진대회 - 장려상포스트 코로나 데이터 시각화 경진대회 - 장려상
포스트 코로나 데이터 시각화 경진대회 - 장려상
 
생체 광학 데이터 분석 AI 경진대회 10위 수상작
생체 광학 데이터 분석 AI 경진대회 10위 수상작생체 광학 데이터 분석 AI 경진대회 10위 수상작
생체 광학 데이터 분석 AI 경진대회 10위 수상작
 
생체 광학 데이터 분석 AI 경진대회 9위 수상작
생체 광학 데이터 분석 AI 경진대회 9위 수상작생체 광학 데이터 분석 AI 경진대회 9위 수상작
생체 광학 데이터 분석 AI 경진대회 9위 수상작
 

Recently uploaded

Epistemic Interaction - tuning interfaces to provide information for AI support
Epistemic Interaction - tuning interfaces to provide information for AI supportEpistemic Interaction - tuning interfaces to provide information for AI support
Epistemic Interaction - tuning interfaces to provide information for AI support
Alan Dix
 
From Siloed Products to Connected Ecosystem: Building a Sustainable and Scala...
From Siloed Products to Connected Ecosystem: Building a Sustainable and Scala...From Siloed Products to Connected Ecosystem: Building a Sustainable and Scala...
From Siloed Products to Connected Ecosystem: Building a Sustainable and Scala...
Product School
 
When stars align: studies in data quality, knowledge graphs, and machine lear...
When stars align: studies in data quality, knowledge graphs, and machine lear...When stars align: studies in data quality, knowledge graphs, and machine lear...
When stars align: studies in data quality, knowledge graphs, and machine lear...
Elena Simperl
 
To Graph or Not to Graph Knowledge Graph Architectures and LLMs
To Graph or Not to Graph Knowledge Graph Architectures and LLMsTo Graph or Not to Graph Knowledge Graph Architectures and LLMs
To Graph or Not to Graph Knowledge Graph Architectures and LLMs
Paul Groth
 
GenAISummit 2024 May 28 Sri Ambati Keynote: AGI Belongs to The Community in O...
GenAISummit 2024 May 28 Sri Ambati Keynote: AGI Belongs to The Community in O...GenAISummit 2024 May 28 Sri Ambati Keynote: AGI Belongs to The Community in O...
GenAISummit 2024 May 28 Sri Ambati Keynote: AGI Belongs to The Community in O...
Sri Ambati
 
How world-class product teams are winning in the AI era by CEO and Founder, P...
How world-class product teams are winning in the AI era by CEO and Founder, P...How world-class product teams are winning in the AI era by CEO and Founder, P...
How world-class product teams are winning in the AI era by CEO and Founder, P...
Product School
 
LF Energy Webinar: Electrical Grid Modelling and Simulation Through PowSyBl -...
LF Energy Webinar: Electrical Grid Modelling and Simulation Through PowSyBl -...LF Energy Webinar: Electrical Grid Modelling and Simulation Through PowSyBl -...
LF Energy Webinar: Electrical Grid Modelling and Simulation Through PowSyBl -...
DanBrown980551
 
FIDO Alliance Osaka Seminar: The WebAuthn API and Discoverable Credentials.pdf
FIDO Alliance Osaka Seminar: The WebAuthn API and Discoverable Credentials.pdfFIDO Alliance Osaka Seminar: The WebAuthn API and Discoverable Credentials.pdf
FIDO Alliance Osaka Seminar: The WebAuthn API and Discoverable Credentials.pdf
FIDO Alliance
 
De-mystifying Zero to One: Design Informed Techniques for Greenfield Innovati...
De-mystifying Zero to One: Design Informed Techniques for Greenfield Innovati...De-mystifying Zero to One: Design Informed Techniques for Greenfield Innovati...
De-mystifying Zero to One: Design Informed Techniques for Greenfield Innovati...
Product School
 
Essentials of Automations: Optimizing FME Workflows with Parameters
Essentials of Automations: Optimizing FME Workflows with ParametersEssentials of Automations: Optimizing FME Workflows with Parameters
Essentials of Automations: Optimizing FME Workflows with Parameters
Safe Software
 
Knowledge engineering: from people to machines and back
Knowledge engineering: from people to machines and backKnowledge engineering: from people to machines and back
Knowledge engineering: from people to machines and back
Elena Simperl
 
PCI PIN Basics Webinar from the Controlcase Team
PCI PIN Basics Webinar from the Controlcase TeamPCI PIN Basics Webinar from the Controlcase Team
PCI PIN Basics Webinar from the Controlcase Team
ControlCase
 
Slack (or Teams) Automation for Bonterra Impact Management (fka Social Soluti...
Slack (or Teams) Automation for Bonterra Impact Management (fka Social Soluti...Slack (or Teams) Automation for Bonterra Impact Management (fka Social Soluti...
Slack (or Teams) Automation for Bonterra Impact Management (fka Social Soluti...
Jeffrey Haguewood
 
The Future of Platform Engineering
The Future of Platform EngineeringThe Future of Platform Engineering
The Future of Platform Engineering
Jemma Hussein Allen
 
DevOps and Testing slides at DASA Connect
DevOps and Testing slides at DASA ConnectDevOps and Testing slides at DASA Connect
DevOps and Testing slides at DASA Connect
Kari Kakkonen
 
GraphRAG is All You need? LLM & Knowledge Graph
GraphRAG is All You need? LLM & Knowledge GraphGraphRAG is All You need? LLM & Knowledge Graph
GraphRAG is All You need? LLM & Knowledge Graph
Guy Korland
 
UiPath Test Automation using UiPath Test Suite series, part 3
UiPath Test Automation using UiPath Test Suite series, part 3UiPath Test Automation using UiPath Test Suite series, part 3
UiPath Test Automation using UiPath Test Suite series, part 3
DianaGray10
 
Monitoring Java Application Security with JDK Tools and JFR Events
Monitoring Java Application Security with JDK Tools and JFR EventsMonitoring Java Application Security with JDK Tools and JFR Events
Monitoring Java Application Security with JDK Tools and JFR Events
Ana-Maria Mihalceanu
 
Generating a custom Ruby SDK for your web service or Rails API using Smithy
Generating a custom Ruby SDK for your web service or Rails API using SmithyGenerating a custom Ruby SDK for your web service or Rails API using Smithy
Generating a custom Ruby SDK for your web service or Rails API using Smithy
g2nightmarescribd
 
Connector Corner: Automate dynamic content and events by pushing a button
Connector Corner: Automate dynamic content and events by pushing a buttonConnector Corner: Automate dynamic content and events by pushing a button
Connector Corner: Automate dynamic content and events by pushing a button
DianaGray10
 

Recently uploaded (20)

Epistemic Interaction - tuning interfaces to provide information for AI support
Epistemic Interaction - tuning interfaces to provide information for AI supportEpistemic Interaction - tuning interfaces to provide information for AI support
Epistemic Interaction - tuning interfaces to provide information for AI support
 
From Siloed Products to Connected Ecosystem: Building a Sustainable and Scala...
From Siloed Products to Connected Ecosystem: Building a Sustainable and Scala...From Siloed Products to Connected Ecosystem: Building a Sustainable and Scala...
From Siloed Products to Connected Ecosystem: Building a Sustainable and Scala...
 
When stars align: studies in data quality, knowledge graphs, and machine lear...
When stars align: studies in data quality, knowledge graphs, and machine lear...When stars align: studies in data quality, knowledge graphs, and machine lear...
When stars align: studies in data quality, knowledge graphs, and machine lear...
 
To Graph or Not to Graph Knowledge Graph Architectures and LLMs
To Graph or Not to Graph Knowledge Graph Architectures and LLMsTo Graph or Not to Graph Knowledge Graph Architectures and LLMs
To Graph or Not to Graph Knowledge Graph Architectures and LLMs
 
GenAISummit 2024 May 28 Sri Ambati Keynote: AGI Belongs to The Community in O...
GenAISummit 2024 May 28 Sri Ambati Keynote: AGI Belongs to The Community in O...GenAISummit 2024 May 28 Sri Ambati Keynote: AGI Belongs to The Community in O...
GenAISummit 2024 May 28 Sri Ambati Keynote: AGI Belongs to The Community in O...
 
How world-class product teams are winning in the AI era by CEO and Founder, P...
How world-class product teams are winning in the AI era by CEO and Founder, P...How world-class product teams are winning in the AI era by CEO and Founder, P...
How world-class product teams are winning in the AI era by CEO and Founder, P...
 
LF Energy Webinar: Electrical Grid Modelling and Simulation Through PowSyBl -...
LF Energy Webinar: Electrical Grid Modelling and Simulation Through PowSyBl -...LF Energy Webinar: Electrical Grid Modelling and Simulation Through PowSyBl -...
LF Energy Webinar: Electrical Grid Modelling and Simulation Through PowSyBl -...
 
FIDO Alliance Osaka Seminar: The WebAuthn API and Discoverable Credentials.pdf
FIDO Alliance Osaka Seminar: The WebAuthn API and Discoverable Credentials.pdfFIDO Alliance Osaka Seminar: The WebAuthn API and Discoverable Credentials.pdf
FIDO Alliance Osaka Seminar: The WebAuthn API and Discoverable Credentials.pdf
 
De-mystifying Zero to One: Design Informed Techniques for Greenfield Innovati...
De-mystifying Zero to One: Design Informed Techniques for Greenfield Innovati...De-mystifying Zero to One: Design Informed Techniques for Greenfield Innovati...
De-mystifying Zero to One: Design Informed Techniques for Greenfield Innovati...
 
Essentials of Automations: Optimizing FME Workflows with Parameters
Essentials of Automations: Optimizing FME Workflows with ParametersEssentials of Automations: Optimizing FME Workflows with Parameters
Essentials of Automations: Optimizing FME Workflows with Parameters
 
Knowledge engineering: from people to machines and back
Knowledge engineering: from people to machines and backKnowledge engineering: from people to machines and back
Knowledge engineering: from people to machines and back
 
PCI PIN Basics Webinar from the Controlcase Team
PCI PIN Basics Webinar from the Controlcase TeamPCI PIN Basics Webinar from the Controlcase Team
PCI PIN Basics Webinar from the Controlcase Team
 
Slack (or Teams) Automation for Bonterra Impact Management (fka Social Soluti...
Slack (or Teams) Automation for Bonterra Impact Management (fka Social Soluti...Slack (or Teams) Automation for Bonterra Impact Management (fka Social Soluti...
Slack (or Teams) Automation for Bonterra Impact Management (fka Social Soluti...
 
The Future of Platform Engineering
The Future of Platform EngineeringThe Future of Platform Engineering
The Future of Platform Engineering
 
DevOps and Testing slides at DASA Connect
DevOps and Testing slides at DASA ConnectDevOps and Testing slides at DASA Connect
DevOps and Testing slides at DASA Connect
 
GraphRAG is All You need? LLM & Knowledge Graph
GraphRAG is All You need? LLM & Knowledge GraphGraphRAG is All You need? LLM & Knowledge Graph
GraphRAG is All You need? LLM & Knowledge Graph
 
UiPath Test Automation using UiPath Test Suite series, part 3
UiPath Test Automation using UiPath Test Suite series, part 3UiPath Test Automation using UiPath Test Suite series, part 3
UiPath Test Automation using UiPath Test Suite series, part 3
 
Monitoring Java Application Security with JDK Tools and JFR Events
Monitoring Java Application Security with JDK Tools and JFR EventsMonitoring Java Application Security with JDK Tools and JFR Events
Monitoring Java Application Security with JDK Tools and JFR Events
 
Generating a custom Ruby SDK for your web service or Rails API using Smithy
Generating a custom Ruby SDK for your web service or Rails API using SmithyGenerating a custom Ruby SDK for your web service or Rails API using Smithy
Generating a custom Ruby SDK for your web service or Rails API using Smithy
 
Connector Corner: Automate dynamic content and events by pushing a button
Connector Corner: Automate dynamic content and events by pushing a buttonConnector Corner: Automate dynamic content and events by pushing a button
Connector Corner: Automate dynamic content and events by pushing a button
 

아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션

  • 1. https://dacon.io 아리랑 위성영상 AI 객체 검출 경진대회 {green669, sbson0621, rnans33, karma1002, ohhs}@koreatech.ac.kr DICE Lab KOREATECH
  • 2. DICE Lab Deep Intelligence for Cognitive Environment (DICE) Lab - School of Computer Science and Engineering, KOREATECH - Focus on deep intelligence systems by understanding various cognitive environments based on language and vision technologies. - https://www.dicelab.kr - Looking for self-motivated graduate students! 2
  • 3. 목차 https://dacon.io 3 1 문제 정의 2 위성영상 도전 과제 3 접근 방법 4 모델 5 실험 결과 6 결론
  • 5. https://dacon.io 5 1. 문제 정의 아리랑 위성영상에 내재된 다수의 객체를 신속, 정확하게 탐지 가능한 인공지능 알고리즘 개발 • Object Detection • Classification • Localization • Horizontal bounding boxes • Oriented bounding boxes
  • 6. https://dacon.io 6 1. 문제 정의 Classification Cat ( x, y, w, h ) Localization Horizontal bounding box Object Detection Classification + Localization(Horizontal bounding box)
  • 7. https://dacon.io 7 1. 문제 정의 Classification Localization Aerial Object Detection Classification + Localization(Oriented bounding box) Ship[1] ( x1, y1, x2, y2, x3, y3, x4, y4 ) Oriented bounding box
  • 8. https://dacon.io 8 1. 문제 정의 Classification Localization Aerial Object Detection Classification + Localization(Oriented bounding box) Ship[1] ( x1, y1, x2, y2, x3, y3, x4, y4 ) Oriented bounding box Aerial Object Detection Task
  • 10. https://dacon.io 10 2. 위성영상 도전 과제 1. 데이터 수의 부족 2. 항공뷰의 특징 3. 데이터의 불균형 4. 데이터 레이블링 노이즈
  • 11. https://dacon.io 11 2. 위성영상 도전 과제1 Dataset Classes Images ILSVRC 2014 200 516,840 COCO2017 80 163,957 PASCAL VOC 2012 20 22,531 Aerial Data 15 1,200 <Aerial Data vs 일반 OD데이터 셋 비교> 데이터 수의 부족
  • 12. https://dacon.io 12 2. 위성영상 도전 과제2 다양한 회전각도 모든 각도를 고려하기 어려움 물체의 밀집 밀집된 물체의 검출이 어려움 항공뷰의 특징
  • 13. https://dacon.io 13 2. 위성영상 도전 과제3 <Aerial Data Class 별 객체 수 비교> 데이터의 개수 불균형 Class Images Ratio Car 154,348 75.658 % Truck 20,931 10.259 % Small ship 13,533 6.633 % Train 5,648 2.768 % Bus 5,429 2.661 % Oil tank 1,093 0.535 % Military aircraft 1,031 0.505 % Civilian aircraft 550 0.269 % Large ship 348 0.170 % Crane 315 0.154 % Roundabout 219 0.107 % Dam 184 0.090 % Helipad 155 0.075 % Bridge 136 0.066 % Athletic field 87 0.042 %
  • 14. https://dacon.io 14 2. 위성영상 도전 과제3 Class length height Dam 259.96 241.30 Athletic field 241.14 257.71 Bridge 173.66 158.53 Large ship 102.95 117.03 Roundabout 98.00 95.06 Crane 73.14 60.51 Civilian aircraft 58.27 58.61 Oil tank 39.36 35.54 Military aircraft 33.77 32.39 Train 26.80 16.80 Helipad 21.70 17.77 Small ship 15.91 15.88 Bus 13.93 16.05 Truck 12.47 13.16 Car 6.96 7.27 <Aerial Data Class 별 크기 비교> 데이터의 크기 불균형
  • 15. https://dacon.io 15 2. 위성영상 도전 과제4 자동차? 학습 데이터 예시(빨강은 실제 어노테이션, 초록은 사람이봐도 애매한 부분) 데이터 레이블링 노이즈
  • 17. https://dacon.io 17 3. 접근 방법 • 데이터 수의 부족  Multi-scale data augmentation - training step • 항공뷰의 특징  RoI Transformer  𝐒 𝟐 A-Nets  Ensemble • 데이터의 불균형  Class-dependent IoU thresholding  Multi-scale augmentation - inference step  Few shot learning • 데이터 레이블링 노이즈  heteroscedastic uncertainty를 활용한 노이즈 캔슬링
  • 18. https://dacon.io 18 3. 접근 방법 • 데이터 수의 부족  Multi-scale data augmentation - training step • 항공뷰의 특징  RoI Transformer  𝐒 𝟐 A-Nets  Ensemble • 데이터의 불균형  Class-dependent IoU thresholding  Multi-scale augmentation - inference step  Few shot learning • 데이터 레이블링 노이즈  Heteroscedastic uncertainty를 활용한 노이즈 캔슬링
  • 19. https://dacon.io 19 3. 접근 방법 - Multi-scale data augmentation • 학습데이터의 크기를 다양한 스케일로 학습[2]시키는 것 • 장점 • 다양한 크기의 object에 강건한 모델을 만들 수 있음 • Ours • 이미지를 1.0배, 1.5배, 2배, 4배의 스케일로 생성
  • 20. https://dacon.io 20 3. 접근 방법 • 데이터 수의 부족  Multi-scale data augmentation - training step • 항공뷰의 특징  RoI Transformer  𝐒 𝟐 A-Nets  Ensemble • 데이터의 불균형  Class-dependent IoU thresholding  Multi-scale augmentation - inference step  Few shot learning • 데이터 레이블링 노이즈  Heteroscedastic uncertainty를 활용한 노이즈 캔슬링
  • 21. https://dacon.io 21 3. 접근 방법 - RoI Transformer • RoI transformer[3] • Angle 자체를 추론함으로써 연산량을 극적으로 줄임 • anchor의 개수 = (num_scale * num_aspect_ratio * num_angles  anchor의 개수 = (num_scale * num_aspect_ratio * 1) • 표현 가능한 angle의 종류를 무한개로 늘림 • num_angles ∈ { π 2 , π 3 , 𝜋 4 , … , 𝜋 𝑛 }, finite set  num_angles ∈ 𝑅 , infinite set
  • 22. https://dacon.io 22 3. 접근 방법 - 𝐒 𝟐 A-Nets S2 A-Nets(Single-shot Alignment Network)[4] • Feature Alignment Module(FAM)  고품질 anchor를 생성하고, alignment convolution을 통해 anchor 위 치에 맞는 convolution을 수행함. • Oriented Detection Module(ODM)  Active Rotating Filters(ARF)를 사용해 방향 정보를 인코딩하여 orientation-sensitive feature를 제공함.
  • 23. https://dacon.io 23 3. 접근 방법 - Ensemble • Ensemble • RoI Transformer 장점 • 2-stage 모델로 정확한 regression이 가능함. • S2 A-Nets 장점 • Alignment covolution을 이용해 정확한 객체의 위치에 대한 연산이 가능한 모델로 classification성능이 우수함. • RoI Transformer결과와 S2 A-Nets결과를 합하여 NMS를 해줌.  RoI Transformer의 장점과 S2 A-Nets장점이 모두 드러난 앙상블 효과를 냄.
  • 24. https://dacon.io 24 3. 접근 방법 • 데이터 수의 부족  Multi-scale data augmentation - training step • 항공뷰의 특징  RoI Transformer  𝐒 𝟐 A-Nets  Ensemble • 데이터의 불균형  Class-dependent IoU thresholding  Multi-scale augmentation - inference step  Few shot learning • 데이터 레이블링 노이즈  Heteroscedastic uncertainty를 활용한 노이즈 캔슬링
  • 25. https://dacon.io 25 3. 접근 방법 - Class-dependent IoU thresholding 개수가 많은 객체에 높은 threshold를 적용 Class Images Ratio Threshold Car 154,348 75.658 % 0.75 Truck 20,931 10.259 % 0.26 Small ship 13,533 6.633 % 0.15 Train 5,648 2.768 % 0.01 Bus 5,429 2.661 % 0.15 Oil tank 1,093 0.535 % 0.01 Military aircraft 1,031 0.505 % 0.01 Civilian aircraft 550 0.269 % 0.01 Large ship 348 0.170 % 0.01 Crane 315 0.154 % 0.01 Roundabout 219 0.107 % 0.01 Dam 184 0.090 % 0.01 Helipad 155 0.075 % 0.01 Bridge 136 0.066 % 0.01 Athletic field 87 0.042 % 0.01
  • 26. https://dacon.io 26 3. 접근 방법 - Multi-scale augmentation - inference step Class length height Dam 259.96 241.30 Athletic field 241.14 257.71 Bridge 173.66 158.53 Large ship 102.95 117.03 Roundabout 98.00 95.06 Crane 73.14 60.51 Civilian aircraft 58.27 58.61 Oil tank 39.36 35.54 Military aircraft 33.77 32.39 Train 26.80 16.80 Helipad 21.70 17.77 Small ship 15.91 15.88 Bus 13.93 16.05 Truck 12.47 13.16 Car 6.96 7.27 클래스별 객체의 크기 차이가 있기 때문에 Inference step에서 다양한 크기의 이미지를 보고 추론하도록 함
  • 27. https://dacon.io 27 3. 접근 방법 – Few shot learning 개수가 적은 10개의 객체에 대하여 따로 학습을 진행함 Class Images Ratio Car 154,348 75.658 % Truck 20,931 10.259 % Small ship 13,533 6.633 % Train 5,648 2.768 % Bus 5,429 2.661 % Oil tank 1,093 0.535 % Military aircraft 1,031 0.505 % Civilian aircraft 550 0.269 % Large ship 348 0.170 % Crane 315 0.154 % Roundabout 219 0.107 % Dam 184 0.090 % Helipad 155 0.075 % Bridge 136 0.066 % Athletic field 87 0.042 %
  • 28. https://dacon.io 28 3. 접근 방법 • 데이터 수의 부족  Multi-scale data augmentation - training step • 항공뷰의 특징  RoI Transformer  𝐒 𝟐 A-Nets  Ensemble • 데이터의 불균형  Class-dependent IoU thresholding  Multi-scale augmentation - inference step  Few shot learning • 데이터 레이블링 노이즈  Heteroscedastic uncertainty를 활용한 노이즈 캔슬링
  • 29. https://dacon.io 29 3. 접근 방법 – 노이즈 캔슬링 p y|f 𝜔 x = N 𝑓 x; 𝜔 , 𝝉−𝟏 𝑰 𝑫 prediction f 𝜔 x 가 주어졌을 때 f 𝜔 x 에 가우시안 노이즈를 섞어서 최종적인 y값을 만들 수 있음
  • 30. https://dacon.io 30 3. 접근 방법 – 노이즈 캔슬링 p y|f 𝜔 x = N 𝑓 x; 𝜔 , 𝝉−𝟏 𝑰 𝑫 f 𝜔 x 는 이상적으로 존재할 거라 믿는 값으로 실제값에서 노이즈를 덜어낸 값
  • 31. https://dacon.io 31 3. 접근 방법 – 노이즈 캔슬링 p y|f 𝜔 x = N 𝑓 x; 𝜔 , 𝝉−𝟏 𝑰 𝑫 종래에는 𝝉−𝟏로 레이블링 데이터 자체의 노이즈에 대한 믿음을 사람이 하이퍼파라미터로 주었음
  • 32. https://dacon.io 32 3. 접근 방법 – 노이즈 캔슬링 p y|f 𝜔 x = N 𝑓 x; 𝜔 , 𝝈 𝟐 (𝐱) 데이터로부터 노이즈를 학습시켜 노이즈 추론도 가능
  • 33. https://dacon.io 33 3. 접근 방법 – 노이즈 캔슬링 p y|f 𝜔 x = N 𝑓 x; 𝜔 , 𝝉−𝟏 𝑰 𝑫 : homoscedastic uncertainty p y|f 𝜔 x = N 𝑓 x; 𝜔 , 𝝈 𝟐(𝐱) : heteroscedastic uncertainty 기존에 homoscedastic(하이퍼파라미터 느낌)으로 주던 노이즈 캔 슬을 heteroscedastic(파라미터) 데이터별로 추론가능하게 줌[2]
  • 34. https://dacon.io 34 3. 접근 방법 – 노이즈 캔슬링 p y|f 𝜔 x = N 𝑓 x; 𝜔 , 𝝉−𝟏 𝑰 𝑫 : homoscedastic uncertainty p y|f 𝜔 x = N 𝑓 x; 𝜔 , 𝝈 𝟐(𝐱) : heteroscedastic uncertainty 노이즈 캔슬링노이즈 캔슬링된 output
  • 36. https://dacon.io 36 4. 전체 프로세스 I 𝑛 3x1024x1024 𝒇 𝒂𝒖𝒈 𝐼 𝑛 Multi-scale Augmentation patch 1 ⋯patch 2 patch k ⋯ patch N RoI Transformer S2A-Nets Box Regression Classification 𝒇 𝒎𝒆𝒓𝒈𝒆( [patch 1, … patch N]) Merge Output image 3x1024x1024 Ship patch 1 ⋯ patch 2 patch k ⋯ patch N Ensemble
  • 38. https://dacon.io 38 5. 실험 셋업 Train(RoI Transformer) • Pretrained backbone model : ResNetXt[5] • GPU : Tesla V100 8대 • Epochs : 7 • Optimzer : SGD • Time : 2.5 days Hyper-parameter Value Learning rate 0.01 Learning rate decay 0.1 Weight decay 0.0001 Warm up iteration 500 Warm up ratio 1.0 / 3​ Milestones​ [6]​ Momentum 0.9 <Train parameter setting> Train(S2aNet) • Pretrained backbone model : ResNetXt[5] • GPU : Tesla V100 8대 • Epochs : 3, 12 • Optimzer : SGD • Time : 1 day Hyper-parameter Value Learning rate 0.01 Learning rate decay 0.1 Weight decay 0.0001 Warm up iteration 500 Warm up ratio 1.0 / 3​ Milestones​ [8,11] Momentum 0.9 <Train parameter setting>
  • 39. https://dacon.io 39 5. 실험 결과 - RoI Tranformer Model Multi-scale training Multi-scale test Pulblic (mAP) Resnet101 (700x700), (1024x1024) (700x700), (1024x1024) 0.4730 Resnext101 (700x700), (1024x1024) (700x700), (1024x1024) 0.5020 Resnext101 (700x700), (1024x1024) (600x600), (800x800), (1024x1024) 0.5350 (+0.0330) Resnext101 (x1.0, x1.5, x2.0) (600x600), (800x800), (1024x1024), (2048x2048) 0.5543 (+0.0523) Resnext101* (x1.0, x1.5, x2.0) (600x600), (800x800), (1024x1024), (2048x2048) 0.5701 (+0.0681) Uncertainty + resnext101* (x1.0, x1.5, x2.0) (600x600), (800x800), (1024x1024), (2048x2048) 0.5890 (+0.0870) * : 클래스별 다른 threshold 적용 _ : Baseline
  • 40. https://dacon.io 40 5. 실험 결과 - S2 A-Nets Model Multi-scale training Multi-scale test Pulblic (mAP) resnet50 (x1.0, x2.0, x4.0) (x0.5, x1.0, x2.0, x4.0) 0.527 (+0.0250) resnet50* (x4.0, x4.0, x4.0) (x0.5, x1.0, x2.0, x4.0) 0.559 (+0.0570) * : 클래스별 다른 threshold 적용
  • 41. https://dacon.io 41 5. 실험 결과 - RoI Tranformer + S2 A-Nets (Ensemble) 모델명 Multi-scale training Multi-scale test Pulblic (mAP) RoI Transformer + S2A-Net RoI Transformer : (x1.0, x1.5, x2.0) S2A-Net : (x1.0, x1.5, x2.0, x4.0) RoI Transformer : ((600x600), (800x800), (1024x1024), (2048x2048)) S2A-Net : (x0.5, x1.0, x2.0, x4.0) 0.6034 (+0.1014) RoI Transformer* + S2A-Net* RoI Transformer : (x1.0, x1.5, x2.0) S2A-Net : (x1.0, x1.5, x2.0, x4.0) RoI Transformer : ((600x600), (800x800), (1024x1024), (2048x2048)) S2A-Net : (x0.5, x1.0, x2.0, x4.0) 0.6179 (+0.1159) Uncertainty based RoI Transformer* + S2A-Net* RoI Transformer : (x1.0, x1.5, x2.0) S2A-Net : (x1.0, x1.5, x2.0, x4.0) RoI Transformer : ((600x600), (800x800), (1024x1024), (2048x2048)) S2A-Net : (x0.5, x1.0, x2.0, x4.0) 0.6261 (+0.1241) * : 클래스별 다른 threshold 적용
  • 42. https://dacon.io 42 5. 실험 결과 - RoI Tranformer + S2 A-Nets (Ensemble) 모델명 Multi-scale training Multi-scale test Pulblic (mAP) Uncertainty based RoI Transformer* + S2A-Net* + Few_shot_S2A-Net* RoI Transformer : (x1.0, x1.5, x2.0) S2A-Net : (x1.0, x1.5, x2.0, x4.0) Few_shot_S2A-Net : (x1.0, x1.5, x2.0, x4.0) RoI Transformer : ((600x600), (800x800), (1024x1024), (2048x2048)) S2A-Net : (x0.5, x1.0, x2.0, x4.0) Few_shot_S2A-Net : (x0.5, x1.0, x2.0, x4.0) 0.6285 (+0.1265) Uncertainty based RoI Transformer* + S2A-Net* + Few_shot_S2A- Net* RoI Transformer : (x1.0, x1.5, x2.0) S2A-Net : (x1.0, x1.5, x2.0, x4.0) Few_shot_S2A-Net : (x1.0, x1.5, x2.0, x4.0) RoI Transformer : ((500x500), (600x600), (800x800), (1024x1024), (1200x1200), (1536x1536), (2048x2048)) S2A-Net : (x0.5, x1.0, x2.0, x4.0) Few_shot_S2A-Net : (x0.5, x1.0, x1.5, x2.0, x3.0, x4.0) 0.6438 (+0.1418) * : 클래스별 다른 threshold 적용
  • 43. https://dacon.io 43 5. 실험 결과 - RoI Tranformer + S2 A-Nets (Ensemble) 모델명 Multi-scale training Multi-scale test Public (mAP) Private (mAP) Uncertainty based RoI Transformer* + S2A-Net* + Few_shot_S2A-Net* RoI Transformer : (x1.0, x1.5, x2.0) S2A-Net : (x1.0, x1.5, x2.0, x4.0) Few_shot_S2A-Net : (x1.0, x1.5, x2.0, x4.0) RoI Transformer : ((500x500), (600x600), (800x800), (1024x1024), (1200x1200), (1536x1536), (2048x2048)) S2A-Net : (x0.5, x1.0, x2.0, x4.0) Few_shot_S2A-Net : (x0.5, x1.0, x1.5, x2.0, x3.0, x4.0) 0.6438 0.6206 * : 클래스별 다른 threshold 적용
  • 44. https://dacon.io 44 5. 실험 결과 분석 - ensemble 효과 RoI Transformer 결과 S2 A-Nets 결과 S2 A-Nets 에서는 helipad 부분을 잘 잡지만, RoI Transformer에서는 잘 잡지 못하는것을 볼 수 있음.
  • 45. https://dacon.io 45 5. 실험 결과 분석 - ensemble 효과 RoI Transformer에서는 잘 잡지 못하던 helipad을 잘 잡게됨. Ensemble(RoI Transformer + S2A-Nets) 결과
  • 47. https://dacon.io 47 6. 결론 • 데이터 수의 부족  Multi-scale data augmentation - training step을 통해 해결했음. • 항공뷰의 특징  RoI Transformer, 𝐒 𝟐 A-Nets을 ensemble하여 해결했음. • 데이터의 불균형  Different class threshold을 통해 데이터 수 간의 불균형을 완화했음.  Multi-scale augmentation – inference step을 통해 객체 크기 불균형을 완화했음.  Few shot learning을 통해 데이터 수 간의 불균형을 완화했음. • 데이터 레이블링 노이즈  Heteroscedastic uncertainty를 활용한 노이즈 캔슬링을 통해 노이즈 레이블링 문제를 완화했음.
  • 48. https://dacon.io 48 Reference [1] https://commons.wikimedia.org/wiki/File:Aerial_photograph_of_a_cargo_ship.jpg [2] J. C. Park, S. H. Lee, J. U. Jung, S. B. Son, H. S. Oh, Y. C. Jung, “Uncertainty-based Deep Object Detection from Aerial Images”, Journal of Institute of Control, Robotics and Systems, (2020). [3] J. Ding, N. Xue, Y. Long, G.-S. Xia, and Q. Lu, “Learning RoI transformer for oriented object detection in aerial images,” Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pp. 2844-2853, (2019). [4] Han, Jiaming, et al. "Align Deep Features for Oriented Object Detection." arXiv preprint arXiv:2008.09397 (2020). [5] 'open-mmlab://resnext101_64x4d'