진동데이터 활용 충돌체 탐지 AI 경진대회 2등

https://dacon.io
진동데이터 활용 충돌체 탐지
AI 경진대회
데이터 잘 모르는 사람

목차
1
2
3
STEP 1
STEP 2
STEP 3
https://dacon.io 2
EDA
모델 구축 & 검증
결과 및 결언
데이터 전처리
모델링
결과 및 결언
• Feature
• Modeling
• 후기
• Split
• Feature
Engineering

https://dacon.io 3
1. EDA
1. 반사파 추측
2. 표준화
3. Agg Feature
4. 속도 피쳐

https://dacon.io 4
1. EDA
1. 반사파 추측
2. 표준화
• 반사파를 추적하기 위해 다양한 방법을 사용하였지만, 유의미한 방법은 없었고,
일정 시간 뒤의 부분(200이후)을 제거하는 것이 가장 효율적이었습니다.
(실험 : Kalman Filter, clipping, 300이후 제거, 150이후 제거 etc…)
• 변수를 추가하면서 기존의 S1~S4와 스케일이 크게 차이가 나서 취해주었습니다.

https://dacon.io 5
1. EDA
3. Agg Feature
4. 속도 피쳐
• 특정 구간별로(30, 50) mean, std, var, max, min 등의 통계량으로 집계하여 변수로
사용했습니다.
• 각 센서를 누적합과 절대값을 이용하여 속도를 만들었습니다.

https://dacon.io 6
2. 모델링
1. CNN model(유용균 박사님 모델)
2. Wavenet
3. Pseudo Labeling
4. Post Process

https://dacon.io 7
2. 모델링
1. CNN Model
• 주신 모델을 그대로 사용하였습니다.
2. Wavenet
• 초기에 진행하던 모델로 Kaggle의 Ion Switching 에서 수상한 모델입니다.
• 시뮬레이션 데이터란 점과 sequential한 데이터라는 점에서 채택한 모델입니다.
• 자세한 사항은 https://www.kaggle.com/mobassir/understanding-ion-switching-with-modeling
위의 링크를 가시면 볼 수 있습니다.
3. 앙상블
• CNN + Model 을 진행했습니다.(5대 5)

https://dacon.io 8
2. 모델링
4. Pseudo Labeling(CNN Model)
• Test의 분포를 넣어주고자 시도하였습니다.
• Test를 5분할하여 Kfold(K=5)로 모델링을 진행할 때, 각 폴드당 Test data를 넣어 학습
했습니다.
• X와 Y, 좌표에 대해서만 진행했습니다.
Train Data Test Data
4. Post Process
• XY(-400, 400), M(25, 175), V(0.2, 1.0) 으로 맞춰주었습니다.

https://dacon.io 9
3. 결과 및 결언
• 너무 낮은 metrics로 인해서 검증이 힘들었던 대회라고 생각됩니다.
• Test 데이터의 Upper, Lower를 대회 종료 3일 전에 알았던 것이 아쉽습니다.
제가 제출한 값들을 보면, 대부분 M기준 21이상, V기준 0.15 이상 인 경우가 많았습니다.
• CNN 모델이 잘 되는 것을 알고, 좀더 깊은 모델들(Pretrained) 을 사용해 보려고 했으나,
Colab으로 진행했기 때문에 할 수 없었던 것이 아쉽습니다.
• 재밌는 대회를 열어주신 데이콘과, 박사님께 감사의 인사를 드립니다.

https://dacon.io 10
3. 결과 및 결언
41 - Time 피쳐 추가
40 - 190 스플릿
39 - 180 스플릿
38 - 225 스플릿
37 - 150 스플릿(220에폭)
36 - 150 스플릿(200에폭)
35 - 200 스플릿
34 - s5678 만듬(짝수index제거)
33 - s2 제거
32 - window 30추가
31 - window max-min
30 - var 제거
29 - median 추가
28 - 속력 123
27 - window 123
26 - post process(x,y : -400, 400)
25 - 플레처/배치사이즈=256
24 - rolling feature quantile 추가
23 - all 0 제거 후 364개 row로 맞춰줌. 최소값(최대 시간을 제외하는 방법)
22 - 속력 diff 추가
21 - mean feature 제거
20 - stat 10 제거
19 - 400에폭 도전
18 - speed ratio(변화량)추가
17 - 거리(변위X) 통게량 사용(거리변수 제거)
16 - 가속도(abs) = 가속력 으로 변환
15 - speed statistic(속력=abs(속도))
14 - s1,2,3,4 remove
13 - speed statistic(속도)
12 - distance
11 - speed feature
10 - lag X, lag stat only 10
9 - lag X, lag stat neg add
8 - lag stat add 30
7 - flip aug
6 - lag x
79이후로 앙상블 실험
78 - 8 : 8 : 2(origin, flie, wavenet)
77 - swa 추가
71 - 앙상블 (no pleatue, pleatu, wavent)
70 - 그냥 모든거 앙상블(가장좋은것들..)= 62 + (65 + (41+69))
69 - multistratified
68 - 200 스플릿 , 375 raw 앙상블
67 - 0 sum 변수
66 - cnn + wavenet(7:3 앙상블)
65 - cnn 10폴드
64 - xym pseudo labeling
63 - xymv pseudo labeling
62 - xy pseudo labeling
61 - 200이후 모델과 200이전 모델 앙상블
60 - 변위 다시추가...
59 - xy만 S round
58 - S round
57 - 모델 densenet512 로 좀 확장
56 - 텐폴드....
55 - v칼만 적용
54 - xym10폴드
53 - kalman fliter
52 - 300에폭...
51 - cnn best + wavenet
50 - kfold
49 - kfold
48 - cv안좋은 단일
47 - 적절한 조절
46 - -400, 400
45 - 적당한 점수(300에폭 overfit..?)
44 - cnn cv 로 변경
43 - cnn, wavenet 앙상블
42 - cnn 첫적용(fe..., 플레처... 적용)
41 - wavenet
1. 실험내용

THANK YOU
THANK YOU
https://dacon.io 11

진동데이터 활용 충돌체 탐지 AI 경진대회 2등

Recommended

Recommended

More Related Content

Similar to 진동데이터 활용 충돌체 탐지 AI 경진대회 2등

Similar to 진동데이터 활용 충돌체 탐지 AI 경진대회 2등 (20)

More from DACON AI 데이콘

More from DACON AI 데이콘 (20)

진동데이터 활용 충돌체 탐지 AI 경진대회 2등