SlideShare a Scribd company logo
1 of 16
Download to read offline
https://dacon.io/competitions/official/235608/overview/
월간 데이콘 5
생체 광학 데이터 분석
AI 경진대회
팀BOAZ_MKS
팀장문성민
팀원김태현,성민석
BOAZ_MKS
목차
STEP 1
STEP 2
STEP 3
2
1 특성 공학
특성 공학
• Null 처리
• Fourier Transform
• Lambert’s law
• Ratio Combination
• Scaling
2 모델링
3 결과 및 결언
모델링
• LightGBM
• Feature Selection
• Ensemble
결과 및 결언
BOAZ_MKS
특성 공학
(Feature Engineering)
BOAZ_MKS
- 보간법(interpolate)을 이용
- 보간법으로 채울 수 없는 데이터는 ffill로 채움
특성 공학 ­ Null 값 처리
BOAZ_MKS
- Fourier Transformation을 통하여
- Jamm의 글 참고
https://dacon.io/competitions/official/235608/codeshare/1130?page=
1&dtype=recent&ptype=pub
특성 공학 ­ Fourier Transformation
BOAZ_MKS
특성 공학 ­ Lambert’s Law
- 람베르트 법칙은 빛이 어떤 물체를 투과할 때, 빛의 반사, 회절, 굴절하면 빛의
세기가 변하는 사실을 바탕으로 유도된 법칙이다. 투과 전과 투과 후의 비에
자연로그를 취하면, 이는 물체의 두께에 비례한다.
- 광흡수에서 입사광의 강도 𝑰 𝟎와 투과광의 강도 𝑰의 비를 로그로 표시한 것이
흡수물질의 두께 d에 비례함을 표현한 법칙
log
𝑰 𝟎
𝑰
= 𝑎𝑑
BOAZ_MKS
- 앞서 Lambert 공식을 활용하여 생성한 흡수 계수에 대하여 Window를
Sliding시켜서 Feature 생성
- 650nm ~ 990nm 까지 모든 순서쌍에 대하여 적용함
특성 공학 ­ Ratio Combination
BOAZ_MKS
- 주어진 데이터의 모든 행에 대하여 Min-Max Scaling과 Standard Scaling를
이용하여 데이터를 scaling함
특성 공학 - Scaling
BOAZ_MKS
모델링
(Modeling)
BOAZ_MKS
모델링 - LightGBM
- LightGBM 2.2.3 버전 사용
- 각 target에 해당하는 4개의 모델을 생성
- 공통된 하이퍼파라미터
- boosting: dart
- learning_rate: 0.05
- max_depth: 10
- bagging_fraction: 0.8
- num_leaves: 128
- feature_fraction: 0.8
BOAZ_MKS
모델링 ­ Feature Selection
- 모델의 Validation Score를 저하시키는 feature 확인
- 해당되는 feature를 A/B 테스트를 통하여 직접 제거함
ca 모델을 위한 feature selection hbo2 모델을 위한 feature selection
BOAZ_MKS
모델링 ­ Define our models
E FA B C D
model 1 model 2
Scaling을 활용
Feature Selection 하지 않음
Scaling을 활용하지 않고
Feature Selection 활용
서로 다른 4가지
Random_state로 학습한 모델들
서로 다른 scaling 처리
BOAZ_MKS
모델링 ­ Ensemble
E FA B C D
model 1 model 2
𝑟𝑒𝑠𝑢𝑙𝑡" 𝑟𝑒𝑠𝑢𝑙𝑡#
𝐹𝑖𝑛𝑎𝑙 𝑟𝑒𝑠𝑢𝑙𝑡
0.7 0.3
BOAZ_MKS
결과 및 결언
(Result & Conclusion)
BOAZ_MKS
- 전처리에 대하여
- 보간법으로는 맨 처음 값을 못 채우는 현상이 발생
- 이를 채우기 위해 맨 처음에 first라는 이름으로 0 을 넣어 보간
- Features에 대하여
- src / dst 와 log10(src/dst) / rho
- Lambert 공식을 응용한 피처를 추가했을 때 성능이 가장 좋았음
- 전체 dst 와 src 의 합을 활용
- 스펙트럼에서 src의 비율, dst의 비율을 활용
- Rho를 활용한 피처를 많이 생성한 것도 성능 향상에 많은 도움이 됨
- Domain knowledge를 활용한 피처들이 성능이 좋았음
- 모델에 대하여
- XGBoost보단 LightGBM 모델의 성능이 더 좋았으며, GBDT 보다 DART에서 좋은 성능을 보였음
- 최대한 많은 경우를 앙상블 했으며 output이 0 미만으로 나온다면 0으로 반환
- Learning rate를 조절하여 학습한 것은 성능 향상에 도움이 안됨
- Max depth나 num_leave를 조절하여 학습한 것은 성능 향상에 도움이 안됨
- Random_state를 여러 개 활용하여 앙상블한 결과가 성능이 좋았음
15
결과 및 결언
BOAZ_MKS
감사합니다
16

More Related Content

What's hot

생체 광학 데이터 분석 AI 경진대회 1위 수상작
생체 광학 데이터 분석 AI 경진대회 1위 수상작생체 광학 데이터 분석 AI 경진대회 1위 수상작
생체 광학 데이터 분석 AI 경진대회 1위 수상작DACON AI 데이콘
 
천체 유형 분류 대회 1위 수상자 코드 설명
천체 유형 분류 대회 1위 수상자 코드 설명천체 유형 분류 대회 1위 수상자 코드 설명
천체 유형 분류 대회 1위 수상자 코드 설명DACON AI 데이콘
 
천체 유형 분류 대회 3위 수상자 코드 설명
천체 유형 분류 대회 3위 수상자 코드 설명천체 유형 분류 대회 3위 수상자 코드 설명
천체 유형 분류 대회 3위 수상자 코드 설명DACON AI 데이콘
 
천체 유형 분류 대회 2위 수상자 코드 설명
천체 유형 분류 대회 2위 수상자 코드 설명천체 유형 분류 대회 2위 수상자 코드 설명
천체 유형 분류 대회 2위 수상자 코드 설명DACON AI 데이콘
 
제주 퇴근시간 버스 승차 인원 예측 2등 수상작
제주 퇴근시간 버스 승차 인원 예측 2등 수상작제주 퇴근시간 버스 승차 인원 예측 2등 수상작
제주 퇴근시간 버스 승차 인원 예측 2등 수상작DACON AI 데이콘
 
원자력발전소 상태 판단 대회 2위 수상자 코드 설명
원자력발전소 상태 판단 대회 2위 수상자 코드 설명원자력발전소 상태 판단 대회 2위 수상자 코드 설명
원자력발전소 상태 판단 대회 2위 수상자 코드 설명DACON AI 데이콘
 
원자력발전소 상태 판단 대회 1위 수상자 코드 설명
원자력발전소 상태 판단 대회 1위 수상자 코드 설명원자력발전소 상태 판단 대회 1위 수상자 코드 설명
원자력발전소 상태 판단 대회 1위 수상자 코드 설명DACON AI 데이콘
 
Yolo v2 urop 발표자료
Yolo v2 urop 발표자료Yolo v2 urop 발표자료
Yolo v2 urop 발표자료DaeHeeKim31
 
PR-218: MFAS: Multimodal Fusion Architecture Search
PR-218: MFAS: Multimodal Fusion Architecture SearchPR-218: MFAS: Multimodal Fusion Architecture Search
PR-218: MFAS: Multimodal Fusion Architecture SearchSunghoon Joo
 
"Learning transferable architectures for scalable image recognition" Paper Re...
"Learning transferable architectures for scalable image recognition" Paper Re..."Learning transferable architectures for scalable image recognition" Paper Re...
"Learning transferable architectures for scalable image recognition" Paper Re...LEE HOSEONG
 
K-Fashion 경진대회 2등 수상자 솔루션
K-Fashion 경진대회 2등 수상자 솔루션K-Fashion 경진대회 2등 수상자 솔루션
K-Fashion 경진대회 2등 수상자 솔루션DACON AI 데이콘
 
Titanic kaggle competition
Titanic kaggle competitionTitanic kaggle competition
Titanic kaggle competitionjdo
 
PR-313 Training BatchNorm and Only BatchNorm: On the Expressive Power of Rand...
PR-313 Training BatchNorm and Only BatchNorm: On the Expressive Power of Rand...PR-313 Training BatchNorm and Only BatchNorm: On the Expressive Power of Rand...
PR-313 Training BatchNorm and Only BatchNorm: On the Expressive Power of Rand...Sunghoon Joo
 
K-Fashion 경진대회 1등 수상자 솔루션
K-Fashion 경진대회 1등 수상자 솔루션K-Fashion 경진대회 1등 수상자 솔루션
K-Fashion 경진대회 1등 수상자 솔루션DACON AI 데이콘
 
"From image level to pixel-level labeling with convolutional networks" Paper ...
"From image level to pixel-level labeling with convolutional networks" Paper ..."From image level to pixel-level labeling with convolutional networks" Paper ...
"From image level to pixel-level labeling with convolutional networks" Paper ...LEE HOSEONG
 

What's hot (15)

생체 광학 데이터 분석 AI 경진대회 1위 수상작
생체 광학 데이터 분석 AI 경진대회 1위 수상작생체 광학 데이터 분석 AI 경진대회 1위 수상작
생체 광학 데이터 분석 AI 경진대회 1위 수상작
 
천체 유형 분류 대회 1위 수상자 코드 설명
천체 유형 분류 대회 1위 수상자 코드 설명천체 유형 분류 대회 1위 수상자 코드 설명
천체 유형 분류 대회 1위 수상자 코드 설명
 
천체 유형 분류 대회 3위 수상자 코드 설명
천체 유형 분류 대회 3위 수상자 코드 설명천체 유형 분류 대회 3위 수상자 코드 설명
천체 유형 분류 대회 3위 수상자 코드 설명
 
천체 유형 분류 대회 2위 수상자 코드 설명
천체 유형 분류 대회 2위 수상자 코드 설명천체 유형 분류 대회 2위 수상자 코드 설명
천체 유형 분류 대회 2위 수상자 코드 설명
 
제주 퇴근시간 버스 승차 인원 예측 2등 수상작
제주 퇴근시간 버스 승차 인원 예측 2등 수상작제주 퇴근시간 버스 승차 인원 예측 2등 수상작
제주 퇴근시간 버스 승차 인원 예측 2등 수상작
 
원자력발전소 상태 판단 대회 2위 수상자 코드 설명
원자력발전소 상태 판단 대회 2위 수상자 코드 설명원자력발전소 상태 판단 대회 2위 수상자 코드 설명
원자력발전소 상태 판단 대회 2위 수상자 코드 설명
 
원자력발전소 상태 판단 대회 1위 수상자 코드 설명
원자력발전소 상태 판단 대회 1위 수상자 코드 설명원자력발전소 상태 판단 대회 1위 수상자 코드 설명
원자력발전소 상태 판단 대회 1위 수상자 코드 설명
 
Yolo v2 urop 발표자료
Yolo v2 urop 발표자료Yolo v2 urop 발표자료
Yolo v2 urop 발표자료
 
PR-218: MFAS: Multimodal Fusion Architecture Search
PR-218: MFAS: Multimodal Fusion Architecture SearchPR-218: MFAS: Multimodal Fusion Architecture Search
PR-218: MFAS: Multimodal Fusion Architecture Search
 
"Learning transferable architectures for scalable image recognition" Paper Re...
"Learning transferable architectures for scalable image recognition" Paper Re..."Learning transferable architectures for scalable image recognition" Paper Re...
"Learning transferable architectures for scalable image recognition" Paper Re...
 
K-Fashion 경진대회 2등 수상자 솔루션
K-Fashion 경진대회 2등 수상자 솔루션K-Fashion 경진대회 2등 수상자 솔루션
K-Fashion 경진대회 2등 수상자 솔루션
 
Titanic kaggle competition
Titanic kaggle competitionTitanic kaggle competition
Titanic kaggle competition
 
PR-313 Training BatchNorm and Only BatchNorm: On the Expressive Power of Rand...
PR-313 Training BatchNorm and Only BatchNorm: On the Expressive Power of Rand...PR-313 Training BatchNorm and Only BatchNorm: On the Expressive Power of Rand...
PR-313 Training BatchNorm and Only BatchNorm: On the Expressive Power of Rand...
 
K-Fashion 경진대회 1등 수상자 솔루션
K-Fashion 경진대회 1등 수상자 솔루션K-Fashion 경진대회 1등 수상자 솔루션
K-Fashion 경진대회 1등 수상자 솔루션
 
"From image level to pixel-level labeling with convolutional networks" Paper ...
"From image level to pixel-level labeling with convolutional networks" Paper ..."From image level to pixel-level labeling with convolutional networks" Paper ...
"From image level to pixel-level labeling with convolutional networks" Paper ...
 

Similar to 생체 광학 데이터 분석 AI 경진대회 7위 수상작

위성관측 데이터 활용 강수량 산출 AI 경진대회 1위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 1위 수상작위성관측 데이터 활용 강수량 산출 AI 경진대회 1위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 1위 수상작DACON AI 데이콘
 
한국어 문서 추출요약 AI 경진대회- 좌충우돌 후기
한국어 문서 추출요약 AI 경진대회- 좌충우돌 후기한국어 문서 추출요약 AI 경진대회- 좌충우돌 후기
한국어 문서 추출요약 AI 경진대회- 좌충우돌 후기Hangil Kim
 
Imagination-Augmented Agents for Deep Reinforcement Learning
Imagination-Augmented Agents for Deep Reinforcement LearningImagination-Augmented Agents for Deep Reinforcement Learning
Imagination-Augmented Agents for Deep Reinforcement Learning성재 최
 
권기훈_개인포트폴리오
권기훈_개인포트폴리오권기훈_개인포트폴리오
권기훈_개인포트폴리오Kihoon4
 
Pg day seoul 2016 session_02_v1.0_ff
Pg day seoul 2016 session_02_v1.0_ffPg day seoul 2016 session_02_v1.0_ff
Pg day seoul 2016 session_02_v1.0_ffPgDay.Seoul
 
Workshop 210417 dhlee
Workshop 210417 dhleeWorkshop 210417 dhlee
Workshop 210417 dhleeDongheon Lee
 
Io t에서의 소프트웨어단위테스트_접근사례
Io t에서의 소프트웨어단위테스트_접근사례Io t에서의 소프트웨어단위테스트_접근사례
Io t에서의 소프트웨어단위테스트_접근사례SangIn Choung
 
Android 성능 지표와 Oreo 의 개선사항
Android 성능 지표와  Oreo 의 개선사항 Android 성능 지표와  Oreo 의 개선사항
Android 성능 지표와 Oreo 의 개선사항 YoungSu Son
 
C'est la vie (hello bert!)
C'est la vie (hello bert!)C'est la vie (hello bert!)
C'est la vie (hello bert!)Junho Lee
 
Progressive Growing of GANs for Improved Quality, Stability, and Variation Re...
Progressive Growing of GANs for Improved Quality, Stability, and Variation Re...Progressive Growing of GANs for Improved Quality, Stability, and Variation Re...
Progressive Growing of GANs for Improved Quality, Stability, and Variation Re...태엽 김
 
Simple Review of Single Image Super Resolution Task
Simple Review of Single Image Super Resolution TaskSimple Review of Single Image Super Resolution Task
Simple Review of Single Image Super Resolution TaskMYEONGGYU LEE
 
11장 시스템
11장 시스템11장 시스템
11장 시스템kidoki
 
모바일 앱 성능 분석 방법 101 (Mobile Application Performance Analysis Methodology 101)
모바일 앱 성능 분석 방법 101 (Mobile Application Performance Analysis Methodology 101) 모바일 앱 성능 분석 방법 101 (Mobile Application Performance Analysis Methodology 101)
모바일 앱 성능 분석 방법 101 (Mobile Application Performance Analysis Methodology 101) YoungSu Son
 
네트워크 경량화 이모저모 @ 2020 DLD
네트워크 경량화 이모저모 @ 2020 DLD네트워크 경량화 이모저모 @ 2020 DLD
네트워크 경량화 이모저모 @ 2020 DLDKim Junghoon
 
[CVPR'22] Domain Generalization via Shuffled Style Assembly for Face Anti-Spo...
[CVPR'22] Domain Generalization via Shuffled Style Assembly for Face Anti-Spo...[CVPR'22] Domain Generalization via Shuffled Style Assembly for Face Anti-Spo...
[CVPR'22] Domain Generalization via Shuffled Style Assembly for Face Anti-Spo...KIMMINHA3
 
안드로이드 Oreo의 변화와 모바일 앱/플랫폼의 적합한 성능 측정 방법
안드로이드 Oreo의 변화와  모바일 앱/플랫폼의 적합한 성능 측정 방법안드로이드 Oreo의 변화와  모바일 앱/플랫폼의 적합한 성능 측정 방법
안드로이드 Oreo의 변화와 모바일 앱/플랫폼의 적합한 성능 측정 방법YoungSu Son
 
좌충우돌 ORM 개발기 2012 DAUM DEVON
좌충우돌 ORM 개발기 2012 DAUM DEVON좌충우돌 ORM 개발기 2012 DAUM DEVON
좌충우돌 ORM 개발기 2012 DAUM DEVONYounghan Kim
 
Denoising auto encoders(d a)
Denoising auto encoders(d a)Denoising auto encoders(d a)
Denoising auto encoders(d a)Tae Young Lee
 
Lightgbm_suman
Lightgbm_sumanLightgbm_suman
Lightgbm_sumansuman_lim
 
GPT-Series.pdf
GPT-Series.pdfGPT-Series.pdf
GPT-Series.pdfKyuri Kim
 

Similar to 생체 광학 데이터 분석 AI 경진대회 7위 수상작 (20)

위성관측 데이터 활용 강수량 산출 AI 경진대회 1위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 1위 수상작위성관측 데이터 활용 강수량 산출 AI 경진대회 1위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 1위 수상작
 
한국어 문서 추출요약 AI 경진대회- 좌충우돌 후기
한국어 문서 추출요약 AI 경진대회- 좌충우돌 후기한국어 문서 추출요약 AI 경진대회- 좌충우돌 후기
한국어 문서 추출요약 AI 경진대회- 좌충우돌 후기
 
Imagination-Augmented Agents for Deep Reinforcement Learning
Imagination-Augmented Agents for Deep Reinforcement LearningImagination-Augmented Agents for Deep Reinforcement Learning
Imagination-Augmented Agents for Deep Reinforcement Learning
 
권기훈_개인포트폴리오
권기훈_개인포트폴리오권기훈_개인포트폴리오
권기훈_개인포트폴리오
 
Pg day seoul 2016 session_02_v1.0_ff
Pg day seoul 2016 session_02_v1.0_ffPg day seoul 2016 session_02_v1.0_ff
Pg day seoul 2016 session_02_v1.0_ff
 
Workshop 210417 dhlee
Workshop 210417 dhleeWorkshop 210417 dhlee
Workshop 210417 dhlee
 
Io t에서의 소프트웨어단위테스트_접근사례
Io t에서의 소프트웨어단위테스트_접근사례Io t에서의 소프트웨어단위테스트_접근사례
Io t에서의 소프트웨어단위테스트_접근사례
 
Android 성능 지표와 Oreo 의 개선사항
Android 성능 지표와  Oreo 의 개선사항 Android 성능 지표와  Oreo 의 개선사항
Android 성능 지표와 Oreo 의 개선사항
 
C'est la vie (hello bert!)
C'est la vie (hello bert!)C'est la vie (hello bert!)
C'est la vie (hello bert!)
 
Progressive Growing of GANs for Improved Quality, Stability, and Variation Re...
Progressive Growing of GANs for Improved Quality, Stability, and Variation Re...Progressive Growing of GANs for Improved Quality, Stability, and Variation Re...
Progressive Growing of GANs for Improved Quality, Stability, and Variation Re...
 
Simple Review of Single Image Super Resolution Task
Simple Review of Single Image Super Resolution TaskSimple Review of Single Image Super Resolution Task
Simple Review of Single Image Super Resolution Task
 
11장 시스템
11장 시스템11장 시스템
11장 시스템
 
모바일 앱 성능 분석 방법 101 (Mobile Application Performance Analysis Methodology 101)
모바일 앱 성능 분석 방법 101 (Mobile Application Performance Analysis Methodology 101) 모바일 앱 성능 분석 방법 101 (Mobile Application Performance Analysis Methodology 101)
모바일 앱 성능 분석 방법 101 (Mobile Application Performance Analysis Methodology 101)
 
네트워크 경량화 이모저모 @ 2020 DLD
네트워크 경량화 이모저모 @ 2020 DLD네트워크 경량화 이모저모 @ 2020 DLD
네트워크 경량화 이모저모 @ 2020 DLD
 
[CVPR'22] Domain Generalization via Shuffled Style Assembly for Face Anti-Spo...
[CVPR'22] Domain Generalization via Shuffled Style Assembly for Face Anti-Spo...[CVPR'22] Domain Generalization via Shuffled Style Assembly for Face Anti-Spo...
[CVPR'22] Domain Generalization via Shuffled Style Assembly for Face Anti-Spo...
 
안드로이드 Oreo의 변화와 모바일 앱/플랫폼의 적합한 성능 측정 방법
안드로이드 Oreo의 변화와  모바일 앱/플랫폼의 적합한 성능 측정 방법안드로이드 Oreo의 변화와  모바일 앱/플랫폼의 적합한 성능 측정 방법
안드로이드 Oreo의 변화와 모바일 앱/플랫폼의 적합한 성능 측정 방법
 
좌충우돌 ORM 개발기 2012 DAUM DEVON
좌충우돌 ORM 개발기 2012 DAUM DEVON좌충우돌 ORM 개발기 2012 DAUM DEVON
좌충우돌 ORM 개발기 2012 DAUM DEVON
 
Denoising auto encoders(d a)
Denoising auto encoders(d a)Denoising auto encoders(d a)
Denoising auto encoders(d a)
 
Lightgbm_suman
Lightgbm_sumanLightgbm_suman
Lightgbm_suman
 
GPT-Series.pdf
GPT-Series.pdfGPT-Series.pdf
GPT-Series.pdf
 

More from DACON AI 데이콘

Introduction to e tapr for hai con -eng
Introduction to e tapr for hai con -engIntroduction to e tapr for hai con -eng
Introduction to e tapr for hai con -engDACON AI 데이콘
 
Introduction to e tapr for hai con -kor
Introduction to e tapr for hai con -korIntroduction to e tapr for hai con -kor
Introduction to e tapr for hai con -korDACON AI 데이콘
 
20210728 대회주최 문의
20210728 대회주최 문의20210728 대회주최 문의
20210728 대회주최 문의DACON AI 데이콘
 
K-Fashion 경진대회 3등 수상자 솔루션
K-Fashion 경진대회 3등 수상자 솔루션K-Fashion 경진대회 3등 수상자 솔루션
K-Fashion 경진대회 3등 수상자 솔루션DACON AI 데이콘
 
아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션DACON AI 데이콘
 
아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션DACON AI 데이콘
 
진동데이터 활용 충돌체 탐지 AI 경진대회 2등
진동데이터 활용 충돌체 탐지 AI 경진대회 2등진동데이터 활용 충돌체 탐지 AI 경진대회 2등
진동데이터 활용 충돌체 탐지 AI 경진대회 2등DACON AI 데이콘
 
진동데이터 활용 충돌체 탐지 AI 경진대회 1등
진동데이터 활용 충돌체 탐지 AI 경진대회 1등진동데이터 활용 충돌체 탐지 AI 경진대회 1등
진동데이터 활용 충돌체 탐지 AI 경진대회 1등DACON AI 데이콘
 
포스트 코로나 데이터 시각화 경진대회 - 대상
포스트 코로나 데이터 시각화 경진대회 - 대상포스트 코로나 데이터 시각화 경진대회 - 대상
포스트 코로나 데이터 시각화 경진대회 - 대상DACON AI 데이콘
 
포스트 코로나 데이터 시각화 경진대회 - 최우수상
포스트 코로나 데이터 시각화 경진대회 - 최우수상포스트 코로나 데이터 시각화 경진대회 - 최우수상
포스트 코로나 데이터 시각화 경진대회 - 최우수상DACON AI 데이콘
 
포스트 코로나 데이터 시각화 경진대회 - 우수상
포스트 코로나 데이터 시각화 경진대회 - 우수상포스트 코로나 데이터 시각화 경진대회 - 우수상
포스트 코로나 데이터 시각화 경진대회 - 우수상DACON AI 데이콘
 
포스트 코로나 데이터 시각화 경진대회 - 장려상2
포스트 코로나 데이터 시각화 경진대회 - 장려상2포스트 코로나 데이터 시각화 경진대회 - 장려상2
포스트 코로나 데이터 시각화 경진대회 - 장려상2DACON AI 데이콘
 
포스트 코로나 데이터 시각화 경진대회 - 장려상
포스트 코로나 데이터 시각화 경진대회 - 장려상포스트 코로나 데이터 시각화 경진대회 - 장려상
포스트 코로나 데이터 시각화 경진대회 - 장려상DACON AI 데이콘
 
생체 광학 데이터 분석 AI 경진대회 5위 수상작
생체 광학 데이터 분석 AI 경진대회 5위 수상작생체 광학 데이터 분석 AI 경진대회 5위 수상작
생체 광학 데이터 분석 AI 경진대회 5위 수상작DACON AI 데이콘
 

More from DACON AI 데이콘 (19)

Introduction to e tapr for hai con -eng
Introduction to e tapr for hai con -engIntroduction to e tapr for hai con -eng
Introduction to e tapr for hai con -eng
 
Introduction to e tapr for hai con -kor
Introduction to e tapr for hai con -korIntroduction to e tapr for hai con -kor
Introduction to e tapr for hai con -kor
 
20210728 대회주최 문의
20210728 대회주최 문의20210728 대회주최 문의
20210728 대회주최 문의
 
데이콘 뽀개기
데이콘 뽀개기데이콘 뽀개기
데이콘 뽀개기
 
Bittrader competition (1)
Bittrader competition (1)Bittrader competition (1)
Bittrader competition (1)
 
Bittrader competition
Bittrader competitionBittrader competition
Bittrader competition
 
Superbai
SuperbaiSuperbai
Superbai
 
K-Fashion 경진대회 3등 수상자 솔루션
K-Fashion 경진대회 3등 수상자 솔루션K-Fashion 경진대회 3등 수상자 솔루션
K-Fashion 경진대회 3등 수상자 솔루션
 
아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션
 
아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션
 
진동데이터 활용 충돌체 탐지 AI 경진대회 2등
진동데이터 활용 충돌체 탐지 AI 경진대회 2등진동데이터 활용 충돌체 탐지 AI 경진대회 2등
진동데이터 활용 충돌체 탐지 AI 경진대회 2등
 
진동데이터 활용 충돌체 탐지 AI 경진대회 1등
진동데이터 활용 충돌체 탐지 AI 경진대회 1등진동데이터 활용 충돌체 탐지 AI 경진대회 1등
진동데이터 활용 충돌체 탐지 AI 경진대회 1등
 
20200923
2020092320200923
20200923
 
포스트 코로나 데이터 시각화 경진대회 - 대상
포스트 코로나 데이터 시각화 경진대회 - 대상포스트 코로나 데이터 시각화 경진대회 - 대상
포스트 코로나 데이터 시각화 경진대회 - 대상
 
포스트 코로나 데이터 시각화 경진대회 - 최우수상
포스트 코로나 데이터 시각화 경진대회 - 최우수상포스트 코로나 데이터 시각화 경진대회 - 최우수상
포스트 코로나 데이터 시각화 경진대회 - 최우수상
 
포스트 코로나 데이터 시각화 경진대회 - 우수상
포스트 코로나 데이터 시각화 경진대회 - 우수상포스트 코로나 데이터 시각화 경진대회 - 우수상
포스트 코로나 데이터 시각화 경진대회 - 우수상
 
포스트 코로나 데이터 시각화 경진대회 - 장려상2
포스트 코로나 데이터 시각화 경진대회 - 장려상2포스트 코로나 데이터 시각화 경진대회 - 장려상2
포스트 코로나 데이터 시각화 경진대회 - 장려상2
 
포스트 코로나 데이터 시각화 경진대회 - 장려상
포스트 코로나 데이터 시각화 경진대회 - 장려상포스트 코로나 데이터 시각화 경진대회 - 장려상
포스트 코로나 데이터 시각화 경진대회 - 장려상
 
생체 광학 데이터 분석 AI 경진대회 5위 수상작
생체 광학 데이터 분석 AI 경진대회 5위 수상작생체 광학 데이터 분석 AI 경진대회 5위 수상작
생체 광학 데이터 분석 AI 경진대회 5위 수상작
 

생체 광학 데이터 분석 AI 경진대회 7위 수상작

  • 1. https://dacon.io/competitions/official/235608/overview/ 월간 데이콘 5 생체 광학 데이터 분석 AI 경진대회 팀BOAZ_MKS 팀장문성민 팀원김태현,성민석
  • 2. BOAZ_MKS 목차 STEP 1 STEP 2 STEP 3 2 1 특성 공학 특성 공학 • Null 처리 • Fourier Transform • Lambert’s law • Ratio Combination • Scaling 2 모델링 3 결과 및 결언 모델링 • LightGBM • Feature Selection • Ensemble 결과 및 결언
  • 4. BOAZ_MKS - 보간법(interpolate)을 이용 - 보간법으로 채울 수 없는 데이터는 ffill로 채움 특성 공학 ­ Null 값 처리
  • 5. BOAZ_MKS - Fourier Transformation을 통하여 - Jamm의 글 참고 https://dacon.io/competitions/official/235608/codeshare/1130?page= 1&dtype=recent&ptype=pub 특성 공학 ­ Fourier Transformation
  • 6. BOAZ_MKS 특성 공학 ­ Lambert’s Law - 람베르트 법칙은 빛이 어떤 물체를 투과할 때, 빛의 반사, 회절, 굴절하면 빛의 세기가 변하는 사실을 바탕으로 유도된 법칙이다. 투과 전과 투과 후의 비에 자연로그를 취하면, 이는 물체의 두께에 비례한다. - 광흡수에서 입사광의 강도 𝑰 𝟎와 투과광의 강도 𝑰의 비를 로그로 표시한 것이 흡수물질의 두께 d에 비례함을 표현한 법칙 log 𝑰 𝟎 𝑰 = 𝑎𝑑
  • 7. BOAZ_MKS - 앞서 Lambert 공식을 활용하여 생성한 흡수 계수에 대하여 Window를 Sliding시켜서 Feature 생성 - 650nm ~ 990nm 까지 모든 순서쌍에 대하여 적용함 특성 공학 ­ Ratio Combination
  • 8. BOAZ_MKS - 주어진 데이터의 모든 행에 대하여 Min-Max Scaling과 Standard Scaling를 이용하여 데이터를 scaling함 특성 공학 - Scaling
  • 10. BOAZ_MKS 모델링 - LightGBM - LightGBM 2.2.3 버전 사용 - 각 target에 해당하는 4개의 모델을 생성 - 공통된 하이퍼파라미터 - boosting: dart - learning_rate: 0.05 - max_depth: 10 - bagging_fraction: 0.8 - num_leaves: 128 - feature_fraction: 0.8
  • 11. BOAZ_MKS 모델링 ­ Feature Selection - 모델의 Validation Score를 저하시키는 feature 확인 - 해당되는 feature를 A/B 테스트를 통하여 직접 제거함 ca 모델을 위한 feature selection hbo2 모델을 위한 feature selection
  • 12. BOAZ_MKS 모델링 ­ Define our models E FA B C D model 1 model 2 Scaling을 활용 Feature Selection 하지 않음 Scaling을 활용하지 않고 Feature Selection 활용 서로 다른 4가지 Random_state로 학습한 모델들 서로 다른 scaling 처리
  • 13. BOAZ_MKS 모델링 ­ Ensemble E FA B C D model 1 model 2 𝑟𝑒𝑠𝑢𝑙𝑡" 𝑟𝑒𝑠𝑢𝑙𝑡# 𝐹𝑖𝑛𝑎𝑙 𝑟𝑒𝑠𝑢𝑙𝑡 0.7 0.3
  • 15. BOAZ_MKS - 전처리에 대하여 - 보간법으로는 맨 처음 값을 못 채우는 현상이 발생 - 이를 채우기 위해 맨 처음에 first라는 이름으로 0 을 넣어 보간 - Features에 대하여 - src / dst 와 log10(src/dst) / rho - Lambert 공식을 응용한 피처를 추가했을 때 성능이 가장 좋았음 - 전체 dst 와 src 의 합을 활용 - 스펙트럼에서 src의 비율, dst의 비율을 활용 - Rho를 활용한 피처를 많이 생성한 것도 성능 향상에 많은 도움이 됨 - Domain knowledge를 활용한 피처들이 성능이 좋았음 - 모델에 대하여 - XGBoost보단 LightGBM 모델의 성능이 더 좋았으며, GBDT 보다 DART에서 좋은 성능을 보였음 - 최대한 많은 경우를 앙상블 했으며 output이 0 미만으로 나온다면 0으로 반환 - Learning rate를 조절하여 학습한 것은 성능 향상에 도움이 안됨 - Max depth나 num_leave를 조절하여 학습한 것은 성능 향상에 도움이 안됨 - Random_state를 여러 개 활용하여 앙상블한 결과가 성능이 좋았음 15 결과 및 결언