SlideShare a Scribd company logo
1 of 11
Download to read offline
https://dacon.io
Dacon 5회 생체광학 데이터
분석 AI 모델링 경진대회
초보
목차
1
2
3
STEP 1
STEP 2
STEP 3
https://dacon.io 2
Data Preprocessing
FE & FS & Model
Conclusion & Discussion
Data Preprocessing
Feature engineering
& Feature selection
& Model
Conclusion & Discussion
• Feature engineering
• Feature selection
• Model & evaluation
• Conclusion
• Discussion
• Rolling mean
• Binning
https://dacon.io 3
Background
Reference : https://www.pinterest.co.kr/pin/579416308282876234/
• 물질에따라 반응하는 에너지의 크기는 다르고 이 에너지의 크기는 파장에 반비례
• 반응한 만큼 빛은 흡수되고(산란..등 제외) 흡수된 빛은 물질의 흡광계수, 거리, 농도에 비례함
• 다양한 빛의 세기, 파장을 입사하여 농도 예측 가능
https://dacon.io 4
1. Data preprocessing
NA
• Dst 에서 20%로 일정하게 분포
• 다양한 결측치 삽입 및 활용을 시도 하였지만 그대로 두는게 제일 좋은 성능
https://dacon.io 5
1. Data preprocessing
1. Rolling mean
• Rolling mean을 통해 파장별로 생성되는 피쳐의 노이즈를 줄이는 효과
• Dst 피쳐에 NaN 값이 많은데 이를 rolling mean을 통해 NaN을 채우는 효과
• Window size = [3, 5]
• Src, dst rolling mean후 이후의 추가적인 피쳐엔지니어링 진행
Reference : https://towardsdatascience.com/machine-learning-part-19-time-series-and-
autoregressive-integrated-moving-average-model-arima-c1005347b0d7
https://dacon.io 6
1. Data preprocessing
2. Binning
• Binning을 통해 파장별로 생성되는 피쳐의 노이즈를 줄여주는 효과
• Binning size = [ 10, 20, 30, 40, 50, 100]
• Binning 후 이후의 추가적인 피쳐엔지니어링 진행
https://dacon.io 7
2-1. Feature engineering
1. dst/src
2. log(dst/src)
3. log(dst/src)/rho
4. Binning , Rolling 후에 1,2,3 피쳐 추가 생성
5. 3번으로 생성된 피쳐로 각 피크의 비율 및 차이 피쳐 추가 생성
( motivation : 근적외선 분광법을 이용한 폐플라스틱 분리선별기술개발, 최형기 )
6. y끼리의 상관관계를 나이브하게 비율로 고려하여 피쳐 생성 ex) 𝑦1 = 𝛼 ∗ 𝑦2
https://dacon.io 8
2-2. Feature selection
• 모델을 학습 시킨 후, 변수를 하나씩 값을 섞고 valid score확인 후 선택
• 5fold에서 모두 2번이상 bad_feaure로 선택시 삭제
1. Permutation test
https://dacon.io 9
2-3. Model & Evaluation
1. LightGBM
5fold, 3 seed ensemble
• 5fold로 cv를 통해 hyperparameter search(나이브하게 진행)
• dart 사용
• 3seed model
https://dacon.io 10
3. Conclusion & Discussion
Conclusion
• 투과도, 흡광도, rho를 나눈 농도와 비례하는 피쳐 생성
• 노이즈를 줄여주기 위해 binning, rolling 수행
• Dst의 NaN 값을 rolling mean으로 대체
• 파장별 log(dst/src)/rho 피크값들의 비율, 차이로 피쳐 생성
• y끼리의 상관관계 고려한 피쳐 생성
Discussion
• Dst에 NA가 많을 수록 validation set에서 성능잘 나오지 않음을 확인했고 채우
려 노력했지만 실패
• NN, knn, kmeans 등을 시도해봤지만 실패했고, NaN 때문에 성능을 뽑기 어렵
다고 생각했지만 1등 코드를 보고 배움
• y끼리의 상관관계를 다양하게 고려해줄 경우 성능 향상 예상
• Ca, Na 의 성능이 좋지 못한데, 흡수파장 영역이 dataset에 비해 낮기때문?
THANK YOU
THANK YOU
https://dacon.io 11

More Related Content

What's hot

생체 광학 데이터 분석 AI 경진대회 1위 수상작
생체 광학 데이터 분석 AI 경진대회 1위 수상작생체 광학 데이터 분석 AI 경진대회 1위 수상작
생체 광학 데이터 분석 AI 경진대회 1위 수상작DACON AI 데이콘
 
천체 유형 분류 대회 1위 수상자 코드 설명
천체 유형 분류 대회 1위 수상자 코드 설명천체 유형 분류 대회 1위 수상자 코드 설명
천체 유형 분류 대회 1위 수상자 코드 설명DACON AI 데이콘
 
천체 유형 분류 대회 3위 수상자 코드 설명
천체 유형 분류 대회 3위 수상자 코드 설명천체 유형 분류 대회 3위 수상자 코드 설명
천체 유형 분류 대회 3위 수상자 코드 설명DACON AI 데이콘
 
천체 유형 분류 대회 2위 수상자 코드 설명
천체 유형 분류 대회 2위 수상자 코드 설명천체 유형 분류 대회 2위 수상자 코드 설명
천체 유형 분류 대회 2위 수상자 코드 설명DACON AI 데이콘
 
Loss function discovery for object detection via convergence simulation drive...
Loss function discovery for object detection via convergence simulation drive...Loss function discovery for object detection via convergence simulation drive...
Loss function discovery for object detection via convergence simulation drive...taeseon ryu
 
Yolo v2 urop 발표자료
Yolo v2 urop 발표자료Yolo v2 urop 발표자료
Yolo v2 urop 발표자료DaeHeeKim31
 
"Learning transferable architectures for scalable image recognition" Paper Re...
"Learning transferable architectures for scalable image recognition" Paper Re..."Learning transferable architectures for scalable image recognition" Paper Re...
"Learning transferable architectures for scalable image recognition" Paper Re...LEE HOSEONG
 
제주 퇴근시간 버스 승차 인원 예측 2등 수상작
제주 퇴근시간 버스 승차 인원 예측 2등 수상작제주 퇴근시간 버스 승차 인원 예측 2등 수상작
제주 퇴근시간 버스 승차 인원 예측 2등 수상작DACON AI 데이콘
 
원자력발전소 상태 판단 대회 2위 수상자 코드 설명
원자력발전소 상태 판단 대회 2위 수상자 코드 설명원자력발전소 상태 판단 대회 2위 수상자 코드 설명
원자력발전소 상태 판단 대회 2위 수상자 코드 설명DACON AI 데이콘
 
원자력발전소 상태 판단 대회 1위 수상자 코드 설명
원자력발전소 상태 판단 대회 1위 수상자 코드 설명원자력발전소 상태 판단 대회 1위 수상자 코드 설명
원자력발전소 상태 판단 대회 1위 수상자 코드 설명DACON AI 데이콘
 
PR-218: MFAS: Multimodal Fusion Architecture Search
PR-218: MFAS: Multimodal Fusion Architecture SearchPR-218: MFAS: Multimodal Fusion Architecture Search
PR-218: MFAS: Multimodal Fusion Architecture SearchSunghoon Joo
 
PR-203: Class-Balanced Loss Based on Effective Number of Samples
PR-203: Class-Balanced Loss Based on Effective Number of SamplesPR-203: Class-Balanced Loss Based on Effective Number of Samples
PR-203: Class-Balanced Loss Based on Effective Number of SamplesSunghoon Joo
 
"From image level to pixel-level labeling with convolutional networks" Paper ...
"From image level to pixel-level labeling with convolutional networks" Paper ..."From image level to pixel-level labeling with convolutional networks" Paper ...
"From image level to pixel-level labeling with convolutional networks" Paper ...LEE HOSEONG
 
PR-313 Training BatchNorm and Only BatchNorm: On the Expressive Power of Rand...
PR-313 Training BatchNorm and Only BatchNorm: On the Expressive Power of Rand...PR-313 Training BatchNorm and Only BatchNorm: On the Expressive Power of Rand...
PR-313 Training BatchNorm and Only BatchNorm: On the Expressive Power of Rand...Sunghoon Joo
 
Yolo v1 urop 발표자료
Yolo v1 urop 발표자료Yolo v1 urop 발표자료
Yolo v1 urop 발표자료DaeHeeKim31
 
Titanic kaggle competition
Titanic kaggle competitionTitanic kaggle competition
Titanic kaggle competitionjdo
 

What's hot (16)

생체 광학 데이터 분석 AI 경진대회 1위 수상작
생체 광학 데이터 분석 AI 경진대회 1위 수상작생체 광학 데이터 분석 AI 경진대회 1위 수상작
생체 광학 데이터 분석 AI 경진대회 1위 수상작
 
천체 유형 분류 대회 1위 수상자 코드 설명
천체 유형 분류 대회 1위 수상자 코드 설명천체 유형 분류 대회 1위 수상자 코드 설명
천체 유형 분류 대회 1위 수상자 코드 설명
 
천체 유형 분류 대회 3위 수상자 코드 설명
천체 유형 분류 대회 3위 수상자 코드 설명천체 유형 분류 대회 3위 수상자 코드 설명
천체 유형 분류 대회 3위 수상자 코드 설명
 
천체 유형 분류 대회 2위 수상자 코드 설명
천체 유형 분류 대회 2위 수상자 코드 설명천체 유형 분류 대회 2위 수상자 코드 설명
천체 유형 분류 대회 2위 수상자 코드 설명
 
Loss function discovery for object detection via convergence simulation drive...
Loss function discovery for object detection via convergence simulation drive...Loss function discovery for object detection via convergence simulation drive...
Loss function discovery for object detection via convergence simulation drive...
 
Yolo v2 urop 발표자료
Yolo v2 urop 발표자료Yolo v2 urop 발표자료
Yolo v2 urop 발표자료
 
"Learning transferable architectures for scalable image recognition" Paper Re...
"Learning transferable architectures for scalable image recognition" Paper Re..."Learning transferable architectures for scalable image recognition" Paper Re...
"Learning transferable architectures for scalable image recognition" Paper Re...
 
제주 퇴근시간 버스 승차 인원 예측 2등 수상작
제주 퇴근시간 버스 승차 인원 예측 2등 수상작제주 퇴근시간 버스 승차 인원 예측 2등 수상작
제주 퇴근시간 버스 승차 인원 예측 2등 수상작
 
원자력발전소 상태 판단 대회 2위 수상자 코드 설명
원자력발전소 상태 판단 대회 2위 수상자 코드 설명원자력발전소 상태 판단 대회 2위 수상자 코드 설명
원자력발전소 상태 판단 대회 2위 수상자 코드 설명
 
원자력발전소 상태 판단 대회 1위 수상자 코드 설명
원자력발전소 상태 판단 대회 1위 수상자 코드 설명원자력발전소 상태 판단 대회 1위 수상자 코드 설명
원자력발전소 상태 판단 대회 1위 수상자 코드 설명
 
PR-218: MFAS: Multimodal Fusion Architecture Search
PR-218: MFAS: Multimodal Fusion Architecture SearchPR-218: MFAS: Multimodal Fusion Architecture Search
PR-218: MFAS: Multimodal Fusion Architecture Search
 
PR-203: Class-Balanced Loss Based on Effective Number of Samples
PR-203: Class-Balanced Loss Based on Effective Number of SamplesPR-203: Class-Balanced Loss Based on Effective Number of Samples
PR-203: Class-Balanced Loss Based on Effective Number of Samples
 
"From image level to pixel-level labeling with convolutional networks" Paper ...
"From image level to pixel-level labeling with convolutional networks" Paper ..."From image level to pixel-level labeling with convolutional networks" Paper ...
"From image level to pixel-level labeling with convolutional networks" Paper ...
 
PR-313 Training BatchNorm and Only BatchNorm: On the Expressive Power of Rand...
PR-313 Training BatchNorm and Only BatchNorm: On the Expressive Power of Rand...PR-313 Training BatchNorm and Only BatchNorm: On the Expressive Power of Rand...
PR-313 Training BatchNorm and Only BatchNorm: On the Expressive Power of Rand...
 
Yolo v1 urop 발표자료
Yolo v1 urop 발표자료Yolo v1 urop 발표자료
Yolo v1 urop 발표자료
 
Titanic kaggle competition
Titanic kaggle competitionTitanic kaggle competition
Titanic kaggle competition
 

Similar to 생체 광학 데이터 분석 AI 경진대회 2위 수상작

네트워크 경량화 이모저모 @ 2020 DLD
네트워크 경량화 이모저모 @ 2020 DLD네트워크 경량화 이모저모 @ 2020 DLD
네트워크 경량화 이모저모 @ 2020 DLDKim Junghoon
 
위성관측 데이터 활용 강수량 산출 AI 경진대회 1위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 1위 수상작위성관측 데이터 활용 강수량 산출 AI 경진대회 1위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 1위 수상작DACON AI 데이콘
 
Progressive Growing of GANs for Improved Quality, Stability, and Variation Re...
Progressive Growing of GANs for Improved Quality, Stability, and Variation Re...Progressive Growing of GANs for Improved Quality, Stability, and Variation Re...
Progressive Growing of GANs for Improved Quality, Stability, and Variation Re...태엽 김
 
소프트웨어 2.0을 활용한 게임 어뷰징 검출
소프트웨어 2.0을 활용한 게임 어뷰징 검출소프트웨어 2.0을 활용한 게임 어뷰징 검출
소프트웨어 2.0을 활용한 게임 어뷰징 검출정주 김
 
Denoising auto encoders(d a)
Denoising auto encoders(d a)Denoising auto encoders(d a)
Denoising auto encoders(d a)Tae Young Lee
 
Image Deep Learning 실무적용
Image Deep Learning 실무적용Image Deep Learning 실무적용
Image Deep Learning 실무적용Youngjae Kim
 
Imagination-Augmented Agents for Deep Reinforcement Learning
Imagination-Augmented Agents for Deep Reinforcement LearningImagination-Augmented Agents for Deep Reinforcement Learning
Imagination-Augmented Agents for Deep Reinforcement Learning성재 최
 
DeepWalk: Online Learning of Social Representations
DeepWalk: Online Learning of Social RepresentationsDeepWalk: Online Learning of Social Representations
DeepWalk: Online Learning of Social RepresentationsSOYEON KIM
 
[한국어] Neural Architecture Search with Reinforcement Learning
[한국어] Neural Architecture Search with Reinforcement Learning[한국어] Neural Architecture Search with Reinforcement Learning
[한국어] Neural Architecture Search with Reinforcement LearningKiho Suh
 
위성관측 데이터 활용 강수량 산출 AI 경진대회 2위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 2위 수상작위성관측 데이터 활용 강수량 산출 AI 경진대회 2위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 2위 수상작ssuserfa4e58
 
위성관측 데이터 활용 강수량 산출 AI 경진대회 2위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 2위 수상작위성관측 데이터 활용 강수량 산출 AI 경진대회 2위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 2위 수상작DACON AI 데이콘
 
Learning how to explain neural networks: PatternNet and PatternAttribution
Learning how to explain neural networks: PatternNet and PatternAttributionLearning how to explain neural networks: PatternNet and PatternAttribution
Learning how to explain neural networks: PatternNet and PatternAttributionGyubin Son
 
Summary in recent advances in deep learning for object detection
Summary in recent advances in deep learning for object detectionSummary in recent advances in deep learning for object detection
Summary in recent advances in deep learning for object detection창기 문
 
Summary in recent advances in deep learning for object detection
Summary in recent advances in deep learning for object detectionSummary in recent advances in deep learning for object detection
Summary in recent advances in deep learning for object detection창기 문
 
1조_SLRA_최종발표.pptx
1조_SLRA_최종발표.pptx1조_SLRA_최종발표.pptx
1조_SLRA_최종발표.pptxssuserb4f344
 
Improved techniques for grid mapping with rao blackwellized particle filters 번역
Improved techniques for grid mapping with rao blackwellized particle filters 번역Improved techniques for grid mapping with rao blackwellized particle filters 번역
Improved techniques for grid mapping with rao blackwellized particle filters 번역jdo
 
SAGAN_2024seminar announce_seoultech.pptx
SAGAN_2024seminar announce_seoultech.pptxSAGAN_2024seminar announce_seoultech.pptx
SAGAN_2024seminar announce_seoultech.pptxssuser4b2fe7
 
"Dataset and metrics for predicting local visible differences" Paper Review
"Dataset and metrics for predicting local visible differences" Paper Review"Dataset and metrics for predicting local visible differences" Paper Review
"Dataset and metrics for predicting local visible differences" Paper ReviewLEE HOSEONG
 
Deep Learning & Convolutional Neural Network
Deep Learning & Convolutional Neural NetworkDeep Learning & Convolutional Neural Network
Deep Learning & Convolutional Neural Networkagdatalab
 

Similar to 생체 광학 데이터 분석 AI 경진대회 2위 수상작 (20)

네트워크 경량화 이모저모 @ 2020 DLD
네트워크 경량화 이모저모 @ 2020 DLD네트워크 경량화 이모저모 @ 2020 DLD
네트워크 경량화 이모저모 @ 2020 DLD
 
위성관측 데이터 활용 강수량 산출 AI 경진대회 1위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 1위 수상작위성관측 데이터 활용 강수량 산출 AI 경진대회 1위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 1위 수상작
 
Progressive Growing of GANs for Improved Quality, Stability, and Variation Re...
Progressive Growing of GANs for Improved Quality, Stability, and Variation Re...Progressive Growing of GANs for Improved Quality, Stability, and Variation Re...
Progressive Growing of GANs for Improved Quality, Stability, and Variation Re...
 
소프트웨어 2.0을 활용한 게임 어뷰징 검출
소프트웨어 2.0을 활용한 게임 어뷰징 검출소프트웨어 2.0을 활용한 게임 어뷰징 검출
소프트웨어 2.0을 활용한 게임 어뷰징 검출
 
Denoising auto encoders(d a)
Denoising auto encoders(d a)Denoising auto encoders(d a)
Denoising auto encoders(d a)
 
Image Deep Learning 실무적용
Image Deep Learning 실무적용Image Deep Learning 실무적용
Image Deep Learning 실무적용
 
Imagination-Augmented Agents for Deep Reinforcement Learning
Imagination-Augmented Agents for Deep Reinforcement LearningImagination-Augmented Agents for Deep Reinforcement Learning
Imagination-Augmented Agents for Deep Reinforcement Learning
 
DeepWalk: Online Learning of Social Representations
DeepWalk: Online Learning of Social RepresentationsDeepWalk: Online Learning of Social Representations
DeepWalk: Online Learning of Social Representations
 
[한국어] Neural Architecture Search with Reinforcement Learning
[한국어] Neural Architecture Search with Reinforcement Learning[한국어] Neural Architecture Search with Reinforcement Learning
[한국어] Neural Architecture Search with Reinforcement Learning
 
위성관측 데이터 활용 강수량 산출 AI 경진대회 2위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 2위 수상작위성관측 데이터 활용 강수량 산출 AI 경진대회 2위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 2위 수상작
 
위성관측 데이터 활용 강수량 산출 AI 경진대회 2위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 2위 수상작위성관측 데이터 활용 강수량 산출 AI 경진대회 2위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 2위 수상작
 
Learning how to explain neural networks: PatternNet and PatternAttribution
Learning how to explain neural networks: PatternNet and PatternAttributionLearning how to explain neural networks: PatternNet and PatternAttribution
Learning how to explain neural networks: PatternNet and PatternAttribution
 
Summary in recent advances in deep learning for object detection
Summary in recent advances in deep learning for object detectionSummary in recent advances in deep learning for object detection
Summary in recent advances in deep learning for object detection
 
Summary in recent advances in deep learning for object detection
Summary in recent advances in deep learning for object detectionSummary in recent advances in deep learning for object detection
Summary in recent advances in deep learning for object detection
 
1조_SLRA_최종발표.pptx
1조_SLRA_최종발표.pptx1조_SLRA_최종발표.pptx
1조_SLRA_최종발표.pptx
 
Improved techniques for grid mapping with rao blackwellized particle filters 번역
Improved techniques for grid mapping with rao blackwellized particle filters 번역Improved techniques for grid mapping with rao blackwellized particle filters 번역
Improved techniques for grid mapping with rao blackwellized particle filters 번역
 
SAGAN_2024seminar announce_seoultech.pptx
SAGAN_2024seminar announce_seoultech.pptxSAGAN_2024seminar announce_seoultech.pptx
SAGAN_2024seminar announce_seoultech.pptx
 
"Dataset and metrics for predicting local visible differences" Paper Review
"Dataset and metrics for predicting local visible differences" Paper Review"Dataset and metrics for predicting local visible differences" Paper Review
"Dataset and metrics for predicting local visible differences" Paper Review
 
Deep learning overview
Deep learning overviewDeep learning overview
Deep learning overview
 
Deep Learning & Convolutional Neural Network
Deep Learning & Convolutional Neural NetworkDeep Learning & Convolutional Neural Network
Deep Learning & Convolutional Neural Network
 

More from DACON AI 데이콘

Introduction to e tapr for hai con -eng
Introduction to e tapr for hai con -engIntroduction to e tapr for hai con -eng
Introduction to e tapr for hai con -engDACON AI 데이콘
 
Introduction to e tapr for hai con -kor
Introduction to e tapr for hai con -korIntroduction to e tapr for hai con -kor
Introduction to e tapr for hai con -korDACON AI 데이콘
 
20210728 대회주최 문의
20210728 대회주최 문의20210728 대회주최 문의
20210728 대회주최 문의DACON AI 데이콘
 
K-Fashion 경진대회 1등 수상자 솔루션
K-Fashion 경진대회 1등 수상자 솔루션K-Fashion 경진대회 1등 수상자 솔루션
K-Fashion 경진대회 1등 수상자 솔루션DACON AI 데이콘
 
K-Fashion 경진대회 2등 수상자 솔루션
K-Fashion 경진대회 2등 수상자 솔루션K-Fashion 경진대회 2등 수상자 솔루션
K-Fashion 경진대회 2등 수상자 솔루션DACON AI 데이콘
 
K-Fashion 경진대회 3등 수상자 솔루션
K-Fashion 경진대회 3등 수상자 솔루션K-Fashion 경진대회 3등 수상자 솔루션
K-Fashion 경진대회 3등 수상자 솔루션DACON AI 데이콘
 
아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션DACON AI 데이콘
 
아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션DACON AI 데이콘
 
진동데이터 활용 충돌체 탐지 AI 경진대회 2등
진동데이터 활용 충돌체 탐지 AI 경진대회 2등진동데이터 활용 충돌체 탐지 AI 경진대회 2등
진동데이터 활용 충돌체 탐지 AI 경진대회 2등DACON AI 데이콘
 
진동데이터 활용 충돌체 탐지 AI 경진대회 1등
진동데이터 활용 충돌체 탐지 AI 경진대회 1등진동데이터 활용 충돌체 탐지 AI 경진대회 1등
진동데이터 활용 충돌체 탐지 AI 경진대회 1등DACON AI 데이콘
 
포스트 코로나 데이터 시각화 경진대회 - 대상
포스트 코로나 데이터 시각화 경진대회 - 대상포스트 코로나 데이터 시각화 경진대회 - 대상
포스트 코로나 데이터 시각화 경진대회 - 대상DACON AI 데이콘
 
포스트 코로나 데이터 시각화 경진대회 - 최우수상
포스트 코로나 데이터 시각화 경진대회 - 최우수상포스트 코로나 데이터 시각화 경진대회 - 최우수상
포스트 코로나 데이터 시각화 경진대회 - 최우수상DACON AI 데이콘
 
포스트 코로나 데이터 시각화 경진대회 - 우수상
포스트 코로나 데이터 시각화 경진대회 - 우수상포스트 코로나 데이터 시각화 경진대회 - 우수상
포스트 코로나 데이터 시각화 경진대회 - 우수상DACON AI 데이콘
 
포스트 코로나 데이터 시각화 경진대회 - 장려상2
포스트 코로나 데이터 시각화 경진대회 - 장려상2포스트 코로나 데이터 시각화 경진대회 - 장려상2
포스트 코로나 데이터 시각화 경진대회 - 장려상2DACON AI 데이콘
 
포스트 코로나 데이터 시각화 경진대회 - 장려상
포스트 코로나 데이터 시각화 경진대회 - 장려상포스트 코로나 데이터 시각화 경진대회 - 장려상
포스트 코로나 데이터 시각화 경진대회 - 장려상DACON AI 데이콘
 

More from DACON AI 데이콘 (20)

Introduction to e tapr for hai con -eng
Introduction to e tapr for hai con -engIntroduction to e tapr for hai con -eng
Introduction to e tapr for hai con -eng
 
Introduction to e tapr for hai con -kor
Introduction to e tapr for hai con -korIntroduction to e tapr for hai con -kor
Introduction to e tapr for hai con -kor
 
20210728 대회주최 문의
20210728 대회주최 문의20210728 대회주최 문의
20210728 대회주최 문의
 
데이콘 뽀개기
데이콘 뽀개기데이콘 뽀개기
데이콘 뽀개기
 
Bittrader competition (1)
Bittrader competition (1)Bittrader competition (1)
Bittrader competition (1)
 
Bittrader competition
Bittrader competitionBittrader competition
Bittrader competition
 
Superbai
SuperbaiSuperbai
Superbai
 
K-Fashion 경진대회 1등 수상자 솔루션
K-Fashion 경진대회 1등 수상자 솔루션K-Fashion 경진대회 1등 수상자 솔루션
K-Fashion 경진대회 1등 수상자 솔루션
 
K-Fashion 경진대회 2등 수상자 솔루션
K-Fashion 경진대회 2등 수상자 솔루션K-Fashion 경진대회 2등 수상자 솔루션
K-Fashion 경진대회 2등 수상자 솔루션
 
K-Fashion 경진대회 3등 수상자 솔루션
K-Fashion 경진대회 3등 수상자 솔루션K-Fashion 경진대회 3등 수상자 솔루션
K-Fashion 경진대회 3등 수상자 솔루션
 
아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션
 
아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션
 
진동데이터 활용 충돌체 탐지 AI 경진대회 2등
진동데이터 활용 충돌체 탐지 AI 경진대회 2등진동데이터 활용 충돌체 탐지 AI 경진대회 2등
진동데이터 활용 충돌체 탐지 AI 경진대회 2등
 
진동데이터 활용 충돌체 탐지 AI 경진대회 1등
진동데이터 활용 충돌체 탐지 AI 경진대회 1등진동데이터 활용 충돌체 탐지 AI 경진대회 1등
진동데이터 활용 충돌체 탐지 AI 경진대회 1등
 
20200923
2020092320200923
20200923
 
포스트 코로나 데이터 시각화 경진대회 - 대상
포스트 코로나 데이터 시각화 경진대회 - 대상포스트 코로나 데이터 시각화 경진대회 - 대상
포스트 코로나 데이터 시각화 경진대회 - 대상
 
포스트 코로나 데이터 시각화 경진대회 - 최우수상
포스트 코로나 데이터 시각화 경진대회 - 최우수상포스트 코로나 데이터 시각화 경진대회 - 최우수상
포스트 코로나 데이터 시각화 경진대회 - 최우수상
 
포스트 코로나 데이터 시각화 경진대회 - 우수상
포스트 코로나 데이터 시각화 경진대회 - 우수상포스트 코로나 데이터 시각화 경진대회 - 우수상
포스트 코로나 데이터 시각화 경진대회 - 우수상
 
포스트 코로나 데이터 시각화 경진대회 - 장려상2
포스트 코로나 데이터 시각화 경진대회 - 장려상2포스트 코로나 데이터 시각화 경진대회 - 장려상2
포스트 코로나 데이터 시각화 경진대회 - 장려상2
 
포스트 코로나 데이터 시각화 경진대회 - 장려상
포스트 코로나 데이터 시각화 경진대회 - 장려상포스트 코로나 데이터 시각화 경진대회 - 장려상
포스트 코로나 데이터 시각화 경진대회 - 장려상
 

생체 광학 데이터 분석 AI 경진대회 2위 수상작

  • 1. https://dacon.io Dacon 5회 생체광학 데이터 분석 AI 모델링 경진대회 초보
  • 2. 목차 1 2 3 STEP 1 STEP 2 STEP 3 https://dacon.io 2 Data Preprocessing FE & FS & Model Conclusion & Discussion Data Preprocessing Feature engineering & Feature selection & Model Conclusion & Discussion • Feature engineering • Feature selection • Model & evaluation • Conclusion • Discussion • Rolling mean • Binning
  • 3. https://dacon.io 3 Background Reference : https://www.pinterest.co.kr/pin/579416308282876234/ • 물질에따라 반응하는 에너지의 크기는 다르고 이 에너지의 크기는 파장에 반비례 • 반응한 만큼 빛은 흡수되고(산란..등 제외) 흡수된 빛은 물질의 흡광계수, 거리, 농도에 비례함 • 다양한 빛의 세기, 파장을 입사하여 농도 예측 가능
  • 4. https://dacon.io 4 1. Data preprocessing NA • Dst 에서 20%로 일정하게 분포 • 다양한 결측치 삽입 및 활용을 시도 하였지만 그대로 두는게 제일 좋은 성능
  • 5. https://dacon.io 5 1. Data preprocessing 1. Rolling mean • Rolling mean을 통해 파장별로 생성되는 피쳐의 노이즈를 줄이는 효과 • Dst 피쳐에 NaN 값이 많은데 이를 rolling mean을 통해 NaN을 채우는 효과 • Window size = [3, 5] • Src, dst rolling mean후 이후의 추가적인 피쳐엔지니어링 진행 Reference : https://towardsdatascience.com/machine-learning-part-19-time-series-and- autoregressive-integrated-moving-average-model-arima-c1005347b0d7
  • 6. https://dacon.io 6 1. Data preprocessing 2. Binning • Binning을 통해 파장별로 생성되는 피쳐의 노이즈를 줄여주는 효과 • Binning size = [ 10, 20, 30, 40, 50, 100] • Binning 후 이후의 추가적인 피쳐엔지니어링 진행
  • 7. https://dacon.io 7 2-1. Feature engineering 1. dst/src 2. log(dst/src) 3. log(dst/src)/rho 4. Binning , Rolling 후에 1,2,3 피쳐 추가 생성 5. 3번으로 생성된 피쳐로 각 피크의 비율 및 차이 피쳐 추가 생성 ( motivation : 근적외선 분광법을 이용한 폐플라스틱 분리선별기술개발, 최형기 ) 6. y끼리의 상관관계를 나이브하게 비율로 고려하여 피쳐 생성 ex) 𝑦1 = 𝛼 ∗ 𝑦2
  • 8. https://dacon.io 8 2-2. Feature selection • 모델을 학습 시킨 후, 변수를 하나씩 값을 섞고 valid score확인 후 선택 • 5fold에서 모두 2번이상 bad_feaure로 선택시 삭제 1. Permutation test
  • 9. https://dacon.io 9 2-3. Model & Evaluation 1. LightGBM 5fold, 3 seed ensemble • 5fold로 cv를 통해 hyperparameter search(나이브하게 진행) • dart 사용 • 3seed model
  • 10. https://dacon.io 10 3. Conclusion & Discussion Conclusion • 투과도, 흡광도, rho를 나눈 농도와 비례하는 피쳐 생성 • 노이즈를 줄여주기 위해 binning, rolling 수행 • Dst의 NaN 값을 rolling mean으로 대체 • 파장별 log(dst/src)/rho 피크값들의 비율, 차이로 피쳐 생성 • y끼리의 상관관계 고려한 피쳐 생성 Discussion • Dst에 NA가 많을 수록 validation set에서 성능잘 나오지 않음을 확인했고 채우 려 노력했지만 실패 • NN, knn, kmeans 등을 시도해봤지만 실패했고, NaN 때문에 성능을 뽑기 어렵 다고 생각했지만 1등 코드를 보고 배움 • y끼리의 상관관계를 다양하게 고려해줄 경우 성능 향상 예상 • Ca, Na 의 성능이 좋지 못한데, 흡수파장 영역이 dataset에 비해 낮기때문?