SlideShare a Scribd company logo
1 of 6
Download to read offline
https://dacon.io
Dacon
생체 광학 데이터 분석
AI 경진대회
Arete 팀
2020.7.3. 제출
목차
1
2
3
STEP 1
STEP 2
STEP 3
https://dacon.io 2
데이터 전처리 & EDA
모델 구축 & 검증
결과 및 결언
데이터 전처리
모델 & post 모델
결론
• 선형 보간
• 파장 고려
• 차이 feature 추가
• PCA/ICA 추가
• Feature 바탕 각 농
도 예측 모델
• 예측된 농도를 포함
하여 다시 post 모델
로 모델링
• 최종 6위
• 개선할 점
https://dacon.io 3
1. 데이터 전처리
- 결측치의 경우 가장 가까운 왼쪽과 오른쪽의 숫자를 바탕으로 선형 보간을 사용함
- Src가 0인 경우 dst도 0으로 설정
- dst가 음수인 경우 결측치로 설정
- 0으로 나누는 것을 방지하기 위해 epsilon = 1e-25로 둠
- Dst feature에 대해 wave length를 고려하여, exp(wave_length* A)를 곱해줌
- 이 때 A = 1/500 혹은 80 혹은 100 으로 조절하는 것이 결과가 좋았음
- Dst/src 를 ratio로 정의하여 ratio 자체를 사용하는 것과 log(ratio)를 같이 사용함
- 변수의 다양성을 위해 보간법을 사용한 뒤 wave_length 보정하는 것과 wave_length 보정
한 뒤에 선형 보간을 하는 것을 둘다 사용함
- log(ratio) 의 경우, 두 개의 wave length에 해당하는 값의 차이를 추가로 구하여 feature에
추가 (np.roll을 이용하여 바로 옆 뿐만 아니라 멀리 떨어진 값의 차이도 같이 구하여
feature에 추가함)
- Dst data, log(ratio) 데이터의 경우 PCA, ICA를 이용하여 적은 수의 dim에 대해 추가적인
feature를 추가해줌
https://dacon.io 4
2. 계층적 모델 구성
- 총 2개의 모델을 구성 (model, post model)
- 첫번째 모델은 전처리된 feature를 바탕으로 각 종류의 농도를 구함
- 이 때 먼저 구한 종류의 농도는 feature가 됨: 예를 들어 처음에는 전처리된 feature
만으로 hhb농도를 구하고, 전처리된 feature + 예측된 hhb농도로 hbo2를 구하고,
전처리된 feature feature + 예측된 hhb농도 + 예측된 hho2농도를 바탕으로 ca를 구
하는 등의 단계적 방법임.
- 두번째 모델(post model)은 전처리된 feature + 첫번째 모델에서 구한 농도들을 모두
feature로 써서 다시 각 종류의 농도를 예측함
- 10- fold cross validation 사용하여 10개의 모델을 앙상블함.
- 두 모델 모두 Lightgbm regressor를 사용함
- 하이퍼 파라미터는 아래와 같음 (왼쪽: 첫번째 모델, 오른쪽: 두번째 모델)
https://dacon.io 5
3. 결론
- Trainining 용 데이터의 경우 overfitting이 잘 되는 것을 관찰하여 test data 에 대한 성능을
높이기 쉽지 않았음.
- 최종 리더보드 결과: 0.80126 (mae)
- 딥러닝 (컨볼루션 혹은 RNN) 을 사용하였으면 더 좋았을 것 같다.
- 소스코드:
https://dacon.io/competitions/official/235608/codeshare/1320?page=1&dtype=recent&ptyp
e=pub
THANK YOU
THANK YOU
https://dacon.io 6

More Related Content

What's hot

생체 광학 데이터 분석 AI 경진대회 10위 수상작
생체 광학 데이터 분석 AI 경진대회 10위 수상작생체 광학 데이터 분석 AI 경진대회 10위 수상작
생체 광학 데이터 분석 AI 경진대회 10위 수상작DACON AI 데이콘
 
천체 유형 분류 대회 1위 수상자 코드 설명
천체 유형 분류 대회 1위 수상자 코드 설명천체 유형 분류 대회 1위 수상자 코드 설명
천체 유형 분류 대회 1위 수상자 코드 설명DACON AI 데이콘
 
천체 유형 분류 대회 3위 수상자 코드 설명
천체 유형 분류 대회 3위 수상자 코드 설명천체 유형 분류 대회 3위 수상자 코드 설명
천체 유형 분류 대회 3위 수상자 코드 설명DACON AI 데이콘
 
천체 유형 분류 대회 2위 수상자 코드 설명
천체 유형 분류 대회 2위 수상자 코드 설명천체 유형 분류 대회 2위 수상자 코드 설명
천체 유형 분류 대회 2위 수상자 코드 설명DACON AI 데이콘
 
K-Fashion 경진대회 2등 수상자 솔루션
K-Fashion 경진대회 2등 수상자 솔루션K-Fashion 경진대회 2등 수상자 솔루션
K-Fashion 경진대회 2등 수상자 솔루션DACON AI 데이콘
 
제주 퇴근시간 버스 승차 인원 예측 2등 수상작
제주 퇴근시간 버스 승차 인원 예측 2등 수상작제주 퇴근시간 버스 승차 인원 예측 2등 수상작
제주 퇴근시간 버스 승차 인원 예측 2등 수상작DACON AI 데이콘
 
원자력발전소 상태 판단 대회 2위 수상자 코드 설명
원자력발전소 상태 판단 대회 2위 수상자 코드 설명원자력발전소 상태 판단 대회 2위 수상자 코드 설명
원자력발전소 상태 판단 대회 2위 수상자 코드 설명DACON AI 데이콘
 
원자력발전소 상태 판단 대회 1위 수상자 코드 설명
원자력발전소 상태 판단 대회 1위 수상자 코드 설명원자력발전소 상태 판단 대회 1위 수상자 코드 설명
원자력발전소 상태 판단 대회 1위 수상자 코드 설명DACON AI 데이콘
 
K-Fashion 경진대회 1등 수상자 솔루션
K-Fashion 경진대회 1등 수상자 솔루션K-Fashion 경진대회 1등 수상자 솔루션
K-Fashion 경진대회 1등 수상자 솔루션DACON AI 데이콘
 
진동데이터 활용 충돌체 탐지 AI 경진대회 2등
진동데이터 활용 충돌체 탐지 AI 경진대회 2등진동데이터 활용 충돌체 탐지 AI 경진대회 2등
진동데이터 활용 충돌체 탐지 AI 경진대회 2등DACON AI 데이콘
 
Yolo v2 urop 발표자료
Yolo v2 urop 발표자료Yolo v2 urop 발표자료
Yolo v2 urop 발표자료DaeHeeKim31
 
Titanic kaggle competition
Titanic kaggle competitionTitanic kaggle competition
Titanic kaggle competitionjdo
 
"Learning transferable architectures for scalable image recognition" Paper Re...
"Learning transferable architectures for scalable image recognition" Paper Re..."Learning transferable architectures for scalable image recognition" Paper Re...
"Learning transferable architectures for scalable image recognition" Paper Re...LEE HOSEONG
 

What's hot (13)

생체 광학 데이터 분석 AI 경진대회 10위 수상작
생체 광학 데이터 분석 AI 경진대회 10위 수상작생체 광학 데이터 분석 AI 경진대회 10위 수상작
생체 광학 데이터 분석 AI 경진대회 10위 수상작
 
천체 유형 분류 대회 1위 수상자 코드 설명
천체 유형 분류 대회 1위 수상자 코드 설명천체 유형 분류 대회 1위 수상자 코드 설명
천체 유형 분류 대회 1위 수상자 코드 설명
 
천체 유형 분류 대회 3위 수상자 코드 설명
천체 유형 분류 대회 3위 수상자 코드 설명천체 유형 분류 대회 3위 수상자 코드 설명
천체 유형 분류 대회 3위 수상자 코드 설명
 
천체 유형 분류 대회 2위 수상자 코드 설명
천체 유형 분류 대회 2위 수상자 코드 설명천체 유형 분류 대회 2위 수상자 코드 설명
천체 유형 분류 대회 2위 수상자 코드 설명
 
K-Fashion 경진대회 2등 수상자 솔루션
K-Fashion 경진대회 2등 수상자 솔루션K-Fashion 경진대회 2등 수상자 솔루션
K-Fashion 경진대회 2등 수상자 솔루션
 
제주 퇴근시간 버스 승차 인원 예측 2등 수상작
제주 퇴근시간 버스 승차 인원 예측 2등 수상작제주 퇴근시간 버스 승차 인원 예측 2등 수상작
제주 퇴근시간 버스 승차 인원 예측 2등 수상작
 
원자력발전소 상태 판단 대회 2위 수상자 코드 설명
원자력발전소 상태 판단 대회 2위 수상자 코드 설명원자력발전소 상태 판단 대회 2위 수상자 코드 설명
원자력발전소 상태 판단 대회 2위 수상자 코드 설명
 
원자력발전소 상태 판단 대회 1위 수상자 코드 설명
원자력발전소 상태 판단 대회 1위 수상자 코드 설명원자력발전소 상태 판단 대회 1위 수상자 코드 설명
원자력발전소 상태 판단 대회 1위 수상자 코드 설명
 
K-Fashion 경진대회 1등 수상자 솔루션
K-Fashion 경진대회 1등 수상자 솔루션K-Fashion 경진대회 1등 수상자 솔루션
K-Fashion 경진대회 1등 수상자 솔루션
 
진동데이터 활용 충돌체 탐지 AI 경진대회 2등
진동데이터 활용 충돌체 탐지 AI 경진대회 2등진동데이터 활용 충돌체 탐지 AI 경진대회 2등
진동데이터 활용 충돌체 탐지 AI 경진대회 2등
 
Yolo v2 urop 발표자료
Yolo v2 urop 발표자료Yolo v2 urop 발표자료
Yolo v2 urop 발표자료
 
Titanic kaggle competition
Titanic kaggle competitionTitanic kaggle competition
Titanic kaggle competition
 
"Learning transferable architectures for scalable image recognition" Paper Re...
"Learning transferable architectures for scalable image recognition" Paper Re..."Learning transferable architectures for scalable image recognition" Paper Re...
"Learning transferable architectures for scalable image recognition" Paper Re...
 

Similar to 생체 광학 데이터 분석 AI 경진대회 6위 수상작

위성관측 데이터 활용 강수량 산출 AI 경진대회 1위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 1위 수상작위성관측 데이터 활용 강수량 산출 AI 경진대회 1위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 1위 수상작DACON AI 데이콘
 
위성관측 데이터 활용 강수량 산출 AI 경진대회 3위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 3위 수상작위성관측 데이터 활용 강수량 산출 AI 경진대회 3위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 3위 수상작DACON AI 데이콘
 
PySpark 배우기 Ch 06. ML 패키지 소개하기
PySpark 배우기 Ch 06. ML 패키지 소개하기PySpark 배우기 Ch 06. ML 패키지 소개하기
PySpark 배우기 Ch 06. ML 패키지 소개하기찬희 이
 
이정근_project_로봇비전시스템.pdf
이정근_project_로봇비전시스템.pdf이정근_project_로봇비전시스템.pdf
이정근_project_로봇비전시스템.pdftangtang1026
 
딥러닝(Deep Learing) using DeepDetect
딥러닝(Deep Learing) using DeepDetect딥러닝(Deep Learing) using DeepDetect
딥러닝(Deep Learing) using DeepDetectJunyi Song
 
Summary in recent advances in deep learning for object detection
Summary in recent advances in deep learning for object detectionSummary in recent advances in deep learning for object detection
Summary in recent advances in deep learning for object detection창기 문
 
Summary in recent advances in deep learning for object detection
Summary in recent advances in deep learning for object detectionSummary in recent advances in deep learning for object detection
Summary in recent advances in deep learning for object detection창기 문
 
Progressive Growing of GANs for Improved Quality, Stability, and Variation Re...
Progressive Growing of GANs for Improved Quality, Stability, and Variation Re...Progressive Growing of GANs for Improved Quality, Stability, and Variation Re...
Progressive Growing of GANs for Improved Quality, Stability, and Variation Re...태엽 김
 
4.representing data and engineering features(epoch#2)
4.representing data and engineering features(epoch#2)4.representing data and engineering features(epoch#2)
4.representing data and engineering features(epoch#2)Haesun Park
 
발표자료 11장
발표자료 11장발표자료 11장
발표자료 11장Juhui Park
 
ECMAScript 6의 새로운 것들!
ECMAScript 6의 새로운 것들!ECMAScript 6의 새로운 것들!
ECMAScript 6의 새로운 것들!WooYoung Cho
 
Chapter 11 Practical Methodology
Chapter 11 Practical MethodologyChapter 11 Practical Methodology
Chapter 11 Practical MethodologyKyeongUkJang
 
어플리케이션 성능 최적화 기법
어플리케이션 성능 최적화 기법어플리케이션 성능 최적화 기법
어플리케이션 성능 최적화 기법Daniel Kim
 
[OpenInfra Days Korea 2018] Day 2 - E5: Mesos to Kubernetes, Cloud Native 서비스...
[OpenInfra Days Korea 2018] Day 2 - E5: Mesos to Kubernetes, Cloud Native 서비스...[OpenInfra Days Korea 2018] Day 2 - E5: Mesos to Kubernetes, Cloud Native 서비스...
[OpenInfra Days Korea 2018] Day 2 - E5: Mesos to Kubernetes, Cloud Native 서비스...OpenStack Korea Community
 
Prediction of bus riders at the time of departure
Prediction of bus riders at the time of departurePrediction of bus riders at the time of departure
Prediction of bus riders at the time of departureHWANGTAEYONG
 
네트워크 경량화 이모저모 @ 2020 DLD
네트워크 경량화 이모저모 @ 2020 DLD네트워크 경량화 이모저모 @ 2020 DLD
네트워크 경량화 이모저모 @ 2020 DLDKim Junghoon
 
SpringCamp 2013 : About Jdk8
SpringCamp 2013 : About Jdk8SpringCamp 2013 : About Jdk8
SpringCamp 2013 : About Jdk8Sangmin Lee
 

Similar to 생체 광학 데이터 분석 AI 경진대회 6위 수상작 (20)

위성관측 데이터 활용 강수량 산출 AI 경진대회 1위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 1위 수상작위성관측 데이터 활용 강수량 산출 AI 경진대회 1위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 1위 수상작
 
위성관측 데이터 활용 강수량 산출 AI 경진대회 3위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 3위 수상작위성관측 데이터 활용 강수량 산출 AI 경진대회 3위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 3위 수상작
 
PySpark 배우기 Ch 06. ML 패키지 소개하기
PySpark 배우기 Ch 06. ML 패키지 소개하기PySpark 배우기 Ch 06. ML 패키지 소개하기
PySpark 배우기 Ch 06. ML 패키지 소개하기
 
이정근_project_로봇비전시스템.pdf
이정근_project_로봇비전시스템.pdf이정근_project_로봇비전시스템.pdf
이정근_project_로봇비전시스템.pdf
 
딥러닝(Deep Learing) using DeepDetect
딥러닝(Deep Learing) using DeepDetect딥러닝(Deep Learing) using DeepDetect
딥러닝(Deep Learing) using DeepDetect
 
3. stream api
3. stream api3. stream api
3. stream api
 
Summary in recent advances in deep learning for object detection
Summary in recent advances in deep learning for object detectionSummary in recent advances in deep learning for object detection
Summary in recent advances in deep learning for object detection
 
Summary in recent advances in deep learning for object detection
Summary in recent advances in deep learning for object detectionSummary in recent advances in deep learning for object detection
Summary in recent advances in deep learning for object detection
 
Progressive Growing of GANs for Improved Quality, Stability, and Variation Re...
Progressive Growing of GANs for Improved Quality, Stability, and Variation Re...Progressive Growing of GANs for Improved Quality, Stability, and Variation Re...
Progressive Growing of GANs for Improved Quality, Stability, and Variation Re...
 
4.representing data and engineering features(epoch#2)
4.representing data and engineering features(epoch#2)4.representing data and engineering features(epoch#2)
4.representing data and engineering features(epoch#2)
 
발표자료 11장
발표자료 11장발표자료 11장
발표자료 11장
 
C++에서 Objective-C까지
C++에서 Objective-C까지C++에서 Objective-C까지
C++에서 Objective-C까지
 
Openface
OpenfaceOpenface
Openface
 
ECMAScript 6의 새로운 것들!
ECMAScript 6의 새로운 것들!ECMAScript 6의 새로운 것들!
ECMAScript 6의 새로운 것들!
 
Chapter 11 Practical Methodology
Chapter 11 Practical MethodologyChapter 11 Practical Methodology
Chapter 11 Practical Methodology
 
어플리케이션 성능 최적화 기법
어플리케이션 성능 최적화 기법어플리케이션 성능 최적화 기법
어플리케이션 성능 최적화 기법
 
[OpenInfra Days Korea 2018] Day 2 - E5: Mesos to Kubernetes, Cloud Native 서비스...
[OpenInfra Days Korea 2018] Day 2 - E5: Mesos to Kubernetes, Cloud Native 서비스...[OpenInfra Days Korea 2018] Day 2 - E5: Mesos to Kubernetes, Cloud Native 서비스...
[OpenInfra Days Korea 2018] Day 2 - E5: Mesos to Kubernetes, Cloud Native 서비스...
 
Prediction of bus riders at the time of departure
Prediction of bus riders at the time of departurePrediction of bus riders at the time of departure
Prediction of bus riders at the time of departure
 
네트워크 경량화 이모저모 @ 2020 DLD
네트워크 경량화 이모저모 @ 2020 DLD네트워크 경량화 이모저모 @ 2020 DLD
네트워크 경량화 이모저모 @ 2020 DLD
 
SpringCamp 2013 : About Jdk8
SpringCamp 2013 : About Jdk8SpringCamp 2013 : About Jdk8
SpringCamp 2013 : About Jdk8
 

More from DACON AI 데이콘

Introduction to e tapr for hai con -eng
Introduction to e tapr for hai con -engIntroduction to e tapr for hai con -eng
Introduction to e tapr for hai con -engDACON AI 데이콘
 
Introduction to e tapr for hai con -kor
Introduction to e tapr for hai con -korIntroduction to e tapr for hai con -kor
Introduction to e tapr for hai con -korDACON AI 데이콘
 
20210728 대회주최 문의
20210728 대회주최 문의20210728 대회주최 문의
20210728 대회주최 문의DACON AI 데이콘
 
K-Fashion 경진대회 3등 수상자 솔루션
K-Fashion 경진대회 3등 수상자 솔루션K-Fashion 경진대회 3등 수상자 솔루션
K-Fashion 경진대회 3등 수상자 솔루션DACON AI 데이콘
 
아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션DACON AI 데이콘
 
아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션DACON AI 데이콘
 
진동데이터 활용 충돌체 탐지 AI 경진대회 1등
진동데이터 활용 충돌체 탐지 AI 경진대회 1등진동데이터 활용 충돌체 탐지 AI 경진대회 1등
진동데이터 활용 충돌체 탐지 AI 경진대회 1등DACON AI 데이콘
 
포스트 코로나 데이터 시각화 경진대회 - 대상
포스트 코로나 데이터 시각화 경진대회 - 대상포스트 코로나 데이터 시각화 경진대회 - 대상
포스트 코로나 데이터 시각화 경진대회 - 대상DACON AI 데이콘
 
포스트 코로나 데이터 시각화 경진대회 - 최우수상
포스트 코로나 데이터 시각화 경진대회 - 최우수상포스트 코로나 데이터 시각화 경진대회 - 최우수상
포스트 코로나 데이터 시각화 경진대회 - 최우수상DACON AI 데이콘
 
포스트 코로나 데이터 시각화 경진대회 - 우수상
포스트 코로나 데이터 시각화 경진대회 - 우수상포스트 코로나 데이터 시각화 경진대회 - 우수상
포스트 코로나 데이터 시각화 경진대회 - 우수상DACON AI 데이콘
 
포스트 코로나 데이터 시각화 경진대회 - 장려상2
포스트 코로나 데이터 시각화 경진대회 - 장려상2포스트 코로나 데이터 시각화 경진대회 - 장려상2
포스트 코로나 데이터 시각화 경진대회 - 장려상2DACON AI 데이콘
 
포스트 코로나 데이터 시각화 경진대회 - 장려상
포스트 코로나 데이터 시각화 경진대회 - 장려상포스트 코로나 데이터 시각화 경진대회 - 장려상
포스트 코로나 데이터 시각화 경진대회 - 장려상DACON AI 데이콘
 
생체 광학 데이터 분석 AI 경진대회 5위 수상작
생체 광학 데이터 분석 AI 경진대회 5위 수상작생체 광학 데이터 분석 AI 경진대회 5위 수상작
생체 광학 데이터 분석 AI 경진대회 5위 수상작DACON AI 데이콘
 

More from DACON AI 데이콘 (18)

Introduction to e tapr for hai con -eng
Introduction to e tapr for hai con -engIntroduction to e tapr for hai con -eng
Introduction to e tapr for hai con -eng
 
Introduction to e tapr for hai con -kor
Introduction to e tapr for hai con -korIntroduction to e tapr for hai con -kor
Introduction to e tapr for hai con -kor
 
20210728 대회주최 문의
20210728 대회주최 문의20210728 대회주최 문의
20210728 대회주최 문의
 
데이콘 뽀개기
데이콘 뽀개기데이콘 뽀개기
데이콘 뽀개기
 
Bittrader competition (1)
Bittrader competition (1)Bittrader competition (1)
Bittrader competition (1)
 
Bittrader competition
Bittrader competitionBittrader competition
Bittrader competition
 
Superbai
SuperbaiSuperbai
Superbai
 
K-Fashion 경진대회 3등 수상자 솔루션
K-Fashion 경진대회 3등 수상자 솔루션K-Fashion 경진대회 3등 수상자 솔루션
K-Fashion 경진대회 3등 수상자 솔루션
 
아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션
 
아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션
 
진동데이터 활용 충돌체 탐지 AI 경진대회 1등
진동데이터 활용 충돌체 탐지 AI 경진대회 1등진동데이터 활용 충돌체 탐지 AI 경진대회 1등
진동데이터 활용 충돌체 탐지 AI 경진대회 1등
 
20200923
2020092320200923
20200923
 
포스트 코로나 데이터 시각화 경진대회 - 대상
포스트 코로나 데이터 시각화 경진대회 - 대상포스트 코로나 데이터 시각화 경진대회 - 대상
포스트 코로나 데이터 시각화 경진대회 - 대상
 
포스트 코로나 데이터 시각화 경진대회 - 최우수상
포스트 코로나 데이터 시각화 경진대회 - 최우수상포스트 코로나 데이터 시각화 경진대회 - 최우수상
포스트 코로나 데이터 시각화 경진대회 - 최우수상
 
포스트 코로나 데이터 시각화 경진대회 - 우수상
포스트 코로나 데이터 시각화 경진대회 - 우수상포스트 코로나 데이터 시각화 경진대회 - 우수상
포스트 코로나 데이터 시각화 경진대회 - 우수상
 
포스트 코로나 데이터 시각화 경진대회 - 장려상2
포스트 코로나 데이터 시각화 경진대회 - 장려상2포스트 코로나 데이터 시각화 경진대회 - 장려상2
포스트 코로나 데이터 시각화 경진대회 - 장려상2
 
포스트 코로나 데이터 시각화 경진대회 - 장려상
포스트 코로나 데이터 시각화 경진대회 - 장려상포스트 코로나 데이터 시각화 경진대회 - 장려상
포스트 코로나 데이터 시각화 경진대회 - 장려상
 
생체 광학 데이터 분석 AI 경진대회 5위 수상작
생체 광학 데이터 분석 AI 경진대회 5위 수상작생체 광학 데이터 분석 AI 경진대회 5위 수상작
생체 광학 데이터 분석 AI 경진대회 5위 수상작
 

생체 광학 데이터 분석 AI 경진대회 6위 수상작

  • 1. https://dacon.io Dacon 생체 광학 데이터 분석 AI 경진대회 Arete 팀 2020.7.3. 제출
  • 2. 목차 1 2 3 STEP 1 STEP 2 STEP 3 https://dacon.io 2 데이터 전처리 & EDA 모델 구축 & 검증 결과 및 결언 데이터 전처리 모델 & post 모델 결론 • 선형 보간 • 파장 고려 • 차이 feature 추가 • PCA/ICA 추가 • Feature 바탕 각 농 도 예측 모델 • 예측된 농도를 포함 하여 다시 post 모델 로 모델링 • 최종 6위 • 개선할 점
  • 3. https://dacon.io 3 1. 데이터 전처리 - 결측치의 경우 가장 가까운 왼쪽과 오른쪽의 숫자를 바탕으로 선형 보간을 사용함 - Src가 0인 경우 dst도 0으로 설정 - dst가 음수인 경우 결측치로 설정 - 0으로 나누는 것을 방지하기 위해 epsilon = 1e-25로 둠 - Dst feature에 대해 wave length를 고려하여, exp(wave_length* A)를 곱해줌 - 이 때 A = 1/500 혹은 80 혹은 100 으로 조절하는 것이 결과가 좋았음 - Dst/src 를 ratio로 정의하여 ratio 자체를 사용하는 것과 log(ratio)를 같이 사용함 - 변수의 다양성을 위해 보간법을 사용한 뒤 wave_length 보정하는 것과 wave_length 보정 한 뒤에 선형 보간을 하는 것을 둘다 사용함 - log(ratio) 의 경우, 두 개의 wave length에 해당하는 값의 차이를 추가로 구하여 feature에 추가 (np.roll을 이용하여 바로 옆 뿐만 아니라 멀리 떨어진 값의 차이도 같이 구하여 feature에 추가함) - Dst data, log(ratio) 데이터의 경우 PCA, ICA를 이용하여 적은 수의 dim에 대해 추가적인 feature를 추가해줌
  • 4. https://dacon.io 4 2. 계층적 모델 구성 - 총 2개의 모델을 구성 (model, post model) - 첫번째 모델은 전처리된 feature를 바탕으로 각 종류의 농도를 구함 - 이 때 먼저 구한 종류의 농도는 feature가 됨: 예를 들어 처음에는 전처리된 feature 만으로 hhb농도를 구하고, 전처리된 feature + 예측된 hhb농도로 hbo2를 구하고, 전처리된 feature feature + 예측된 hhb농도 + 예측된 hho2농도를 바탕으로 ca를 구 하는 등의 단계적 방법임. - 두번째 모델(post model)은 전처리된 feature + 첫번째 모델에서 구한 농도들을 모두 feature로 써서 다시 각 종류의 농도를 예측함 - 10- fold cross validation 사용하여 10개의 모델을 앙상블함. - 두 모델 모두 Lightgbm regressor를 사용함 - 하이퍼 파라미터는 아래와 같음 (왼쪽: 첫번째 모델, 오른쪽: 두번째 모델)
  • 5. https://dacon.io 5 3. 결론 - Trainining 용 데이터의 경우 overfitting이 잘 되는 것을 관찰하여 test data 에 대한 성능을 높이기 쉽지 않았음. - 최종 리더보드 결과: 0.80126 (mae) - 딥러닝 (컨볼루션 혹은 RNN) 을 사용하였으면 더 좋았을 것 같다. - 소스코드: https://dacon.io/competitions/official/235608/codeshare/1320?page=1&dtype=recent&ptyp e=pub