SlideShare a Scribd company logo
1 of 9
Download to read offline
https://dacon.io
Dacon 13회
Mission 13. 2019 Jeju BigData Competition
-퇴근시간 버스승차인원 예측 모델링 경진대회
Dining
목차
1
2
3
STEP 1
STEP 2
STEP 3
https://dacon.io 2
데이터 전처리 & EDA
모델 구축 & 검증
결과 및 결언
데이터 전처리
모델링
CV system
• LGBM
• KFold
• _________
• _________
• _________
• cleaning
• combine
• Remove outlier
• Agg feuatre
https://dacon.io 3
1. 데이터 전처리
1. Cleaning
2. Combine
3. Outlier remove
4. Agg feature
5. Frequency encoding
데이터 다운로드
https://dacon.io 4
1. 데이터 전처리
1. Cleaning
- Bus route id 0000 제거
- Station name 띄어쓰기 제거
- 위도, 경도 round해서 사용
2. Combine
- Bus route id + station code
- Bus route id + 위도, 경도 정보
3. Outlier remove
- Train, test data 두개의 데이터 셋에 모두
존재하는 데이터만 사용
데이터 다운로드
https://dacon.io 5
1. 데이터 전처리
4. Agg Feature
- Day 기준, 평균/80백분위수 데이터로 집계함수 사용
- Day 기준, (bus route id, station code, station name)
평균/80백분위수 데이터로 집계함수 사용
5. Frequency encoding
- Bus route id, station code, station name 등의
Categorical 변수의 경우 빈도수를 계산해 줌으로써
모델에 다양한 정보를 주었음
데이터 다운로드
https://dacon.io 6
2. 모델링
1. Lgbm 사용
2. 파라미터
데이터 다운로드
https://dacon.io 7
2. 모델링
4. CV score와 lb score를 맞추기 위해 노력하였고,
마지막의 잘못된 피쳐를 제외하고는 모두 일치하였습니다.
3. Feature importance
데이터 다운로드
https://dacon.io 8
3. CV system
1. Kfold를 이용한 out of folds 이용
2. StratifiedKFold 를 이용
3. 앙상블
대회 참가해보기
THANK YOU

More Related Content

Similar to 제주 퇴근시간 버스 승차 인원 예측 2등 수상작

위성관측 데이터 활용 강수량 산출 AI 경진대회 1위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 1위 수상작위성관측 데이터 활용 강수량 산출 AI 경진대회 1위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 1위 수상작DACON AI 데이콘
 
위성관측 데이터 활용 강수량 산출 AI 경진대회 2위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 2위 수상작위성관측 데이터 활용 강수량 산출 AI 경진대회 2위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 2위 수상작ssuserfa4e58
 
위성관측 데이터 활용 강수량 산출 AI 경진대회 2위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 2위 수상작위성관측 데이터 활용 강수량 산출 AI 경진대회 2위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 2위 수상작DACON AI 데이콘
 
위성관측 데이터 활용 강수량 산출 AI 경진대회 3위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 3위 수상작위성관측 데이터 활용 강수량 산출 AI 경진대회 3위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 3위 수상작DACON AI 데이콘
 
Prediction of bus riders at the time of departure
Prediction of bus riders at the time of departurePrediction of bus riders at the time of departure
Prediction of bus riders at the time of departureHWANGTAEYONG
 
진동데이터 활용 충돌체 탐지 AI 경진대회 2등
진동데이터 활용 충돌체 탐지 AI 경진대회 2등진동데이터 활용 충돌체 탐지 AI 경진대회 2등
진동데이터 활용 충돌체 탐지 AI 경진대회 2등DACON AI 데이콘
 

Similar to 제주 퇴근시간 버스 승차 인원 예측 2등 수상작 (7)

위성관측 데이터 활용 강수량 산출 AI 경진대회 1위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 1위 수상작위성관측 데이터 활용 강수량 산출 AI 경진대회 1위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 1위 수상작
 
위성관측 데이터 활용 강수량 산출 AI 경진대회 2위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 2위 수상작위성관측 데이터 활용 강수량 산출 AI 경진대회 2위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 2위 수상작
 
위성관측 데이터 활용 강수량 산출 AI 경진대회 2위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 2위 수상작위성관측 데이터 활용 강수량 산출 AI 경진대회 2위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 2위 수상작
 
5959 mrc ppt
5959 mrc ppt5959 mrc ppt
5959 mrc ppt
 
위성관측 데이터 활용 강수량 산출 AI 경진대회 3위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 3위 수상작위성관측 데이터 활용 강수량 산출 AI 경진대회 3위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 3위 수상작
 
Prediction of bus riders at the time of departure
Prediction of bus riders at the time of departurePrediction of bus riders at the time of departure
Prediction of bus riders at the time of departure
 
진동데이터 활용 충돌체 탐지 AI 경진대회 2등
진동데이터 활용 충돌체 탐지 AI 경진대회 2등진동데이터 활용 충돌체 탐지 AI 경진대회 2등
진동데이터 활용 충돌체 탐지 AI 경진대회 2등
 

More from DACON AI 데이콘

Introduction to e tapr for hai con -eng
Introduction to e tapr for hai con -engIntroduction to e tapr for hai con -eng
Introduction to e tapr for hai con -engDACON AI 데이콘
 
Introduction to e tapr for hai con -kor
Introduction to e tapr for hai con -korIntroduction to e tapr for hai con -kor
Introduction to e tapr for hai con -korDACON AI 데이콘
 
20210728 대회주최 문의
20210728 대회주최 문의20210728 대회주최 문의
20210728 대회주최 문의DACON AI 데이콘
 
K-Fashion 경진대회 2등 수상자 솔루션
K-Fashion 경진대회 2등 수상자 솔루션K-Fashion 경진대회 2등 수상자 솔루션
K-Fashion 경진대회 2등 수상자 솔루션DACON AI 데이콘
 
K-Fashion 경진대회 3등 수상자 솔루션
K-Fashion 경진대회 3등 수상자 솔루션K-Fashion 경진대회 3등 수상자 솔루션
K-Fashion 경진대회 3등 수상자 솔루션DACON AI 데이콘
 
아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션DACON AI 데이콘
 
아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션DACON AI 데이콘
 
진동데이터 활용 충돌체 탐지 AI 경진대회 1등
진동데이터 활용 충돌체 탐지 AI 경진대회 1등진동데이터 활용 충돌체 탐지 AI 경진대회 1등
진동데이터 활용 충돌체 탐지 AI 경진대회 1등DACON AI 데이콘
 
포스트 코로나 데이터 시각화 경진대회 - 대상
포스트 코로나 데이터 시각화 경진대회 - 대상포스트 코로나 데이터 시각화 경진대회 - 대상
포스트 코로나 데이터 시각화 경진대회 - 대상DACON AI 데이콘
 
포스트 코로나 데이터 시각화 경진대회 - 최우수상
포스트 코로나 데이터 시각화 경진대회 - 최우수상포스트 코로나 데이터 시각화 경진대회 - 최우수상
포스트 코로나 데이터 시각화 경진대회 - 최우수상DACON AI 데이콘
 
포스트 코로나 데이터 시각화 경진대회 - 우수상
포스트 코로나 데이터 시각화 경진대회 - 우수상포스트 코로나 데이터 시각화 경진대회 - 우수상
포스트 코로나 데이터 시각화 경진대회 - 우수상DACON AI 데이콘
 
포스트 코로나 데이터 시각화 경진대회 - 장려상2
포스트 코로나 데이터 시각화 경진대회 - 장려상2포스트 코로나 데이터 시각화 경진대회 - 장려상2
포스트 코로나 데이터 시각화 경진대회 - 장려상2DACON AI 데이콘
 
포스트 코로나 데이터 시각화 경진대회 - 장려상
포스트 코로나 데이터 시각화 경진대회 - 장려상포스트 코로나 데이터 시각화 경진대회 - 장려상
포스트 코로나 데이터 시각화 경진대회 - 장려상DACON AI 데이콘
 
생체 광학 데이터 분석 AI 경진대회 10위 수상작
생체 광학 데이터 분석 AI 경진대회 10위 수상작생체 광학 데이터 분석 AI 경진대회 10위 수상작
생체 광학 데이터 분석 AI 경진대회 10위 수상작DACON AI 데이콘
 
생체 광학 데이터 분석 AI 경진대회 9위 수상작
생체 광학 데이터 분석 AI 경진대회 9위 수상작생체 광학 데이터 분석 AI 경진대회 9위 수상작
생체 광학 데이터 분석 AI 경진대회 9위 수상작DACON AI 데이콘
 

More from DACON AI 데이콘 (20)

Introduction to e tapr for hai con -eng
Introduction to e tapr for hai con -engIntroduction to e tapr for hai con -eng
Introduction to e tapr for hai con -eng
 
Introduction to e tapr for hai con -kor
Introduction to e tapr for hai con -korIntroduction to e tapr for hai con -kor
Introduction to e tapr for hai con -kor
 
20210728 대회주최 문의
20210728 대회주최 문의20210728 대회주최 문의
20210728 대회주최 문의
 
데이콘 뽀개기
데이콘 뽀개기데이콘 뽀개기
데이콘 뽀개기
 
Bittrader competition (1)
Bittrader competition (1)Bittrader competition (1)
Bittrader competition (1)
 
Bittrader competition
Bittrader competitionBittrader competition
Bittrader competition
 
Superbai
SuperbaiSuperbai
Superbai
 
K-Fashion 경진대회 2등 수상자 솔루션
K-Fashion 경진대회 2등 수상자 솔루션K-Fashion 경진대회 2등 수상자 솔루션
K-Fashion 경진대회 2등 수상자 솔루션
 
K-Fashion 경진대회 3등 수상자 솔루션
K-Fashion 경진대회 3등 수상자 솔루션K-Fashion 경진대회 3등 수상자 솔루션
K-Fashion 경진대회 3등 수상자 솔루션
 
아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션
 
아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션
 
진동데이터 활용 충돌체 탐지 AI 경진대회 1등
진동데이터 활용 충돌체 탐지 AI 경진대회 1등진동데이터 활용 충돌체 탐지 AI 경진대회 1등
진동데이터 활용 충돌체 탐지 AI 경진대회 1등
 
20200923
2020092320200923
20200923
 
포스트 코로나 데이터 시각화 경진대회 - 대상
포스트 코로나 데이터 시각화 경진대회 - 대상포스트 코로나 데이터 시각화 경진대회 - 대상
포스트 코로나 데이터 시각화 경진대회 - 대상
 
포스트 코로나 데이터 시각화 경진대회 - 최우수상
포스트 코로나 데이터 시각화 경진대회 - 최우수상포스트 코로나 데이터 시각화 경진대회 - 최우수상
포스트 코로나 데이터 시각화 경진대회 - 최우수상
 
포스트 코로나 데이터 시각화 경진대회 - 우수상
포스트 코로나 데이터 시각화 경진대회 - 우수상포스트 코로나 데이터 시각화 경진대회 - 우수상
포스트 코로나 데이터 시각화 경진대회 - 우수상
 
포스트 코로나 데이터 시각화 경진대회 - 장려상2
포스트 코로나 데이터 시각화 경진대회 - 장려상2포스트 코로나 데이터 시각화 경진대회 - 장려상2
포스트 코로나 데이터 시각화 경진대회 - 장려상2
 
포스트 코로나 데이터 시각화 경진대회 - 장려상
포스트 코로나 데이터 시각화 경진대회 - 장려상포스트 코로나 데이터 시각화 경진대회 - 장려상
포스트 코로나 데이터 시각화 경진대회 - 장려상
 
생체 광학 데이터 분석 AI 경진대회 10위 수상작
생체 광학 데이터 분석 AI 경진대회 10위 수상작생체 광학 데이터 분석 AI 경진대회 10위 수상작
생체 광학 데이터 분석 AI 경진대회 10위 수상작
 
생체 광학 데이터 분석 AI 경진대회 9위 수상작
생체 광학 데이터 분석 AI 경진대회 9위 수상작생체 광학 데이터 분석 AI 경진대회 9위 수상작
생체 광학 데이터 분석 AI 경진대회 9위 수상작
 

제주 퇴근시간 버스 승차 인원 예측 2등 수상작

  • 1. https://dacon.io Dacon 13회 Mission 13. 2019 Jeju BigData Competition -퇴근시간 버스승차인원 예측 모델링 경진대회 Dining
  • 2. 목차 1 2 3 STEP 1 STEP 2 STEP 3 https://dacon.io 2 데이터 전처리 & EDA 모델 구축 & 검증 결과 및 결언 데이터 전처리 모델링 CV system • LGBM • KFold • _________ • _________ • _________ • cleaning • combine • Remove outlier • Agg feuatre
  • 3. https://dacon.io 3 1. 데이터 전처리 1. Cleaning 2. Combine 3. Outlier remove 4. Agg feature 5. Frequency encoding
  • 4. 데이터 다운로드 https://dacon.io 4 1. 데이터 전처리 1. Cleaning - Bus route id 0000 제거 - Station name 띄어쓰기 제거 - 위도, 경도 round해서 사용 2. Combine - Bus route id + station code - Bus route id + 위도, 경도 정보 3. Outlier remove - Train, test data 두개의 데이터 셋에 모두 존재하는 데이터만 사용
  • 5. 데이터 다운로드 https://dacon.io 5 1. 데이터 전처리 4. Agg Feature - Day 기준, 평균/80백분위수 데이터로 집계함수 사용 - Day 기준, (bus route id, station code, station name) 평균/80백분위수 데이터로 집계함수 사용 5. Frequency encoding - Bus route id, station code, station name 등의 Categorical 변수의 경우 빈도수를 계산해 줌으로써 모델에 다양한 정보를 주었음
  • 6. 데이터 다운로드 https://dacon.io 6 2. 모델링 1. Lgbm 사용 2. 파라미터
  • 7. 데이터 다운로드 https://dacon.io 7 2. 모델링 4. CV score와 lb score를 맞추기 위해 노력하였고, 마지막의 잘못된 피쳐를 제외하고는 모두 일치하였습니다. 3. Feature importance
  • 8. 데이터 다운로드 https://dacon.io 8 3. CV system 1. Kfold를 이용한 out of folds 이용 2. StratifiedKFold 를 이용 3. 앙상블