SlideShare a Scribd company logo
1 of 8
Download to read offline
https://dacon.io
Dacon 15회 원자력발전소
상태 판단 모델링 경진대회
남자둘여자둘
목차
https://dacon.io 2
STEP 1 데이터 전처리 & 변수 선택
모델 구축 & 검증STEP 2
결과 및 결언STEP 3
데이터 다운로드
https://dacon.io 3
1-1. 데이터 전처리
문자열 (Bad, ON, OFF, CLOSE, Open equip fail, Normal, No Data, System char[],
MID POSITION, Priority 3, Configure)과 Null 값에 대해서 다른 데이터와 비교하
여 데이터의 특성에 맞게 최빈값 전처리
…
<원본 데이터>
데이터 다운로드
https://dacon.io 4
1-2. 변수 선택
목적: 변별력이 없는 변수를 제거하여 정확도와 속도 개선
수행내용: 특정 변수의 데이터가 모두 동일하다면 (원소의 수가 하나라면) 상태판단에 변
별력이 없을 것임. 따라서 모든 데이터가 동일한 변수를 제외
결과: 5122개의 변수 중 3513개의 변수 선택
train과 test셋에 적용 시켜준 뒤, 재사용을 위해 저장
데이터 다운로드
https://dacon.io 5
<모델 구축 parameter 값>
1000 epoch씩 학습시키며 모델을 저장하고
log_loss값 확인
총 6000번의 학습을 진행하여 모델을 구축
2. 모델 구축 & 검증
learning_rate, max_depth, num_leaves,
fraction 값들을 조정하면서 학습 실행
데이터 다운로드
https://dacon.io 6
결과값 ( Submission) 에 대해 MinMax로 Rescaling 하여 값을 보정하였다.
<결과 원본> <결과 보정 값>
2. 모델 구축 & 검증 데이터 다운로드
https://dacon.io 7
3. 결과 및 결언
- 6000번까지 1000번 단위로 epoch를 늘려가며 학습을 수행
- 검증셋에 대한 logloss는 epoch가 6000일 때 0.213872, epoch가 4000일 때 0.229422로
epoch 6000일 때가 더 좋은 분류모델인 것으로 판단되었음
- 하지만 가채점 결과, epoch 4000 일 때의 모델에 의한 logloss가 0.015 정도 더 낮은 결과를 보임
- 이는 6000 epoch동안 학습한 모델이 training Data에 대해 오버피팅 된 것으로 판단됨
- 스케일링 방식 : 1) mean (scale X) | 2) scale -> mean | 3) mean -> scale
- 3) mean -> scale 순으로 스케일한 방식이 logloss가 가장 낮은 결과를 보여줌 (최종제출파일)
데이터 다운로드
THANK YOU
THANK YOU
https://dacon.io 8
대회 참여해보기

More Related Content

Similar to 원자력발전소 상태 판단 대회 2위 수상자 코드 설명

생체 광학 데이터 분석 AI 경진대회 4위 수상작
생체 광학 데이터 분석 AI 경진대회 4위 수상작생체 광학 데이터 분석 AI 경진대회 4위 수상작
생체 광학 데이터 분석 AI 경진대회 4위 수상작DACON AI 데이콘
 
위성관측 데이터 활용 강수량 산출 AI 경진대회 1위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 1위 수상작위성관측 데이터 활용 강수량 산출 AI 경진대회 1위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 1위 수상작DACON AI 데이콘
 
배치 프로그램에서 튜닝대상 SQL 추출하기_Wh oracle
배치 프로그램에서 튜닝대상 SQL 추출하기_Wh oracle배치 프로그램에서 튜닝대상 SQL 추출하기_Wh oracle
배치 프로그램에서 튜닝대상 SQL 추출하기_Wh oracle엑셈
 
위성관측 데이터 활용 강수량 산출 AI 경진대회 2위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 2위 수상작위성관측 데이터 활용 강수량 산출 AI 경진대회 2위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 2위 수상작ssuserfa4e58
 
위성관측 데이터 활용 강수량 산출 AI 경진대회 2위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 2위 수상작위성관측 데이터 활용 강수량 산출 AI 경진대회 2위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 2위 수상작DACON AI 데이콘
 
Spark performance tuning
Spark performance tuningSpark performance tuning
Spark performance tuninghaiteam
 
02.실행환경 교육교재(데이터처리)
02.실행환경 교육교재(데이터처리)02.실행환경 교육교재(데이터처리)
02.실행환경 교육교재(데이터처리)Hankyo
 
MariaDB 마이그레이션 - 네오클로바
MariaDB 마이그레이션 - 네오클로바MariaDB 마이그레이션 - 네오클로바
MariaDB 마이그레이션 - 네오클로바NeoClova
 
천체 유형 분류 대회 1위 수상자 코드 설명
천체 유형 분류 대회 1위 수상자 코드 설명천체 유형 분류 대회 1위 수상자 코드 설명
천체 유형 분류 대회 1위 수상자 코드 설명DACON AI 데이콘
 
데이터 분석 프로세스
데이터 분석 프로세스데이터 분석 프로세스
데이터 분석 프로세스Lee Seungeun
 
천체 유형 분류 대회 2위 수상자 코드 설명
천체 유형 분류 대회 2위 수상자 코드 설명천체 유형 분류 대회 2위 수상자 코드 설명
천체 유형 분류 대회 2위 수상자 코드 설명DACON AI 데이콘
 

Similar to 원자력발전소 상태 판단 대회 2위 수상자 코드 설명 (11)

생체 광학 데이터 분석 AI 경진대회 4위 수상작
생체 광학 데이터 분석 AI 경진대회 4위 수상작생체 광학 데이터 분석 AI 경진대회 4위 수상작
생체 광학 데이터 분석 AI 경진대회 4위 수상작
 
위성관측 데이터 활용 강수량 산출 AI 경진대회 1위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 1위 수상작위성관측 데이터 활용 강수량 산출 AI 경진대회 1위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 1위 수상작
 
배치 프로그램에서 튜닝대상 SQL 추출하기_Wh oracle
배치 프로그램에서 튜닝대상 SQL 추출하기_Wh oracle배치 프로그램에서 튜닝대상 SQL 추출하기_Wh oracle
배치 프로그램에서 튜닝대상 SQL 추출하기_Wh oracle
 
위성관측 데이터 활용 강수량 산출 AI 경진대회 2위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 2위 수상작위성관측 데이터 활용 강수량 산출 AI 경진대회 2위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 2위 수상작
 
위성관측 데이터 활용 강수량 산출 AI 경진대회 2위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 2위 수상작위성관측 데이터 활용 강수량 산출 AI 경진대회 2위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 2위 수상작
 
Spark performance tuning
Spark performance tuningSpark performance tuning
Spark performance tuning
 
02.실행환경 교육교재(데이터처리)
02.실행환경 교육교재(데이터처리)02.실행환경 교육교재(데이터처리)
02.실행환경 교육교재(데이터처리)
 
MariaDB 마이그레이션 - 네오클로바
MariaDB 마이그레이션 - 네오클로바MariaDB 마이그레이션 - 네오클로바
MariaDB 마이그레이션 - 네오클로바
 
천체 유형 분류 대회 1위 수상자 코드 설명
천체 유형 분류 대회 1위 수상자 코드 설명천체 유형 분류 대회 1위 수상자 코드 설명
천체 유형 분류 대회 1위 수상자 코드 설명
 
데이터 분석 프로세스
데이터 분석 프로세스데이터 분석 프로세스
데이터 분석 프로세스
 
천체 유형 분류 대회 2위 수상자 코드 설명
천체 유형 분류 대회 2위 수상자 코드 설명천체 유형 분류 대회 2위 수상자 코드 설명
천체 유형 분류 대회 2위 수상자 코드 설명
 

More from DACON AI 데이콘

Introduction to e tapr for hai con -eng
Introduction to e tapr for hai con -engIntroduction to e tapr for hai con -eng
Introduction to e tapr for hai con -engDACON AI 데이콘
 
Introduction to e tapr for hai con -kor
Introduction to e tapr for hai con -korIntroduction to e tapr for hai con -kor
Introduction to e tapr for hai con -korDACON AI 데이콘
 
20210728 대회주최 문의
20210728 대회주최 문의20210728 대회주최 문의
20210728 대회주최 문의DACON AI 데이콘
 
K-Fashion 경진대회 2등 수상자 솔루션
K-Fashion 경진대회 2등 수상자 솔루션K-Fashion 경진대회 2등 수상자 솔루션
K-Fashion 경진대회 2등 수상자 솔루션DACON AI 데이콘
 
K-Fashion 경진대회 3등 수상자 솔루션
K-Fashion 경진대회 3등 수상자 솔루션K-Fashion 경진대회 3등 수상자 솔루션
K-Fashion 경진대회 3등 수상자 솔루션DACON AI 데이콘
 
아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션DACON AI 데이콘
 
아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션DACON AI 데이콘
 
진동데이터 활용 충돌체 탐지 AI 경진대회 2등
진동데이터 활용 충돌체 탐지 AI 경진대회 2등진동데이터 활용 충돌체 탐지 AI 경진대회 2등
진동데이터 활용 충돌체 탐지 AI 경진대회 2등DACON AI 데이콘
 
진동데이터 활용 충돌체 탐지 AI 경진대회 1등
진동데이터 활용 충돌체 탐지 AI 경진대회 1등진동데이터 활용 충돌체 탐지 AI 경진대회 1등
진동데이터 활용 충돌체 탐지 AI 경진대회 1등DACON AI 데이콘
 
포스트 코로나 데이터 시각화 경진대회 - 대상
포스트 코로나 데이터 시각화 경진대회 - 대상포스트 코로나 데이터 시각화 경진대회 - 대상
포스트 코로나 데이터 시각화 경진대회 - 대상DACON AI 데이콘
 
포스트 코로나 데이터 시각화 경진대회 - 최우수상
포스트 코로나 데이터 시각화 경진대회 - 최우수상포스트 코로나 데이터 시각화 경진대회 - 최우수상
포스트 코로나 데이터 시각화 경진대회 - 최우수상DACON AI 데이콘
 
포스트 코로나 데이터 시각화 경진대회 - 우수상
포스트 코로나 데이터 시각화 경진대회 - 우수상포스트 코로나 데이터 시각화 경진대회 - 우수상
포스트 코로나 데이터 시각화 경진대회 - 우수상DACON AI 데이콘
 
포스트 코로나 데이터 시각화 경진대회 - 장려상2
포스트 코로나 데이터 시각화 경진대회 - 장려상2포스트 코로나 데이터 시각화 경진대회 - 장려상2
포스트 코로나 데이터 시각화 경진대회 - 장려상2DACON AI 데이콘
 
포스트 코로나 데이터 시각화 경진대회 - 장려상
포스트 코로나 데이터 시각화 경진대회 - 장려상포스트 코로나 데이터 시각화 경진대회 - 장려상
포스트 코로나 데이터 시각화 경진대회 - 장려상DACON AI 데이콘
 
생체 광학 데이터 분석 AI 경진대회 10위 수상작
생체 광학 데이터 분석 AI 경진대회 10위 수상작생체 광학 데이터 분석 AI 경진대회 10위 수상작
생체 광학 데이터 분석 AI 경진대회 10위 수상작DACON AI 데이콘
 

More from DACON AI 데이콘 (20)

Introduction to e tapr for hai con -eng
Introduction to e tapr for hai con -engIntroduction to e tapr for hai con -eng
Introduction to e tapr for hai con -eng
 
Introduction to e tapr for hai con -kor
Introduction to e tapr for hai con -korIntroduction to e tapr for hai con -kor
Introduction to e tapr for hai con -kor
 
20210728 대회주최 문의
20210728 대회주최 문의20210728 대회주최 문의
20210728 대회주최 문의
 
데이콘 뽀개기
데이콘 뽀개기데이콘 뽀개기
데이콘 뽀개기
 
Bittrader competition (1)
Bittrader competition (1)Bittrader competition (1)
Bittrader competition (1)
 
Bittrader competition
Bittrader competitionBittrader competition
Bittrader competition
 
Superbai
SuperbaiSuperbai
Superbai
 
K-Fashion 경진대회 2등 수상자 솔루션
K-Fashion 경진대회 2등 수상자 솔루션K-Fashion 경진대회 2등 수상자 솔루션
K-Fashion 경진대회 2등 수상자 솔루션
 
K-Fashion 경진대회 3등 수상자 솔루션
K-Fashion 경진대회 3등 수상자 솔루션K-Fashion 경진대회 3등 수상자 솔루션
K-Fashion 경진대회 3등 수상자 솔루션
 
아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션
 
아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션
 
진동데이터 활용 충돌체 탐지 AI 경진대회 2등
진동데이터 활용 충돌체 탐지 AI 경진대회 2등진동데이터 활용 충돌체 탐지 AI 경진대회 2등
진동데이터 활용 충돌체 탐지 AI 경진대회 2등
 
진동데이터 활용 충돌체 탐지 AI 경진대회 1등
진동데이터 활용 충돌체 탐지 AI 경진대회 1등진동데이터 활용 충돌체 탐지 AI 경진대회 1등
진동데이터 활용 충돌체 탐지 AI 경진대회 1등
 
20200923
2020092320200923
20200923
 
포스트 코로나 데이터 시각화 경진대회 - 대상
포스트 코로나 데이터 시각화 경진대회 - 대상포스트 코로나 데이터 시각화 경진대회 - 대상
포스트 코로나 데이터 시각화 경진대회 - 대상
 
포스트 코로나 데이터 시각화 경진대회 - 최우수상
포스트 코로나 데이터 시각화 경진대회 - 최우수상포스트 코로나 데이터 시각화 경진대회 - 최우수상
포스트 코로나 데이터 시각화 경진대회 - 최우수상
 
포스트 코로나 데이터 시각화 경진대회 - 우수상
포스트 코로나 데이터 시각화 경진대회 - 우수상포스트 코로나 데이터 시각화 경진대회 - 우수상
포스트 코로나 데이터 시각화 경진대회 - 우수상
 
포스트 코로나 데이터 시각화 경진대회 - 장려상2
포스트 코로나 데이터 시각화 경진대회 - 장려상2포스트 코로나 데이터 시각화 경진대회 - 장려상2
포스트 코로나 데이터 시각화 경진대회 - 장려상2
 
포스트 코로나 데이터 시각화 경진대회 - 장려상
포스트 코로나 데이터 시각화 경진대회 - 장려상포스트 코로나 데이터 시각화 경진대회 - 장려상
포스트 코로나 데이터 시각화 경진대회 - 장려상
 
생체 광학 데이터 분석 AI 경진대회 10위 수상작
생체 광학 데이터 분석 AI 경진대회 10위 수상작생체 광학 데이터 분석 AI 경진대회 10위 수상작
생체 광학 데이터 분석 AI 경진대회 10위 수상작
 

원자력발전소 상태 판단 대회 2위 수상자 코드 설명

  • 1. https://dacon.io Dacon 15회 원자력발전소 상태 판단 모델링 경진대회 남자둘여자둘
  • 2. 목차 https://dacon.io 2 STEP 1 데이터 전처리 & 변수 선택 모델 구축 & 검증STEP 2 결과 및 결언STEP 3 데이터 다운로드
  • 3. https://dacon.io 3 1-1. 데이터 전처리 문자열 (Bad, ON, OFF, CLOSE, Open equip fail, Normal, No Data, System char[], MID POSITION, Priority 3, Configure)과 Null 값에 대해서 다른 데이터와 비교하 여 데이터의 특성에 맞게 최빈값 전처리 … <원본 데이터> 데이터 다운로드
  • 4. https://dacon.io 4 1-2. 변수 선택 목적: 변별력이 없는 변수를 제거하여 정확도와 속도 개선 수행내용: 특정 변수의 데이터가 모두 동일하다면 (원소의 수가 하나라면) 상태판단에 변 별력이 없을 것임. 따라서 모든 데이터가 동일한 변수를 제외 결과: 5122개의 변수 중 3513개의 변수 선택 train과 test셋에 적용 시켜준 뒤, 재사용을 위해 저장 데이터 다운로드
  • 5. https://dacon.io 5 <모델 구축 parameter 값> 1000 epoch씩 학습시키며 모델을 저장하고 log_loss값 확인 총 6000번의 학습을 진행하여 모델을 구축 2. 모델 구축 & 검증 learning_rate, max_depth, num_leaves, fraction 값들을 조정하면서 학습 실행 데이터 다운로드
  • 6. https://dacon.io 6 결과값 ( Submission) 에 대해 MinMax로 Rescaling 하여 값을 보정하였다. <결과 원본> <결과 보정 값> 2. 모델 구축 & 검증 데이터 다운로드
  • 7. https://dacon.io 7 3. 결과 및 결언 - 6000번까지 1000번 단위로 epoch를 늘려가며 학습을 수행 - 검증셋에 대한 logloss는 epoch가 6000일 때 0.213872, epoch가 4000일 때 0.229422로 epoch 6000일 때가 더 좋은 분류모델인 것으로 판단되었음 - 하지만 가채점 결과, epoch 4000 일 때의 모델에 의한 logloss가 0.015 정도 더 낮은 결과를 보임 - 이는 6000 epoch동안 학습한 모델이 training Data에 대해 오버피팅 된 것으로 판단됨 - 스케일링 방식 : 1) mean (scale X) | 2) scale -> mean | 3) mean -> scale - 3) mean -> scale 순으로 스케일한 방식이 logloss가 가장 낮은 결과를 보여줌 (최종제출파일) 데이터 다운로드
  • 8. THANK YOU THANK YOU https://dacon.io 8 대회 참여해보기