Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

빅데이터 윈윈 컨퍼런스_빅데이터 기반 지능형 도시가스 배관 위험 예측 기술 개발

661 views

Published on

[빅데이터 윈윈(Win-Win)컨퍼런스]메타라이츠-박길주 이사

Published in: Data & Analytics
  • Be the first to comment

빅데이터 윈윈 컨퍼런스_빅데이터 기반 지능형 도시가스 배관 위험 예측 기술 개발

  1. 1. 도시가스 배관에 대한 상시 감시체계 구축 및 빅데이터 기반 위험 예측 기술 개발로 배관안전 사전조치 및 안전하고 행복한 국민 생활기반 마련 • 과 제 명 : 빅데이터 기반 지능형 도시가스 배관 위험 예측 관리 기술 개발 • 과제주관 : 메타라이츠㈜, 한국가스안전공사 가스안전연구원(참여) • 수행내용 - 배관안전관리시스템, 배관위험예측관리시스템 개발 1) 실시간 배관 상태 안전 모니터링 서비스 개발(도시가스사) 2) 빅데이터 분석 기술 기반 실시간 배관 위험 예측 서비스 개발(빅데이터센터) 3) 사고 긴급 차단 및 배관 안전 정보 서비스 개발(도시가스 담당자) - 도시가스사 현장 적용/검증 및 사업홍보(K-ICT 빅데이터센터 성과전시회 및 세미나 참여) - K-ICT 빅데이터센터 사업과의 연계 및 협력(데이터셋 제공 등)
  2. 2. 배관에 부착된 장치로부터 배관 상태 데이터를 자동 수집하고 딥러닝 기술을 활용한 배관 안전 빅데이터 분석 및 위험 예측과 대응 기술 개발
  3. 3. • 문제발견 - 문제 발견까지의 시간이 소요(점검주기 : 1년, 5년) - 일부 위험요소만 확인 - 현장 방문 조사 및 점검원의 교통사고 위험 상존 • 상황분석 - 수동 자료 수집 및 시간과 인력 소요가 많음 - 경험적 판단에 의한 원인 분석(Scoring Chart) - 실제 굴착을 통한 손상 확인 및 고비용 발생 • 의사결정 - 의사결정에 대한 시간이 오래 걸림 - 검증 불가, 실제 적용을 통해 확인 • 문제발견 - 문제 발생시 즉시 발견 - 종합적 위험요인 분석 - IoT 기반 원격측정 및 실시간 데이터 수집 • 상황분석 - 실시간 배관 상태 자료 수집 - 딥러닝 및 통계적 기법을 통한 분석 - 데이터 기반 객관적 원인 분석 • 의사결정 - 시스템을 통한 빠른 의사결정 지원 - 데이터 분석 검증 기법을 통한 확인 - 예측을 통한 사전 예방
  4. 4. 2007 – 2010년 사이 배관 사고 원인 - 미국 PHMSA(파이프라인 및 위험물안전청) 자료 공사 신고 - 확인 SCADA 등 확인 점검, 간접 측정 자료 점검, 간접 측정 자료 ● 배관의 주요 위험 원인
  5. 5. ● 배관 위험 예측
  6. 6. ● 배관안전 데이터 개요 ● 측정 데이터 기준 정보 유형 대상 정보 장치 정보 배관, 정압기, 정류기, 테스트박스(TestBox, TB), FMS 측정정보 실시간 정압기, 정류기, TB 데이터, FMS 데이터 비실시간 TB검사(전위), 정압기검사(1,2차압력), 정류기검사(출력전압, 출력전류, 방식전위) 정밀안전진단(DCVG %IR, CIPS 전위) 데이터 기준 전위 자연 –500 ~ -450mV, 분위-부식방지를 위하여 –850mV이하 유지 저항 2Ω 전류 전류가 높으면 전압은 낮음. 소모량(mA):많이 소모되면 이상 상태 %IR 저항대비 소모량으로 35% 이상이면 결함 - 과대하게 전류를 사용함 IRDrop 낮음 ● 압력 이상값 경보 기준 구분 이상경보 기준 비고 HIHI HI LOW LOLO 정압기 1차압력 0.93 0.90 0.65 0.60 2차압력 2.80 2.70 1.70 1.60 46 44 35 33 조정기 1차압력 - 0.93 0.65 - 2차압력 - 2.70 1.70 - 구분 상용압력이 2.5kPa인경우 상용압력이 40kPa인 경우 그 밖의 경우 이상압력 통보설비 상한값 3.2kPa 이하 (2.7kPa) (44kPa) 상용압력의 1.1배 이하 하한값 1.2kPa 이하 (1.7kPa) (35kPa) 상용압력의 0.7배 이상
  7. 7. 장치 속성 정보 비고 배관 공사번호, 배관번호, 배관유형(PLP), 운영압력(MPa, 중압), 관경(A), 두께(mm), 연장(길이), 토양비저항(Ω-㎝), 방식방법(외부전원법), 접합방법, 밸브수, TB수, 구역, 구간 TestBox 관리번호, 방식방법, 설치방법, 설치형태, 구역, 구간 정압기 공사번호, 정압기번호, 정압기유형, 구조형태, 공급압력(MPa), 입구관경(A), 출구관경(A), 구역, 구간 정류기 공사번호, 정류기번호, 정격출력(V), 소요전류밀도(mA/㎡), 토양비저항(Ω-㎝), 사용양극 FMS FMS번호, 공급유량, 공급열량 ● 장치정보 – 운영환경 주요 속성정보 장치 속성 값/단위 샘플 수집방법 실시간 정보 TB 전위 mV -1.46mV 수집주기 : 5초 이내(10개), 수집방식 : 원격전송(LoRa) 정압기 1차압력 MPa 0.785MPa 수집주기 : 5초 이내 수집방식 : SCADA 시스템 연계2차압력 MPa 2.086MPa 정류기 전압 V 60V 수집주기 : 5초 이내 수집방식 : 기존 정류기 로거로부터 데이터 수집 전류 A 3A 방식전위 mV -1850mV FMS 압력 MPa 0.900MPa 수집주기 : 5초 이내 수집방식 : 기존 FMS 시스템 연계 온도 ℃ 18.721℃ 평균순간유량 ㎥ 38.058㎥ 공급유량 ㎥ 38.144㎥ 평균순간열량 - 1,605,720 비실시간 정보 TB검사 전위 mV -1.139mV 자율검사, 정기검사 정압기검사 압력(1차/2차) MPa 0.785MPa 자율검사, 정기검사, 안전점검, 특별점검(해빙기, 우기, 명절, 동절기 등), 보수분해 정류기검사 출력전압/출력전류/방식전위 V/A/mV -1.46mV 자율검사 ● 측정정보
  8. 8. ● 데이터 수집 시스템 구성 압력 (원격통신) 유량/열량 (원격통신) 전위 (원격통신) 정압기 계량설비 TestBox 압력 (원격통신) 유량/열량 (원격통신) 전위 (원격통신) 배관안전관리시스템 배관안전데이터 표준DB 위험예측분석 SCADA FMS통신서버 (KT & SK) 압력 (TCP/IP) 유량/열량 (TCP/IP) 표준화 변환 실시간 데이터 수집 어뎁터 ● 전송 데이터 프로토콜 ● TB원격측정장비 제작 [설치개념도] [측정단말기] [IoT모뎀] TB박스
  9. 9.  도시가스 배관위험 예측시스템 구조 배관 운영 환경 및 속성 배관 이력 외부 환경변수 시간변수 데이터 도시가스 배관 이상탐지 예측 모듈 탐색적 분석 Standardization Normalization Feature Extraction Random Forest Support Vector Machine Deep Learning 데이터 전처리 예측 모델 시각화 모듈 배관위험 예측관리 시스템 (배관안전 빅데이터센터) 실시간 데이터 처리 정류기 측정 데이터 출력전압(V) 출력전류(A) 방식전위(mV) 정압기 측정 데이터 1차압력(MPa) 2차압력(kPa) FMS 측정 데이터 압력(Mpa) 온도(℃) 평균순간유량 공급유량 평균순간열량 공급열량 T/B 전위값  도시가스 배관위험 예측시스템 구조
  10. 10. ● 머신러닝 기반 배관 이상 탐지모형 측정 데이터 (학습용) [성능평가] 정탐 미탐 오탐 탐지결과 DB [ 이상탐지 결과 ] 학습 입력 탐지 검증 측정 데이터 (검증용) [ 탐지 모형 ] (예측알고리즘) • Random Forest • Support Vector Machine • Neural Network • Deep Learning 현재(t)과거(t-1)과거(t-2)과거(t-3) 현재 정보로는 이상이 없지만, 과거의 누적된 행동과 결합하면 이상징후  RNN + LSTM은 시계열 데이터에서 과거의 정보가 현재에 영향을 미치는 의존성을 학습하여 예측하는 데에 높은 성능를 보이고 있음 CNN (t-3) CNN (t-2) CNN (t-1)
  11. 11.  주요 속성 - 전기방식을 사용한 배관 데이터를 정류기와 테스트 박스로부터 수집 • 정류기의 출력전압, 출력전류, 방식전위 데이터 사용 • 테스트박스의 배관 피복 전위값 데이터 사용 - 배관 피복 외 압력, 유량을 통한 배관 이상탐지를 위해 데이터 추가 수집 • 정압기의 배관 압력 데이터 사용 • 열량계량 시스템의 유량 데이터  추가 속성 - 도시가스 배관과 사용량에 영향을 미치는 요인 데이터 추가 수집 • 기상, 인구통계, 유가, 출생률 - 배관 데이터의 주기성을 사용하기 위해 시계열 데이터 추가 • 이동평균, 이전 수치  통합 데이터 전처리 - 누락된 수치는 일정 기간 전의 수치로 대체 - 변수들의 수치 범위를 조절하기 위해 scaling 진행 데이터 구분 속성 배관 운영 데이터 정류기 출력전압 출력전류 방식전위 테스트박스 전위 정압기 압력 외부 환경 변수 기상 기온 강수량 풍속 유가 프로판(LPG) 인구통계 출생률 계절 계절 시간 변수 이동평균 6개월 3개월 이전수치 1년 전 1달 전 1년 전 최대 1년 전 최소 1달 전 최대 1달 전 최소  전체 데이터셋
  12. 12.  정압기 통합 데이터셋 압력 시간변수외부환경변수
  13. 13.  상관분석  정압기 데이터 상관분석  정류기 데이터 상관분석 테스트박스 데이터 상관분석  정류기, 테스트박스, 정압기 데이터 셋에 외부환경변수를 추가 후 상관분석 진행  주기성을 가지고 있는 배관운영 데이터 분석을 위해 시간변수를 추가 생성  정압기 데이터 셋에 우선 시간변수를 추가 생성하고 속성간의 상관관계 분석 - 정압기의 압력과 시간변수가 높은 양의 상관관계를 가짐
  14. 14.  배관 압력 예측 모델  데이터 기간 : 2009년 1월 1일 ~ 2017년 8월 19일  사용 features 데이터 구분 속성 배관운영 정압기 압력 외부환경 변수 기상 기온 강수량 풍속 유가 프로판(LPG) 인구통계 출생률 계절 계절 시간 변수 이동평균 6개월 3개월 이전수치 1년 전 1달 전 1년 전 최대 1년 전 최소 1달 전 최대 1달 전 최소  분석 알고리즘 - 통계적 분석 알고리즘 : MA, ARIMA - 기계학습 알고리즘 : Random Forest Regression과 Support Vector Regression(SVR) 사용 Deep Learning : LSTM(long-short term memory) Random Forest Regression 모델은 결정 트리 200개, 500개의 모델의 성능 비교 SVR모델은 RBF, Linear, Polynomial 커널 함수 모델의 성능 비교  성능 측정 - RSME(root mean squared error) = 1 𝑛 σ𝑖=1 𝑛 (𝑦𝑖 − ෥𝑦𝑖)2 - MAPE (mean absolute percentage error) = 100 𝑛 σ𝑖=1 𝑛 𝑦 𝑖−෦𝑦𝑖 𝑦 𝑖 - 10 cross validation을 사용해 성능 측정  실험 방법 - 데이터의 주기성을 사용하기 위해 생성한 파생 변수가 예측모델 성능향상에 미치는 영향을 확인하기 위해 시간변수를 단계적으로 추가해 예측모델의 성능을 측정
  15. 15.  배관 압력 예측 모델  정압기 압력 예측 통계 모델 성능 비교 MA ARIMA RMSE 0.22 0.73  정압기 압력 예측 기계학습 모델 성능 비교(RMSE) 데이터 셋 Random Forest Regression Support Vector Regression 200 Trees 500 Trees RBF Kernel Linear Kernel Polynomial Kernel 정압기, 외부환경변수 0.46 0.46 0.56 0.39 0.38 정압기, 외부환경변수, 이동 평균 0.20 0.20 0.47 0.22 0.22 정압기, 외부환경변수, 이동 평균, 1년 전 수치 0.19 0.19 0.48 0.22 0.32 정압기, 외부환경변수, 이동 평균, 1년 전 수치, 1년 전 최 대, 최소 수치 0.19 0.20 0.50 0.21 0.44 – 외부환경변수와 시계열 속성을 모두 통합한 데이터 셋을 사용한 경우 가장 성능이 우수함 – SVR의 경우 Linear 커널 함수를 사용한 모델의 성능이 우수함 – Random Forest Regression 모델은 트리의 개수와 상관없이 SVR보다 우수한 성능을 보임
  16. 16.  배관 압력 예측 모델  LSTM 모델을 사용한 일 단위 배관 압력 예측 모델 성능 비교 RF-500 SVR-linear LSTM RMSE MAPE RMSE MAPE RMSE MAPE 공주시 1차 0.11 9.93 0.11 10.75 0.06 5.98 2차 0.18 6.63 0.18 7.18 0.17 6.33 금산군 1차 0.08 4.33 0.28 18.58 0.01 0.72 2차 0.07 2.65 0.29 9.04 0.05 1.87 논산시 1차 0.04 2.78 0.07 8.97 0.03 2.01 2차 0.09 2.72 0.11 4.75 0.05 1.81 보령시 1차 0.01 1.26 0.06 6.88 0.02 1.77 2차 0.10 3.00 0.12 4.28 0.06 2.23 부여군 1차 0.20 17.72 0.24 20.71 0.10 7.02 2차 0.53 18.19 0.21 7.23 0.05 1.73 서천군 1차 0.04 2.28 0.04 3.50 0.01 1.24 2차 0.13 3.26 0.12 4.48 0.09 3.33 세종시 1차 0.04 3.56 0.09 9.66 0.04 3.83 2차 0.10 3.49 0.15 6.32 0.11 4.69 아산시 1차 0.11 9.50 0.14 14.62 0.05 5.11 2차 0.13 3.69 0.09 3.61 0.10 3.82 천안시 1차 0.05 4.09 0.14 12.68 0.02 2.52 2차 0.08 2.93 0.09 3.70 0.36 5.80 Avg 0.12 5.67 0.14 8.72 0.08 3.43 0.12 0.14 0.08 5.67 8.72 3.43 0 1 2 3 4 5 6 7 8 9 10 Random forest SVR LSTM RMSE MAPE
  17. 17.  배관 압력 예측 모델  배관 압력 예측 결과

×