5. T R A N S A F E R 엔 트 로 피
5
• 전 세계적으로 코로나가 확산된 2월 말부터 대중교통 이용 감소 추세가 뚜렷하게 나타남
코로나로 인한 대중교통 이용 감소
추진 배경
Coronavirus & Your Commute: How COVID-19 is Affecting Public Transportation Around the
World
6. T R A N S A F E R 엔 트 로 피
6
코로나로 인한 대중교통 이용 감소
Park J (April 14, 2020) Changes in Subway Ridership in Response to COVID-19 in Seoul, South Korea: Implications for Social D
Cureus 12(4): e7668. doi:10.7759/cureus.7668
추진 배경
• 국내 주요 코로나 확산 시점과 대중교통 이용률의 급격한 감소 시점이 일치
7. T R A N S A F E R 엔 트 로 피
7
대중교통 이용 중 감염 우려 확산
news1(2020.03.17.). 4.5m 떨어지고 30분 후 탑승한 버스 승객, 코로나에 감염
추진 배경
• 출근이 꺼려지는 이유: 대중교통을 이용해야 해서(59.7%)
사람인/ 2월 10일 ~12일 / 직장인 1,446명 대상
8. T R A N S A F E R 엔 트 로 피
8
현상 1) 대중교통 외 다른 교통수단으로의 전환
추진 배경
• 전체 교통량은 예년 추세를 회복중인 반면, 대중교통 이용량은 3월 말 기준 35% 감소
• 대중교통 이용 감소, 승용차 이용 증가 3∼5월 출퇴근 시간대 교통량은 작년 12월보다 오히려 증가
삼성교통안전문화연구소(2020.07.13). '코로나19 이후 교통특성 변화’ 서울시, 서울TOPIS(“대중교통 목적통행량"을 이용하여 경기연구원에서
작성)
9. T R A N S A F E R 엔 트 로 피
9
현상 2) 그럼에도 대중교통 이용률은 다시 증가 중
추진 배경
• 대중교통 이용률은 3월 초 부터 다시 증가 추세로 전환 (38.5%(3월 4일) 34.2%(3월30일))
서울시, 서울TOPIS(“대중교통 목적통행량"을 이용하여 경기연구원에서 작성)
10. T R A N S A F E R 엔 트 로 피
10
현상 3) 누군가에게 대중교통은 대체불가능한 수단이다
추진 배경
• Leisure를 위한 이용은
30% 수준으로 감소,
• Work를 위한 이용은
60% 수준으로 유지
Park J (April 14, 2020) Changes in Subway Ridership in Response to COVID-19 in Seoul, South Korea: Implications for
Social Distancing. Cureus 12(4): e7668. doi:10.7759/cureus.7668
11. T R A N S A F E R 엔 트 로 피
11
현상 3) 누군가에게 대중교통은 대체불가능한 수단이다
추진 배경
• 코로나 고위험군인 노인층의 이용률이 더 급격히 증가하는 중
Park J (April 14, 2020) Changes in Subway Ridership in Response to COVID-19 in Seoul, South Korea: Implications for
Social Distancing. Cureus 12(4): e7668. doi:10.7759/cureus.7668
-
13. T R A N S A F E R 엔 트 로 피
13
• 공학 + 교육 전공자
• 데이터 수집 및 전처리, 혼잡도 분석
Hello!
팀 엔트로피
김한길
• 뇌영상분석, 자연언어처리 엔지니어 경험
• 웹서버 프로그래밍, 랜덤 네트워크 알고리즘 구현
신윤하
• 뇌영상분석 경험
• 코로나19 데이터 분석 및 위험도 분석
최예라
팀원 소개
문제 정의
14. T R A N S A F E R 엔 트 로 피
14
팀 엔트로피의 해결책 방향성
문제 정의
• 개인 수준에서 실천할 수 있어야 한다.
• 누구나 쉽게 실천할 수 있는 지속 가능한 방식이어야 한다
-
+
α
15. T R A N S A F E R 엔 트 로 피
15
서울시 열린데이터 데이터 탐색
문제 정의
• 주제, 유형, 제공 변수 등 탐색 구현 가능 서비스 선정
16. New Normal 시대의 New Transfer
혼잡도 기반 대중교통 위험지수를 개발,
위험지수에 따른 대중교통 경로 추천 서비스
제공!
T R A N S A F E R 엔 트 로 피문제 정의
17. T R A N S A F E R 엔 트 로 피
17
오늘 여기에 어떻게 오셨나요?
문제 정의
• 수도권, 특히 서울은 특정 목적지로 갈 수 있는 다양한 경로가 동시에 존재
-
18. T R A N S A F E R 엔 트 로 피
18
기 유사 서비스
문제 정의
사진 출처: TECHWORLD
< 서울지하철(1~8호선) 열차 내 호선별 혼잡도 정보제공 > < T map 대중교통앱 내 혼잡도 정보제공 >
(장점) 호선별 정보 제공
(단점) 열차 탑승 후 확인
(장점) 출발 전 미리 확인 가능
(단점) 혼잡도로 질병 위험도를 추측하기 어려움
19. T R A N S A F E R 엔 트 로 피
19
TRANSFER: 조금 느려도, 더 안전한 대중교통 경로를 추천!
문제 정의
-
기존 TRANSAFER
20. T R A N S A F E R 엔 트 로 피
20
TRANSFER: 조금 느려도, 더 안전한 대중교통 경로를 추천!
문제 정의
-
기존 TRANSAFER
21. T R A N S A F E R 엔 트 로 피
21
TRANSFER: 조금 느려도, 더 안전한 대중교통 경로를 추천!
문제 정의
-
Safe순
기존 TRANSAFER
질병위험지수에
기반하여 보다 안전한
대중교통 경로 추천
대중교통
이용자 분산
대중교통 전체 이용자의
코로나 위험도 감소
23. T R A N S A F E R 엔 트 로 피
23
분석 및
구현 도구
분석 및 구현
• 데이터 수집 및 전처리, 분석
데이터 분석 언어: Python
• 데이터 분석 결과 및 데이터 공유 편리
• 무료 GPU 사용 가능
데이터 분석 도구: google colab / Drive
• Python 기반 Web Framework
• 빠른 시간 내 서비스 구현 가능
웹서버 구현 Framework
• 다양한 포맷의 자료 저장 지원
• 실시간 공동 수정 가능
자료 및 아이디어 공유: Notion
24. T R A N S A F E R 엔 트 로 피
24
1) 지하철 혼잡도 계산
분석 및 구현
• 사용 공공 데이터
• 1-4호선: 서울교통공사 역별 혼잡도 현황(최신: 2015년도)
• 5-8호선: 위 데이터가 존재하지 않음
• 서울교통공사 일별 역별 시간대별 승하차 인원(2015)
데이터에서 승차 데이터만 추출
• 역별로 주중/주말 시간대별 승차 데이터 추출
• 5-8호선 역의 승차 패턴과 가장 유사한 승차 인원
패턴(최소 유클리드 거리)을 보이는 1-4호선의
혼잡도 데이터를 imputation
25. T R A N S A F E R 엔 트 로 피
25
2) 버스 혼잡도 계산
분석 및 구현
• 지하철과 달리 혼잡도 데이터가 존재하지 않음
승하차 인원 데이터에 기반, 직접 정류소별 탑승인원을 예측
• 분석 및 도출 과정
① 데이터 전처리
② Odsey API로 추가 버스 및 정류소 정보 가져오기
③ 정류소별 탑승인원 예측
• 이용 데이터
• 서울시 버스노선별 정류장별 시간대별 승하차 인원 정보
• 서울시 버스노선별 정류장별 승하차 인원 정보
26. T R A N S A F E R 엔 트 로 피
26
2) 버스 혼잡도 계산: ①데이터 전처리
분석 및 구현
서울시 버스노선별 정류장별 승하차 인원
정보
서울시 버스노선별 정류장별 시간대별 승하차 인원 정
보
2020.5. 한 달 데이터 기준, 30682560 rows × 12 columns (3.55G)
데이터 전처리 및 결합 버스노선/정류장별 날짜/시간별 승하차 인원 데이터 생성
27. T R A N S A F E R 엔 트 로 피
27
2) 버스 혼잡도 계산: ②버스 및 정류소 정보 가져오기
분석 및 구현
• 공공데이터에서 제공하지 않는 노선 및 정류장 세부정보 확보
다양한 데이터 제공
유료
길찾기 서비스 제공 안함 세부경로에대한데이터제공안함
무료
다양한 데이터 제공
일정 수준까지 무료
BUS_ROUTE_NO, STND_BSST_ID
28. T R A N S A F E R 엔 트 로 피
28
2) 버스 혼잡도 계산: ③ 정류장별 재차인원 수 도출
분석 및 구현
1. 버스 노선 총 거리 및 총 버스정류장 수
버스 기점 출발시간 추론
2. 정류장별 통과 시점 추론
3. 버스노선/정류장별 날짜/시간별 승하차 인원 데이터
정류장별 탑승인원 추론
승차 하차기점
29. T R A N S A F E R 엔 트 로 피
29
• 감염병 예측에 널리 사용되고 있는 SIR 모델을
세분화한 SEIRS 모델에 네트워크 분석 방법론을 접목한
확장 SEIRS 모델로 코로나 위험지수 산출
3) 혼잡도 기반 재차인원 및 위험지수 산출
https://github.com/ryansmcgee/seirsplus
• SEIRS 모델
• S + E + I + R = N
• S (Susceptible): 감염대상 집단
• E (Exposed): 접촉 집단
• I (Infectious): 감염 집단
• R (Recovered): 회복 집단
• N: 전체 집단
• 회복이 되었어도 면역이 평생 유지되지 않아
일정 기간 이후 R이 S로 확률적 전환
• 확장 SEIRS 모델
• 감염 집단이 증상 미발현 집단, 무증상 집단,
유증상 집단, 입원 집단으로 세부 분류됨
분석 및 구현
30. T R A N S A F E R 엔 트 로 피
30
• SEIRS 모델 + 네트워크 구조
• 노드(node): S, E, I, R 등의 상태를 개별적으로 갖는
개인
• 엣지(edge): 개인 간 상호작용
• 밀접 접촉(close contact)
• 포괄 접촉(global contact)
• Python seirsplus package
• 특정 형태/크기의 확률적으로 변화하는 네트워크
내에서 SEIRS 모델에 기반한 감염 전파
시뮬레이션이 가능
• 예: 지역사회, 직장
3) 혼잡도 기반 재차인원 및 위험지수 산출
https://github.com/ryansmcgee/seirsplus
밀접 접촉
포괄 접촉
분석 및 구현
31. T R A N S A F E R 엔 트 로 피
31
• 감염병 관련 파라미터를 설정해 지정한 기간 동안의
감염 양상을 시뮬레이션 가능
3) 혼잡도 기반 재차인원 및 위험지수 산출
https://github.com/ryansmcgee/seirsplus
• 아이디어
• 지하철/버스 차내를 특정 형태의 네트워크로
보고, 혼잡도 및 재차인원에 따른 감염 전파를
시뮬레이션하자!
• 다른 조건이 동일하고 재차인원만 다를 때의
코로나 위험지수를 시뮬레이션으로 산출
• 지하철/버스 차내 네트워크는 어떤 모습일까?
• 최대 재차인원일 때 노드가 바로 주변과만
연결되는 격자 네트워크(grid network)로 상정
시뮬레이션 예시
분석 및 구현
32. T R A N S A F E R 엔 트 로 피
32
• 실제 생성한 지하철 네트워크 예시
3) 혼잡도 기반 재차인원 및 위험지수 산출
• 교통수단별 네트워크 생성
• 최대 재차인원 설정
• 지하철: 혼잡도 230% = 368명
• 일반버스: 혼잡도 150% = 70명
• 네트워크 생성
• = 최대 크기: 차내 공간에 최대 재차인원을
좌석/통로 위치에 기반해 배치
• < 최대 크기: 최대 크기 네트워크에서
무작위로 노드를 제거하되, 좌석 위치의
노드는 낮은 확률로 제거
• 인원수 입력 시 해당 크기의 네트워크를
생성하게 함
지하철 네트워크: 368명 탑승 시(최대)
지하철 네트워크: 100명 탑승 시
분석 및 구현
33. T R A N S A F E R 엔 트 로 피
33
• 실제 생성한 버스 네트워크 예시
3) 혼잡도 기반 재차인원 및 위험지수 산출
• 교통수단별 네트워크 생성
• 최대 재차인원 설정
• 지하철: 혼잡도 230% = 368명
• 일반버스: 혼잡도 150% = 70명
• 네트워크 생성
• = 최대 크기: 차내 공간에 최대 재차인원을
좌석/통로 위치에 기반해 배치
• < 최대 크기: 최대 크기 네트워크에서
무작위로 노드를 제거하되, 좌석 위치의
노드는 낮은 확률로 제거
• 인원수 입력 시 해당 크기의 네트워크를
생성하게 함
버스 네트워크: 70명 탑승 시(최대)
버스 네트워크: 24명 탑승 시
분석 및 구현
34. T R A N S A F E R 엔 트 로 피
34
• 지하철/버스 재차인원별 코로나 위험지수 산출
3) 혼잡도 기반 재차인원 및 위험지수 산출
• 주요 파라미터
• 감염재생산수 = 0.5
• 감염자가 평균적으로 감염시킬 수 있는 2차
감염자의 수, 대중교통 내 마스크 착용이
필수인 것을 감안해 낮게 설정
• 최초 E(노출 집단) 크기 = (재차인원) X (1/10)
• 시뮬레이션 및 위험지수 산출
• T = 30일
• 재차인원별로 각 500회 네트워크 생성 및
시뮬레이션 시행
• 위험지수 = (평균 예상 감염자 비율) X (재차인원)
지하철 버스
재차인원에 따른 위험지수
분석 및 구현
35. T R A N S A F E R 엔 트 로 피분석 및 구현
출발지를
입력해주세요!
API::getInfoList 에서
값이 존재하는가?
No
존재하지 않는
출발지입니다!
다시 입력해주세요.
지도에 표시된
출발지 중에서
하나를 선택해주세요!
Yes
목적지를
입력해주세요!
API::getInfoList 에서
값이 존재하는가?
존재하지 않는
출발지입니다!
다시 입력해주세요.
No
ODSay 외부 API 이용
대중교통환승경로 검색
공공데이터 기반
경로별 혼잡도 계산
교통별 혼잡도 기반
위험 지수 계산 및 점수화
최단경로 top 3,
안전한 경로 top 3,
위험한 경로 top 3
사용자에게 전달
S
E
Yes
37. T R A N S A F E R 엔 트 로 피
37
실 서비스 화면
TRANSAFER 서비스 소개
① 출발지 입력
② 해당 출발지 주변 정류소를 확인 후 선택
③ 목적지 입력
④ 해당 목적지 주변 정류소를 확인 후 선택
⑤ 안전한 경로 순으로 추천된 대중교통 경로 확인
38. T R A N S A F E R 엔 트 로 피
38
실 서비스 화면
TRANSAFER 서비스 소개
39. T R A N S A F E R 엔 트 로 피
39
Future Work
TRANSAFER 서비스 소개
• 직장, 학교 등 주기적으로 가는 장소에 대한 알림 기능 구현
• 생활인구 및 상업지역, 공원 / 생활서비스 /시설 데이터 활용
산책, 쇼핑, 드라이브 등 이용자 취향에 맞는 안전한 장소/경로 추천
• 위험지수 도출 알고리즘 고도화
• 지하철 차량 내 혼잡도 뿐만 아니라 역사 내/환승 과정에 대한 혼잡도 반영
• 명절/휴가 등 특수 상황 혼잡도 고려
• 개인별 건강 상태가 반영된 여러 감염질환에 대한 종합 위험지수 도출
개인 수준: 단순히 마스크를 쓰고, 손잡이를 가능한 만지지 말고, http://chicagokoreatimes.com/코로나-시대-대중교통-이용···안전수칙-꼭-지켜라/
대중교통 수준: 소독 자주, 소독제 구비,
국가 수준: 유연근무제 도입을 확대하여 출퇴근 통행량을 감소시키고, 경기도 시내버스 등 대중교통 공급을 확대
울시는 11일, 급감했던 대중교통 이용객 수가 점차 증가함에 따라 혼잡도 분석 및 예측 실시를 통해 교통수단별 맞춤형 대책을 오는 5월 13일(수)부터 본격 시행할 예정이다. 우선 지하철 이용객 증가에 따른 코로나19 감염 예방을 위해 ‘전동차 이용객 혼잡도 관리기준’을 마련하고 승객 간 물리적 거리를 확보할 수 있도록 혼잡단계별 특별대책을 시행한다. 단계별 조치는 ▲혼잡도가 80% 이하일 때는 ‘여유’ ▲혼잡도 80~130%는 ‘보통’ ▲혼잡도 130~150%는 ‘주의’ ▲혼잡도 150% 이상일 때는 ‘혼잡’단계로 구분해 조치가 이뤄진다. 혼잡도 170% 이상이 되면 안내 요원의 탑승 통제와 역·관제·기관사 판단하에 혼잡구간 무정차 통과도 가능토록 한다. 버스의 경우, 혼잡노선의 승객 수 추이를 지속적으로 모니터링하고 증회 운행, 예비차 추가 투입 등 상황별 혼잡도 완화 대책을 시행해 전염병 확산 위험을 사전 차단할 계획이다. https://www.pharmnews.com/news/articleView.html?idxno=100462