머신러닝 예측모델링의 전제와 가정 [전용준.리비젼]

© 2019 RE::VISION 머신러닝 예측모델링의 전제와 가정
전 용 준
리비젼컨설팅 대표/ 경영학 박사
010. 3095. 1451 xyxonxyxon@empal.com
머신러닝 예측모델링의
전제와 가정
2019. 8.

© 2019 RE::VISION 머신러닝 예측모델링의 전제와 가정 1
OUTLINE
머신러닝 예측모델이
맞지 않는 이유는?
Data Vs. Algorithm
머신러닝 예측모델의 전제와 가정
머신러닝 예측모델링의 전제와 가정 :

머신러닝 예측모델이 맞지 않는 이유는?
• 예측모델링: 단순한 구조 Input – Model – Output
• 왜 정확도를 얻지 못하는가?
• 정확하지 않다면 셋 중 어딘가에 문제가 존재하는 것
INPUT
(DATA) MODEL
(ALGORITHM)
OUTPUT
(PREDICTION)
PAST FUTURE

Data Vs. Algorithm
• 예측정확도를 높이기 위한 흔한 노력:
• 다른, 최신 알고리즘 적용 (e.g. DNN)
• 더 크고 복잡하게 구성
• 진짜 문제는?
• 데이터, 문제정의
INPUT
(DATA) MODEL
(ALGORITHM)
OUTPUT
(PREDICTION)

참고: 데이터 량이 해결할 수 없는 측면들
딥러닝이 기대를 모으는
이유: 대규모 데이터를
투입할 수록 모델 성능
향상
많은 데이터를 가진
기업이 경쟁에서 시장
독식?
 일정수준의 정확도를
넘어서면 Biz성과에 더
이상 영향주지 않을 수
있음 (예: 5%의 이탈예측
오차를 4.5%로 낮춰도
이탈방지성과 향상 미미)
https://www.analyticsvidhya.com/blog/2017/04/comparison-between-deep-
learning-machine-learning/
데이터 량 증가에 따른 알고리즘 성능 향상 곡선
Threshold of
Competitive
Advantage
Adapted from an Exhibit by Andrew Ng

머신러닝 예측모델의 전제 (가정)
[1] 과거가 미래의 척도가 된다
[2] 분석에 필요한 데이터가 존재한다
[3] 데이터가 예측하려는 내용을 담고 있다
Implicit
Assumptions?

[전제 1] 과거가 미래의 척도가 된다
• 미래를 모델링하기 위해서는 과거에서 힌트를 얻는 방법
밖에 없음
• 과거와 미래가 다른 Mechanism을 가졌다면?
과거 미래
과거 미래
과거 미래
Time
NO JAPAN(?)

[전제 2] 분석에 필요한 데이터가 존재한다
• 매출을 예측하고자 한다면
매출 데이터와 더불어
매출에 영향을 미칠만한
요소들에 대한 다양한
데이터 항목 존재(=확보
가능) 필요
• 고객의 관심도를 예측하고자
한다면 측정된 관심도와
고객의 특성, 상황에 대한
데이터 존재 필요

[전제 3] 데이터가 예측하려는 내용을 담고 있다
• 예: 구글검색지수는 대상에 대한 긍정 또는 부정적인
“태도”를 직접적으로 의미하지 않음
(자료: 구글트렌드 - 유니클로 검색추이)

근본적 이슈 :: 모호한 요건
• 모호한 요건 (분석 주제):
• 신용카드를 사용하지 않을
사람은?
 몇 개월 동안?
 사용액 0원?
 사용액 십만원 미만?

Case 1 :: 완전히 새로운 상황에 대한 예측
• [1] SUV를 처음 출시하는
자동차 브랜드가
• 기존 승용차 판매
이력을 사용하여
• 고객별로 SUV
구매가능성을 예측?
• [2] 구글이 검색을 전면
유료화한다면
• 기존 고객 중 누가
전환할 것인가?

Case 2 :: 기록이 남아있지 않은 상황에서의 예측
• 과거 캠페인에 관한 이력이 남아있지 않은
신용카드사라면?
• 누가 캠페인의 대상이었는지도, 누가 캠페인에
응답했는지도 남아있지 않다면?
• 과거에 진행한 캠페인의 세부내용이
무엇이었는지가 기록으로 남아있지 않다면?

머신러닝 예측모델링: 현실적 조언
가정이 성립하는지에
대한 판단이 어렵다면?
전제사항이
부분적으로만
충족된다면?
“두 번 세 번 다시 생각하라.
알고리즘 보다는 데이터와 문제 구조를
다시 검토하라.
생각지 않았던 중요한 데이터를 쉽게 확보할
방법이 있는지, 예측 대상을 재정의해야
하는지 살펴라.”

…
전 용 준
대표/컨설턴트 | 리비젼컨설팅
xyxonxyxon@empal.com 010.3095.1451
Keyword: 예측모델링 | 데이터 마이닝 | 빅 데이터
http://www.revision.co.kr
contact:
머신러닝 예측모델링의 전제와 가정

머신러닝 예측모델링의 전제와 가정 [전용준.리비젼]

Recommended

Recommended

More Related Content

Similar to 머신러닝 예측모델링의 전제와 가정 [전용준.리비젼]

Similar to 머신러닝 예측모델링의 전제와 가정 [전용준.리비젼] (20)

머신러닝 예측모델링의 전제와 가정 [전용준.리비젼]