머신러닝 예측모델링의 전제와 가정 [전용준.리비젼]
( 블로그 포스트 : http://blog.daum.net/revisioncrm/439 )
머신러닝 예측모델이 맞지 않는 이유는 데이터, 알고리즘, 예측 대상 설정 중 어딘가가 잘못되어 있기 때문.
그렇다면, Data와 Algorithm 중 어디를 고치는 것이 더 중요할 것인가?
머신러닝 예측모델의 전제와 가정
(Implicit Assumptions?)
[1] 과거가 미래의 척도가 된다
[2] 분석에 필요한 데이터가 존재한다
[3] 데이터가 예측하려는 내용을 담고 있다
이 전제사항들 중 무언가가 성립하지 않는다면 정확한 예측을 할 수 있는 모델이 만들어질 수 있겠는가?
가정이 성립하는지에 대한 판단이 어렵다면?
전제사항이 부분적으로만 충족된다면?
어쩌면 예측모델링이 무의미하거나, 예측모델링이 불가능한 상황일 수 도 있다. 그러한 상황에서라면 억지로 모델을 만든다고해봐야 쓸모가 있을 것인가?
[#전용준 #리비젼컨설팅 #머신러닝 #예측모델링]