Q: X, Y축 상의 자료를 분석하시오.
Q: 모호한 데이터에 대해서도 분석 가능한가?
체중관리 앱을 만든다고 가정하고,
사용자의 체중이 시간에 따라 증가하면 경고하고, 감소하면 칭찬하는 기능을 넣으려고 한다.
증가/감소 했음을 어떻게 판단할 것인가?
1종 오류와 2종 오류를 어떻게 제어할 수 있는가?
Lady가 홍차를 먼저 넣은 밀크티와, 우유를 먼저 넣은 밀크티를 구분할 수 있는 능력이 있다고 주장한다.
실험 설계: 4개의 홍차를 먼저 넣은 밀크티, 4개의 우유를 먼저 넣은 밀크티 총 8개의 밀크티를 무작위로 배치한 뒤 4개를 선택해 맞추도록 한다.
주장에 대해 가설을 설정하고 검정한다.
귀무가설: 맞출 확률이 ½ 이다. (구분할 수 있는 능력이 없다)
대립가설: 맞출 확률이 ½ 보다 높다. (구분할 수 있는 능력이 있다)
Exact Test. 모형 없이 검정 가능.
변수 종류에 대한 이해
양적 변수
질적 변수 - 명목형, 순서형
몸무게 예제는 양적 변수(시간)와 양적 변수(몸무게) 간의 관계
티 예제는 명목형 변수와 명목형 변수 간의 관계
모형 설정 후 회귀방정식 추정
추정된 식에서 설명변수의 중요성을 평가하고
주어진 설명변수들의 값에 대한 반응변수의 값을 예측하기 위하여 사용될 수 있다.
SSE 개념 소개
ch2.R
Setwd로 소스코드 다운로드 받은 디렉토리로 이동
복잡한 모델일 수록 Goodness of Fit은 크다.
변수를 왕창 추가하면 될까? > No. 해석 불가능. 설득력 없음. 대신 Prediction은 가능.