선형 회귀와 로지스틱회귀
• 선형 회귀분석은 연속된 숫자를 예측합니다.(Regression)
• 환율 가격 예측, 농작물 수확량 등
• 로지스틱 회귀는 미리 정의된 클래스 레이블을 예측합니다(Classification)
• 이진분류: 스팸분류, 암진단, 다중 분류: 손글씨 숫자 분류
4
𝑦" = 𝑤 × 𝑥 + 𝑏
학습
• 여기서는 예를간단히 하기위해 학습 데이터로 모델의 성능을
평가했습니다만 실전에서는 이렇게 해서는 안됩니다
prediction 의 모든 원
소에 적용, 0.5보다 크
면 True, 작으면 False[569, 1] 크기
5000번 학습하면서
손실함수 값 기록
92% 정확도
13
14.
정리
• 선형 회귀
•회귀 모델입니다.
• 선형 회귀의 대표적인 비용함수는 MSE(mean square error)입니다.
• 경사하강법을 사용하여 점진적으로 최적의 값을 찾았습니다.
• 특성이 많을 경우 성능이 뛰어나며 대량의 데이터셋에도 잘 동작합니다.
• 로지스틱 회귀
• 분류 모델 입니다.
• 이진 분류의 경우 시그모이드 함수의 결과가 0.5 보다 높을 때는 True, 그 이하는
False 로 분류합니다.
• 시그모이드 함수를 사용한 로지스틱 회귀의 비용함수 미분의 결과는 선형 회귀와 동
일합니다.
14
SGD, mini-batch GD
•Batch 그래디언트 디센트
• 전체 훈련 데이터를 사용
• 가장 좋은 방법, 대규모 데이터 셋에 적용하기 힘
듬
• SGD(Stochastic Gradient Descent):
• 훈련 데이터 하나씩 사용
• 빠른 학습 가능, 노이즈 데이터로 인해 변동이 큼
• mini-batch GD
• 훈련 데이터를 조금씩 나누어 사용
• Batch 와 SGD의 절충안으로 일정 개수의 데이터
를 이용하여 학습
50