Ml

소박한 머신러닝 이야기

Field of study that gives computers the ability
to learn without being explicitly programmed.
What is Machine Learning?

머신 러닝의 종류
• Supervised Learning (지도학습)
• 데이터 X에 대해 Y를 예측 하는 것
• 답이 있는 문제에서 답을 예측하는 것
• Unsupervised Learning (비지도학습)
• 데이터 X는 어떻게 설명 될 수 있는가
• 해석은 알아서

Supervised Learning
• Classification (분류)
• Target Value : Discreate Value
• 예시 : 스팸 분류, 필기체 인식, 보균자 색출
• Regression (회귀)
• Target Value : Continuous Value
• 예시 : 가격 예측(집값, 주가)

Unsupervised Learning
• Clustering (군집화)
• 비슷한 문제 찾기
• Association Rule Learning (연관 규칙 학습)
• 연관 상품 추천
• 연관 웹페이지 추천

머신러닝을 한다는 것..
• Training Set : 데이터 집합
• Hypothesis: 추론 (알고리즘)
• Feature : 변수
• Target Value: 결과물
Training Set
Learning Algorithm
HypothesisFeature Target Value

추론 함수 만들기 (지도학습 – 선형회귀 기준)
Training Set
Learning Algorithm
HypothesisFeature Target Value

Hypothesis Function (=Cost Function)
• ‘데이터가 x일 때 y의 결과가 나올 것이다’
• 예측한 둘 사이의 관계 혹은 함수
•  = 
•  : Training Set
•  : 상수
•  : 예측값
• 즉, 좋은  값을 선택해야, 정확한 예측값을 구함
0
1
2
3
4
5
6
7
8
9
0 2 4 6 8 10 12

Gradient Descent 경사하강법
• 미분의 개념을 최적화 문제에 적용한 대표적 방법
• minimum을 찾는 때까지 지속적으로 를 업데이트

Gradient Descent 경사하강법
점점 최적화

Over/Underfitting
회귀
분류

머신러닝 큰그림
Experiment
ObservationAnalysis
Model &
Hypothesis
Describe Orchestrate
Instrument
Measure
Manage/Curate
Process
Visualise
Repeat
Share

머신러닝 학습단계
• Feature
• Target Variable
Modeling
Machine

머신러닝 테스트 단계
Featrue
Predict = model(features)
Machine
Predicted
Target variable

머신러닝 성능평가 단계
Training Data Features
Accuracy =
Correctly Predicted Target Variables / Total Predicted Target Variables
Predicted Target VariablesMachine

실제로 구현해보기
• 필기체 인식하기
• Data : Handwritten digit image
• Taget Value : 0, 1, 2, 3, 4, 5, 6, 7, 8, 9

순서
• 데이터 수집
• 데이터 학습
• 테스트 및 성능평가

데이터 수집 (1)
• 머신러닝 정보 사이트
• 문제 풀기
• 머신러닝 관련 자료
• Training Set
• 등등
Kaggle (https://www.kaggle.com/datasets)

데이터 수집 (2)
• MNIST Database
• Handwritten digit image set
• 5,000개 (0~9까지 각 500개씩)
• 각 이미지는 20px * 20px
grayscale

데이터 학습
• Supervised Learning - Classification (분류)
• Multi-Class Classification
• One-vs-All

데이터 학습
• 0~9, 각 숫자를 분류할 수 있는 분류기 학습
• 각 분류기는 숫자를 판별할 수 있는 를 갖게 됨
0 Classifier
6 Classifier

• Accuracy : 90.4% (94% 이상은 되야 잘한 것..ㅠㅠ)
• 예측 실패 데이터:
성능평가

Ml

Recommended

Recommended

More Related Content

Similar to Ml

Similar to Ml (20)

More from Doo Sung Eom

More from Doo Sung Eom (6)

Ml