• SCALA CRASH COURSE
• 스칼라 학교
•
•
1. JAVA SDK INSTALL
2. 스파크 노트북 (HTTP://SPARK-NOTEBOOK.IO/)
3.
4.
5.
Reference: http://spark.apache.org/docs/latest/cluster-overview.html
•
•
•
•
•
•
•
•
•
•
Reference:
https://dzone.com/articles/big-data-
processing-spark
• TRANSFORMATION
•
•
•
• ACTION
•
•
•
•
•
•
• CANNOT BE OPTIMIZED BY SPARK
•
Reference: http://www.slideshare.net/databricks/2015-0616-spark-summit
•
• OPTIMIZED BY SPARK
Reference: http://www.slideshare.net/databricks/spark-sqlsse2015public
Reference: http://www.slideshare.net/databricks/spark-sqlsse2015public
• LOST TYPE SAFETY
•
•
•
•
•
•
•
•
•
•
실습
ML 이론
선형대수, 통계, 프로그래밍
•
•
•
Hello World 부터
타이핑하고
시작하자
• 타이타닉 생존 예측프로젝트 목표
• 데이터 살펴보기데이터 이해
• 타이타닉 데이터데이터 준비
• ML 알고리즘 선택과 트레이닝 실행모델링
• 테스트 데이터를 사용해서 모델 평가평가
• 캐글에 올리기배포
75%
•
•
•
•
•
•
•
Reference: https://www.kaggle.com/c/titanic/data
•
•
•
•
•
•
Reference: https://www.kaggle.com/c/titanic/data
•
•
•
•
•
•
•
•
•
• CHEAT SHEET
•
ML Workflow라고 생각하자
Workflow안에 두 단계 존재
- 파이프를 변형(모델)
- 파이프를 통해 결과 획득
Training
Data
맞춤형 파이프 라인 (Model)
Test
Data
Model
Result
동영상 소개
Reference: https://en.wikipedia.org/wiki/Receiver_operating_characteristic
HOUSE PRICE PREDICTION
•
•
Apache Spark 입문에서 머신러닝까지

Apache Spark 입문에서 머신러닝까지

Editor's Notes