SlideShare a Scribd company logo
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
컨퍼런스 톡
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서
고려대학교 인공지능학과
분석 12기 성민석
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
들어가기 앞서
INTRODUCTION
2
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
머신러닝과 딥러닝을
처음 공부했을 시점으로 돌아가서
3
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 844
※ 주의: 본 발표와 관련 없는 강의들입니다.
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 845
머신러닝/딥러닝
진짜?
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 846
머신러닝/딥러닝
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 847
데이터 과학 데이터 분석
?
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 848
데이터 과학 데이터 분석
?
통계학
?
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 849
데이터 과학 데이터 분석
?
인공지능?
통계학
?
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 8410
데이터 과학 데이터 분석
?
인공지능? 머신러닝
?
통계학
?
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 8411
데이터 과학 데이터 분석
?
인공지능? 머신러닝
?
딥러닝
?
통계학
?
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 8412
데이터 과학 데이터 분석
?
인공지능? 머신러닝
?
딥러닝
?
통계학
?
뭐가 뭔지
하나도 모르겠다
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 8413
데이터 과학 데이터 분석
?
인공지능? 머신러닝
?
딥러닝
?
통계학
?
아하
결국 다 같은 건가(?)
예전의 저와 같이
머신러닝/딥러닝을
처음 공부하시는 분들을 위해
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 8414
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
인공지능
어떻게 공부해야 하지?
15
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
인공지능
어떻게 공부해야 하지?
→ 일단 프로그래밍 언어부터 공부
16
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
Python? R?
17
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
Python! R?
18
- 시중에 공부할 수 있는 책이 훨씬 많음
- 사이킷런, 텐서플로우 그리고
파이토치와 같은 ML/DL 라이브러리가
탄탄하게 준비
- 커뮤니티가 훨씬 커서 물어볼 수 있는
환경이 좋음
- 웹이나 모바일 어플리케이션 활용
가능해서 확장성이 좋음
- …
※ 주의: 어디까지나 선택은 개인의 자유입니다. 둘 다 좋은 언어입니다.
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 8419
BOAZ 분석 커리큘럼대로
머신러닝과 딥러닝으로 분류
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 8420
정형 데이터 비정형 데이터
머신러닝 딥러닝
※ 주의: 편의상 데이터 타입에 따라서 메소드를 정했습니다.
Computer Vision
Natural Language Process
BOAZ 분석 커리큘럼대로
머신러닝과 딥러닝으로 분류
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
머신러닝
MACHINE LEARNING
21
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
머신러닝
어떻게 시작하지?
22
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 8423
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 8424
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 8425
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 8426
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 8427
머신러닝
이제 다 배웠다!
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 8428
Kaggle의 대표적인 연습 예제: 타이타닉
https://www.kaggle.com/c/titanic/data
에이
저걸 누가 못해(?)
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 8429
Kaggle의 대표적인 연습 예제: 타이타닉
https://github.com/minsuk-heo/kaggle-titanic/
네 그 누가
바로 접니다...
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 8430
머신러닝을
어떻게 써야하지?
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
머신러닝 파이프라인
31
※ 주의: 실제 머신러닝 파이프라인과 다소 상이할 수 있습니다
데이터 수집 데이터 전처리 피처 엔지니어링 모델링 하이퍼파라미터 튜닝 평가
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
머신러닝 파이프라인
32
※ 주의: 실제 머신러닝 파이프라인과 다소 상이할 수 있습니다
데이터 수집 데이터 전처리 피처 엔지니어링 모델링 하이퍼파라미터 튜닝 평가
머신러닝 ≠ 모델링
Tree Neural Net
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
머신러닝 파이프라인
33
※ 주의: 실제 머신러닝 파이프라인과 다소 상이할 수 있습니다
데이터 수집 데이터 전처리 피처 엔지니어링 모델링 하이퍼파라미터 튜닝 평가
머신러닝 ⊃ 모델링
Tree Neural Net
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
머신러닝 파이프라인
34
※ 주의: 실제 머신러닝 파이프라인과 다소 상이할 수 있습니다
데이터 수집 데이터 전처리 피처 엔지니어링 모델링 하이퍼파라미터 튜닝 평가
- Web Crawling
- Database / SQL
- …
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
머신러닝 파이프라인
35
※ 주의: 실제 머신러닝 파이프라인과 다소 상이할 수 있습니다
데이터 수집 데이터 전처리 피처 엔지니어링 모델링 하이퍼파라미터 튜닝 평가
- 결측치
- 이상치
- …
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
머신러닝 파이프라인
36
※ 주의: 실제 머신러닝 파이프라인과 다소 상이할 수 있습니다
데이터 수집 데이터 전처리 피처 엔지니어링 모델링 하이퍼파라미터 튜닝 평가
- 파생 변수 생성
- 피처 이산화 및 로그, 지수화
- 피처 스케일링
- 피처 선택
- …
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
머신러닝 파이프라인
37
※ 주의: 실제 머신러닝 파이프라인과 다소 상이할 수 있습니다
데이터 수집 데이터 전처리 피처 엔지니어링 모델링 하이퍼파라미터 튜닝 평가
- 파생 변수 생성
- 피처 이산화 및 로그, 지수화
- 피처 스케일링
- 피처 선택
- …
사실상 가장 힘들고
귀찮지만 중요한 부분
탐색적 데이터 분석
(EDA)
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
머신러닝 파이프라인
38
※ 주의: 실제 머신러닝 파이프라인과 다소 상이할 수 있습니다
데이터 수집 데이터 전처리 피처 엔지니어링 모델링 하이퍼파라미터 튜닝 평가
- 파생 변수 생성
- 피처 이산화 및 로그, 지수화
- 피처 스케일링
- 피처 선택
- …
사실상 가장 힘들고
귀찮지만 중요한 부분
탐색적 데이터 분석
(EDA)
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
머신러닝 파이프라인
39
※ 주의: 실제 머신러닝 파이프라인과 다소 상이할 수 있습니다
데이터 수집 데이터 전처리 피처 엔지니어링 모델링 하이퍼파라미터 튜닝 평가
- 파생 변수 생성
- 피처 이산화 및 로그, 지수화
- 피처 스케일링
- 피처 선택
- …
사실상 가장 힘들고
귀찮지만 중요한 부분
Garbage In, Garbage Out
탐색적 데이터 분석
(EDA)
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
머신러닝 파이프라인
40
※ 주의: 실제 머신러닝 파이프라인과 다소 상이할 수 있습니다
데이터 수집 데이터 전처리 피처 엔지니어링 모델링 하이퍼파라미터 튜닝 평가
- 파생 변수 생성
- 피처 이산화 및 로그, 지수화
- 피처 스케일링
- 피처 선택
- …
사실상 가장 힘들고
귀찮지만 중요한 부분
공모전의 등수나
컴피티션의 성능을 좌우
Garbage In, Garbage Out
탐색적 데이터 분석
(EDA)
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
머신러닝 파이프라인
41
※ 주의: 실제 머신러닝 파이프라인과 다소 상이할 수 있습니다
데이터 수집 데이터 전처리 피처 엔지니어링 모델링 하이퍼파라미터 튜닝 평가
- 파생 변수 생성
- 피처 이산화 및 로그, 지수화
- 피처 스케일링
- 피처 선택
- …
사실상 가장 힘들고
귀찮지만 중요한 부분
공모전의 등수나
컴피티션의 성능을 좌우
Garbage In, Garbage Out
탐색적 데이터 분석
(EDA)
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
머신러닝 파이프라인
42
※ 주의: 실제 머신러닝 파이프라인과 다소 상이할 수 있습니다
데이터 수집 데이터 전처리 피처 엔지니어링 모델링 하이퍼파라미터 튜닝 평가
- 선형회귀
- 결정 트리
- 랜덤 포레스트
- 신경망
- …
Tree Neural Net
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
머신러닝 파이프라인
43
※ 주의: 실제 머신러닝 파이프라인과 다소 상이할 수 있습니다
데이터 수집 데이터 전처리 피처 엔지니어링 모델링 하이퍼파라미터 튜닝 평가
- 선형회귀
- 결정 트리
- 랜덤 포레스트
- 신경망
- …
Tree Neural Net
모델 생성 모델 학습 모델 평가 모델 예측
model = DecisionTree() model.fit(X_train, y_train) model.score(X_test, y_test) model.predict(X_unseen)
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
머신러닝 파이프라인
44
※ 주의: 실제 머신러닝 파이프라인과 다소 상이할 수 있습니다
데이터 수집 데이터 전처리 피처 엔지니어링 모델링 하이퍼파라미터 튜닝 평가
- 랜덤 서치
- 그리드 서치
- …
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
머신러닝 파이프라인
45
※ 주의: 실제 머신러닝 파이프라인과 다소 상이할 수 있습니다
데이터 수집 데이터 전처리 피처 엔지니어링 모델링 하이퍼파라미터 튜닝 평가
- 학습/검증/평가 데이터
- 교차검증
- MSE, RMSE, MAE …
- …
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
캐글이나 데이콘
많이 참가해보시길 바랍니다
(그리고 이전보다 다른 참가자들의 전체적인 파이프라인이 눈에 잘 들어오실 겁니다)
46
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
캐글이나 데이콘
많이 참가해보시길 바랍니다
(그리고 이전보다 다른 참가자들의 전체적인 파이프라인이 눈에 잘 들어오실 겁니다)
47
저처럼 영어 못하시는 분은
이걸로 캐글 입문하셔도 좋습니다 :)
영어 한글
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
머신러닝 추천 강의
48
Andrew Ng교수님의 Coursera 머신러닝 강의
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
머신러닝 추천 도서
49
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
머신러닝 추천 도서
50
- 사이킷런을 활용하는 예제
- 머신러닝 이론은 배웠지만
어떻게 활용하는지 궁금한
학습자에게 유용
- 이론을 배우지 않았다면
구성이 다소 불친절할 수 있음
※ 주의: 지극히 개인적인 견해입니다
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
머신러닝 추천 도서
51
- 머신러닝/딥러닝의 교과서
- 지도학습과 비지도학습으로
나뉘어 있는 이론 위주의 책
구성
- 이론을 충실하게 배울 수
있으나 실제로 활용법은 없음
- 책 후반에 딥러닝도 배울 수
있음
※ 주의: 지극히 개인적인 견해입니다
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
머신러닝 추천 도서
52
- 핸즈온 머신러닝의 순한맛
(그래서 일부로 같은 도마뱀?)
- 처음 머신러닝을 입문한다면
개인적으로 추천
- 공룡책보다 사이킷런 활용
예제가 적어서 아쉬움
※ 주의: 지극히 개인적인 견해입니다
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
딥러닝
DEEP LEARNING
53
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
딥러닝
어떻게 시작하지?
54
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 8455
딥러닝 이론
이제 다 배웠다!
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 8456
나 무시하나?
그런 건 쉽지!
MNIST
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 8457
https://thumbs.gfycat.com/AffectionateMemorableGreyhounddog-size_restricted.gif
근데 이걸
어떻게 코딩하지?
내 머리 속 CNN이 작동하는 상상
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
텐서플로우? 파이토치?
58
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 8459
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 8460
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 8461
딥러닝 초보자들에게 적합
보다 간편한 프레임워크로 쉽게 딥러닝 입문 가능
초보자들에게 추천한다고 해서 초보적인 수준의 코드만 짤 수 있는 것은 아님
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 8462
대학원생들에게 적합
최근 많은 논문의 코드들이 PyTorch 로 나오고 있음
비전과 텍스트에 특화된 라이브러리를 활용할 수 있음
Build with run 방식의 Dynamic 모델링이 가능하기 때문에 여러가지 시도를 할 수 있음
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 8463
개발자들에게 적합
Google에서 관리하고 있기 때문에 실제 웹/앱 서비스하기 위해 적합
소형 디바이스와 같은 경량화된 딥러닝을 원한다면 추천 → TensorFlow Lite
TensorFlow 1.X는 build and run 방식의 static한 모델링 → 초보자에게 어려움
TensorFlow 2.X 버전이 나오면서 초보자들도 다루기 쉬워지고 있음
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
딥러닝 파이프라인
64
데이터 수집 데이터 전처리 신경망 구성 오차함수 및
최적화 기법 선택
모델 학습 모델 추론
※ 주의: 실제 딥러닝 파이프라인과 다소 상이할 수 있습니다
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
딥러닝 파이프라인
65
데이터 수집 데이터 전처리 신경망 구성 오차함수 및
최적화 기법 선택
모델 학습 모델 추론
※ 주의: 실제 딥러닝 파이프라인과 다소 상이할 수 있습니다
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
딥러닝 파이프라인
66
데이터 수집 데이터 전처리 신경망 구성 오차함수 및
최적화 기법 선택
모델 학습 모델 추론
- Dataset 생성하기
- DataLoader 생성하기
※ 주의: 실제 딥러닝 파이프라인과 다소 상이할 수 있습니다
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
딥러닝 파이프라인
67
데이터 수집 데이터 전처리 신경망 구성 오차함수 및
최적화 기법 선택
모델 학습 모델 추론
- Dataset 생성하기
- DataLoader 생성하기
※ 주의: 실제 딥러닝 파이프라인과 다소 상이할 수 있습니다
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
딥러닝 파이프라인
68
데이터 수집 데이터 전처리 신경망 구성 오차함수 및
최적화 기법 선택
모델 학습 모델 추론
- 클래스 생성 후
forward 함수 정의
※ 주의: 실제 딥러닝 파이프라인과 다소 상이할 수 있습니다
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
딥러닝 파이프라인
69
데이터 수집 데이터 전처리 신경망 구성 오차함수 및
최적화 기법 선택
모델 학습 모델 추론
※ 주의: 실제 딥러닝 파이프라인과 다소 상이할 수 있습니다
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
딥러닝 파이프라인
70
데이터 수집 데이터 전처리 신경망 구성 오차함수 및
최적화 기법 선택
모델 학습 모델 추론
※ 주의: 실제 딥러닝 파이프라인과 다소 상이할 수 있습니다
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
딥러닝 파이프라인
71
※ 주의: 실제 딥러닝 파이프라인과 다소 상이할 수 있습니다
데이터 수집 데이터 전처리 신경망 구성 오차함수 및
최적화 기법 선택
모델 학습 모델 추론
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
딥러닝 파이프라인
72
데이터 수집 데이터 전처리 신경망 구성 오차함수 및
최적화 기법 선택
모델 학습 모델 추론
※ 주의: 실제 딥러닝 파이프라인과 다소 상이할 수 있습니다
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
딥러닝 파이프라인
73
데이터 수집 데이터 전처리 신경망 구성 오차함수 및
최적화 기법 선택
모델 학습 모델 추론
※ 주의: 실제 딥러닝 파이프라인과 다소 상이할 수 있습니다
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
딥러닝 파이프라인
74
데이터 수집 데이터 전처리 신경망 구성 오차함수 및
최적화 기법 선택
모델 학습 모델 추론
※ 주의: 실제 딥러닝 파이프라인과 다소 상이할 수 있습니다
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
딥러닝 파이프라인
75
데이터 수집 데이터 전처리 신경망 구성 오차함수 및
최적화 기법 선택
모델 학습 모델 추론
※ 주의: 실제 딥러닝 파이프라인과 다소 상이할 수 있습니다
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
여러분의 친구
76
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
여러분의 선생님
77
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
딥러닝 추천 강의
78
김성훈 교수님의 모두의 딥러닝
김성훈 교수님
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
딥러닝 추천 강의 – 컴퓨터 비전
79
Stanford 대학의 CS231n 강좌
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
딥러닝 추천 강의 – 자연어 처리
80
Stanford 대학의 CS231n 강좌
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
딥러닝 추천 도서
81
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
딥러닝 프레임워크 추천 도서
82
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
들어주셔서 감사합니다 :)
83
궁금한 점이 있으시다면 언제든지 minsuksung@korea.ac.kr이나 슬랙 DM으로 연락주세요!
Bigdata is Our A to Z
분석 12기 성민석
머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84
REFERENCE
• Andrew Ng 교수님의 코세라 머신러닝 강좌: https://ko.coursera.org/learn/machine-learning
• 김성훈 교수님의 모두의 딥러닝: https://hunkim.github.io/ml/
• 김성훈 교수님의 YouTube: https://www.youtube.com/watch?v=BS6O0zOGX4E&list=PLlMkM4tgfjnLSOjrEJN31gZATbcj_MpUm
• Stanford CS231n 공식 홈페이지: http://cs231n.stanford.edu/
• CS231n 한글자막 GitHub: https://github.com/aikorea/cs231n/tree/master/captions/Ko
• 성민석의 GitHub: https://github.com/minsuk-sung
84

More Related Content

Similar to BOAZ Conference Talk (Minsuk Sung)

데이터분석의 길 3 “r 워크플로우 (스토리텔링)”
데이터분석의 길 3   “r 워크플로우 (스토리텔링)”데이터분석의 길 3   “r 워크플로우 (스토리텔링)”
데이터분석의 길 3 “r 워크플로우 (스토리텔링)”
Jaimie Kwon (권재명)
 

Similar to BOAZ Conference Talk (Minsuk Sung) (20)

How to Create Value from Data, and Its Difficulty
How to Create Value from Data, and Its DifficultyHow to Create Value from Data, and Its Difficulty
How to Create Value from Data, and Its Difficulty
 
Deep learning text NLP and Spark Collaboration . 한글 딥러닝 Text NLP & Spark
Deep learning text NLP and Spark Collaboration . 한글 딥러닝 Text NLP & SparkDeep learning text NLP and Spark Collaboration . 한글 딥러닝 Text NLP & Spark
Deep learning text NLP and Spark Collaboration . 한글 딥러닝 Text NLP & Spark
 
Peopleplus hr session(2) people analytics, start today
Peopleplus hr session(2) people analytics, start todayPeopleplus hr session(2) people analytics, start today
Peopleplus hr session(2) people analytics, start today
 
T ka kr_4th
T ka kr_4thT ka kr_4th
T ka kr_4th
 
DLAB Big Data Issue Report 001
DLAB Big Data Issue Report 001DLAB Big Data Issue Report 001
DLAB Big Data Issue Report 001
 
[TMS 2018] 자금확보 / Lablup 신정규 CEO, 님아 제발 그 강을 마오
[TMS 2018] 자금확보 / Lablup 신정규 CEO, 님아 제발 그 강을 마오[TMS 2018] 자금확보 / Lablup 신정규 CEO, 님아 제발 그 강을 마오
[TMS 2018] 자금확보 / Lablup 신정규 CEO, 님아 제발 그 강을 마오
 
데이터분석의 길 5: “고수는 큰자료를 두려워하지 않는다” (클릭확률예측 상편)
데이터분석의 길 5:  “고수는 큰자료를 두려워하지 않는다” (클릭확률예측 상편)데이터분석의 길 5:  “고수는 큰자료를 두려워하지 않는다” (클릭확률예측 상편)
데이터분석의 길 5: “고수는 큰자료를 두려워하지 않는다” (클릭확률예측 상편)
 
1.introduction(epoch#2)
1.introduction(epoch#2)1.introduction(epoch#2)
1.introduction(epoch#2)
 
Searching for magic formula by deep learning
Searching for magic formula by deep learningSearching for magic formula by deep learning
Searching for magic formula by deep learning
 
Neural stream
Neural streamNeural stream
Neural stream
 
Display Ads Platform에 대한 약간 그럴싸한 안내와 잡담
Display Ads Platform에 대한 약간 그럴싸한 안내와 잡담Display Ads Platform에 대한 약간 그럴싸한 안내와 잡담
Display Ads Platform에 대한 약간 그럴싸한 안내와 잡담
 
예비 개발자를 위한 소프트웨어 세상 이야기
예비 개발자를 위한 소프트웨어 세상 이야기예비 개발자를 위한 소프트웨어 세상 이야기
예비 개발자를 위한 소프트웨어 세상 이야기
 
NDC 2016, [슈판워] 맨땅에서 데이터 분석 시스템 만들어나가기
NDC 2016, [슈판워] 맨땅에서 데이터 분석 시스템 만들어나가기NDC 2016, [슈판워] 맨땅에서 데이터 분석 시스템 만들어나가기
NDC 2016, [슈판워] 맨땅에서 데이터 분석 시스템 만들어나가기
 
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: GRUTER의 빅데이터 플랫폼 및 전략 소개
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: GRUTER의 빅데이터 플랫폼 및 전략 소개GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: GRUTER의 빅데이터 플랫폼 및 전략 소개
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: GRUTER의 빅데이터 플랫폼 및 전략 소개
 
[PandoraCube] 구글 애널리틱스 소개
[PandoraCube] 구글 애널리틱스 소개[PandoraCube] 구글 애널리틱스 소개
[PandoraCube] 구글 애널리틱스 소개
 
[전용준] 비즈니스가치를 위한 AI적용: 이슈와 과제 2018
[전용준] 비즈니스가치를 위한 AI적용: 이슈와 과제 2018[전용준] 비즈니스가치를 위한 AI적용: 이슈와 과제 2018
[전용준] 비즈니스가치를 위한 AI적용: 이슈와 과제 2018
 
데이터분석의 길 3 “r 워크플로우 (스토리텔링)”
데이터분석의 길 3   “r 워크플로우 (스토리텔링)”데이터분석의 길 3   “r 워크플로우 (스토리텔링)”
데이터분석의 길 3 “r 워크플로우 (스토리텔링)”
 
Chapter 11 Practical Methodology
Chapter 11 Practical MethodologyChapter 11 Practical Methodology
Chapter 11 Practical Methodology
 
[2A7]Linkedin'sDataScienceWhyIsItScience
[2A7]Linkedin'sDataScienceWhyIsItScience[2A7]Linkedin'sDataScienceWhyIsItScience
[2A7]Linkedin'sDataScienceWhyIsItScience
 
실리콘 밸리 데이터 사이언티스트의 하루
실리콘 밸리 데이터 사이언티스트의 하루실리콘 밸리 데이터 사이언티스트의 하루
실리콘 밸리 데이터 사이언티스트의 하루
 

BOAZ Conference Talk (Minsuk Sung)

  • 1. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 컨퍼런스 톡 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 고려대학교 인공지능학과 분석 12기 성민석
  • 2. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 들어가기 앞서 INTRODUCTION 2
  • 3. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 머신러닝과 딥러닝을 처음 공부했을 시점으로 돌아가서 3
  • 4. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 844 ※ 주의: 본 발표와 관련 없는 강의들입니다.
  • 5. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 845 머신러닝/딥러닝 진짜?
  • 6. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 846 머신러닝/딥러닝
  • 7. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 847 데이터 과학 데이터 분석 ?
  • 8. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 848 데이터 과학 데이터 분석 ? 통계학 ?
  • 9. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 849 데이터 과학 데이터 분석 ? 인공지능? 통계학 ?
  • 10. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 8410 데이터 과학 데이터 분석 ? 인공지능? 머신러닝 ? 통계학 ?
  • 11. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 8411 데이터 과학 데이터 분석 ? 인공지능? 머신러닝 ? 딥러닝 ? 통계학 ?
  • 12. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 8412 데이터 과학 데이터 분석 ? 인공지능? 머신러닝 ? 딥러닝 ? 통계학 ? 뭐가 뭔지 하나도 모르겠다
  • 13. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 8413 데이터 과학 데이터 분석 ? 인공지능? 머신러닝 ? 딥러닝 ? 통계학 ? 아하 결국 다 같은 건가(?) 예전의 저와 같이 머신러닝/딥러닝을 처음 공부하시는 분들을 위해
  • 14. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 8414
  • 15. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 인공지능 어떻게 공부해야 하지? 15
  • 16. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 인공지능 어떻게 공부해야 하지? → 일단 프로그래밍 언어부터 공부 16
  • 17. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 Python? R? 17
  • 18. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 Python! R? 18 - 시중에 공부할 수 있는 책이 훨씬 많음 - 사이킷런, 텐서플로우 그리고 파이토치와 같은 ML/DL 라이브러리가 탄탄하게 준비 - 커뮤니티가 훨씬 커서 물어볼 수 있는 환경이 좋음 - 웹이나 모바일 어플리케이션 활용 가능해서 확장성이 좋음 - … ※ 주의: 어디까지나 선택은 개인의 자유입니다. 둘 다 좋은 언어입니다.
  • 19. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 8419 BOAZ 분석 커리큘럼대로 머신러닝과 딥러닝으로 분류
  • 20. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 8420 정형 데이터 비정형 데이터 머신러닝 딥러닝 ※ 주의: 편의상 데이터 타입에 따라서 메소드를 정했습니다. Computer Vision Natural Language Process BOAZ 분석 커리큘럼대로 머신러닝과 딥러닝으로 분류
  • 21. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 머신러닝 MACHINE LEARNING 21
  • 22. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 머신러닝 어떻게 시작하지? 22
  • 23. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 8423
  • 24. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 8424
  • 25. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 8425
  • 26. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 8426
  • 27. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 8427 머신러닝 이제 다 배웠다!
  • 28. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 8428 Kaggle의 대표적인 연습 예제: 타이타닉 https://www.kaggle.com/c/titanic/data 에이 저걸 누가 못해(?)
  • 29. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 8429 Kaggle의 대표적인 연습 예제: 타이타닉 https://github.com/minsuk-heo/kaggle-titanic/ 네 그 누가 바로 접니다...
  • 30. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 8430 머신러닝을 어떻게 써야하지?
  • 31. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 머신러닝 파이프라인 31 ※ 주의: 실제 머신러닝 파이프라인과 다소 상이할 수 있습니다 데이터 수집 데이터 전처리 피처 엔지니어링 모델링 하이퍼파라미터 튜닝 평가
  • 32. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 머신러닝 파이프라인 32 ※ 주의: 실제 머신러닝 파이프라인과 다소 상이할 수 있습니다 데이터 수집 데이터 전처리 피처 엔지니어링 모델링 하이퍼파라미터 튜닝 평가 머신러닝 ≠ 모델링 Tree Neural Net
  • 33. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 머신러닝 파이프라인 33 ※ 주의: 실제 머신러닝 파이프라인과 다소 상이할 수 있습니다 데이터 수집 데이터 전처리 피처 엔지니어링 모델링 하이퍼파라미터 튜닝 평가 머신러닝 ⊃ 모델링 Tree Neural Net
  • 34. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 머신러닝 파이프라인 34 ※ 주의: 실제 머신러닝 파이프라인과 다소 상이할 수 있습니다 데이터 수집 데이터 전처리 피처 엔지니어링 모델링 하이퍼파라미터 튜닝 평가 - Web Crawling - Database / SQL - …
  • 35. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 머신러닝 파이프라인 35 ※ 주의: 실제 머신러닝 파이프라인과 다소 상이할 수 있습니다 데이터 수집 데이터 전처리 피처 엔지니어링 모델링 하이퍼파라미터 튜닝 평가 - 결측치 - 이상치 - …
  • 36. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 머신러닝 파이프라인 36 ※ 주의: 실제 머신러닝 파이프라인과 다소 상이할 수 있습니다 데이터 수집 데이터 전처리 피처 엔지니어링 모델링 하이퍼파라미터 튜닝 평가 - 파생 변수 생성 - 피처 이산화 및 로그, 지수화 - 피처 스케일링 - 피처 선택 - …
  • 37. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 머신러닝 파이프라인 37 ※ 주의: 실제 머신러닝 파이프라인과 다소 상이할 수 있습니다 데이터 수집 데이터 전처리 피처 엔지니어링 모델링 하이퍼파라미터 튜닝 평가 - 파생 변수 생성 - 피처 이산화 및 로그, 지수화 - 피처 스케일링 - 피처 선택 - … 사실상 가장 힘들고 귀찮지만 중요한 부분 탐색적 데이터 분석 (EDA)
  • 38. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 머신러닝 파이프라인 38 ※ 주의: 실제 머신러닝 파이프라인과 다소 상이할 수 있습니다 데이터 수집 데이터 전처리 피처 엔지니어링 모델링 하이퍼파라미터 튜닝 평가 - 파생 변수 생성 - 피처 이산화 및 로그, 지수화 - 피처 스케일링 - 피처 선택 - … 사실상 가장 힘들고 귀찮지만 중요한 부분 탐색적 데이터 분석 (EDA)
  • 39. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 머신러닝 파이프라인 39 ※ 주의: 실제 머신러닝 파이프라인과 다소 상이할 수 있습니다 데이터 수집 데이터 전처리 피처 엔지니어링 모델링 하이퍼파라미터 튜닝 평가 - 파생 변수 생성 - 피처 이산화 및 로그, 지수화 - 피처 스케일링 - 피처 선택 - … 사실상 가장 힘들고 귀찮지만 중요한 부분 Garbage In, Garbage Out 탐색적 데이터 분석 (EDA)
  • 40. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 머신러닝 파이프라인 40 ※ 주의: 실제 머신러닝 파이프라인과 다소 상이할 수 있습니다 데이터 수집 데이터 전처리 피처 엔지니어링 모델링 하이퍼파라미터 튜닝 평가 - 파생 변수 생성 - 피처 이산화 및 로그, 지수화 - 피처 스케일링 - 피처 선택 - … 사실상 가장 힘들고 귀찮지만 중요한 부분 공모전의 등수나 컴피티션의 성능을 좌우 Garbage In, Garbage Out 탐색적 데이터 분석 (EDA)
  • 41. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 머신러닝 파이프라인 41 ※ 주의: 실제 머신러닝 파이프라인과 다소 상이할 수 있습니다 데이터 수집 데이터 전처리 피처 엔지니어링 모델링 하이퍼파라미터 튜닝 평가 - 파생 변수 생성 - 피처 이산화 및 로그, 지수화 - 피처 스케일링 - 피처 선택 - … 사실상 가장 힘들고 귀찮지만 중요한 부분 공모전의 등수나 컴피티션의 성능을 좌우 Garbage In, Garbage Out 탐색적 데이터 분석 (EDA)
  • 42. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 머신러닝 파이프라인 42 ※ 주의: 실제 머신러닝 파이프라인과 다소 상이할 수 있습니다 데이터 수집 데이터 전처리 피처 엔지니어링 모델링 하이퍼파라미터 튜닝 평가 - 선형회귀 - 결정 트리 - 랜덤 포레스트 - 신경망 - … Tree Neural Net
  • 43. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 머신러닝 파이프라인 43 ※ 주의: 실제 머신러닝 파이프라인과 다소 상이할 수 있습니다 데이터 수집 데이터 전처리 피처 엔지니어링 모델링 하이퍼파라미터 튜닝 평가 - 선형회귀 - 결정 트리 - 랜덤 포레스트 - 신경망 - … Tree Neural Net 모델 생성 모델 학습 모델 평가 모델 예측 model = DecisionTree() model.fit(X_train, y_train) model.score(X_test, y_test) model.predict(X_unseen)
  • 44. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 머신러닝 파이프라인 44 ※ 주의: 실제 머신러닝 파이프라인과 다소 상이할 수 있습니다 데이터 수집 데이터 전처리 피처 엔지니어링 모델링 하이퍼파라미터 튜닝 평가 - 랜덤 서치 - 그리드 서치 - …
  • 45. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 머신러닝 파이프라인 45 ※ 주의: 실제 머신러닝 파이프라인과 다소 상이할 수 있습니다 데이터 수집 데이터 전처리 피처 엔지니어링 모델링 하이퍼파라미터 튜닝 평가 - 학습/검증/평가 데이터 - 교차검증 - MSE, RMSE, MAE … - …
  • 46. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 캐글이나 데이콘 많이 참가해보시길 바랍니다 (그리고 이전보다 다른 참가자들의 전체적인 파이프라인이 눈에 잘 들어오실 겁니다) 46
  • 47. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 캐글이나 데이콘 많이 참가해보시길 바랍니다 (그리고 이전보다 다른 참가자들의 전체적인 파이프라인이 눈에 잘 들어오실 겁니다) 47 저처럼 영어 못하시는 분은 이걸로 캐글 입문하셔도 좋습니다 :) 영어 한글
  • 48. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 머신러닝 추천 강의 48 Andrew Ng교수님의 Coursera 머신러닝 강의
  • 49. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 머신러닝 추천 도서 49
  • 50. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 머신러닝 추천 도서 50 - 사이킷런을 활용하는 예제 - 머신러닝 이론은 배웠지만 어떻게 활용하는지 궁금한 학습자에게 유용 - 이론을 배우지 않았다면 구성이 다소 불친절할 수 있음 ※ 주의: 지극히 개인적인 견해입니다
  • 51. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 머신러닝 추천 도서 51 - 머신러닝/딥러닝의 교과서 - 지도학습과 비지도학습으로 나뉘어 있는 이론 위주의 책 구성 - 이론을 충실하게 배울 수 있으나 실제로 활용법은 없음 - 책 후반에 딥러닝도 배울 수 있음 ※ 주의: 지극히 개인적인 견해입니다
  • 52. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 머신러닝 추천 도서 52 - 핸즈온 머신러닝의 순한맛 (그래서 일부로 같은 도마뱀?) - 처음 머신러닝을 입문한다면 개인적으로 추천 - 공룡책보다 사이킷런 활용 예제가 적어서 아쉬움 ※ 주의: 지극히 개인적인 견해입니다
  • 53. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 딥러닝 DEEP LEARNING 53
  • 54. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 딥러닝 어떻게 시작하지? 54
  • 55. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 8455 딥러닝 이론 이제 다 배웠다!
  • 56. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 8456 나 무시하나? 그런 건 쉽지! MNIST
  • 57. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 8457 https://thumbs.gfycat.com/AffectionateMemorableGreyhounddog-size_restricted.gif 근데 이걸 어떻게 코딩하지? 내 머리 속 CNN이 작동하는 상상
  • 58. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 텐서플로우? 파이토치? 58
  • 59. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 8459
  • 60. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 8460
  • 61. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 8461 딥러닝 초보자들에게 적합 보다 간편한 프레임워크로 쉽게 딥러닝 입문 가능 초보자들에게 추천한다고 해서 초보적인 수준의 코드만 짤 수 있는 것은 아님
  • 62. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 8462 대학원생들에게 적합 최근 많은 논문의 코드들이 PyTorch 로 나오고 있음 비전과 텍스트에 특화된 라이브러리를 활용할 수 있음 Build with run 방식의 Dynamic 모델링이 가능하기 때문에 여러가지 시도를 할 수 있음
  • 63. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 8463 개발자들에게 적합 Google에서 관리하고 있기 때문에 실제 웹/앱 서비스하기 위해 적합 소형 디바이스와 같은 경량화된 딥러닝을 원한다면 추천 → TensorFlow Lite TensorFlow 1.X는 build and run 방식의 static한 모델링 → 초보자에게 어려움 TensorFlow 2.X 버전이 나오면서 초보자들도 다루기 쉬워지고 있음
  • 64. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 딥러닝 파이프라인 64 데이터 수집 데이터 전처리 신경망 구성 오차함수 및 최적화 기법 선택 모델 학습 모델 추론 ※ 주의: 실제 딥러닝 파이프라인과 다소 상이할 수 있습니다
  • 65. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 딥러닝 파이프라인 65 데이터 수집 데이터 전처리 신경망 구성 오차함수 및 최적화 기법 선택 모델 학습 모델 추론 ※ 주의: 실제 딥러닝 파이프라인과 다소 상이할 수 있습니다
  • 66. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 딥러닝 파이프라인 66 데이터 수집 데이터 전처리 신경망 구성 오차함수 및 최적화 기법 선택 모델 학습 모델 추론 - Dataset 생성하기 - DataLoader 생성하기 ※ 주의: 실제 딥러닝 파이프라인과 다소 상이할 수 있습니다
  • 67. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 딥러닝 파이프라인 67 데이터 수집 데이터 전처리 신경망 구성 오차함수 및 최적화 기법 선택 모델 학습 모델 추론 - Dataset 생성하기 - DataLoader 생성하기 ※ 주의: 실제 딥러닝 파이프라인과 다소 상이할 수 있습니다
  • 68. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 딥러닝 파이프라인 68 데이터 수집 데이터 전처리 신경망 구성 오차함수 및 최적화 기법 선택 모델 학습 모델 추론 - 클래스 생성 후 forward 함수 정의 ※ 주의: 실제 딥러닝 파이프라인과 다소 상이할 수 있습니다
  • 69. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 딥러닝 파이프라인 69 데이터 수집 데이터 전처리 신경망 구성 오차함수 및 최적화 기법 선택 모델 학습 모델 추론 ※ 주의: 실제 딥러닝 파이프라인과 다소 상이할 수 있습니다
  • 70. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 딥러닝 파이프라인 70 데이터 수집 데이터 전처리 신경망 구성 오차함수 및 최적화 기법 선택 모델 학습 모델 추론 ※ 주의: 실제 딥러닝 파이프라인과 다소 상이할 수 있습니다
  • 71. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 딥러닝 파이프라인 71 ※ 주의: 실제 딥러닝 파이프라인과 다소 상이할 수 있습니다 데이터 수집 데이터 전처리 신경망 구성 오차함수 및 최적화 기법 선택 모델 학습 모델 추론
  • 72. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 딥러닝 파이프라인 72 데이터 수집 데이터 전처리 신경망 구성 오차함수 및 최적화 기법 선택 모델 학습 모델 추론 ※ 주의: 실제 딥러닝 파이프라인과 다소 상이할 수 있습니다
  • 73. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 딥러닝 파이프라인 73 데이터 수집 데이터 전처리 신경망 구성 오차함수 및 최적화 기법 선택 모델 학습 모델 추론 ※ 주의: 실제 딥러닝 파이프라인과 다소 상이할 수 있습니다
  • 74. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 딥러닝 파이프라인 74 데이터 수집 데이터 전처리 신경망 구성 오차함수 및 최적화 기법 선택 모델 학습 모델 추론 ※ 주의: 실제 딥러닝 파이프라인과 다소 상이할 수 있습니다
  • 75. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 딥러닝 파이프라인 75 데이터 수집 데이터 전처리 신경망 구성 오차함수 및 최적화 기법 선택 모델 학습 모델 추론 ※ 주의: 실제 딥러닝 파이프라인과 다소 상이할 수 있습니다
  • 76. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 여러분의 친구 76
  • 77. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 여러분의 선생님 77
  • 78. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 딥러닝 추천 강의 78 김성훈 교수님의 모두의 딥러닝 김성훈 교수님
  • 79. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 딥러닝 추천 강의 – 컴퓨터 비전 79 Stanford 대학의 CS231n 강좌
  • 80. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 딥러닝 추천 강의 – 자연어 처리 80 Stanford 대학의 CS231n 강좌
  • 81. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 딥러닝 추천 도서 81
  • 82. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 딥러닝 프레임워크 추천 도서 82
  • 83. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 들어주셔서 감사합니다 :) 83 궁금한 점이 있으시다면 언제든지 minsuksung@korea.ac.kr이나 슬랙 DM으로 연락주세요!
  • 84. Bigdata is Our A to Z 분석 12기 성민석 머신러닝/딥러닝을 처음 공부하는 딥린이를 위한 안내서 / 84 REFERENCE • Andrew Ng 교수님의 코세라 머신러닝 강좌: https://ko.coursera.org/learn/machine-learning • 김성훈 교수님의 모두의 딥러닝: https://hunkim.github.io/ml/ • 김성훈 교수님의 YouTube: https://www.youtube.com/watch?v=BS6O0zOGX4E&list=PLlMkM4tgfjnLSOjrEJN31gZATbcj_MpUm • Stanford CS231n 공식 홈페이지: http://cs231n.stanford.edu/ • CS231n 한글자막 GitHub: https://github.com/aikorea/cs231n/tree/master/captions/Ko • 성민석의 GitHub: https://github.com/minsuk-sung 84