Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
EN
DK
Uploaded by
Donam Kim
PPTX, PDF
8,290 views
Apache Spark 입문에서 머신러닝까지
발렌타인 웨비나 - Apache Spark 슬라이드 자료입니다.
Technology
◦
Related topics:
Apache Spark
•
Read more
71
Save
Share
Embed
Embed presentation
Download
Downloaded 314 times
1
/ 58
2
/ 58
3
/ 58
4
/ 58
5
/ 58
6
/ 58
7
/ 58
8
/ 58
9
/ 58
10
/ 58
11
/ 58
12
/ 58
13
/ 58
14
/ 58
15
/ 58
16
/ 58
17
/ 58
18
/ 58
19
/ 58
20
/ 58
21
/ 58
22
/ 58
23
/ 58
24
/ 58
25
/ 58
26
/ 58
27
/ 58
28
/ 58
29
/ 58
30
/ 58
31
/ 58
32
/ 58
33
/ 58
34
/ 58
35
/ 58
36
/ 58
37
/ 58
38
/ 58
39
/ 58
40
/ 58
41
/ 58
42
/ 58
43
/ 58
44
/ 58
45
/ 58
46
/ 58
47
/ 58
48
/ 58
49
/ 58
50
/ 58
51
/ 58
52
/ 58
53
/ 58
54
/ 58
55
/ 58
56
/ 58
57
/ 58
58
/ 58
More Related Content
PDF
빅데이터 분석을 위한 스파크 2 프로그래밍 : 대용량 데이터 처리부터 머신러닝까지
by
위키북스
PDF
Zeppelin(Spark)으로 데이터 분석하기
by
SangWoo Kim
PDF
Spark Day 2017 Machine Learning & Deep Learning With Spark
by
SangHoon Lee
PDF
[NDC 2018] Spark, Flintrock, Airflow 로 구현하는 탄력적이고 유연한 데이터 분산처리 자동화 인프라 구축
by
Juhong Park
PDF
Apache Zeppelin으로 데이터 분석하기
by
SangWoo Kim
PPTX
Apache spark 소개 및 실습
by
동현 강
PPTX
2.apache spark 실습
by
동현 강
PDF
Spark overview 이상훈(SK C&C)_스파크 사용자 모임_20141106
by
SangHoon Lee
빅데이터 분석을 위한 스파크 2 프로그래밍 : 대용량 데이터 처리부터 머신러닝까지
by
위키북스
Zeppelin(Spark)으로 데이터 분석하기
by
SangWoo Kim
Spark Day 2017 Machine Learning & Deep Learning With Spark
by
SangHoon Lee
[NDC 2018] Spark, Flintrock, Airflow 로 구현하는 탄력적이고 유연한 데이터 분산처리 자동화 인프라 구축
by
Juhong Park
Apache Zeppelin으로 데이터 분석하기
by
SangWoo Kim
Apache spark 소개 및 실습
by
동현 강
2.apache spark 실습
by
동현 강
Spark overview 이상훈(SK C&C)_스파크 사용자 모임_20141106
by
SangHoon Lee
What's hot
PDF
Spark Day 2017@Seoul(Spark Bootcamp)
by
Sang-bae Lim
PPTX
Spark machine learning & deep learning
by
hoondong kim
PDF
Spark + S3 + R3를 이용한 데이터 분석 시스템 만들기
by
AWSKRUG - AWS한국사용자모임
PDF
스파크와 이클립스_연동하기
by
Dohyung Park
PDF
Cloudera session seoul - Spark bootcamp
by
Sang-bae Lim
PDF
스타트업 사례로 본 로그 데이터 분석 : Tajo on AWS
by
Matthew (정재화)
PPTX
[D2 COMMUNITY] Spark User Group - 스파크를 통한 딥러닝 이론과 실제
by
NAVER D2
PPTX
Spark sql
by
동현 강
PDF
Presto, Zeppelin을 이용한 초간단 BI 구축 사례
by
Hyoungjun Kim
PDF
Spark은 왜 이렇게 유명해지고 있을까?
by
KSLUG
PDF
[113]apache zeppelin 이문수
by
NAVER D2
PDF
Cluster - spark
by
HyeonSeok Choi
PDF
Zeppelin notebook 만들기
by
Soo-Kyung Choi
PDF
검색로그시스템 with Python
by
itproman35
PPTX
(Apacje Spark)아파치 스파크 개요, 소개, 스파크란?
by
탑크리에듀(구로디지털단지역3번출구 2분거리)
PDF
Spark 소개 2부
by
Jinho Yoo
PDF
Apache kafka intro_20150313_springloops
by
SungMin OH
PDF
AWS Aurora 운영사례 (by 배은미)
by
I Goo Lee.
PDF
Real-time Big Data Analytics Practice with Unstructured Data
by
Ted Won
PDF
Spark_Overview_qna
by
현철 박
Spark Day 2017@Seoul(Spark Bootcamp)
by
Sang-bae Lim
Spark machine learning & deep learning
by
hoondong kim
Spark + S3 + R3를 이용한 데이터 분석 시스템 만들기
by
AWSKRUG - AWS한국사용자모임
스파크와 이클립스_연동하기
by
Dohyung Park
Cloudera session seoul - Spark bootcamp
by
Sang-bae Lim
스타트업 사례로 본 로그 데이터 분석 : Tajo on AWS
by
Matthew (정재화)
[D2 COMMUNITY] Spark User Group - 스파크를 통한 딥러닝 이론과 실제
by
NAVER D2
Spark sql
by
동현 강
Presto, Zeppelin을 이용한 초간단 BI 구축 사례
by
Hyoungjun Kim
Spark은 왜 이렇게 유명해지고 있을까?
by
KSLUG
[113]apache zeppelin 이문수
by
NAVER D2
Cluster - spark
by
HyeonSeok Choi
Zeppelin notebook 만들기
by
Soo-Kyung Choi
검색로그시스템 with Python
by
itproman35
(Apacje Spark)아파치 스파크 개요, 소개, 스파크란?
by
탑크리에듀(구로디지털단지역3번출구 2분거리)
Spark 소개 2부
by
Jinho Yoo
Apache kafka intro_20150313_springloops
by
SungMin OH
AWS Aurora 운영사례 (by 배은미)
by
I Goo Lee.
Real-time Big Data Analytics Practice with Unstructured Data
by
Ted Won
Spark_Overview_qna
by
현철 박
Viewers also liked
PPTX
Spark 소개 1부
by
Jinho Yoo
PDF
Scalding - Big Data Programming with Scala
by
Taewook Eom
PDF
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: Tajo와 SQL-on-Hadoop
by
Gruter
PDF
Zeppelin, TensorFlow, Deep Learning 맛보기
by
Taejun Kim
PPTX
elasticsearch_적용 및 활용_정리
by
Junyi Song
PPTX
AB Test Platform - 우종호
by
Jongho Woo
PDF
Elastic Search (엘라스틱서치) 입문
by
SeungHyun Eom
Spark 소개 1부
by
Jinho Yoo
Scalding - Big Data Programming with Scala
by
Taewook Eom
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: Tajo와 SQL-on-Hadoop
by
Gruter
Zeppelin, TensorFlow, Deep Learning 맛보기
by
Taejun Kim
elasticsearch_적용 및 활용_정리
by
Junyi Song
AB Test Platform - 우종호
by
Jongho Woo
Elastic Search (엘라스틱서치) 입문
by
SeungHyun Eom
Similar to Apache Spark 입문에서 머신러닝까지
PDF
『9가지 사례로 익히는 고급 스파크 분석(2판) 』 맛보기
by
복연 이
PDF
『9가지 사례로 익히는 고급 스파크 분석』 - 맛보기
by
복연 이
PPTX
Start spark
by
ssuser31a17d
PDF
발표자료 11장
by
Juhui Park
PDF
sparklyr을 활용한 R 분산 처리
by
Sang-bae Lim
PDF
RUCK 2017 - 강병엽 - Spark와 R을 연동한 빅데이터 분석
by
r-kor
PDF
Python & Spark
by
itproman35
PPTX
What is spark
by
jaeho kang
PDF
[264] large scale deep-learning_on_spark
by
NAVER D2
PDF
Machine Learning with Apache Spark and Zeppelin
by
Dataya Nolja
PDF
Spark와 Hadoop, 완벽한 조합 (한국어)
by
Teddy Choi
PDF
『파이썬 라이브러리를 활용한 머신러닝』 맛보기
by
복연 이
PDF
Spark & Zeppelin을 활용한 머신러닝 실전 적용기
by
Taejun Kim
PDF
Tensorflow for Deep Learning(SK Planet)
by
Tae Young Lee
PDF
01 linear regression
by
CHUN HO LEE
PDF
1 linear regression
by
CHUN HO LEE
PDF
100% Serverless big data scale production Deep Learning System
by
hoondong kim
PDF
Understanding MLOps
by
Chun Myung Kyu
PDF
Amazon SageMaker 오버뷰 - 강성문, AWS AI/ML 스페셜리스트 :: AIML 특집 웨비나
by
Amazon Web Services Korea
PDF
Apache Spark
by
ssuser09ca0c1
『9가지 사례로 익히는 고급 스파크 분석(2판) 』 맛보기
by
복연 이
『9가지 사례로 익히는 고급 스파크 분석』 - 맛보기
by
복연 이
Start spark
by
ssuser31a17d
발표자료 11장
by
Juhui Park
sparklyr을 활용한 R 분산 처리
by
Sang-bae Lim
RUCK 2017 - 강병엽 - Spark와 R을 연동한 빅데이터 분석
by
r-kor
Python & Spark
by
itproman35
What is spark
by
jaeho kang
[264] large scale deep-learning_on_spark
by
NAVER D2
Machine Learning with Apache Spark and Zeppelin
by
Dataya Nolja
Spark와 Hadoop, 완벽한 조합 (한국어)
by
Teddy Choi
『파이썬 라이브러리를 활용한 머신러닝』 맛보기
by
복연 이
Spark & Zeppelin을 활용한 머신러닝 실전 적용기
by
Taejun Kim
Tensorflow for Deep Learning(SK Planet)
by
Tae Young Lee
01 linear regression
by
CHUN HO LEE
1 linear regression
by
CHUN HO LEE
100% Serverless big data scale production Deep Learning System
by
hoondong kim
Understanding MLOps
by
Chun Myung Kyu
Amazon SageMaker 오버뷰 - 강성문, AWS AI/ML 스페셜리스트 :: AIML 특집 웨비나
by
Amazon Web Services Korea
Apache Spark
by
ssuser09ca0c1
Apache Spark 입문에서 머신러닝까지
3.
• SCALA CRASH
COURSE • 스칼라 학교
4.
• •
9.
1. JAVA SDK
INSTALL 2. 스파크 노트북 (HTTP://SPARK-NOTEBOOK.IO/) 3. 4. 5.
13.
Reference: http://spark.apache.org/docs/latest/cluster-overview.html
14.
• • •
15.
• • • • •
17.
• •
18.
Reference: https://dzone.com/articles/big-data- processing-spark
19.
• TRANSFORMATION • • •
20.
• ACTION • • •
21.
• •
22.
• • CANNOT BE
OPTIMIZED BY SPARK •
24.
Reference: http://www.slideshare.net/databricks/2015-0616-spark-summit
25.
• • OPTIMIZED BY
SPARK
26.
Reference: http://www.slideshare.net/databricks/spark-sqlsse2015public
27.
Reference: http://www.slideshare.net/databricks/spark-sqlsse2015public
28.
• LOST TYPE
SAFETY
33.
• • • •
34.
• • •
36.
• • •
38.
실습 ML 이론 선형대수, 통계,
프로그래밍
39.
• • •
40.
Hello World 부터 타이핑하고 시작하자
42.
• 타이타닉 생존
예측프로젝트 목표 • 데이터 살펴보기데이터 이해 • 타이타닉 데이터데이터 준비 • ML 알고리즘 선택과 트레이닝 실행모델링 • 테스트 데이터를 사용해서 모델 평가평가 • 캐글에 올리기배포
43.
75% •
44.
• • • • • • Reference: https://www.kaggle.com/c/titanic/data
45.
• • • • • • Reference: https://www.kaggle.com/c/titanic/data
46.
• •
47.
• • • • • •
48.
• • CHEAT SHEET •
50.
ML Workflow라고 생각하자 Workflow안에
두 단계 존재 - 파이프를 변형(모델) - 파이프를 통해 결과 획득
52.
Training Data 맞춤형 파이프 라인
(Model)
53.
Test Data Model Result
54.
동영상 소개 Reference: https://en.wikipedia.org/wiki/Receiver_operating_characteristic
56.
HOUSE PRICE PREDICTION
57.
• •
Editor's Notes
#11
정말 쉽죠^^?
Download