Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Introduction to Software (Big data, Intelligence and Cloud)

539 views

Published on

KAIST UMLS 연구실 홈커밍데이 발표자료

Published in: Software
  • Login to see the comments

Introduction to Software (Big data, Intelligence and Cloud)

  1. 1. your name Software Is Eating The World 2015.11.7 김우찬 g.wckim@gmail.com
  2. 2. your name My Interests • Bioinformatics • Big Data Platform • Data Mining
  3. 3. your name
  4. 4. your name
  5. 5. your name 왜 소프트웨어인가? • 모든 제품과 산업에서 사용됨
  6. 6. your name 돈 되는 SW : Uber Uber 현대기아차 사업모델 차량 합승 서비스 자동차 제조/판매 자동차 판매량 0대 800만대 기업가치 50조원 60조원
  7. 7. your name 돈 되는 SW : Airbnb Airbnb IHG 사업모델 숙박 대여 서비스 호텔업 (업계1위) 숙박 건물 개수 0개 4,600+ (호텔수) 기업가치 25조원 10조원
  8. 8. your name 돈 되는 SW : Facebook Facebook 삼성전자 사업모델 인터넷 서비스 전자제품 제조/판매 대표제품/ 서비스 Facebook Instagram Messenger 스마트폰 메모리 가전제품 기업가치 300조원 200조원
  9. 9. your name 3가지 주제 Big Data Intelligence Cloud
  10. 10. your name Big Data
  11. 11. your name 빅데이터의 시작
  12. 12. your name Hadoop 출현 배경 • 2003년 Google 논문 – Google File System • 2004년 Google 논문 – MapReduce • 2005년 Hadoop 개발 (더그커팅) –Apache 오픈소스
  13. 13. your name Hadoop은 왜 나타났나? • Data가 너무 많아지고 있음 • 많은 Data로 무언가 해야 할 듯
  14. 14. your name Hadoop은 무엇인가? • HDFS + MapReduce
  15. 15. your name Hadoop의 장점 • Scale-Up 보다는 Scale-Out • 장애에 강함 • 쉬운 인터페이스
  16. 16. your name Hadoop Ecosystem SQL 그래프 ML 클러스터 관리
  17. 17. your name Hot Trend
  18. 18. your name Spark 장점 1 • 모든 게 다 있음
  19. 19. your name Spark 장점 2 • 매우 빠름 (메모리 기반 연산)
  20. 20. your name Spark 장점 3 • 코드 라인이 짧음
  21. 21. your name Intelligence
  22. 22. your name Machine Learning
  23. 23. your name ML로 무엇을 할 수 있나? • 사용자 행동 분석 • 추천 (컨텐츠, 광고, …) • 인식 (음성, 이미지, 영상)
  24. 24. your name 예측(추천)의 힘 • Netflix –시청하는 영화의 2/3가 추천으로 발생 • Google –38% 이상의 뉴스 조회가 추천으로 발생 • Amazon –판매액의 35%가 추천으로 발생
  25. 25. your name Deep Learning
  26. 26. your name 숫자 인식 (MNIST)
  27. 27. your name 이미지 인식 (ImageNet) • Large Scale Visual Recognition Challenge (ILSVRC)
  28. 28. your name Cloud
  29. 29. your name Public vs. Private
  30. 30. your name Cloud에 필요한 것들 • Server 자원 관리
  31. 31. your name Cloud에 필요한 것들 • Cluster 자원 관리
  32. 32. your name Public Cloud 강자 • AWS (Amazon Web Service)
  33. 33. your name 결론 • Big Data –Hadoop에서 시작해서 지금은 Spark가 대세임 • Intelligence –향후에 (특히 연구자 입장에서) 가장 할만한 분야임 (특히 DL) • Cloud –그냥 AWS 쓰는 게 좋음 (분석가 입장)

×