More Related Content
PDF
Amazon SageMaker 모델 학습 방법 소개::최영준, 솔루션즈 아키텍트 AI/ML 엑스퍼트, AWS::AWS AIML 스페셜 웨비나 PDF
AWS Summit Seoul 2023 | 롯데면세점이 고객에게 차별화된 경험을 제공하는 방법: AWS Native 서비스를 활용한 초개인... PDF
클라우드 세상에서 살아남기: 금융편 - 이한주 대표이사/공동창업자, 베스핀 글로벌 / 김민성 팀장, KB국민카드 :: AWS Summit ... PDF
AWS Summit Seoul 2023 |투자를 모두에게, 토스증권의 MTS 구축 사례 PDF
금융 분야 마이데이터 (My Data) 산업 도입 방안 및 AWS 활용법 – 고종원 AWS 어카운트 매니저, 양찬욱 KB국민카드 팀장:: ... PDF
AWS 관리형 서비스를 활용하여 Kubernetes 를 위한 Devops 환경 구축하기 - 김광영, AWS솔루션즈 아키텍트:: AWS S... PDF
AWS Summit Seoul 2023 | 다중 계정 및 하이브리드 환경에서 안전한 IAM 체계 만들기 PDF
AWS 클라우드 비용 최적화를 위한 TIP - 임성은 AWS 매니저 What's hot
PDF
AWS Summit Seoul 2023 | 금융 디지털 서비스 혁신을 리딩하는 교보정보통신의 클라우드 마이그레이션 사례 소개 PDF
딥러닝 서비스에 쓰이는 GPU 인스턴스 비용 효율을 위한 스팟(Spot) 활용기 - 손은주, 매스프레소 :: AWS DevDay 2018 PDF
[금융사를 위한 AWS Generative AI Day 2023] 3_AWS Generative AI 기술특징과 접근... PDF
금융권 최신 AWS 도입 사례 총정리 – 신한 제주 은행, KB손해보험 사례를 중심으로 - 지성국 사업 개발 담당 이사, AWS / 정을용... PDF
LG전자 - Amazon Aurora 및 RDS 블루/그린 배포를 이용한 데이터베이스 업그레이드 안정성 확보 - 발표자: 이은경 책임, L... PDF
AWS Summit Seoul 2023 | KB의 통합 음성 AI서비스의 현재와 미래 - 하이브리드 클라우드 기반의 똑똑한 AI상담원 콜봇 PDF
AWS Summit Seoul 2023 | 스타트업의 빠른 성장, 안정적인 서비스 운영 노하우는? PDF
AWS Summit Seoul 2023 | 성공적인 AWS RDS 마이그레이션을 위한 여정과 필수 고려사항 PDF
Amazon SageMaker 모델 빌딩 파이프라인 소개::이유동, AI/ML 스페셜리스트 솔루션즈 아키텍트, AWS::AWS AIML 스... PDF
AWS Summit Seoul 2023 | 진짜로 코드 없이 기계학습 모델을 만드는 것이 가능하다구요? SageMaker로 No/Low 코... PDF
AWS Elastic Beanstalk 활용하여 수 분만에 코드 배포하기 (최원근, AWS 솔루션즈 아키텍트) :: AWS DevDay2018 PDF
KB국민은행은 시작했다 - 쉽고 빠른 클라우드 거버넌스 적용 전략 - 강병억 AWS 솔루션즈 아키텍트 / 장강홍 클라우드플랫폼단 차장, ... PDF
진정한 하이브리드 환경을 위한 올바른 선택, AWS Outposts! - 강동환 AWS 솔루션즈 아키텍트 :: AWS Summit Seou... PDF
금융권을 위한 AWS Direct Connect 기반 하이브리드 구성 방법 - AWS Summit Seoul 2017 PPTX
AWS 의 비용 절감 프레임워크와 신규 프로그램을 활용한 전략적 비용절감 :: AWS Travel and Transportation 온라인... PDF
AWS Fargate와 Amazon ECS를 사용한 CI/CD 베스트 프랙티스 - 유재석, AWS 솔루션즈 아키텍트 :: AWS Build... PDF
Amazon Personalize Event Tracker 실시간 고객 반응을 고려한 추천::김태수, 솔루션즈 아키텍트, AWS::AWS ... PDF
[AWS Dev Day] 실습워크샵 | Amazon EKS 핸즈온 워크샵 PDF
20190312 AWS Black Belt Online Seminar AWS Well-Architected Frameworkによるコスト最適化 PDF
Amazon Sagemaker Studio를 통한 ML개발하기 - 소성운(크로키닷컴) :: AWS Community D... Similar to 머신러닝 도우미, Amazon SageMaker 따라하기: SageMaker 국내 적용 사례
PDF
Amazon SageMaker 오버뷰 - 강성문, AWS AI/ML 스페셜리스트 :: AIML 특집 웨비나 PDF
AWS기반 서버리스 데이터레이크 구축하기 - 김진웅 (SK C&C) :: AWS Community Day 2020 PDF
데이터 과학자를 위한 신규 인공지능 서비스 - 김대근, 이유동, AWS AI/ML 스페셜리스트 솔루션즈 아키텍트 / 소성운, 카카오스타일 ... PDF
있는 그대로 저장하고, 바로 분석 가능한, 새로운 관점의 데이터 애널리틱 플랫폼 - 정세웅 애널리틱 스페셜리스트, AWS PDF
[금융고객을 위한 AWS re:Invent 2022 re:Cap] 3.AWS reInvent 2022 Technical Highlights... PDF
스마트 팩토리에 인공지능과 기계학습은 필수! - 남궁영환 AWS 데이터 사이언티스트 / 김진일 차장, 한화토탈 :: AWS Summit S... PDF
핵심 미래 분석 기술! 시계열 분석을 활용한 수요예측과 재고관리 최적화 사례 – 김형일 AWS 솔루션즈 아키텍트, 이환기 신세계아이앤씨 A... PDF
스마트 팩토리: AWS 사물인터넷과 인공지능을 활용한 스마트 팩토리 구축 – 최영준 AWS 솔루션즈 아키텍트, 정현아 AWS 솔루션즈 아키... PDF
Amazon SageMaker를 이용한 예측 분석-남궁영환 솔루션즈 아키텍트, AWS PDF
Amazon EMR 고급 활용 기법 - AWS Summit Seoul 2017 PDF
2017 Ad-Tech on AWS 세미나ㅣ국내외 애드테크 고객 사례 및 Machine Learning 소개 PDF
AWS기반 서버리스 데이터레이크 구축하기 - 김진웅 (SK C&C) :: AWS Community Day 2020 PDF
AWS Builders 3: 인공지능을 활용하여 설비 및 생산 라인에서의 이상 감지 고도화하기 PDF
SageMaker를 활용한 엔터프라이즈 머신러닝 도입 및 프로세스 개선 방법 (김필호 AI/ML 스페셜리스트 솔루션즈 아키텍트, AWS) ... PDF
AWS 기계 학습 솔루션을 활용한 온라인 사기·부정거래 감지 – 서지혜 AWS 스타트업 AIML 스페셜리스트:: AWS Cloud Week... PDF
인공지능 / 기계학습 기반의 디지털 트랜스포메이션 및 글로벌 사례 - 김선수 사업개발 담당, AWS / 정진환 팀장, SK텔레콤 / 구태훈... PDF
[AWS Innovate 온라인 컨퍼런스] Amazon SageMaker 신규 기능을 활용한 다양한 ML 모델 실험해 보기 - 서지혜, A... PDF
AWS CLOUD 2018- AWS의 새로운 통합 머신러닝 플랫폼 서비스, Amazon SageMaker (김무현 솔루션즈 아키텍트) PDF
AI/ML re:invent 2019 recap at Delivery Hero Korea PDF
AWS re:Invent 2020 Awesome AI/ML Services More from BESPIN GLOBAL
PDF
AWS 상의 컨테이너 서비스 소개 ECS, EKS - 이종립 / Principle Enterprise Evangelist @베스핀글로벌 PDF
[AWSxBespin Startup Webinar] AWS, 스타트업의 비즈니스에 날개를 달다. PPTX
OpsNow를 활용한 AWS Cloud 비용 최적화 전략 PDF
[웨비나] 다중 AWS 계정에서의 CI/CD 구축 PDF
국내 건설 기계사 도입 사례를 통해 보는 AI가 적용된 수요 예측 관리 - 베스핀글로벌 조창윤 AI/ML팀 팀장 PDF
Session 2. 클라우드 운영 효율화 방안 및 글로벌 진출 사례 - 베스핀글로벌 이주원 상무 PDF
Session 1. 디지털 트렌스포메이션의 핵심, 클라우드 마이그레이션 A to Z - 베스핀글로벌 이근우 위원 PDF
Session 3. 제조업의 미래를 바꾸는 Microsoft Azure AI/ML/IoT 플랫폼 - 베스핀글로벌 박플로 차장 PDF
게임을 위한 최적의 AWS DB 서비스 소개 Dynamo DB, Aurora - 이종립 / Principle Enterprise Evang... PDF
[VDI on Azure] DaaS 구축과 운영, 신화와 현실 PDF
Aws guard duty security monitoring service PDF
PDF
PDF
Azure ML과 PowerBI로 분석 예측하는 COVID-19 PPTX
빅데이터 분석 플랫폼 구축 사례 - 전처리 속도 해결을 위한 PoC PDF
Session 4. 쉽게 보는 딥러닝 트랜드와 AWS 활용 시나리오 - 베스핀글로벌 이승규 매니저 PDF
PDF
AWS에서 클라우드 시작하기 - 클라우드 마이그레이션 AtoZ PDF
“전략적 접근이 필요하다” 멀티 클라우드 환경의 자원 및 비용 관리 방안 PDF
Session 2. 스마트한 클라우드 관리 방법 - 베스핀글로벌 박대식 매니저 머신러닝 도우미, Amazon SageMaker 따라하기: SageMaker 국내 적용 사례
- 1.
Machine Learning Platform(AWS SageMaker) 사례
Bespin Global, Machine Learning Team 조창윤 팀장
2020.07.03
📺발표 영상 다시보기 https://youtu.be/UlJdYQrtv8w
- 2.
Copyright © 2020BESPIN GLOBAL Co., Ltd. All rights reserved | Confidential
🌏http://www.bespinglobal.com | 📞1668-1280 | ✉info_aws@bespinglobal.com
2
SageMaker Overview
• 필요한 만큼 만 Sizing
• 언제든지 즉시, Deploy
• 사용한 만큼 지불
• Managed, Server-less
• 유연한 Re-Architecture
Public Cloud 특징
• 대용량 Data-Set 처리
• Built-in Algorithm 제공
• Hyperparameter Tuning 제공
• Serving시 Auto-Scaling제공
• 다양한 AWS Service 와 쉽게 연계
Machine Learning on AWS 특징
Build1
Training2
Serving3 Iteration
Notebooks
Experiments
AutoPilot
Debugger
Processing
Model Monitor
Machine Learning
Platform
New
- 3.
Copyright © 2020BESPIN GLOBAL Co., Ltd. All rights reserved | Confidential
🌏http://www.bespinglobal.com | 📞1668-1280 | ✉info_aws@bespinglobal.com
3
SageMaker Infrastructure
Data Lake Raw
데이터
Training
데이터
Validation
데이터
Test
데이터
Model Artifacts
1 Build 2 Training 3 Serving
Notebook Instance
Real-time Endpoints
Batch transformTraining jobs Hyperparameter tuning
Endpoint
Training
Image
Inference
Image
Processing, Build & Training
Training Code
Image
Notebook, Processing, Experiments, Debugger
Data-Set
Code
Real-time Endpoint & Batch Serving
Processing, Autopilot, Model Monitor
Inference Code
Image
Model
Artifacts
SageMaker
Studio
▪ AWS SageMaker (EC2, CPU/GPU, S3, ECS/ECR)
- 4.
Copyright © 2020BESPIN GLOBAL Co., Ltd. All rights reserved | Confidential
🌏http://www.bespinglobal.com | 📞1668-1280 | ✉info_aws@bespinglobal.com
4
사례: H사 (Demand Forecasting)
내부 데이터 소스
Database
외부 데이터 소스
다수의 내부/외부 데이터
환율, 유가
데이터
Batch, Trigger 실행
데이터 저장
Training 데이터
ML 결과 데이터
3
Machine Learning Platform (PaaS)
SageMaker (Jupyter Notebook)
Training
데이터 시각화
8
Self BI
7
9
5
Model Artifacts
Development4
Oracle PostgreSQL
데이터 파이프라인
2
Deploy/Prediction6
IoT 데이터 소스
장비 가동 및 운영 정보
1 Data
원본 데이터
예측 데이터
Data Visualization & Analysis
9
예측 결과
확인
Feature Engineering Model Training &
Parameter Tuning
Model Evaluation
AWS (Seoul)
- 5.
Copyright © 2020BESPIN GLOBAL Co., Ltd. All rights reserved | Confidential
🌏http://www.bespinglobal.com | 📞1668-1280 | ✉info_aws@bespinglobal.com
5
사례: H사 (Demand Forecasting)
▪ 언제나 고민 : Model 개수를 몇 개로 할것인가 (Data Point 개수만큼, 아님 단 하나)
▪ 데이터가 부족 : 6년을 모았다. But 주당 1건씩, 총 300 여건이다.
▪ 데이터에 대한 신뢰성 : 믿자, 믿지 않으면 그 무엇을 믿으리요.
▪ 주요 요인이 되는 데이터 : 누구보다 고민을 많이한 현업의 Domain Knowledge 가 최고!
▪ 현업과 같이 Project 을 진행 : 언제나 즐겁고 결과가 나쁘지 않다.
▪ ETL (Glue) 엔지니어에게 : 끝날때까지 미안하다, 요구사항을 끝없이 변경한다.
▪ To SageMaker
✓ 나는 퇴근하지만 Linear Learner 와 DeepAR 의 HPO 을 진행해줘서 고맙다.
✓ New Feature 인 Experiments 기능이 없어서 많이 아쉬웠다.
✓ 하나 진행하는동안 다른 하나로 다양한 Trial 을 할 수 있었다.
- 6.
Copyright © 2020BESPIN GLOBAL Co., Ltd. All rights reserved | Confidential
🌏http://www.bespinglobal.com | 📞1668-1280 | ✉info_aws@bespinglobal.com
6
사례: S사 (Demand Forecasting)
1차 데이터 가공
& Upload Data
Training
Forecasting
[Data Lake]
데이터 Ingestion
(API)
현업
시각화
SDK 을 이용한
Forecast API 호출
Preprocessing
& Training/Prediction
SCM
Amazon
Forecast Service
(SaaS)
AWS (Oregon)
A1
B1
B2
Prediction Data
결과 반영
A2
Prediction Data
결과 반영
1
Integrate API
현업
Access
Firewall Open
Elastic IP
Development / Production
Weekly Upload
CPU, GPU
P3(V100)
P2(K80)
DN(T4)
- 7.
Copyright © 2020BESPIN GLOBAL Co., Ltd. All rights reserved | Confidential
🌏http://www.bespinglobal.com | 📞1668-1280 | ✉info_aws@bespinglobal.com
7
사례: S사 (Demand Forecasting)
▪ 고객 요건
- Network 보안 제약 존재 (SSH 사용 불가), 단 HTTP/HTTPS 및 RDP 사용 가능
- 1개의 Model 로 운영중인 Python 코드 존재
- 제품 Segmentation 화 & 다양한 Model 개발 필요
- 비용 효율적으로 GPU 사용을 통한 빠른 Training 및 Prediction 수행 필요
- 여러명의 Data Scientist 분들이 끊임없는 Trial 을 수행할 수 있는 환경 필요
▪ 구현 방법
- 다양한 방법으로 Feature Engineering 진행 (on SageMaker)
- 2주 간격으로 다양한 모델 개발 및 Accuracy 측정 (on SageMaker)
- 개발된 모델은 EC2 (Deep Learning AMI) 에서 수행 (Gateway 형식의 Windows 서버, SageMaker Terminal 사용)
- 쉽게 GPU 을 탑재한 EC2 사용 (현재 Docker 을 이용한 분산 처리 시도중)
- Batch 형식으로 자동화
▪ On-Premise 에서 AWS SDK Python (Boto3) 을 사용하여 S3 에 Data-Set 을 Upload 함
▪ On-Premise 에서 S3 에 저장된 Prediction 결과를 Download 함
- 8.
Copyright © 2020BESPIN GLOBAL Co., Ltd. All rights reserved | Confidential
🌏http://www.bespinglobal.com | 📞1668-1280 | ✉info_aws@bespinglobal.com
8
사례: D사 (Anomaly Detection & Failure Cause Analysis)
S3 (Data Lake)
AWS (Seoul)
SageMaker
Raw Data Staging Data
Glue
Athena
AWS (Virginia)
S3
Glue
Training Data
ECS NotebookTraining/Serving
American corporation Korea corporation
Plant (25개)
(On-Premise)
Loading Transfer
[Data Lake]
- Raw Data
: Parquet
- Staging Data
: Parquet, Partitioned
IoT 데이터 소스
Plant Sensor, Status 정보
[Plant 당 데이터]
- Parquet 기준
- 크기 : 약 700MB/1달
- 간격 : 1~2 rows / sec
- Column 개수 : 625 개
Kinesis
Raw Data
현업
- 9.
Copyright © 2020BESPIN GLOBAL Co., Ltd. All rights reserved | Confidential
🌏http://www.bespinglobal.com | 📞1668-1280 | ✉info_aws@bespinglobal.com
9
사례: D사 (Anomaly Detection & Failure Cause Analysis)
▪ 데이터
- 데이터를 알고 있는 현업의 불참
▪ 장애 시점에 대한 명확한 부재 (연속 장애 상황에서), 장애 원인에 대한 신뢰성 없음
▪ Plant 별로 Feature 개수 다름, Feature 값의 시작 시점 다름, 정상 상태에서 Feature 값의 차이 존재 등
▪ Plant 장비에 대한 이해 부족 : 계절에 따른 온도 추이, 장애 원인에 따른 정상/비정상 Sensor 분류 등
- 데이터의 량은 많으나 데이터의 기간이 1년 이하의 데이터임 : Seasonality, Trend 파악 어려움
- DataLake (AWS S3) 에 Parquet 형식으로 저장되어 데이터 처리에 용이
▪ Work with SageMaker
- 대용량 데이터 분석을 진행
- 쉬운 Instance Type 변경 (컴퓨팅 최적화, 메모리 최적화 유형 등)
- 다양한 Built-in Algorithm 제공 : K-means, PCA (Principal Component Analysis), RCF (Random Cut Forest)
- DataLake (AWS S3) 및 AWS Athena 와의 쉬운 연계
- 10.
HELPING YOUR AI& ML JOURNEY ON CLOUD.
📺발표 영상 다시보기 https://youtu.be/UlJdYQrtv8w
[문의] 📞1668-1280 ✉info_aws@bespinglobal.com