본 강연에서 다룰내용
왜 관리형 데이터베이스가 편리할까요?
AWS 관리형 데이터베이스 종류 및 선택 시 고려 사항은?
AWS 데이터베이스 선택 옵션들
• Amazon RDS—관리형 관계형 데이터베이스
• Amazon DynamoDB—관리형 NoSQL 데이터베이스
• Amazon ElastiCache—관리형 인-메모리 데이터베이스
• Amazon Redshift—관리형 데이터웨어하우스
직접 데이터베이스를 운영한다면?
Power,HVAC, net
Rack and stack
Server maintenance
OS patches
DB s/w patches
Database backups
Scaling
High availability
DB s/w installs
OS installation
you
App optimization
6.
직접 데이터베이스를 운영한다면?
Power,HVAC, net
Rack and stack
Server maintenance
OS patches
DB s/w patches
Database backups
Scaling
High availability
DB s/w installs
OS installation
you
App optimization
7.
직접 Amazon EC2에 데이터베이스를 운영한다면?
Power, HVAC, net
Rack and stack
Server maintenance
OS patches
DB s/w patches
Database backups
Scaling
High availability
DB s/w installs
OS installation
you
App optimization
8.
직접 Amazon EC2에 데이터베이스를 운영한다면?
OS patches
DB s/w patches
Database backups
Scaling
High availability
DB s/w installs
you
App optimization
Power, HVAC, net
Rack and stack
Server maintenance
OS installation
9.
AWS 관리형 데이터베이스를선택한다면?
Power, HVAC, net
Rack and stack
Server maintenance
OS patches
DB s/w patches
Database backups
App optimization
High availability
DB s/w installs
OS installation
you
Scaling
10.
간단히 정리해 보면
•직접 운영—여러분이 직접 하드웨어, 운영체제, 보안, 업데이트,
백업, 복제 등을 관리. 하지만, 모든 것을 직접 컨트롤 가능.
• EC2 에 설치/운영—여러분은 데이터베이스와 관련된 업데이트,
패치, 복제, 백업 등을 관리. 하지만, 하드웨어, 운영체제 등은
AWS에서 관리.
• AWS 관리형 데이터베이스—AWS에서 하드웨어부터 데이터베이스
운영/관리까지 모두 제공. 백업, 복제 등의 기능을 서비스 형태로
제공. 패치, 업데이트 적용 등을 자동으로 제공.
데이터베이스 타입별 AWS관리형 데이터베이스
Amazon
DynamoDB
Document
and Key-
Value Store
Amazon
RDS
SQL
Database
Engines
Amazon
ElastiCache
In-Memory
Key-Value
Store
Amazon
Redshift
Data
Warehouse
목적에 맞는 데이터베이스종류 선택
Data Tier
Search
Amazon
Elasticsearch
Amazon
CloudSearch
Cache
Redis
Memcached
SQL
Amazon Aurora
MySQL
PostgreSQL
Oracle
SQL Server
NoSQL
Cassandra
Amazon DynamoDB
HBase
MongoDB
Applications
Database + Search Tier
15.
Hot Warm Cold
용량MB–GB GB–TB PB
아이템 크기 B–KB KB–MB KB–TB
레이턴시 ms ms, sec min, hrs
내구성 Low–High High Very High
요청 건수 Very High High Low
용량 대비 비용 $$-$ $-¢¢ ¢
Hot Data Warm Data Cold Data
데이터의 저장/접근에 대한 특징 고려
16.
Amazon
ElastiCache
Amazon
DynamoDB
Amazon
Aurora
Amazon
Elasticsearch
Amazon
EMR (HDFS)
Amazon
S3
Amazon
Glacier
평균 응답속도ms ms ms, sec ms,sec sec,min,hrs
ms,sec,mi
n
(~ size)
hrs
용량 GB
GB–TBs
(no limit)
GB–TB
(64 TB
Max)
GB–TB
GB–PB
(~nodes)
MB–PB
(no limit)
GB–PB
(no limit)
아이템 크기 B-KB
KB
(400 KB max)
KB
(64 KB)
KB
(1 MB max)
MB-GB
KB-GB
(5 TB max)
GB
(40 TB max)
요청 건수
High -
Very High
Very High
(no limit)
High High
Low – Very
High
Low –
Very High
(no limit)
Very Low
용량 대비
비용
$$ ¢¢ ¢¢ ¢¢ ¢ ¢ ¢/10
내구성 Low - Moderate Very High Very High High High Very High Very High
Hot Data Warm Data Cold Data
어떤 데이터베이스 서비스를 선택할까요?
17.
NoSQL vs. SQL
•스키마 없음
• 단순한 읽고/쓰기 구조
• 단순한 데이터 모델
• 무한에 가까운 확장성
• 성능, 가용성 집중
• 스키마 사용
• 매우 복잡한 관계성
• 트랜젝션 및 Join 쿼리
• 어려운 확장성
• 데이터 정합성에 집중
NoSQL SQL
RDS 기능 및사양
지원 기능 Aurora MySQL PostgreSQL Oracle SQL Server
VPC ü ü ü ü ü
고가용성 ü ü ü ü ü
인스턴스 변경 ü ü ü ü ü
암호화 ü ü ü ü ü
리프 리플리카 지원 ü ü ü 3rd-party
SolutionsCross region 기능 ü ü ü
최대 저장 용량 64 TB 6 TB 6 TB 6 TB 4 TB
스토리지 확장
Auto
Scaling
ü ü ü
Provisioned IOPS NA 30,000 30,000 30,000 20,000
22.
Amazon Aurora: 고가용성고성능 관계형
데이터베이스
SQL
Trans-
actions
AZ 1 AZ 2 AZ 3
Caching
Amazon
S3
ü 동일 시스템에서 MySQL 보다 5배 이상 빠른 성능
ü Sysbench 벤치마크 결과:
100K writes/sec
500K reads/sec
ü 99.99% 가용성을 제공하도록 아키텍처 디자인
ü 3 가용 영역(AZ)에 6 벌 데이터 복제
ü 최대 64TB지원 및 15 개의 읽기 복제본(Read
Replica) 지원
ü MySQL, PostgreSQL 지원
23.
Amazon RDS 간단하고빠른 성능 확장
데이터베이스 인스턴스
타입을 원하는 타입으로
변경 지원
필요에 따라 데이터베이스
저장 공간 확장 지원
24.
Amazon RDS 다양한저장소 옵션 제공
General Purpose
(SSD)
다양한 용도의 비용
효율적인 스토리지
Provisioned IOPS
(SSD)
최대 30,000 IOPS를
지원하는 OLTP를
위한 고성능 스토리지
Magnetic
요청 수가 적고
작은 워크로드에
적합한 스토리지
리전 내 또는다른 리전으로 읽기 복제 구성
ü 재해 발생 시 빠른 복구
ü 고객에게 보다 빠른 접근 제공
ü 손쉬운 마이그레이션 지원
리전 내 지원
• MySQL
• MariaDB
• PostgreSQL
• Aurora
리전 간 지원
• MySQL
• MariaDB
• PostgreSQL
• Aurora
Note: April-2017 현재 기준
27.
손쉬운 백업 기능지원
자동 백업
(Automated Backup)
• 특정 시점으로 복구 가능
• Amazon RDS의 기본 기능
• 최대 35일까지 보존 기간을 선택
가능
수동 스냅샷
(Manual snapshots)
• 스냅샵으로 새로운 데이터베이스
생성 가능
• 고객이 직접 명령으로 생성
• 시간 제한 없이 보관 가능
• 안전하게 Amazon S3에 보관
28.
월
비용 = +
참조:http://aws.amazon.com/rds/pricing/
사용된 스토리지DB 인스턴스 사용 시간
(스토리지 타입 별 다름)(인스턴스 종류 별 다름)
프리 티어 (첫 12 개월 간)
• 750 시간, micro DB 인스턴스
• 20 GB 스토리지
• 20 GB 백업 공간
• 천만 I/O
GBN ×
사용한만큼만 비용 지불
DynamoDB의 다양한 사용처
광고IoT 게임
모바일
웹
• 광고 서빙
• 타겟팅
• 사용자 ID 조회
• 사용자 정보
관리
• 세션 정보
트래킹
• 실시간 비딩
• 장치 상태
트래킹
디바이스의
• 메타정보 저장
및 조회
• 실시간 메시지
전달, 공지
• 상세 게임 정보
저장
• 리더보드
• 게임 세션 정보
저장 트래킹
• 사용 히스토리
• 로그 저장
• 고객 정보 저장
• 세션 정보 저장
• 개인 설정 정보
저장
• 부가 정보 저장
사용한 만큼만 비용지불
월 비용 = GB +
참조: http://aws.amazon.com/dynamodb/pricing/
저장된
데이터 크기
쓰기
용량
단위
(WCUs)
+
읽기
용량
단위
(RCUs)
프리 티어:
• 25 GB 데이터 스토리지
• 25 쓰기 용량 단위
• 25 읽기 용량 단위
• AWS account 단위
Amazon
Redshift
빠르고 간단하며 비용효율적인 관계형
데이터 웨어하우스
대용량 분산 아키텍처
페타바이트 확장
완전 관리형
고용량 스토리지, 고성능 연산 선택 가능
비용 효율, $1,000/TB/연
47.
전형적인 데이터 웨어하우징
비지니스보고 복잡한 분석 쿼리 및
파이프라인
보안 및 규정
손 쉬운 마이그레이션 – 간단한 UI를 지원한는 AWS Database Migration Service 지원
보안 및 규정 – 종단 간 암호화, SOC 1/2/3, PCI-DSS, HIPAA, FedRAMP 준수
다양한 파트너 솔루션 – 풍부한 BI 및 ETL 솔루션 지원
Petabyte 규모의 다중
Redshift 클러스터 사용.
보안 요건 만족
SQL Server에서 Redshift
전환. 비용 절감, 성능
향상
보안 규약 만족 및 57% 비용
절약
대용량 데이터 입력
및 갱신
48.
로그 분석 시스템/서비스
IoT를포함한
다양한 로그
데이터 분석
클릭 스트림
이벤트 분석
시간 구간/변화에
따른 데이터 분석
낮은 비용 – 매우 낮은 비용으로 대량의 데이터 분석 가능
높은 성능 – Massively Parallel Processing (MPP), 컬럼 기반, 병렬 데이터 로딩, 쿼리 최적화 지원의
아키텍쳐
준실시간 데이터 처리 – 준실시간 처리를 위해 Amazon Kinesis Firehose를 통해 데이터 로딩과 마이크로
배치 업무 지원
상호 데이터 분석 및 추천
엔진. 25~100배 성능 향상
승차 비용을위한 승객 분석 및
제품 개발에 활용
예측 광고와 분석 활용
49.
비지니스 어플리케이션
다양한 사용자/부서
BI어플리케이션 지원
백엔드 서비스 활용 서비스 구조의 분석
솔루션 구축 제공
관려형 서비스 – 프로비져닝, 백업, 업그레이드, 보안기능, 압축 등의 모든 기능이 관리형으로 제공되어 고객은
비지니스에 집중
사용시간 과금 – 초기 비용 없이 사용한만큼 과금 되며, 필요하면 다 수의 클러스터도 바로 생성
타 AWS 서비스와 연동 – 다른 AWS 서비스들과 연동되어 쉽게 파이트 라인을 구성 가능
Infosys Information
Platform (IIP) 를 AWS에
구성
분석 서비스
제공
제품 및 고객 분석
시스템
50.
Amazon Redshift 아키텍처
리더노드
• SQL 엔드포인트
• 메타 정보 저장
• 쿼리 최적화
• 쿼리 스케쥴링 최적화
컴퓨트 노드
• 실제 컬럼별 데이터 저장
• 병렬/분산 쿼리 수행 처리, 데이터 로드,
백업, 복구 수행
최대 2 PB (compressed) 지원
• DC1: SSD, 확장160 GB–326 TB
• DS2: HDD, 확장 2 TB–2 PB
10 GigE
데이터 추출
백업
복구
JDBC/ODBC
51.
Amazon Redshift 빠른이유
최적의 I/O 수행
컬럼 방식 저장
데이터 압축
범위별 저장(Zone maps)
노드별 Direct 스토리지
큰 블럭 사이즈 사용
10 | 13 | 14 | 26 |…
… | 100 | 245 | 324
375 | 393 | 417…
… 512 | 549 | 623
637 | 712 | 809 …
… | 834 | 921 | 959
10
324
375
623
637
959
ID Age State Amount
123 20 CA 500
345 25 WA 250
678 40 FL 125
957 37 WA 375
52.
완전 관리형 서비스,증분 백업 지원
지속적/증분 백업
노드 간 카피 본 지원
지속적 증분 백업을 안전한 S3(Amazon
Simple Storage Service) 에 저장
지속적 증분 백업을 다른 리젼으로
복제 지원
Streaming 복구 지원으로 빠른 사용
가능
Amazon S3
Amazon S3
Region 1
Region 2
53.
완전 관리형 서비스;높은 가용성
Amazon S3
Amazon S3
Region 1
Region 2
내결함을 위한 관리 지원
디스크 결함
노드 결함
네트워크 결함
Availability Zone/Region 수준의 이벤트
발생 대비
54.
사용한 만큼만 지불
참조:https://aws.amazon.com/redshift/pricing/
월 비용 = N ×
노드가 사용된 시간노드 수
프리 티어:
• 2개월간 무료 사용
• 750 시간 DC1.large 사용
• 백업 공간 무료
55.
Amazon.com – 웹로그분석
Amazon.com의 웹로그 분석
1PB+ 워크로드, 일간 2TB 축적, 매년 67%
증가
가장 큰 테이블: 400 TB
고객 행동 파악 분석 필요 요건
현재 솔루션
기존 DW—시간 당 일주일 치 분석
Hadoop—시간 당 한 달 치 분석
56.
15개월 치 1PB처리 쿼리에 약 14분 소요 !
500억 Row 데이터 로딩에 약 10분 소요!
210억 Row 데이터와 100억 Row 데이터 Join 쿼리의 경우 기존
Hive에서 3일 à 2 시간 !
파이프라인 로드에 기존 90 시간 (Oracle) to 8 시간 !
64 개 클러스터
800 노드
13PB 스토리지
2 데이터 베이스 관리자
Amazon
Redshift로
빠르고 쉽게~
본 강연이 끝난후…
• 프리 티어: https://aws.amazon.com/ko/free/
• AWS 시작하기: https://aws.amazon.com/ko/getting-started/
• AWS 자습서
• AWS 첫 번째 프로젝트 구축 및 시작하기
• 동영상 및 웹 세미나
• AWS 교육 자격증
• 자습형 실습: https://amazon.qwiklabs.com/catalog?locale=ko
https://www.awssummit.kr
AWS Summit 모바일앱을 통해 지금 세션 평가에
참여하시면, 행사 후 기념품을 드립니다.
#AWSSummitKR 해시태그로 소셜 미디어에
여러분의 행사 소감을 올려주세요.
발표 자료 및 녹화 동영상은 AWS Korea 공식 소셜
채널로 곧 공유될 예정입니다.
여러분의 피드백을 기다립니다!