© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
S E O U L | M A Y 4 , 2 0 2 3
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
AWS에서 최소한의 비용으로
구현하는 멀티리전 재해복구
안준환
솔루션즈 아키텍트
AWS
솔루션즈 아키텍트
AWS
Yongzhe Ren
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
AWS에서의 재해복구
AWS Backup을 이용한 멀티리전 재해복구
AWS Elastic Disaster Recovery를 이용한 온프레미스 재해복구
Agenda
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
AWS에서의 재해복구
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
재해복구 - Disaster recovery
자연재해 기술적 이슈 휴먼 액션
• 비즈니스 지속성
• 희귀하지만 대규모 장애상황
- 자연재해
- 기술적 이슈
- 휴먼 액션
• 개별 장애에 대한 목표 측정
- 복구 시간(Recovery Time)
- 복구 시점(Recovery Point)
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
복구시점 및 복구시간 목표
재해 발생시 수용 가능한 데이터
손실이 어느정도 입니까?
재해 발생
복구 시점 목표
(Recovery Point Objective / RPO)
복구 시간 목표
(Recovery Time Objective / RTO)
데이터 손실
발생 구간
서비스 다운
발생 구간
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Backup & restore Pilot light Multi-site
active/active
Warm standby
RPO/RTO:
수시간
RPO/RTO:
수분/수십분
RPO/RTO:
수분
RPO/RTO:
실시간
• 낮은 우선순위 유즈케이스
• 이벤트 발생 후에 전체
리소스 생성
• 이벤트 발생 후에 백업 복구
• 비용: $
• 라이브 데이터
• 서비스는 유휴 상태 유지
• 이벤트 발생 후에 일부
리소스 생성 및 확장
• 비용: $$
• 소규모로 상시 구동
• 비즈니스 크리티컬
• 이벤트 발생 후에
리소스 확장
• 비용: $$$
• 무중단
• 0에 가까운 데이터 손실
• 미션 크리티컬 서비스
• 비용: $$$$
클라우드에서의 재해 복구 전략
Active/Passive
AWS Backup AWS Elastic Disaster Recovery
Active/Active
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Backup & Restore
Multi-Site Active/Active
Pilot Light
Warm Standby
Backup & Restore
Pilot Light
Warm Standby
Multi-Site Active/Active
비용
복구시간 목표 - RTO
서비스 중단 기간
수용 가능 비용
복구
목표
시간
재해에 의한 비즈니스 영향
재해복구 준비비용
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Multi-Site Active/Active
Warm Standby
Pilot Light Backup & Restore
Multi-Site Active/Active
Warm Standby
Pilot Light Backup & Restore
비용
복구시점 목표 - RPO
재해에 의한 데이터 손실
복구
목표
시점
수용 가능 비용
재해복구 준비비용
재해에 의한 비즈니스 영향
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
AWS Backup을 이용한
멀티리전 재해복구
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Backup & restore Pilot light Multi-site
active/active
Warm standby
RPO/RTO:
수시간
RPO/RTO:
수분/수십분
RPO/RTO:
수분
RPO/RTO:
실시간
• 낮은 우선순위 유즈케이스
• 이벤트 발생 후에 전체
리소스 생성
• 이벤트 발생 후에 백업 복구
• 비용: $
• 라이브 데이터
• 서비스는 유휴 상태 유지
• 이벤트 발생 후에 일부
리소스 생성 및 확장
• 비용: $$
• 소규모로 상시 구동
• 비즈니스 크리티컬
• 이벤트 발생 후에
리소스 확장
• 비용: $$$
• 무중단
• 0에 가까운 데이터 손실
• 미션 크리티컬 서비스
• 비용: $$$$
클라우드에서의 재해 복구 전략
Active/Passive
AWS Backup
Active/Active
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
재해복구를 위한 백업 대상
o EBS volumes
o RDS volumes
o Files on EFS
o S3 objects
…
o VPC configure
o RDS configure
o ElastiCache configure
o ALB configure
o EC2 configure
…
1. 데이터 백업
2. 메타데이터 백업
백업
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
메타데이터 – 인프라 구성 정보
온프레미스 AWS 클라우드
CMDB
• AWS CloudFormation
• Terraform
• AWS Cloud Development Kit
CMDB
AWS
API
IaC
(Infrastr
ucture as
a Code)
CMDB: 구성 관리 데이터베이스, Configuration Management Database
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Backup & Restore 기반 재해복구 자동화
Backup
Vault
Data Backup
Metadata Backup
Restore
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
AWS Backup 개요
AWS Backup 완전관리형 정책 기반 백업 서비스로, 여러 AWS 서비스들에
걸쳐 자동화된 중앙 집중식 관리를 지원하는 백업 서비스
Amazon EBS
블록
스토리지
Amazon FSx for
Windows File Server
Amazon EFS
Amazon FSx
for Lustre
파일
스토리지
데이터베이스
Amazon
Aurora
Amazon RDS
Amazon
Neptune
Amazon
DocumentDB
Amazon
DynamoDB
오브젝트
스토리지
Amazon S3 VMware Cloud
on AWS
Amazon EC2
컴퓨트
AWS Storage
Gateway
데이터
전송
AWS Storage
Gateway
+
Amazon FSx for
NetApp ONTAP
Amazon FSx
for OpenZFS
Amazon
Redshift
Amazon
Timestream
관리
AWS
CloudFormation
애플리케이션
SAP Hana
on EC2 (preview)
Windows
Volume
Shadow Copy
Service
on EC2
On-
premises
AWS
Outpost
하이브리드
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
재해복구 자동화 구현 예
IaC 기반의
AWS 리소스 관리
AWS Backup을 이용한
데이터(instances) 및
메타데이터(infrastructure)의
정기적인 백업
재해 발생시
백업으로부터
재해 복구 수행
원본
애플리케이션
복구
애플리케이션
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
IaC 관리 및 백업 (1/5)
• 형상관리 기반 IaC 코드 관리
- AWS CodeCommit – 관리형 git 서비스
• IaC 코드 백업 자동화
- 사용자의 git push 이벤트에 따라 코드
저장소(AWS CodeCommit)의 IaC 코드를
S3 버킷에 복제
- IaC 코드가 복제된 S3 버킷을 AWS
Backup을 이용해 리전 간 복제 자동화
※ AWS CloudFormation은 AWS Backup을 통한 백업 가능
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
IaC 코드 의존성 분리 (2/5)
• 의존성 분리
- 재해 복구용으로 IaC 코드 이용 위해 코드 내
원본 리전에 대한 의존성 분리
• 정적 의존성 분리
- 복구 리전의 정적 정보가 포함된 IaC 코드는
사전에 작성
- 리전 정보, 가용영역 정보 등
• 동적 의존성 분리
- 복구 리전의 동적 정보가 포함된 IaC 코드는
복구 시점에 작성 – 자동화 검토
- EC2 인스턴스 복구용 AMI 정보, RDS 복구용
DB Snapshot 정보 등
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
관리형 리소스에 대한 간접 접근 (3/5)
• 관리형 서비스의 엔드포인트 형태
- 많은 관리형 서비스들의 엔드포인트(DNS name)에는
리전이름과 고유ID가 포함됨
예) app-123456789.ap-northeast-2.elb.amazonaws.com,
db.123456789.ap-northeast-2.rds.amazonaws.com
• 복구중 리소스 생성시 엔드포인트 변경됨
- 애플리케이션 코드나 설정 등, 애플리케이션 배포 번들에
엔드포인트 정보가 포함된 경우, 복구과정 중 수정 필요
- 엔드포인트에 간접적으로 접근하도록 구성 후, 복구 과정
중 생성한 리소스에 대한 엔드포인트 업데이트 자동화
- Amazon Route53 Private Hosted Zone 또는 AWS
Systems Manager Parameter Store 등 활용 가능
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
재해 복구 태스크의 실행 독립성 확보 (4/5)
• 복구 작업의 독립성
- 복구 프로세스는 복구 리전의
리소스만을 이용하여 구동 해야함
- AWS CodePipeline, AWS CodeBuild
등의 CI/CD 도구는 좋은 선택
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
재해복구 시스템의 지속적인 검증 및 보완 (5/5)
- 재해복구는 원타임 구축 대상이 아님
- 유사시 원활한 재해복구를 위해서 지속적인 검증과 보완이 필수
검증
보완
구축
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
AWS Elastic Disaster Recovery를
이용한 재해복구
(온프레미스에서 AWS로 재해복구)
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
클라우드 재해 복구 장점
온프레미스 재해 복구 클라우드 재해 복구
• 테스트 또는 복구에 필요한 경우에만
사용, 사용된 서비스에 대해서만 지불
• IT 관리 오버헤드 감소
• (훨씬!) 더 많은 자동화
• 운영 환경을 종료하지 않고 쉽고 반복
가능한 테스트
• 몇 분 만에 시스템 가동
• 막대한 선결제 및 지속적인 하드웨어 비용
• 데이터 증가로 하드웨어 및 운영 비용이
증가
• 비즈니스 중단 없이는 테스트하기가 어려울
수 있음
• 전 세계적으로 분산된 비즈니스를 위한 관리
및 인프라 오버헤드
필요할 때만 사용할 수 있는 퍼블릭 클라우드의 장점은 백업, 재해 복구에 적합
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
클라우드 재해 복구의 비즈니스 효과
견고한 운영 체계
최상위 복구 목표를 기반으로 안정적인 안정성과 가용성 달성
운영 효율성
중복 인프라 및 라이선스 의 필요성을 줄임으로써 비용 절감을 확보
비즈니스 연속성에 대한 확신
운영 환경에 영향이 없는 쉬운 재해 복구 테스트를 수행하여 가동 중지
시간 및 데이터 손실을 최소화
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Backup & restore Pilot light Multi-site
active/active
Warm standby
RPO/RTO:
수시간
RPO/RTO:
수분/수십분
RPO/RTO:
수분
RPO/RTO:
실시간
• 낮은 우선순위 유즈케이스
• 이벤트 발생 후에 전체
리소스 생성
• 이벤트 발생 후에 백업 복구
• 비용: $
• 라이브 데이터
• 서비스는 유휴 상태 유지
• 이벤트 발생 후에 일부
리소스 생성 및 확장
• 비용: $$
• 소규모로 상시 구동
• 비즈니스 크리티컬
• 이벤트 발생 후에
리소스 확장
• 비용: $$$
• 무중단
• 0에 가까운 데이터 손실
• 미션 크리티컬 서비스
• 비용: $$$$
클라우드에서의 재해 복구 전략
Active/Passive Active/Active
AWS Elastic Disaster Recovery
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
AWS Elastic Disaster Recovery 소개
다양한 고객의 요건에 맞는 안정적이고, 확장 가능하며, 안전한 스토리지 서비스 포트폴리오 제공
자동화
최소한의 기술
요구사항
운영에 영향을 주지
않는 DR 테스트
신뢰성
견고하고 예측 가능한
연속 복제 기능
랜섬웨어, 충돌 및 인적
오류에 대한 보호
RPO: Seconds
RTO: Minutes
유연성
모슨 소스에서 복제
다양한 OS, 응용 프로그램
및 데이터베이스 지원
테스트,복구, Fail Back의
통합 프로세스 지원
유휴 복구 사이트 리소스를
제거하고 필요한 만큼만 지불
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
AWS Elastic Disaster Recovery 사용 패턴
온프레미스에서 AWS
AWS 리전에서 AWS 다른 리전
다른 클라우드에서 AWS
AWS 가용 영역에서
AWS 다른 가용 영역
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
AWS Elastic Disaster Recovery 작동방식
단일 프로세스상의 재해 복제 운영 및 Failover/Failback 수행
Set up
설정 정의 및
지속적인 데이터
복제 시작
Test
무중단 테스트를
위한 인스턴스
시작
Failover
몇 분 안에
AWS에서 복구
인스턴스 시작
Operate
모니터링 및
주기적인 훈련으로
준비태세 유지
Failback
복제 시작 및 기본 사이트로
돌아가기
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
AWS Elastic Disaster Recovery 지원 대상
Applications
Databases
x86 operating
systems
Source
infrastructure
Physical Data Centers
물리적, 가상 및 클라우드 서버에서 확장 가능하고 비용 효율적인 재해 복구 서비스
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
AWS Elastic Disaster Recovery 아키텍처
온프레미스 또는 기타 클라우드에서 AWS
AWS
Replication
Agent
AWS
Replication
Agent
Replication servers
(Lightweight EC2
Instances)
EBS Volumes
Staging Area Subnets
(in user VPC)
Recovery
instance
Recovery
instance
Recovery Subnets
(in user VPC)
EBS Volumes
Disks
AWS Cloud
Agent 제어 프로토콜
AWS Region
블록레벨 지속 복제
( 압축 & 암호화)
복제 서버
상태 보고
스테이징 영역 리소스가
자동으로 생성 및 종료됨
RTO(분) 및 RPO(초)로 시작된
복구 인스턴스
DRS
Data center or cloud
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Demo
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Demo Architecture
Replication servers
(Lightweight EC2
Instances)
EBS Volumes
Staging Area Subnets (in user
VPC)
WAS
instance
DB
instance
Recovery Subnets
(in user VPC)
AWS Cloud
Agent 제어 프로토콜
AWS Region (Singapore)
블록레벨 지속 복제
( 압축 & 암호화)
복제 서버
상태 보고
스테이징 영역 리소스가
자동으로 생성 및 종료됨
RTO(분) 및 RPO(초)로
시작된 복구 인스턴스
DRS
AWS Region (Seoul)
온프레미스 가정
AWS
Replication Agent
WordPress
(WEB)
AWS
Replication Agent
MySQL
(DB)
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Demo Architecture
EBS Volumes
Staging Area Subnets
(in user VPC)
WAS
instance
DB
instance
Recovery Subnets
(in user VPC)
AWS Cloud
Agent 제어 프로토콜
AWS Region
(Singapore)
블록레벨 지속 복제
( 압축 & 암호화)
복제 서버
상태 보고
스테이징 영역 리소스가
자동으로 생성 및 종료됨
RTO(분) 및 RPO(초)로
시작된 복구 인스턴스
DRS
AWS Region (Seoul)
온프레미스 가정
AWS
Replication
Agent
WordPress
(WEB)
AWS
Replication
Agent
MySQL
(DB)
Replication servers
(Lightweight EC2
Instances)
환경 구성
1
2 Target VPC 구성
3 Agent 설치
4 데이터 복제
5 복구 시작
6 서비스 확인
1
2
3
4
5
6
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
3줄 요약
1. 데이터와 메타데이터(구성정보) 함께 백업하여 재해에
대비 합니다.
2. AWS Elastic Disaster Recovery를 이용하면
비용효율적으로 온프레미스 장비에 대한 재해복구
구성이 가능합니다.
3. 재해복구는 원타임 구축 대상이 아니며, 지속적인
검증과 보완만이 비즈니스의 지속성을 보장할 수
있습니다.
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
참고 자료
AWS Backup 및 AWS Elastic
Disaster Recovery
관련 워크샵 자료
AWS Skill Builder
무료 온라인 트레이닝
AWS 클라우드에서의 재해
복구 백서 및 안내서 자료
<AWS Backup 워크샵> <AWS DRS 워크샵> <AWS 재해복구 백서> <AWS Skill Builder>
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.

AWS Summit Seoul 2023 | AWS에서 최소한의 비용으로 구현하는 멀티리전 DR 자동화 구성

  • 1.
    © 2023, AmazonWeb Services, Inc. or its affiliates. All rights reserved. S E O U L | M A Y 4 , 2 0 2 3
  • 2.
    © 2023, AmazonWeb Services, Inc. or its affiliates. All rights reserved. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. AWS에서 최소한의 비용으로 구현하는 멀티리전 재해복구 안준환 솔루션즈 아키텍트 AWS 솔루션즈 아키텍트 AWS Yongzhe Ren
  • 3.
    © 2023, AmazonWeb Services, Inc. or its affiliates. All rights reserved. AWS에서의 재해복구 AWS Backup을 이용한 멀티리전 재해복구 AWS Elastic Disaster Recovery를 이용한 온프레미스 재해복구 Agenda
  • 4.
    © 2023, AmazonWeb Services, Inc. or its affiliates. All rights reserved. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. AWS에서의 재해복구
  • 5.
    © 2023, AmazonWeb Services, Inc. or its affiliates. All rights reserved. 재해복구 - Disaster recovery 자연재해 기술적 이슈 휴먼 액션 • 비즈니스 지속성 • 희귀하지만 대규모 장애상황 - 자연재해 - 기술적 이슈 - 휴먼 액션 • 개별 장애에 대한 목표 측정 - 복구 시간(Recovery Time) - 복구 시점(Recovery Point)
  • 6.
    © 2023, AmazonWeb Services, Inc. or its affiliates. All rights reserved. 복구시점 및 복구시간 목표 재해 발생시 수용 가능한 데이터 손실이 어느정도 입니까? 재해 발생 복구 시점 목표 (Recovery Point Objective / RPO) 복구 시간 목표 (Recovery Time Objective / RTO) 데이터 손실 발생 구간 서비스 다운 발생 구간
  • 7.
    © 2023, AmazonWeb Services, Inc. or its affiliates. All rights reserved. Backup & restore Pilot light Multi-site active/active Warm standby RPO/RTO: 수시간 RPO/RTO: 수분/수십분 RPO/RTO: 수분 RPO/RTO: 실시간 • 낮은 우선순위 유즈케이스 • 이벤트 발생 후에 전체 리소스 생성 • 이벤트 발생 후에 백업 복구 • 비용: $ • 라이브 데이터 • 서비스는 유휴 상태 유지 • 이벤트 발생 후에 일부 리소스 생성 및 확장 • 비용: $$ • 소규모로 상시 구동 • 비즈니스 크리티컬 • 이벤트 발생 후에 리소스 확장 • 비용: $$$ • 무중단 • 0에 가까운 데이터 손실 • 미션 크리티컬 서비스 • 비용: $$$$ 클라우드에서의 재해 복구 전략 Active/Passive AWS Backup AWS Elastic Disaster Recovery Active/Active
  • 8.
    © 2023, AmazonWeb Services, Inc. or its affiliates. All rights reserved. Backup & Restore Multi-Site Active/Active Pilot Light Warm Standby Backup & Restore Pilot Light Warm Standby Multi-Site Active/Active 비용 복구시간 목표 - RTO 서비스 중단 기간 수용 가능 비용 복구 목표 시간 재해에 의한 비즈니스 영향 재해복구 준비비용
  • 9.
    © 2023, AmazonWeb Services, Inc. or its affiliates. All rights reserved. Multi-Site Active/Active Warm Standby Pilot Light Backup & Restore Multi-Site Active/Active Warm Standby Pilot Light Backup & Restore 비용 복구시점 목표 - RPO 재해에 의한 데이터 손실 복구 목표 시점 수용 가능 비용 재해복구 준비비용 재해에 의한 비즈니스 영향
  • 10.
    © 2023, AmazonWeb Services, Inc. or its affiliates. All rights reserved. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. AWS Backup을 이용한 멀티리전 재해복구
  • 11.
    © 2023, AmazonWeb Services, Inc. or its affiliates. All rights reserved. Backup & restore Pilot light Multi-site active/active Warm standby RPO/RTO: 수시간 RPO/RTO: 수분/수십분 RPO/RTO: 수분 RPO/RTO: 실시간 • 낮은 우선순위 유즈케이스 • 이벤트 발생 후에 전체 리소스 생성 • 이벤트 발생 후에 백업 복구 • 비용: $ • 라이브 데이터 • 서비스는 유휴 상태 유지 • 이벤트 발생 후에 일부 리소스 생성 및 확장 • 비용: $$ • 소규모로 상시 구동 • 비즈니스 크리티컬 • 이벤트 발생 후에 리소스 확장 • 비용: $$$ • 무중단 • 0에 가까운 데이터 손실 • 미션 크리티컬 서비스 • 비용: $$$$ 클라우드에서의 재해 복구 전략 Active/Passive AWS Backup Active/Active
  • 12.
    © 2023, AmazonWeb Services, Inc. or its affiliates. All rights reserved. 재해복구를 위한 백업 대상 o EBS volumes o RDS volumes o Files on EFS o S3 objects … o VPC configure o RDS configure o ElastiCache configure o ALB configure o EC2 configure … 1. 데이터 백업 2. 메타데이터 백업 백업
  • 13.
    © 2023, AmazonWeb Services, Inc. or its affiliates. All rights reserved. 메타데이터 – 인프라 구성 정보 온프레미스 AWS 클라우드 CMDB • AWS CloudFormation • Terraform • AWS Cloud Development Kit CMDB AWS API IaC (Infrastr ucture as a Code) CMDB: 구성 관리 데이터베이스, Configuration Management Database
  • 14.
    © 2023, AmazonWeb Services, Inc. or its affiliates. All rights reserved. Backup & Restore 기반 재해복구 자동화 Backup Vault Data Backup Metadata Backup Restore
  • 15.
    © 2023, AmazonWeb Services, Inc. or its affiliates. All rights reserved. AWS Backup 개요 AWS Backup 완전관리형 정책 기반 백업 서비스로, 여러 AWS 서비스들에 걸쳐 자동화된 중앙 집중식 관리를 지원하는 백업 서비스 Amazon EBS 블록 스토리지 Amazon FSx for Windows File Server Amazon EFS Amazon FSx for Lustre 파일 스토리지 데이터베이스 Amazon Aurora Amazon RDS Amazon Neptune Amazon DocumentDB Amazon DynamoDB 오브젝트 스토리지 Amazon S3 VMware Cloud on AWS Amazon EC2 컴퓨트 AWS Storage Gateway 데이터 전송 AWS Storage Gateway + Amazon FSx for NetApp ONTAP Amazon FSx for OpenZFS Amazon Redshift Amazon Timestream 관리 AWS CloudFormation 애플리케이션 SAP Hana on EC2 (preview) Windows Volume Shadow Copy Service on EC2 On- premises AWS Outpost 하이브리드
  • 16.
    © 2023, AmazonWeb Services, Inc. or its affiliates. All rights reserved. 재해복구 자동화 구현 예 IaC 기반의 AWS 리소스 관리 AWS Backup을 이용한 데이터(instances) 및 메타데이터(infrastructure)의 정기적인 백업 재해 발생시 백업으로부터 재해 복구 수행 원본 애플리케이션 복구 애플리케이션
  • 17.
    © 2023, AmazonWeb Services, Inc. or its affiliates. All rights reserved. IaC 관리 및 백업 (1/5) • 형상관리 기반 IaC 코드 관리 - AWS CodeCommit – 관리형 git 서비스 • IaC 코드 백업 자동화 - 사용자의 git push 이벤트에 따라 코드 저장소(AWS CodeCommit)의 IaC 코드를 S3 버킷에 복제 - IaC 코드가 복제된 S3 버킷을 AWS Backup을 이용해 리전 간 복제 자동화 ※ AWS CloudFormation은 AWS Backup을 통한 백업 가능
  • 18.
    © 2023, AmazonWeb Services, Inc. or its affiliates. All rights reserved. IaC 코드 의존성 분리 (2/5) • 의존성 분리 - 재해 복구용으로 IaC 코드 이용 위해 코드 내 원본 리전에 대한 의존성 분리 • 정적 의존성 분리 - 복구 리전의 정적 정보가 포함된 IaC 코드는 사전에 작성 - 리전 정보, 가용영역 정보 등 • 동적 의존성 분리 - 복구 리전의 동적 정보가 포함된 IaC 코드는 복구 시점에 작성 – 자동화 검토 - EC2 인스턴스 복구용 AMI 정보, RDS 복구용 DB Snapshot 정보 등
  • 19.
    © 2023, AmazonWeb Services, Inc. or its affiliates. All rights reserved. 관리형 리소스에 대한 간접 접근 (3/5) • 관리형 서비스의 엔드포인트 형태 - 많은 관리형 서비스들의 엔드포인트(DNS name)에는 리전이름과 고유ID가 포함됨 예) app-123456789.ap-northeast-2.elb.amazonaws.com, db.123456789.ap-northeast-2.rds.amazonaws.com • 복구중 리소스 생성시 엔드포인트 변경됨 - 애플리케이션 코드나 설정 등, 애플리케이션 배포 번들에 엔드포인트 정보가 포함된 경우, 복구과정 중 수정 필요 - 엔드포인트에 간접적으로 접근하도록 구성 후, 복구 과정 중 생성한 리소스에 대한 엔드포인트 업데이트 자동화 - Amazon Route53 Private Hosted Zone 또는 AWS Systems Manager Parameter Store 등 활용 가능
  • 20.
    © 2023, AmazonWeb Services, Inc. or its affiliates. All rights reserved. 재해 복구 태스크의 실행 독립성 확보 (4/5) • 복구 작업의 독립성 - 복구 프로세스는 복구 리전의 리소스만을 이용하여 구동 해야함 - AWS CodePipeline, AWS CodeBuild 등의 CI/CD 도구는 좋은 선택
  • 21.
    © 2023, AmazonWeb Services, Inc. or its affiliates. All rights reserved. 재해복구 시스템의 지속적인 검증 및 보완 (5/5) - 재해복구는 원타임 구축 대상이 아님 - 유사시 원활한 재해복구를 위해서 지속적인 검증과 보완이 필수 검증 보완 구축
  • 22.
    © 2023, AmazonWeb Services, Inc. or its affiliates. All rights reserved. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. AWS Elastic Disaster Recovery를 이용한 재해복구 (온프레미스에서 AWS로 재해복구)
  • 23.
    © 2023, AmazonWeb Services, Inc. or its affiliates. All rights reserved. 클라우드 재해 복구 장점 온프레미스 재해 복구 클라우드 재해 복구 • 테스트 또는 복구에 필요한 경우에만 사용, 사용된 서비스에 대해서만 지불 • IT 관리 오버헤드 감소 • (훨씬!) 더 많은 자동화 • 운영 환경을 종료하지 않고 쉽고 반복 가능한 테스트 • 몇 분 만에 시스템 가동 • 막대한 선결제 및 지속적인 하드웨어 비용 • 데이터 증가로 하드웨어 및 운영 비용이 증가 • 비즈니스 중단 없이는 테스트하기가 어려울 수 있음 • 전 세계적으로 분산된 비즈니스를 위한 관리 및 인프라 오버헤드 필요할 때만 사용할 수 있는 퍼블릭 클라우드의 장점은 백업, 재해 복구에 적합
  • 24.
    © 2023, AmazonWeb Services, Inc. or its affiliates. All rights reserved. 클라우드 재해 복구의 비즈니스 효과 견고한 운영 체계 최상위 복구 목표를 기반으로 안정적인 안정성과 가용성 달성 운영 효율성 중복 인프라 및 라이선스 의 필요성을 줄임으로써 비용 절감을 확보 비즈니스 연속성에 대한 확신 운영 환경에 영향이 없는 쉬운 재해 복구 테스트를 수행하여 가동 중지 시간 및 데이터 손실을 최소화
  • 25.
    © 2023, AmazonWeb Services, Inc. or its affiliates. All rights reserved. Backup & restore Pilot light Multi-site active/active Warm standby RPO/RTO: 수시간 RPO/RTO: 수분/수십분 RPO/RTO: 수분 RPO/RTO: 실시간 • 낮은 우선순위 유즈케이스 • 이벤트 발생 후에 전체 리소스 생성 • 이벤트 발생 후에 백업 복구 • 비용: $ • 라이브 데이터 • 서비스는 유휴 상태 유지 • 이벤트 발생 후에 일부 리소스 생성 및 확장 • 비용: $$ • 소규모로 상시 구동 • 비즈니스 크리티컬 • 이벤트 발생 후에 리소스 확장 • 비용: $$$ • 무중단 • 0에 가까운 데이터 손실 • 미션 크리티컬 서비스 • 비용: $$$$ 클라우드에서의 재해 복구 전략 Active/Passive Active/Active AWS Elastic Disaster Recovery
  • 26.
    © 2023, AmazonWeb Services, Inc. or its affiliates. All rights reserved. AWS Elastic Disaster Recovery 소개 다양한 고객의 요건에 맞는 안정적이고, 확장 가능하며, 안전한 스토리지 서비스 포트폴리오 제공 자동화 최소한의 기술 요구사항 운영에 영향을 주지 않는 DR 테스트 신뢰성 견고하고 예측 가능한 연속 복제 기능 랜섬웨어, 충돌 및 인적 오류에 대한 보호 RPO: Seconds RTO: Minutes 유연성 모슨 소스에서 복제 다양한 OS, 응용 프로그램 및 데이터베이스 지원 테스트,복구, Fail Back의 통합 프로세스 지원 유휴 복구 사이트 리소스를 제거하고 필요한 만큼만 지불
  • 27.
    © 2023, AmazonWeb Services, Inc. or its affiliates. All rights reserved. AWS Elastic Disaster Recovery 사용 패턴 온프레미스에서 AWS AWS 리전에서 AWS 다른 리전 다른 클라우드에서 AWS AWS 가용 영역에서 AWS 다른 가용 영역
  • 28.
    © 2023, AmazonWeb Services, Inc. or its affiliates. All rights reserved. AWS Elastic Disaster Recovery 작동방식 단일 프로세스상의 재해 복제 운영 및 Failover/Failback 수행 Set up 설정 정의 및 지속적인 데이터 복제 시작 Test 무중단 테스트를 위한 인스턴스 시작 Failover 몇 분 안에 AWS에서 복구 인스턴스 시작 Operate 모니터링 및 주기적인 훈련으로 준비태세 유지 Failback 복제 시작 및 기본 사이트로 돌아가기
  • 29.
    © 2023, AmazonWeb Services, Inc. or its affiliates. All rights reserved. AWS Elastic Disaster Recovery 지원 대상 Applications Databases x86 operating systems Source infrastructure Physical Data Centers 물리적, 가상 및 클라우드 서버에서 확장 가능하고 비용 효율적인 재해 복구 서비스
  • 30.
    © 2023, AmazonWeb Services, Inc. or its affiliates. All rights reserved. AWS Elastic Disaster Recovery 아키텍처 온프레미스 또는 기타 클라우드에서 AWS AWS Replication Agent AWS Replication Agent Replication servers (Lightweight EC2 Instances) EBS Volumes Staging Area Subnets (in user VPC) Recovery instance Recovery instance Recovery Subnets (in user VPC) EBS Volumes Disks AWS Cloud Agent 제어 프로토콜 AWS Region 블록레벨 지속 복제 ( 압축 & 암호화) 복제 서버 상태 보고 스테이징 영역 리소스가 자동으로 생성 및 종료됨 RTO(분) 및 RPO(초)로 시작된 복구 인스턴스 DRS Data center or cloud
  • 31.
    © 2023, AmazonWeb Services, Inc. or its affiliates. All rights reserved. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Demo
  • 32.
    © 2023, AmazonWeb Services, Inc. or its affiliates. All rights reserved. Demo Architecture Replication servers (Lightweight EC2 Instances) EBS Volumes Staging Area Subnets (in user VPC) WAS instance DB instance Recovery Subnets (in user VPC) AWS Cloud Agent 제어 프로토콜 AWS Region (Singapore) 블록레벨 지속 복제 ( 압축 & 암호화) 복제 서버 상태 보고 스테이징 영역 리소스가 자동으로 생성 및 종료됨 RTO(분) 및 RPO(초)로 시작된 복구 인스턴스 DRS AWS Region (Seoul) 온프레미스 가정 AWS Replication Agent WordPress (WEB) AWS Replication Agent MySQL (DB)
  • 33.
    © 2023, AmazonWeb Services, Inc. or its affiliates. All rights reserved. Demo Architecture EBS Volumes Staging Area Subnets (in user VPC) WAS instance DB instance Recovery Subnets (in user VPC) AWS Cloud Agent 제어 프로토콜 AWS Region (Singapore) 블록레벨 지속 복제 ( 압축 & 암호화) 복제 서버 상태 보고 스테이징 영역 리소스가 자동으로 생성 및 종료됨 RTO(분) 및 RPO(초)로 시작된 복구 인스턴스 DRS AWS Region (Seoul) 온프레미스 가정 AWS Replication Agent WordPress (WEB) AWS Replication Agent MySQL (DB) Replication servers (Lightweight EC2 Instances) 환경 구성 1 2 Target VPC 구성 3 Agent 설치 4 데이터 복제 5 복구 시작 6 서비스 확인 1 2 3 4 5 6
  • 34.
    © 2023, AmazonWeb Services, Inc. or its affiliates. All rights reserved. 3줄 요약 1. 데이터와 메타데이터(구성정보) 함께 백업하여 재해에 대비 합니다. 2. AWS Elastic Disaster Recovery를 이용하면 비용효율적으로 온프레미스 장비에 대한 재해복구 구성이 가능합니다. 3. 재해복구는 원타임 구축 대상이 아니며, 지속적인 검증과 보완만이 비즈니스의 지속성을 보장할 수 있습니다.
  • 35.
    © 2023, AmazonWeb Services, Inc. or its affiliates. All rights reserved. 참고 자료 AWS Backup 및 AWS Elastic Disaster Recovery 관련 워크샵 자료 AWS Skill Builder 무료 온라인 트레이닝 AWS 클라우드에서의 재해 복구 백서 및 안내서 자료 <AWS Backup 워크샵> <AWS DRS 워크샵> <AWS 재해복구 백서> <AWS Skill Builder>
  • 36.
    © 2023, AmazonWeb Services, Inc. or its affiliates. All rights reserved. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.