SlideShare a Scribd company logo
1 of 65
Download to read offline
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
© 2022, Amazon Web Services, Inc. or its affiliates.
워크로드 특성에 따른
안전하고 효율적인
Data Lake 운영 방안
박성훈
Account Growth Lead
AWS
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
Agenda
• Data Lakes 구축의 어려움
• 확장 가능한 S3 Keyspace 설계
• 예기치 않은 사고로부터 데이터 보호
• 비용 최적화
2
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
Customers want more value from their data
3
Growing
exponentially
From new
sources
Increasingly
diverse
Used by
many people
Analyzed by many
applications
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
Building a Modern Data Strategy
Catalog
Governance
Data
Sources
People,
Apps, and
Devices
Analytics
Machine
Learning Databases
Data
Lakes
4
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
The benefits of scalable data lakes
5
모든 데이터를 오픈 형식으로 저장
스토리지를 컴퓨팅에서 분리
스토리지를 엑사바이트까지 비용 효율적으로 확장
분석 및 ML 엔진 선택
Catalog
Data lake
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
Challenges in building data lakes
Challenge #1: Data ingestion
신뢰할 수 있는 데이터 수집
파이프라인을 구축하는 것은
복잡하다 Challenge #2: Data management
S3에 데이터를 저장하고
최적화하는데 시간이 많이 걸린다
Challenge #3: Security & governance
세분화된 권한을 관리는 것이 어렵고 오류가
발생하기 쉽다
Amazon S3 AWS Lake Formation
Data Catalog
AWS Glue ETL
Amazon Athena
Amazon EMR
Amazon Redshift
Spectrum
Amazon
SageMaker
Challenge #5: Data sharing
계정 및 조직 간에 공유하는
것은 복잡하다 6
Challenge #4: Integrations
선택한 서비스나
애플리케이션을 통합하는 것이
어렵다
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
신뢰할 수 있는 데이터 수집
파이프라인을 구축하는 것은
복잡하다
Challenges in building data lakes
Challenge #3: Security & governance
세분화된 권한을 관리는 것이 어렵고 오류가
발생하기 쉽다
Amazon S3 AWS Lake Formation
Data Catalog
AWS Glue ETL
Amazon Athena
Amazon EMR
Amazon Redshift
Spectrum
Amazon
SageMaker
Challenge #5: Data sharing
계정 및 조직 간에 공유하는
것은 번거로운 작업이다 7
Challenge #2: Data management
S3에 데이터를 저장하고
최적화하는데 시간이 많이 걸린다
Challenge #4: Integrations
선택한 서비스나
애플리케이션을 통합하는 것이
어렵다
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
© 2022, Amazon Web Services, Inc. or its affiliates.
확장 가능한
S3 Keyspace 설계
8
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
Index Performance Baseline
9
Request Method All Regions
GET/HEAD 5,500
requests per second
PUT/POST/DELETE 3,500
requests per second
• 초당 요청은 인덱스 파티션 당 요청입니다.
• 접두사 수에는 제한이 없습니다.
• 503 Slow Down 오류는 요청 속도를 늦추는 주요 지표입니다.
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
Request rates are allocated proportionally
10
Workload
50% PUT and 50% GET
operations in a single partition
Example 1 Total TPS
(50% * 3,500) + (50% * 5,500) =
1,750 + 2,750 =
4,500 TPS Combined
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
Request rates are allocated proportionally
11
Workload
50% PUT and 50% GET
operations in a single partition
Example 1 Total TPS
(50% * 3,500) + (50% * 5,500) =
1,750 + 2,750 =
4,500 TPS Combined
Workload
30% PUT and 70% GET
operations in a single partition
Example 2 Total TPS
(30% * 3,500) + (70% * 5,500) =
1,050 + 3,850 =
4,900 TPS Combined
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
How to Increase Requests per Second
• 인덱스를 여러 파티션에 분산
• 인덱스를 분할하는 두 가지 방법
▪ Auto partitioning
➢고객의 개입 없이 S3에서 수행
➢시간이 지남에 따라 S3 워크로드가 점차 증가할 때 잘 동작
▪ Pre-partition request
➢케이스 생성을 통해 지원
➢S3 워크로드가 빠르게 증가할 때 선호
12
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
Auto Partitioning At Work
13
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
Optimize Partition Use
2018년 7월 이전
• 접두사 앞에 해시 추가
▪ examplebucket/232a-2013-26-05-15-00-00/cust1234234/photo001.jpg
▪ examplebucket/232b-2013-26-05-15-00-00/cust1234234/photo002.jpg
…
▪ examplebucket/292a-2013-26-05-15-00-00/cust1234234/photo099.jpg
• 접두사 앞에 해시를 추가하여 요청이 여러 인덱스 파티션으로 분산
14
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
Optimize Partition Use
2018년 7월부터
• Keyspace에 자연명을 사용할 수 있습니다.버킷의 접두사 수에는
제한이 없습니다.
• Keyspace 설계 시, 모든 요청이 동일한 인덱스 파티션에 대해 요청을
수행하는 시나리오를 방지해야 합니다.
• 워크로드가 여러 인덱스 파티션에 걸쳐 잘 분산될 수 있는 높은
카디널리티 접두사를 사용하는 것이 중요합니다.
15
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
Example: Autonomous vehicles
1. 많은 계측 자동차가 중앙에 위치하고 있습니다.
2. 매일 그 자동차들은 운전을 하고 많은 데이터를
수집합니다.
3. 거의 동시에 차고지로 돌아와서 수집한 데이터를
데이터 레이크에 업로드 합니다.
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
Example: Autonomous vehicles
17
awsexamplebucket/daily-uploads/<date>/<car>/drive-data
객체 Key 이름
버킷 이름
접두사 객체 이름
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
Example: Autonomous vehicles
18
/daily-uploads/20220710/CAR01/drive-data
/daily-uploads/20220710/CAR02/drive-data
/daily-uploads/20220710/CAR03/drive-data
/daily-uploads/20220710/CAR04/drive-data
/daily-uploads/20220710/CAR05/drive-data
요구 사항: 3,000 PUTs/sec per car – 15,000 PUTs/sec
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
Example: Autonomous vehicles
19
All cars get throttled
around 3,500
PUTs/sec (total)
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
Example: Autonomous vehicles
20
All cars get throttled
around 3,500
PUTs/sec (total)
New index prefixes
are created, raising
max TPS
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
Example: Autonomous vehicles
21
/daily-uploads/20220710/CAR01/drive-data
/daily-uploads/20220710/CAR02/drive-data
/daily-uploads/20220710/CAR03/drive-data
/daily-uploads/20220710/CAR04/drive-data
/daily-uploads/20220710/CAR05/drive-data
5개의 인덱스 파티션이 만들어질 때 까지 Throttle이 발생합니다.
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
Example: Autonomous vehicles
22
/daily-uploads/20220710/CAR01/drive-data
/daily-uploads/20220710/CAR02/drive-data
/daily-uploads/20220710/CAR03/drive-data
/daily-uploads/20220710/CAR04/drive-data
/daily-uploads/20220710/CAR05/drive-data
5개의 인덱스 파티션이 만들어질 때 까지 Throttle이 발생합니다.
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
Example: Autonomous vehicles
23
/daily-uploads/20220710/CAR01/drive-data
/daily-uploads/20220710/CAR02/drive-data
/daily-uploads/20220710/CAR03/drive-data
/daily-uploads/20220710/CAR04/drive-data
/daily-uploads/20220710/CAR05/drive-data
5개의 인덱스 파티션이 만들어질 때 까지 Throttle이 발생합니다.
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
Example: Autonomous vehicles
24
/daily-uploads/20220710/CAR01/drive-data
/daily-uploads/20220710/CAR02/drive-data
/daily-uploads/20220710/CAR03/drive-data
/daily-uploads/20220710/CAR04/drive-data
/daily-uploads/20220710/CAR05/drive-data
S3가 접두사를 기준으로 5개의 인덱스 파티션을 만들었습니다.
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
Example: Autonomous vehicles
25
다음 날은…
/daily-uploads/20220711/CAR01/drive-data
/daily-uploads/20220711/CAR02/drive-data
/daily-uploads/20220711/CAR03/drive-data
/daily-uploads/20220711/CAR04/drive-data
/daily-uploads/20220711/CAR05/drive-data
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
Example: Autonomous vehicles
26
/daily-uploads/20220710/CAR01/drive-data
/daily-uploads/20220710/CAR02/drive-data
/daily-uploads/20220710/CAR03/drive-data
/daily-uploads/20220710/CAR04/drive-data
/daily-uploads/20220710/CAR05/drive-data
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
Example: Autonomous vehicles
27
/daily-uploads/20220711/CAR01/drive-data
/daily-uploads/20220711/CAR02/drive-data
/daily-uploads/20220711/CAR03/drive-data
/daily-uploads/20220711/CAR04/drive-data
/daily-uploads/20220711/CAR05/drive-data
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
Example: Autonomous vehicles
28
/daily-uploads/<date>/<car>/drive-data
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
Example: Autonomous vehicles
29
/daily-uploads/<car>/<date>/drive-data
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
Example: Autonomous vehicles
30
/daily-uploads/CAR01/20220711/drive-data
/daily-uploads/CAR02/20220711/drive-data
/daily-uploads/CAR03/20220711/drive-data
/daily-uploads/CAR04/20220711/drive-data
/daily-uploads/CAR05/20220711/drive-data
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
Example: Autonomous vehicles
31
/daily-uploads/CAR01/20220712/drive-data
/daily-uploads/CAR02/20220712/drive-data
/daily-uploads/CAR03/20220712/drive-data
/daily-uploads/CAR04/20220712/drive-data
/daily-uploads/CAR05/20220712/drive-data
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
S3 Requests
32
GET s3://mybucket/flight_info/*
mybucket Prefix : flight_info
Client
Sequential read
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
S3 Requests on Amazon EMR
33
여러 컨테이너가 동시에 단일 접두사에 읽기 요청을 보냅니다.
GET s3://mybucket/flight_info/*
mybucket Prefix : flight_info
EMR Core/Task Nodes
Read in parallel
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
S3 Requests on Amazon EMR
34
중복도가 낮은 접두사를 추가하여 요청을 여러 인덱스 파티션으로 분산
GET s3://mybucket/flight_info/*
mybucket
flight_info/US
EMR Core/Task Nodes
flight_info/EU
Read in parallel
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
How does S3 automatically scale request rates?
35
BucketName/prefix:
mybucket/flight_info/US/
mybucket/flight_info/EU/
mubucket/ …
3,500 PUT tps
5,500 GET tps
mybucket
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
How does S3 automatically scale request rates?
36
BucketName/prefix:
mybucket/flight_info/US/
mybucket/flight_info/EU/
mubucket/ …
mybucket
1st Partition
2nd Partition
3,500 PUT tps
5,500 GET tps
3,500 PUT tps
5,500 GET tps
/…
/flight_info
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
How does S3 automatically scale request rates?
37
BucketName/prefix:
mybucket/flight_info/US/
mybucket/flight_info/EU/
mubucket/ …
mybucket
1st Partition
2nd Partition
3rd Partition
3,500 PUT tps
5,500 GET tps
3,500 PUT tps
5,500 GET tps
3,500 PUT tps
5,500 GET tps
3,500 PUT tps
5,500 GET tps
/flight_info
/…
/US
/EU
/…
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
© 2022, Amazon Web Services, Inc. or its affiliates.
예기치 않은 사고로부터
데이터 보호
38
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
Amazon S3 Versioning
39
Key = cat.jpg
PUT
• 버전 관리를 사용하는 버킷에 객체를
PUT할 때 비 최신 버전은 덮어쓰지
않습니다.
• 실수로 객체를 덮어쓰거나 삭제하는 것을
방지하고, 객체의 이전 버전을 검색할 수
있습니다.
• 더 이상 최신 버전이 아닌 객체를
S3 Lifecycle로 이전하거나 삭제할 수
있습니다.
Key = cat.jpg
Version ID = 2
Key = cat.jpg
Version ID = 1
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
Amazon S3 Versioning
40
Key = cat.jpg
• 버전 관리를 사용하는 버킷에 객체를
PUT할 때 비 최신 버전은 덮어쓰지
않습니다.
• 실수로 객체를 덮어쓰거나 삭제하는 것을
방지하고, 객체의 이전 버전을 검색할 수
있습니다.
• 더 이상 최신 버전이 아닌 객체를
S3 Lifecycle로 이전하거나 삭제할 수
있습니다.
Key = cat.jpg
Version ID = 2
Key = cat.jpg
Version ID = 1
Key = cat.jpg
Version ID = 2
Key = cat.jpg
Version ID = 1
DELETE
Delete Marker
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
Amazon S3 Versioning
41
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
S3 Replication
42
Source
Destination • 버킷 간에 객체를 복제하는 탄력적이고
저렴한 완전 관리형 기능입니다.
• 복제할 위치와 방법을 구성할 수 있는
다양한 기능을 통해 유연성을 제공합니다.
• 복제 규칙이 구성되면 원본 버킷의 객체와
메타데이터를 자동으로 복제합니다.
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
US East US East
Flexible replication
43
Same Region
동일한 AWS 리전 내에서 복제
Cross-Region
다른 AWS 리전으로 복제
Multiple destinations
여러 대상 버킷에 복제
US East US West
Account A
Cross-account
서로 다른 AWS 계정 간 복제
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
AWS Backup for S3
44
• AWS 서비스 및 하이브리드 워크로드의 데이터
보호를 중앙 집중화하고 자동화 정책을
기반으로 대규모 데이터 보호를 간편하고 비용
효율적으로 수행할 수 있는 완전 관리형
서비스입니다.
• 클릭 한 번으로 Amazon S3에 저장된
애플리케이션 데이터를 특정 시점으로 쉽게
복원할 수 있습니다.
• 데이터 보호에 대한 규정 준수 또는 비즈니스
정책을 지원하는 데 도움이 됩니다.
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
AWS Backup for S3
용어 의미
RPO(Recovery Point Objective) 복구 시점 목표
RTO(Recovery Time Objective) 복구에 걸리는 시간 목표
스냅샷(Snapshot) 특정 시점의 데이터 상태
스냅샷 백업(Snapshot Backup) 특정 시점 만을 백업하기 때문에 복원도 해당 시점으로만 가능
연속 백업(Continuous Backup)
첫 번째 전체 백업 (Full Backup) 후 지속적으로 증분 백업을
수행하므로 복원할 수 있는 시점이 광범위
PiTR(Point-in-Time-Recovery) 지정한 특정 시간으로 복구. 지속적 백업으로 가능
백업 용어 정리
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
AWS Backup for S3
46
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
AWS Backup for S3
47
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
AWS Backup for S3
48
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
S3 Lifecycle
49
Lifecycle Configuration을 사용하여
• 데이터를 보다 비용 효율적인 스토리지
클래스로 이동
• 객체 사용 기간에 따라 만료시켜 시간에
따른 스토리지 지출 관리
데이터를 보다 비용 효율적인 스토리지 클래스로 이동
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
S3 Lifecycle
50
더 이상 보존할 필요가 없는 데이터 세트의 자동 삭제
Lifecycle Configuration을 사용하여
• 각 객체의 Noncurrent Versions 삭제
• 만료된 객체의 Delete Markers 삭제
• Incomplete Multipart-Uploads 삭제
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
S3 Lifecycle
51
더 이상 보존할 필요가 없는 데이터 세트의 자동 삭제
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
Amazon S3 Object Lock
52
S3 Object Lock을 사용하여 객체를 write once, read many(WORM)
모델을 사용하여 저장
거버넌스 모드 규정 준수 모드
• 특별한 권한이 없는 한 사용자는
객체 버전을 덮어쓰거나
삭제하거나 잠금 설정을 변경할
수 없음
• 필요에 따라 일부 사용자에게
보관 설정을 변경하거나 객체를
삭제할 수 있는 권한을 부여할
수 있음
• 보호된 객체 버전은 AWS
계정의 루트 사용자를 포함한
어떤 사용자도 덮어쓰거나
삭제할 수 없음
• 객체를 잠그면 보관 모드를
변경할 수 없으며 보관 기간을
줄일 수 없음
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
Amazon S3 Object Lock
53
S3 Object Lock을 사용하여 객체를 write once, read many(WORM)
모델을 사용하여 저장
거버넌스 모드 규정 준수 모드
• 특별한 권한이 없는 한 사용자는
객체 버전을 덮어쓰거나
삭제하거나 잠금 설정을 변경할
수 없음
• 필요에 따라 일부 사용자에게
보관 설정을 변경하거나 객체를
삭제할 수 있는 권한을 부여할 수
있음
• 보호된 객체 버전은 AWS
계정의 루트 사용자를 포함한
어떤 사용자도 덮어쓰거나
삭제할 수 없음
• 객체를 잠그면 보관 모드를
변경할 수 없으며 보관 기간을
줄일 수 없음
Object Lock은 고정된 시간 동안 또는 무기한으로
객체의 삭제 또는 덮어쓰기를 방지하는 데 도움이 될 수
있지만 데이터 레이크 데이터 스토어로 사용되는 S3
버킷에 적용하는 것은 아주 신중히 고려해야 합니다.
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
© 2022, Amazon Web Services, Inc. or its affiliates.
비용 최적화
54
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
S3 Intelligent-Tiering Storage Class
55
• 세 가지 액세스 계층 간에 자동으로 객체 이동
• 클라우드에서 가장 낮은 스토리지 비용을
실현하기 위한 비동기식 아카이빙 옵션
• 성능 영향, 운영 오버헤드, 수명주기 비용 또는
검색 비용 없음
• 99.9% 의 가용성과 99.999999999% 의
내구성을 제공하도록 설계
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
Frequent
Access tier
Infrequent
Access tier
Archive
Instant
Access tier
+30 days +60 days
S3 Intelligent-Tiering automatically optimizes cost in
three access tiers
새로 추가된 Archive Instant
Access Tier로 최대 68%
비용할인
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
Use S3 Intelligent-Tiering by default for data with
unknown or changing access patterns
Milliseconds access (automatic) Minutes to hours (optional)
Frequent
Access tier
Infrequent
Access tier
Archive
Instant
Access tier
Deep
Archive
Access tier
Archive
Access tier
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
Considerations for using S3 Intelligent-Tiering Storage
Class
58
• Amazon EMR에서 Hive, Spark, 그리고 Presto
와 같은 오픈 소스 프레임워크
▪ 작업 대상에 Archive Access Tier에 있는 객체가
있는 경우 작업 실패
• Amazon Athena와 Amazon Redshift Spectrum
▪ Query는 오류 없이 결과 값을 반환하지만 Archive
Access Tier에 있는 객체들은 건너뜁니다. 따라서,
예상과 다른 결과 값을 얻을 수 있으므로 Archive
Access Tier 사용 시 주의 필요
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
Amazon S3 Storage Lens overview
59
• 조직 차원의 가시성
• 29개의 스토리지 사용량 및 활동 지표
• 리전, 스토리지 클래스, 버킷 및 접두사별로
드릴다운
• 비용 효율성 및 데이터 보호 모범 사례를 위한
권장 사항
• 통합된 S3 콘솔 경험
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
Example Insights from S3 Storage Lens
60
S3 Storage Lens를 사용하여 계정 또는 전체 AWS 조직에서 % noncurrent
version bytes 및 % incomplete MPU bytes를 확인할 수 있습니다.
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
© 2022, Amazon Web Services, Inc. or its affiliates.
Takeaways
61
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
Takeaways
62
워크로드의 I/O 패턴을
고려한 Keyspace 설계
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
Takeaways
63
워크로드의 I/O 패턴을
고려한 Keyspace 설계
S3가 제공하는 기능들과
AWS Backup을 활용한
데이터 보호
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
Takeaways
64
S3 스토리지 클래스와
분석 도구를 활용한 비용
최적화
워크로드의 I/O 패턴을
고려한 Keyspace 설계
S3가 제공하는 기능들과
AWS Backup을 활용한
데이터 보호
AWS DATA SPECIAL WEBINAR
© 2022, Amazon Web Services, Inc. or its affiliates.
Thank you!
© 2022, Amazon Web Services, Inc. or its affiliates.
박성훈

More Related Content

What's hot

AWS Summit Seoul 2023 | 서버리스, 이제는 데이터 분석에서 활용해요!
AWS Summit Seoul 2023 | 서버리스, 이제는 데이터 분석에서 활용해요!AWS Summit Seoul 2023 | 서버리스, 이제는 데이터 분석에서 활용해요!
AWS Summit Seoul 2023 | 서버리스, 이제는 데이터 분석에서 활용해요!Amazon Web Services Korea
 
AWS와 함께 하는 클라우드 컴퓨팅 - 홍민우 AWS 매니저
AWS와 함께 하는 클라우드 컴퓨팅 - 홍민우 AWS 매니저AWS와 함께 하는 클라우드 컴퓨팅 - 홍민우 AWS 매니저
AWS와 함께 하는 클라우드 컴퓨팅 - 홍민우 AWS 매니저Amazon Web Services Korea
 
AWS Summit Seoul 2023 | 가격은 저렴, 성능은 최대로! 확 달라진 Amazon EC2 알아보기
AWS Summit Seoul 2023 | 가격은 저렴, 성능은 최대로! 확 달라진 Amazon EC2 알아보기AWS Summit Seoul 2023 | 가격은 저렴, 성능은 최대로! 확 달라진 Amazon EC2 알아보기
AWS Summit Seoul 2023 | 가격은 저렴, 성능은 최대로! 확 달라진 Amazon EC2 알아보기Amazon Web Services Korea
 
AWS 네트워크 보안을 위한 계층별 보안 구성 모범 사례 – 조이정, AWS 솔루션즈 아키텍트:: AWS 온라인 이벤트 – 클라우드 보안 특집
AWS 네트워크 보안을 위한 계층별 보안 구성 모범 사례 – 조이정, AWS 솔루션즈 아키텍트:: AWS 온라인 이벤트 – 클라우드 보안 특집AWS 네트워크 보안을 위한 계층별 보안 구성 모범 사례 – 조이정, AWS 솔루션즈 아키텍트:: AWS 온라인 이벤트 – 클라우드 보안 특집
AWS 네트워크 보안을 위한 계층별 보안 구성 모범 사례 – 조이정, AWS 솔루션즈 아키텍트:: AWS 온라인 이벤트 – 클라우드 보안 특집Amazon Web Services Korea
 
Internal Architecture of Amazon Aurora (Level 400) - 발표자: 정달영, APAC RDS Speci...
Internal Architecture of Amazon Aurora (Level 400) - 발표자: 정달영, APAC RDS Speci...Internal Architecture of Amazon Aurora (Level 400) - 발표자: 정달영, APAC RDS Speci...
Internal Architecture of Amazon Aurora (Level 400) - 발표자: 정달영, APAC RDS Speci...Amazon Web Services Korea
 
데이터 분석가를 위한 신규 분석 서비스 - 김기영, AWS 분석 솔루션즈 아키텍트 / 변규현, 당근마켓 소프트웨어 엔지니어 :: AWS r...
데이터 분석가를 위한 신규 분석 서비스 - 김기영, AWS 분석 솔루션즈 아키텍트 / 변규현, 당근마켓 소프트웨어 엔지니어 :: AWS r...데이터 분석가를 위한 신규 분석 서비스 - 김기영, AWS 분석 솔루션즈 아키텍트 / 변규현, 당근마켓 소프트웨어 엔지니어 :: AWS r...
데이터 분석가를 위한 신규 분석 서비스 - 김기영, AWS 분석 솔루션즈 아키텍트 / 변규현, 당근마켓 소프트웨어 엔지니어 :: AWS r...Amazon Web Services Korea
 
AWS Transit Gateway를 통한 Multi-VPC 아키텍처 패턴 - 강동환 솔루션즈 아키텍트, AWS :: AWS Summit ...
AWS Transit Gateway를 통한 Multi-VPC 아키텍처 패턴 - 강동환 솔루션즈 아키텍트, AWS :: AWS Summit ...AWS Transit Gateway를 통한 Multi-VPC 아키텍처 패턴 - 강동환 솔루션즈 아키텍트, AWS :: AWS Summit ...
AWS Transit Gateway를 통한 Multi-VPC 아키텍처 패턴 - 강동환 솔루션즈 아키텍트, AWS :: AWS Summit ...Amazon Web Services Korea
 
Amazon DocumentDB - Architecture 및 Best Practice (Level 200) - 발표자: 장동훈, Sr. ...
Amazon DocumentDB - Architecture 및 Best Practice (Level 200) - 발표자: 장동훈, Sr. ...Amazon DocumentDB - Architecture 및 Best Practice (Level 200) - 발표자: 장동훈, Sr. ...
Amazon DocumentDB - Architecture 및 Best Practice (Level 200) - 발표자: 장동훈, Sr. ...Amazon Web Services Korea
 
AWS DMS를 통한 오라클 DB 마이그레이션 방법 - AWS Summit Seoul 2017
AWS DMS를 통한 오라클 DB 마이그레이션 방법 - AWS Summit Seoul 2017AWS DMS를 통한 오라클 DB 마이그레이션 방법 - AWS Summit Seoul 2017
AWS DMS를 통한 오라클 DB 마이그레이션 방법 - AWS Summit Seoul 2017Amazon Web Services Korea
 
AWS Summit Seoul 2023 | 다중 계정 및 하이브리드 환경에서 안전한 IAM 체계 만들기
AWS Summit Seoul 2023 | 다중 계정 및 하이브리드 환경에서 안전한 IAM 체계 만들기AWS Summit Seoul 2023 | 다중 계정 및 하이브리드 환경에서 안전한 IAM 체계 만들기
AWS Summit Seoul 2023 | 다중 계정 및 하이브리드 환경에서 안전한 IAM 체계 만들기Amazon Web Services Korea
 
모든 데이터를 위한 단 하나의 저장소, Amazon S3 기반 데이터 레이크::정세웅::AWS Summit Seoul 2018
모든 데이터를 위한 단 하나의 저장소, Amazon S3 기반 데이터 레이크::정세웅::AWS Summit Seoul 2018모든 데이터를 위한 단 하나의 저장소, Amazon S3 기반 데이터 레이크::정세웅::AWS Summit Seoul 2018
모든 데이터를 위한 단 하나의 저장소, Amazon S3 기반 데이터 레이크::정세웅::AWS Summit Seoul 2018Amazon Web Services Korea
 
20191023 AWS Black Belt Online Seminar Amazon EMR
20191023 AWS Black Belt Online Seminar Amazon EMR20191023 AWS Black Belt Online Seminar Amazon EMR
20191023 AWS Black Belt Online Seminar Amazon EMRAmazon Web Services Japan
 
대규모 온프레미스 하둡 마이그레이션을 위한 실행 전략과 최적화 방안 소개-유철민, AWS Data Architect / 박성열,AWS Pr...
대규모 온프레미스 하둡 마이그레이션을 위한 실행 전략과 최적화 방안 소개-유철민, AWS Data Architect / 박성열,AWS Pr...대규모 온프레미스 하둡 마이그레이션을 위한 실행 전략과 최적화 방안 소개-유철민, AWS Data Architect / 박성열,AWS Pr...
대규모 온프레미스 하둡 마이그레이션을 위한 실행 전략과 최적화 방안 소개-유철민, AWS Data Architect / 박성열,AWS Pr...Amazon Web Services Korea
 
CloudWatch 성능 모니터링과 신속한 대응을 위한 노하우 - 박선용 솔루션즈 아키텍트:: AWS Cloud Track 3 Gaming
CloudWatch 성능 모니터링과 신속한 대응을 위한 노하우 - 박선용 솔루션즈 아키텍트:: AWS Cloud Track 3 GamingCloudWatch 성능 모니터링과 신속한 대응을 위한 노하우 - 박선용 솔루션즈 아키텍트:: AWS Cloud Track 3 Gaming
CloudWatch 성능 모니터링과 신속한 대응을 위한 노하우 - 박선용 솔루션즈 아키텍트:: AWS Cloud Track 3 GamingAmazon Web Services Korea
 
Amazon Redshift Deep Dive - Serverless, Streaming, ML, Auto Copy (New feature...
Amazon Redshift Deep Dive - Serverless, Streaming, ML, Auto Copy (New feature...Amazon Redshift Deep Dive - Serverless, Streaming, ML, Auto Copy (New feature...
Amazon Redshift Deep Dive - Serverless, Streaming, ML, Auto Copy (New feature...Amazon Web Services Korea
 
사례로 알아보는 Database Migration Service : 데이터베이스 및 데이터 이관, 통합, 분리, 분석의 도구 - 발표자: ...
사례로 알아보는 Database Migration Service : 데이터베이스 및 데이터 이관, 통합, 분리, 분석의 도구 - 발표자: ...사례로 알아보는 Database Migration Service : 데이터베이스 및 데이터 이관, 통합, 분리, 분석의 도구 - 발표자: ...
사례로 알아보는 Database Migration Service : 데이터베이스 및 데이터 이관, 통합, 분리, 분석의 도구 - 발표자: ...Amazon Web Services Korea
 
Amazon OpenSearch - Use Cases, Security/Observability, Serverless and Enhance...
Amazon OpenSearch - Use Cases, Security/Observability, Serverless and Enhance...Amazon OpenSearch - Use Cases, Security/Observability, Serverless and Enhance...
Amazon OpenSearch - Use Cases, Security/Observability, Serverless and Enhance...Amazon Web Services Korea
 
AWS Lambda를 기반으로한 실시간 빅테이터 처리하기
AWS Lambda를 기반으로한 실시간 빅테이터 처리하기AWS Lambda를 기반으로한 실시간 빅테이터 처리하기
AWS Lambda를 기반으로한 실시간 빅테이터 처리하기Amazon Web Services Korea
 
AWS Summit Seoul 2023 | 롯데면세점이 고객에게 차별화된 경험을 제공하는 방법: AWS Native 서비스를 활용한 초개인...
AWS Summit Seoul 2023 | 롯데면세점이 고객에게 차별화된 경험을 제공하는 방법: AWS Native 서비스를 활용한 초개인...AWS Summit Seoul 2023 | 롯데면세점이 고객에게 차별화된 경험을 제공하는 방법: AWS Native 서비스를 활용한 초개인...
AWS Summit Seoul 2023 | 롯데면세점이 고객에게 차별화된 경험을 제공하는 방법: AWS Native 서비스를 활용한 초개인...Amazon Web Services Korea
 

What's hot (20)

AWS Summit Seoul 2023 | 서버리스, 이제는 데이터 분석에서 활용해요!
AWS Summit Seoul 2023 | 서버리스, 이제는 데이터 분석에서 활용해요!AWS Summit Seoul 2023 | 서버리스, 이제는 데이터 분석에서 활용해요!
AWS Summit Seoul 2023 | 서버리스, 이제는 데이터 분석에서 활용해요!
 
AWS와 함께 하는 클라우드 컴퓨팅 - 홍민우 AWS 매니저
AWS와 함께 하는 클라우드 컴퓨팅 - 홍민우 AWS 매니저AWS와 함께 하는 클라우드 컴퓨팅 - 홍민우 AWS 매니저
AWS와 함께 하는 클라우드 컴퓨팅 - 홍민우 AWS 매니저
 
AWS Summit Seoul 2023 | 가격은 저렴, 성능은 최대로! 확 달라진 Amazon EC2 알아보기
AWS Summit Seoul 2023 | 가격은 저렴, 성능은 최대로! 확 달라진 Amazon EC2 알아보기AWS Summit Seoul 2023 | 가격은 저렴, 성능은 최대로! 확 달라진 Amazon EC2 알아보기
AWS Summit Seoul 2023 | 가격은 저렴, 성능은 최대로! 확 달라진 Amazon EC2 알아보기
 
AWS 네트워크 보안을 위한 계층별 보안 구성 모범 사례 – 조이정, AWS 솔루션즈 아키텍트:: AWS 온라인 이벤트 – 클라우드 보안 특집
AWS 네트워크 보안을 위한 계층별 보안 구성 모범 사례 – 조이정, AWS 솔루션즈 아키텍트:: AWS 온라인 이벤트 – 클라우드 보안 특집AWS 네트워크 보안을 위한 계층별 보안 구성 모범 사례 – 조이정, AWS 솔루션즈 아키텍트:: AWS 온라인 이벤트 – 클라우드 보안 특집
AWS 네트워크 보안을 위한 계층별 보안 구성 모범 사례 – 조이정, AWS 솔루션즈 아키텍트:: AWS 온라인 이벤트 – 클라우드 보안 특집
 
Internal Architecture of Amazon Aurora (Level 400) - 발표자: 정달영, APAC RDS Speci...
Internal Architecture of Amazon Aurora (Level 400) - 발표자: 정달영, APAC RDS Speci...Internal Architecture of Amazon Aurora (Level 400) - 발표자: 정달영, APAC RDS Speci...
Internal Architecture of Amazon Aurora (Level 400) - 발표자: 정달영, APAC RDS Speci...
 
데이터 분석가를 위한 신규 분석 서비스 - 김기영, AWS 분석 솔루션즈 아키텍트 / 변규현, 당근마켓 소프트웨어 엔지니어 :: AWS r...
데이터 분석가를 위한 신규 분석 서비스 - 김기영, AWS 분석 솔루션즈 아키텍트 / 변규현, 당근마켓 소프트웨어 엔지니어 :: AWS r...데이터 분석가를 위한 신규 분석 서비스 - 김기영, AWS 분석 솔루션즈 아키텍트 / 변규현, 당근마켓 소프트웨어 엔지니어 :: AWS r...
데이터 분석가를 위한 신규 분석 서비스 - 김기영, AWS 분석 솔루션즈 아키텍트 / 변규현, 당근마켓 소프트웨어 엔지니어 :: AWS r...
 
Amazon DynamoDB 키 디자인 패턴
Amazon DynamoDB 키 디자인 패턴Amazon DynamoDB 키 디자인 패턴
Amazon DynamoDB 키 디자인 패턴
 
AWS Transit Gateway를 통한 Multi-VPC 아키텍처 패턴 - 강동환 솔루션즈 아키텍트, AWS :: AWS Summit ...
AWS Transit Gateway를 통한 Multi-VPC 아키텍처 패턴 - 강동환 솔루션즈 아키텍트, AWS :: AWS Summit ...AWS Transit Gateway를 통한 Multi-VPC 아키텍처 패턴 - 강동환 솔루션즈 아키텍트, AWS :: AWS Summit ...
AWS Transit Gateway를 통한 Multi-VPC 아키텍처 패턴 - 강동환 솔루션즈 아키텍트, AWS :: AWS Summit ...
 
Amazon DocumentDB - Architecture 및 Best Practice (Level 200) - 발표자: 장동훈, Sr. ...
Amazon DocumentDB - Architecture 및 Best Practice (Level 200) - 발표자: 장동훈, Sr. ...Amazon DocumentDB - Architecture 및 Best Practice (Level 200) - 발표자: 장동훈, Sr. ...
Amazon DocumentDB - Architecture 및 Best Practice (Level 200) - 발표자: 장동훈, Sr. ...
 
AWS DMS를 통한 오라클 DB 마이그레이션 방법 - AWS Summit Seoul 2017
AWS DMS를 통한 오라클 DB 마이그레이션 방법 - AWS Summit Seoul 2017AWS DMS를 통한 오라클 DB 마이그레이션 방법 - AWS Summit Seoul 2017
AWS DMS를 통한 오라클 DB 마이그레이션 방법 - AWS Summit Seoul 2017
 
AWS Summit Seoul 2023 | 다중 계정 및 하이브리드 환경에서 안전한 IAM 체계 만들기
AWS Summit Seoul 2023 | 다중 계정 및 하이브리드 환경에서 안전한 IAM 체계 만들기AWS Summit Seoul 2023 | 다중 계정 및 하이브리드 환경에서 안전한 IAM 체계 만들기
AWS Summit Seoul 2023 | 다중 계정 및 하이브리드 환경에서 안전한 IAM 체계 만들기
 
모든 데이터를 위한 단 하나의 저장소, Amazon S3 기반 데이터 레이크::정세웅::AWS Summit Seoul 2018
모든 데이터를 위한 단 하나의 저장소, Amazon S3 기반 데이터 레이크::정세웅::AWS Summit Seoul 2018모든 데이터를 위한 단 하나의 저장소, Amazon S3 기반 데이터 레이크::정세웅::AWS Summit Seoul 2018
모든 데이터를 위한 단 하나의 저장소, Amazon S3 기반 데이터 레이크::정세웅::AWS Summit Seoul 2018
 
20191023 AWS Black Belt Online Seminar Amazon EMR
20191023 AWS Black Belt Online Seminar Amazon EMR20191023 AWS Black Belt Online Seminar Amazon EMR
20191023 AWS Black Belt Online Seminar Amazon EMR
 
대규모 온프레미스 하둡 마이그레이션을 위한 실행 전략과 최적화 방안 소개-유철민, AWS Data Architect / 박성열,AWS Pr...
대규모 온프레미스 하둡 마이그레이션을 위한 실행 전략과 최적화 방안 소개-유철민, AWS Data Architect / 박성열,AWS Pr...대규모 온프레미스 하둡 마이그레이션을 위한 실행 전략과 최적화 방안 소개-유철민, AWS Data Architect / 박성열,AWS Pr...
대규모 온프레미스 하둡 마이그레이션을 위한 실행 전략과 최적화 방안 소개-유철민, AWS Data Architect / 박성열,AWS Pr...
 
CloudWatch 성능 모니터링과 신속한 대응을 위한 노하우 - 박선용 솔루션즈 아키텍트:: AWS Cloud Track 3 Gaming
CloudWatch 성능 모니터링과 신속한 대응을 위한 노하우 - 박선용 솔루션즈 아키텍트:: AWS Cloud Track 3 GamingCloudWatch 성능 모니터링과 신속한 대응을 위한 노하우 - 박선용 솔루션즈 아키텍트:: AWS Cloud Track 3 Gaming
CloudWatch 성능 모니터링과 신속한 대응을 위한 노하우 - 박선용 솔루션즈 아키텍트:: AWS Cloud Track 3 Gaming
 
Amazon Redshift Deep Dive - Serverless, Streaming, ML, Auto Copy (New feature...
Amazon Redshift Deep Dive - Serverless, Streaming, ML, Auto Copy (New feature...Amazon Redshift Deep Dive - Serverless, Streaming, ML, Auto Copy (New feature...
Amazon Redshift Deep Dive - Serverless, Streaming, ML, Auto Copy (New feature...
 
사례로 알아보는 Database Migration Service : 데이터베이스 및 데이터 이관, 통합, 분리, 분석의 도구 - 발표자: ...
사례로 알아보는 Database Migration Service : 데이터베이스 및 데이터 이관, 통합, 분리, 분석의 도구 - 발표자: ...사례로 알아보는 Database Migration Service : 데이터베이스 및 데이터 이관, 통합, 분리, 분석의 도구 - 발표자: ...
사례로 알아보는 Database Migration Service : 데이터베이스 및 데이터 이관, 통합, 분리, 분석의 도구 - 발표자: ...
 
Amazon OpenSearch - Use Cases, Security/Observability, Serverless and Enhance...
Amazon OpenSearch - Use Cases, Security/Observability, Serverless and Enhance...Amazon OpenSearch - Use Cases, Security/Observability, Serverless and Enhance...
Amazon OpenSearch - Use Cases, Security/Observability, Serverless and Enhance...
 
AWS Lambda를 기반으로한 실시간 빅테이터 처리하기
AWS Lambda를 기반으로한 실시간 빅테이터 처리하기AWS Lambda를 기반으로한 실시간 빅테이터 처리하기
AWS Lambda를 기반으로한 실시간 빅테이터 처리하기
 
AWS Summit Seoul 2023 | 롯데면세점이 고객에게 차별화된 경험을 제공하는 방법: AWS Native 서비스를 활용한 초개인...
AWS Summit Seoul 2023 | 롯데면세점이 고객에게 차별화된 경험을 제공하는 방법: AWS Native 서비스를 활용한 초개인...AWS Summit Seoul 2023 | 롯데면세점이 고객에게 차별화된 경험을 제공하는 방법: AWS Native 서비스를 활용한 초개인...
AWS Summit Seoul 2023 | 롯데면세점이 고객에게 차별화된 경험을 제공하는 방법: AWS Native 서비스를 활용한 초개인...
 

Similar to 워크로드 특성에 따른 안전하고 효율적인 Data Lake 운영 방안

코리안리 - 데이터 분석 플랫폼 구축 여정, 그 시작과 과제 - 발표자: 김석기 그룹장, 데이터비즈니스센터, 메가존클라우드 ::: AWS ...
코리안리 - 데이터 분석 플랫폼 구축 여정, 그 시작과 과제 - 발표자: 김석기 그룹장, 데이터비즈니스센터, 메가존클라우드 ::: AWS ...코리안리 - 데이터 분석 플랫폼 구축 여정, 그 시작과 과제 - 발표자: 김석기 그룹장, 데이터비즈니스센터, 메가존클라우드 ::: AWS ...
코리안리 - 데이터 분석 플랫폼 구축 여정, 그 시작과 과제 - 발표자: 김석기 그룹장, 데이터비즈니스센터, 메가존클라우드 ::: AWS ...Amazon Web Services Korea
 
[보험사를 위한 AWS Data Analytics Day] 5_KB금융그룹과 계열사의 AWS 기ᄇ...
[보험사를 위한 AWS Data Analytics Day] 5_KB금융그룹과 계열사의 AWS 기ᄇ...[보험사를 위한 AWS Data Analytics Day] 5_KB금융그룹과 계열사의 AWS 기ᄇ...
[보험사를 위한 AWS Data Analytics Day] 5_KB금융그룹과 계열사의 AWS 기ᄇ...AWS Korea 금융산업팀
 
[보험사를 위한 AWS Data Analytics Day] 5_KB금융그룹과 계열사의 AWS 기ᄇ...
[보험사를 위한 AWS Data Analytics Day] 5_KB금융그룹과 계열사의 AWS 기ᄇ...[보험사를 위한 AWS Data Analytics Day] 5_KB금융그룹과 계열사의 AWS 기ᄇ...
[보험사를 위한 AWS Data Analytics Day] 5_KB금융그룹과 계열사의 AWS 기ᄇ...AWS Korea 금융산업팀
 
AWS Summit Seoul 2023 | 데이터, 분석 및 AI를 통합하는 단 하나의 레이크하우스, Databricks on AWS 로 ...
AWS Summit Seoul 2023 | 데이터, 분석 및 AI를 통합하는 단 하나의 레이크하우스, Databricks on AWS 로 ...AWS Summit Seoul 2023 | 데이터, 분석 및 AI를 통합하는 단 하나의 레이크하우스, Databricks on AWS 로 ...
AWS Summit Seoul 2023 | 데이터, 분석 및 AI를 통합하는 단 하나의 레이크하우스, Databricks on AWS 로 ...Amazon Web Services Korea
 
[보험사를 위한 AWS Data Analytics Day] 6_Data Analytics의 현재와 미래-토ᄉ...
[보험사를 위한 AWS Data Analytics Day] 6_Data Analytics의 현재와 미래-토ᄉ...[보험사를 위한 AWS Data Analytics Day] 6_Data Analytics의 현재와 미래-토ᄉ...
[보험사를 위한 AWS Data Analytics Day] 6_Data Analytics의 현재와 미래-토ᄉ...AWS Korea 금융산업팀
 
스토리지 분야 신규 서비스 - 이창익, AWS 마이그레이션 스페셜리스트 :: AWS re:Invent re:Cap 2021
스토리지 분야 신규 서비스 - 이창익, AWS 마이그레이션 스페셜리스트 :: AWS re:Invent re:Cap 2021스토리지 분야 신규 서비스 - 이창익, AWS 마이그레이션 스페셜리스트 :: AWS re:Invent re:Cap 2021
스토리지 분야 신규 서비스 - 이창익, AWS 마이그레이션 스페셜리스트 :: AWS re:Invent re:Cap 2021Amazon Web Services Korea
 
AWS Summit Seoul 2023 | AWS의 관리형 VDI 서비스! 알고 계셨나요?
AWS Summit Seoul 2023 | AWS의 관리형 VDI 서비스! 알고 계셨나요?AWS Summit Seoul 2023 | AWS의 관리형 VDI 서비스! 알고 계셨나요?
AWS Summit Seoul 2023 | AWS의 관리형 VDI 서비스! 알고 계셨나요?Amazon Web Services Korea
 
SK Telecom - 망관리 프로젝트 TANGO의 오픈소스 데이터베이스 전환 여정 - 발표자 : 박승전, Project Manager, ...
SK Telecom - 망관리 프로젝트 TANGO의 오픈소스 데이터베이스 전환 여정 - 발표자 : 박승전, Project Manager, ...SK Telecom - 망관리 프로젝트 TANGO의 오픈소스 데이터베이스 전환 여정 - 발표자 : 박승전, Project Manager, ...
SK Telecom - 망관리 프로젝트 TANGO의 오픈소스 데이터베이스 전환 여정 - 발표자 : 박승전, Project Manager, ...Amazon Web Services Korea
 
데이터 분석플랫폼을 위한 데이터 전처리부터 시각화까지 한번에 보기 - 노인철 AWS 솔루션즈 아키텍트 :: AWS Summit Seoul ...
데이터 분석플랫폼을 위한 데이터 전처리부터 시각화까지 한번에 보기 - 노인철 AWS 솔루션즈 아키텍트 :: AWS Summit Seoul ...데이터 분석플랫폼을 위한 데이터 전처리부터 시각화까지 한번에 보기 - 노인철 AWS 솔루션즈 아키텍트 :: AWS Summit Seoul ...
데이터 분석플랫폼을 위한 데이터 전처리부터 시각화까지 한번에 보기 - 노인철 AWS 솔루션즈 아키텍트 :: AWS Summit Seoul ...Amazon Web Services Korea
 
게임의 성공을 위한 Scalable 한 데이터 플랫폼 사례 공유 - 오승용, 데이터 플랫폼 리더, 데브시스터즈 ::: Games on AW...
게임의 성공을 위한 Scalable 한 데이터 플랫폼 사례 공유 - 오승용, 데이터 플랫폼 리더, 데브시스터즈 ::: Games on AW...게임의 성공을 위한 Scalable 한 데이터 플랫폼 사례 공유 - 오승용, 데이터 플랫폼 리더, 데브시스터즈 ::: Games on AW...
게임의 성공을 위한 Scalable 한 데이터 플랫폼 사례 공유 - 오승용, 데이터 플랫폼 리더, 데브시스터즈 ::: Games on AW...Amazon Web Services Korea
 
분석 워크로드 마이그레이션의 모든 것-김기영, AWS Analytics Specialist SA / 김성일, AWS Analytics Sp...
분석 워크로드 마이그레이션의 모든 것-김기영, AWS Analytics Specialist SA / 김성일, AWS Analytics Sp...분석 워크로드 마이그레이션의 모든 것-김기영, AWS Analytics Specialist SA / 김성일, AWS Analytics Sp...
분석 워크로드 마이그레이션의 모든 것-김기영, AWS Analytics Specialist SA / 김성일, AWS Analytics Sp...Amazon Web Services Korea
 
AWS Summit Seoul 2023 | MongoDB Atlas와 함께하는 Developer Data Platform
AWS Summit Seoul 2023 | MongoDB Atlas와 함께하는 Developer Data PlatformAWS Summit Seoul 2023 | MongoDB Atlas와 함께하는 Developer Data Platform
AWS Summit Seoul 2023 | MongoDB Atlas와 함께하는 Developer Data PlatformAmazon Web Services Korea
 
기술 지원 사례로 알아보는 마이그레이션 이슈 및 해결 방안 모음-김용기, AWS Storage Specialist SA / 한소영, AWS...
기술 지원 사례로 알아보는 마이그레이션 이슈 및 해결 방안 모음-김용기, AWS Storage Specialist SA / 한소영, AWS...기술 지원 사례로 알아보는 마이그레이션 이슈 및 해결 방안 모음-김용기, AWS Storage Specialist SA / 한소영, AWS...
기술 지원 사례로 알아보는 마이그레이션 이슈 및 해결 방안 모음-김용기, AWS Storage Specialist SA / 한소영, AWS...Amazon Web Services Korea
 
[금융고객을 위한 AWS re:Invent 2022 re:Cap] 3.AWS reInvent 2022 Technical Highlights...
[금융고객을 위한 AWS re:Invent 2022 re:Cap] 3.AWS reInvent 2022 Technical Highlights...[금융고객을 위한 AWS re:Invent 2022 re:Cap] 3.AWS reInvent 2022 Technical Highlights...
[금융고객을 위한 AWS re:Invent 2022 re:Cap] 3.AWS reInvent 2022 Technical Highlights...AWS Korea 금융산업팀
 
AWS Summit Seoul 2023 | 오픈소스 데이터베이스로 탈 오라클! Why not?
AWS Summit Seoul 2023 | 오픈소스 데이터베이스로 탈 오라클! Why not?AWS Summit Seoul 2023 | 오픈소스 데이터베이스로 탈 오라클! Why not?
AWS Summit Seoul 2023 | 오픈소스 데이터베이스로 탈 오라클! Why not?Amazon Web Services Korea
 
서버리스 기반 데이터베이스 모델링 및 운영 노하우 알아보기 - 변규현 SW 엔지니어, 당근마켓 / 김선형 CTO, 티클 :: AWS Sum...
서버리스 기반 데이터베이스 모델링 및 운영 노하우 알아보기 - 변규현 SW 엔지니어, 당근마켓 / 김선형 CTO, 티클 :: AWS Sum...서버리스 기반 데이터베이스 모델링 및 운영 노하우 알아보기 - 변규현 SW 엔지니어, 당근마켓 / 김선형 CTO, 티클 :: AWS Sum...
서버리스 기반 데이터베이스 모델링 및 운영 노하우 알아보기 - 변규현 SW 엔지니어, 당근마켓 / 김선형 CTO, 티클 :: AWS Sum...Amazon Web Services Korea
 
AWS Summit Seoul 2023 | Snowflake: 모든 데이터 워크로드를 위한 하나의 클라우드 데이터 플랫폼
AWS Summit Seoul 2023 | Snowflake: 모든 데이터 워크로드를 위한 하나의 클라우드 데이터 플랫폼AWS Summit Seoul 2023 | Snowflake: 모든 데이터 워크로드를 위한 하나의 클라우드 데이터 플랫폼
AWS Summit Seoul 2023 | Snowflake: 모든 데이터 워크로드를 위한 하나의 클라우드 데이터 플랫폼Amazon Web Services Korea
 
[금융고객을 위한 Resiliency in the Cloud] AWS를 활용한 금융사 Resiliency 구성...
[금융고객을 위한 Resiliency in the Cloud] AWS를 활용한 금융사 Resiliency 구성...[금융고객을 위한 Resiliency in the Cloud] AWS를 활용한 금융사 Resiliency 구성...
[금융고객을 위한 Resiliency in the Cloud] AWS를 활용한 금융사 Resiliency 구성...AWS Korea 금융산업팀
 
KB국민카드 - 클라우드 기반 분석 플랫폼 혁신 여정 - 발표자: 박창용 과장, 데이터전략본부, AI혁신부, KB카드│강병억, Soluti...
KB국민카드 - 클라우드 기반 분석 플랫폼 혁신 여정 - 발표자: 박창용 과장, 데이터전략본부, AI혁신부, KB카드│강병억, Soluti...KB국민카드 - 클라우드 기반 분석 플랫폼 혁신 여정 - 발표자: 박창용 과장, 데이터전략본부, AI혁신부, KB카드│강병억, Soluti...
KB국민카드 - 클라우드 기반 분석 플랫폼 혁신 여정 - 발표자: 박창용 과장, 데이터전략본부, AI혁신부, KB카드│강병억, Soluti...Amazon Web Services Korea
 
변화와 혁신을 위한 클라우드 마이그레이션 – 김진우 AWS 어카운트 매니저, 이아영 네오위즈 가버너스팀 팀장, 박주희 우아한형제들 시스템신...
변화와 혁신을 위한 클라우드 마이그레이션 – 김진우 AWS 어카운트 매니저, 이아영 네오위즈 가버너스팀 팀장, 박주희 우아한형제들 시스템신...변화와 혁신을 위한 클라우드 마이그레이션 – 김진우 AWS 어카운트 매니저, 이아영 네오위즈 가버너스팀 팀장, 박주희 우아한형제들 시스템신...
변화와 혁신을 위한 클라우드 마이그레이션 – 김진우 AWS 어카운트 매니저, 이아영 네오위즈 가버너스팀 팀장, 박주희 우아한형제들 시스템신...Amazon Web Services Korea
 

Similar to 워크로드 특성에 따른 안전하고 효율적인 Data Lake 운영 방안 (20)

코리안리 - 데이터 분석 플랫폼 구축 여정, 그 시작과 과제 - 발표자: 김석기 그룹장, 데이터비즈니스센터, 메가존클라우드 ::: AWS ...
코리안리 - 데이터 분석 플랫폼 구축 여정, 그 시작과 과제 - 발표자: 김석기 그룹장, 데이터비즈니스센터, 메가존클라우드 ::: AWS ...코리안리 - 데이터 분석 플랫폼 구축 여정, 그 시작과 과제 - 발표자: 김석기 그룹장, 데이터비즈니스센터, 메가존클라우드 ::: AWS ...
코리안리 - 데이터 분석 플랫폼 구축 여정, 그 시작과 과제 - 발표자: 김석기 그룹장, 데이터비즈니스센터, 메가존클라우드 ::: AWS ...
 
[보험사를 위한 AWS Data Analytics Day] 5_KB금융그룹과 계열사의 AWS 기ᄇ...
[보험사를 위한 AWS Data Analytics Day] 5_KB금융그룹과 계열사의 AWS 기ᄇ...[보험사를 위한 AWS Data Analytics Day] 5_KB금융그룹과 계열사의 AWS 기ᄇ...
[보험사를 위한 AWS Data Analytics Day] 5_KB금융그룹과 계열사의 AWS 기ᄇ...
 
[보험사를 위한 AWS Data Analytics Day] 5_KB금융그룹과 계열사의 AWS 기ᄇ...
[보험사를 위한 AWS Data Analytics Day] 5_KB금융그룹과 계열사의 AWS 기ᄇ...[보험사를 위한 AWS Data Analytics Day] 5_KB금융그룹과 계열사의 AWS 기ᄇ...
[보험사를 위한 AWS Data Analytics Day] 5_KB금융그룹과 계열사의 AWS 기ᄇ...
 
AWS Summit Seoul 2023 | 데이터, 분석 및 AI를 통합하는 단 하나의 레이크하우스, Databricks on AWS 로 ...
AWS Summit Seoul 2023 | 데이터, 분석 및 AI를 통합하는 단 하나의 레이크하우스, Databricks on AWS 로 ...AWS Summit Seoul 2023 | 데이터, 분석 및 AI를 통합하는 단 하나의 레이크하우스, Databricks on AWS 로 ...
AWS Summit Seoul 2023 | 데이터, 분석 및 AI를 통합하는 단 하나의 레이크하우스, Databricks on AWS 로 ...
 
[보험사를 위한 AWS Data Analytics Day] 6_Data Analytics의 현재와 미래-토ᄉ...
[보험사를 위한 AWS Data Analytics Day] 6_Data Analytics의 현재와 미래-토ᄉ...[보험사를 위한 AWS Data Analytics Day] 6_Data Analytics의 현재와 미래-토ᄉ...
[보험사를 위한 AWS Data Analytics Day] 6_Data Analytics의 현재와 미래-토ᄉ...
 
스토리지 분야 신규 서비스 - 이창익, AWS 마이그레이션 스페셜리스트 :: AWS re:Invent re:Cap 2021
스토리지 분야 신규 서비스 - 이창익, AWS 마이그레이션 스페셜리스트 :: AWS re:Invent re:Cap 2021스토리지 분야 신규 서비스 - 이창익, AWS 마이그레이션 스페셜리스트 :: AWS re:Invent re:Cap 2021
스토리지 분야 신규 서비스 - 이창익, AWS 마이그레이션 스페셜리스트 :: AWS re:Invent re:Cap 2021
 
AWS Summit Seoul 2023 | AWS의 관리형 VDI 서비스! 알고 계셨나요?
AWS Summit Seoul 2023 | AWS의 관리형 VDI 서비스! 알고 계셨나요?AWS Summit Seoul 2023 | AWS의 관리형 VDI 서비스! 알고 계셨나요?
AWS Summit Seoul 2023 | AWS의 관리형 VDI 서비스! 알고 계셨나요?
 
SK Telecom - 망관리 프로젝트 TANGO의 오픈소스 데이터베이스 전환 여정 - 발표자 : 박승전, Project Manager, ...
SK Telecom - 망관리 프로젝트 TANGO의 오픈소스 데이터베이스 전환 여정 - 발표자 : 박승전, Project Manager, ...SK Telecom - 망관리 프로젝트 TANGO의 오픈소스 데이터베이스 전환 여정 - 발표자 : 박승전, Project Manager, ...
SK Telecom - 망관리 프로젝트 TANGO의 오픈소스 데이터베이스 전환 여정 - 발표자 : 박승전, Project Manager, ...
 
데이터 분석플랫폼을 위한 데이터 전처리부터 시각화까지 한번에 보기 - 노인철 AWS 솔루션즈 아키텍트 :: AWS Summit Seoul ...
데이터 분석플랫폼을 위한 데이터 전처리부터 시각화까지 한번에 보기 - 노인철 AWS 솔루션즈 아키텍트 :: AWS Summit Seoul ...데이터 분석플랫폼을 위한 데이터 전처리부터 시각화까지 한번에 보기 - 노인철 AWS 솔루션즈 아키텍트 :: AWS Summit Seoul ...
데이터 분석플랫폼을 위한 데이터 전처리부터 시각화까지 한번에 보기 - 노인철 AWS 솔루션즈 아키텍트 :: AWS Summit Seoul ...
 
게임의 성공을 위한 Scalable 한 데이터 플랫폼 사례 공유 - 오승용, 데이터 플랫폼 리더, 데브시스터즈 ::: Games on AW...
게임의 성공을 위한 Scalable 한 데이터 플랫폼 사례 공유 - 오승용, 데이터 플랫폼 리더, 데브시스터즈 ::: Games on AW...게임의 성공을 위한 Scalable 한 데이터 플랫폼 사례 공유 - 오승용, 데이터 플랫폼 리더, 데브시스터즈 ::: Games on AW...
게임의 성공을 위한 Scalable 한 데이터 플랫폼 사례 공유 - 오승용, 데이터 플랫폼 리더, 데브시스터즈 ::: Games on AW...
 
분석 워크로드 마이그레이션의 모든 것-김기영, AWS Analytics Specialist SA / 김성일, AWS Analytics Sp...
분석 워크로드 마이그레이션의 모든 것-김기영, AWS Analytics Specialist SA / 김성일, AWS Analytics Sp...분석 워크로드 마이그레이션의 모든 것-김기영, AWS Analytics Specialist SA / 김성일, AWS Analytics Sp...
분석 워크로드 마이그레이션의 모든 것-김기영, AWS Analytics Specialist SA / 김성일, AWS Analytics Sp...
 
AWS Summit Seoul 2023 | MongoDB Atlas와 함께하는 Developer Data Platform
AWS Summit Seoul 2023 | MongoDB Atlas와 함께하는 Developer Data PlatformAWS Summit Seoul 2023 | MongoDB Atlas와 함께하는 Developer Data Platform
AWS Summit Seoul 2023 | MongoDB Atlas와 함께하는 Developer Data Platform
 
기술 지원 사례로 알아보는 마이그레이션 이슈 및 해결 방안 모음-김용기, AWS Storage Specialist SA / 한소영, AWS...
기술 지원 사례로 알아보는 마이그레이션 이슈 및 해결 방안 모음-김용기, AWS Storage Specialist SA / 한소영, AWS...기술 지원 사례로 알아보는 마이그레이션 이슈 및 해결 방안 모음-김용기, AWS Storage Specialist SA / 한소영, AWS...
기술 지원 사례로 알아보는 마이그레이션 이슈 및 해결 방안 모음-김용기, AWS Storage Specialist SA / 한소영, AWS...
 
[금융고객을 위한 AWS re:Invent 2022 re:Cap] 3.AWS reInvent 2022 Technical Highlights...
[금융고객을 위한 AWS re:Invent 2022 re:Cap] 3.AWS reInvent 2022 Technical Highlights...[금융고객을 위한 AWS re:Invent 2022 re:Cap] 3.AWS reInvent 2022 Technical Highlights...
[금융고객을 위한 AWS re:Invent 2022 re:Cap] 3.AWS reInvent 2022 Technical Highlights...
 
AWS Summit Seoul 2023 | 오픈소스 데이터베이스로 탈 오라클! Why not?
AWS Summit Seoul 2023 | 오픈소스 데이터베이스로 탈 오라클! Why not?AWS Summit Seoul 2023 | 오픈소스 데이터베이스로 탈 오라클! Why not?
AWS Summit Seoul 2023 | 오픈소스 데이터베이스로 탈 오라클! Why not?
 
서버리스 기반 데이터베이스 모델링 및 운영 노하우 알아보기 - 변규현 SW 엔지니어, 당근마켓 / 김선형 CTO, 티클 :: AWS Sum...
서버리스 기반 데이터베이스 모델링 및 운영 노하우 알아보기 - 변규현 SW 엔지니어, 당근마켓 / 김선형 CTO, 티클 :: AWS Sum...서버리스 기반 데이터베이스 모델링 및 운영 노하우 알아보기 - 변규현 SW 엔지니어, 당근마켓 / 김선형 CTO, 티클 :: AWS Sum...
서버리스 기반 데이터베이스 모델링 및 운영 노하우 알아보기 - 변규현 SW 엔지니어, 당근마켓 / 김선형 CTO, 티클 :: AWS Sum...
 
AWS Summit Seoul 2023 | Snowflake: 모든 데이터 워크로드를 위한 하나의 클라우드 데이터 플랫폼
AWS Summit Seoul 2023 | Snowflake: 모든 데이터 워크로드를 위한 하나의 클라우드 데이터 플랫폼AWS Summit Seoul 2023 | Snowflake: 모든 데이터 워크로드를 위한 하나의 클라우드 데이터 플랫폼
AWS Summit Seoul 2023 | Snowflake: 모든 데이터 워크로드를 위한 하나의 클라우드 데이터 플랫폼
 
[금융고객을 위한 Resiliency in the Cloud] AWS를 활용한 금융사 Resiliency 구성...
[금융고객을 위한 Resiliency in the Cloud] AWS를 활용한 금융사 Resiliency 구성...[금융고객을 위한 Resiliency in the Cloud] AWS를 활용한 금융사 Resiliency 구성...
[금융고객을 위한 Resiliency in the Cloud] AWS를 활용한 금융사 Resiliency 구성...
 
KB국민카드 - 클라우드 기반 분석 플랫폼 혁신 여정 - 발표자: 박창용 과장, 데이터전략본부, AI혁신부, KB카드│강병억, Soluti...
KB국민카드 - 클라우드 기반 분석 플랫폼 혁신 여정 - 발표자: 박창용 과장, 데이터전략본부, AI혁신부, KB카드│강병억, Soluti...KB국민카드 - 클라우드 기반 분석 플랫폼 혁신 여정 - 발표자: 박창용 과장, 데이터전략본부, AI혁신부, KB카드│강병억, Soluti...
KB국민카드 - 클라우드 기반 분석 플랫폼 혁신 여정 - 발표자: 박창용 과장, 데이터전략본부, AI혁신부, KB카드│강병억, Soluti...
 
변화와 혁신을 위한 클라우드 마이그레이션 – 김진우 AWS 어카운트 매니저, 이아영 네오위즈 가버너스팀 팀장, 박주희 우아한형제들 시스템신...
변화와 혁신을 위한 클라우드 마이그레이션 – 김진우 AWS 어카운트 매니저, 이아영 네오위즈 가버너스팀 팀장, 박주희 우아한형제들 시스템신...변화와 혁신을 위한 클라우드 마이그레이션 – 김진우 AWS 어카운트 매니저, 이아영 네오위즈 가버너스팀 팀장, 박주희 우아한형제들 시스템신...
변화와 혁신을 위한 클라우드 마이그레이션 – 김진우 AWS 어카운트 매니저, 이아영 네오위즈 가버너스팀 팀장, 박주희 우아한형제들 시스템신...
 

More from Amazon Web Services Korea

AWS Modern Infra with Storage Roadshow 2023 - Day 2
AWS Modern Infra with Storage Roadshow 2023 - Day 2AWS Modern Infra with Storage Roadshow 2023 - Day 2
AWS Modern Infra with Storage Roadshow 2023 - Day 2Amazon Web Services Korea
 
AWS Modern Infra with Storage Roadshow 2023 - Day 1
AWS Modern Infra with Storage Roadshow 2023 - Day 1AWS Modern Infra with Storage Roadshow 2023 - Day 1
AWS Modern Infra with Storage Roadshow 2023 - Day 1Amazon Web Services Korea
 
Amazon Elasticache - Fully managed, Redis & Memcached Compatible Service (Lev...
Amazon Elasticache - Fully managed, Redis & Memcached Compatible Service (Lev...Amazon Elasticache - Fully managed, Redis & Memcached Compatible Service (Lev...
Amazon Elasticache - Fully managed, Redis & Memcached Compatible Service (Lev...Amazon Web Services Korea
 
[Keynote] 슬기로운 AWS 데이터베이스 선택하기 - 발표자: 강민석, Korea Database SA Manager, WWSO, A...
[Keynote] 슬기로운 AWS 데이터베이스 선택하기 - 발표자: 강민석, Korea Database SA Manager, WWSO, A...[Keynote] 슬기로운 AWS 데이터베이스 선택하기 - 발표자: 강민석, Korea Database SA Manager, WWSO, A...
[Keynote] 슬기로운 AWS 데이터베이스 선택하기 - 발표자: 강민석, Korea Database SA Manager, WWSO, A...Amazon Web Services Korea
 
Demystify Streaming on AWS - 발표자: 이종혁, Sr Analytics Specialist, WWSO, AWS :::...
Demystify Streaming on AWS - 발표자: 이종혁, Sr Analytics Specialist, WWSO, AWS :::...Demystify Streaming on AWS - 발표자: 이종혁, Sr Analytics Specialist, WWSO, AWS :::...
Demystify Streaming on AWS - 발표자: 이종혁, Sr Analytics Specialist, WWSO, AWS :::...Amazon Web Services Korea
 
Amazon EMR - Enhancements on Cost/Performance, Serverless - 발표자: 김기영, Sr Anal...
Amazon EMR - Enhancements on Cost/Performance, Serverless - 발표자: 김기영, Sr Anal...Amazon EMR - Enhancements on Cost/Performance, Serverless - 발표자: 김기영, Sr Anal...
Amazon EMR - Enhancements on Cost/Performance, Serverless - 발표자: 김기영, Sr Anal...Amazon Web Services Korea
 
Enabling Agility with Data Governance - 발표자: 김성연, Analytics Specialist, WWSO,...
Enabling Agility with Data Governance - 발표자: 김성연, Analytics Specialist, WWSO,...Enabling Agility with Data Governance - 발표자: 김성연, Analytics Specialist, WWSO,...
Enabling Agility with Data Governance - 발표자: 김성연, Analytics Specialist, WWSO,...Amazon Web Services Korea
 
From Insights to Action, How to build and maintain a Data Driven Organization...
From Insights to Action, How to build and maintain a Data Driven Organization...From Insights to Action, How to build and maintain a Data Driven Organization...
From Insights to Action, How to build and maintain a Data Driven Organization...Amazon Web Services Korea
 
[Keynote] Accelerating Business Outcomes with AWS Data - 발표자: Saeed Gharadagh...
[Keynote] Accelerating Business Outcomes with AWS Data - 발표자: Saeed Gharadagh...[Keynote] Accelerating Business Outcomes with AWS Data - 발표자: Saeed Gharadagh...
[Keynote] Accelerating Business Outcomes with AWS Data - 발표자: Saeed Gharadagh...Amazon Web Services Korea
 
Amazon DynamoDB - Use Cases and Cost Optimization - 발표자: 이혁, DynamoDB Special...
Amazon DynamoDB - Use Cases and Cost Optimization - 발표자: 이혁, DynamoDB Special...Amazon DynamoDB - Use Cases and Cost Optimization - 발표자: 이혁, DynamoDB Special...
Amazon DynamoDB - Use Cases and Cost Optimization - 발표자: 이혁, DynamoDB Special...Amazon Web Services Korea
 
LG전자 - Amazon Aurora 및 RDS 블루/그린 배포를 이용한 데이터베이스 업그레이드 안정성 확보 - 발표자: 이은경 책임, L...
LG전자 - Amazon Aurora 및 RDS 블루/그린 배포를 이용한 데이터베이스 업그레이드 안정성 확보 - 발표자: 이은경 책임, L...LG전자 - Amazon Aurora 및 RDS 블루/그린 배포를 이용한 데이터베이스 업그레이드 안정성 확보 - 발표자: 이은경 책임, L...
LG전자 - Amazon Aurora 및 RDS 블루/그린 배포를 이용한 데이터베이스 업그레이드 안정성 확보 - 발표자: 이은경 책임, L...Amazon Web Services Korea
 
LG 이노텍 - Amazon Redshift Serverless를 활용한 데이터 분석 플랫폼 혁신 과정 - 발표자: 유재상 선임, LG이노...
LG 이노텍 - Amazon Redshift Serverless를 활용한 데이터 분석 플랫폼 혁신 과정 - 발표자: 유재상 선임, LG이노...LG 이노텍 - Amazon Redshift Serverless를 활용한 데이터 분석 플랫폼 혁신 과정 - 발표자: 유재상 선임, LG이노...
LG 이노텍 - Amazon Redshift Serverless를 활용한 데이터 분석 플랫폼 혁신 과정 - 발표자: 유재상 선임, LG이노...Amazon Web Services Korea
 
[Keynote] Data Driven Organizations with AWS Data - 발표자: Agnes Panosian, Head...
[Keynote] Data Driven Organizations with AWS Data - 발표자: Agnes Panosian, Head...[Keynote] Data Driven Organizations with AWS Data - 발표자: Agnes Panosian, Head...
[Keynote] Data Driven Organizations with AWS Data - 발표자: Agnes Panosian, Head...Amazon Web Services Korea
 
AWS Summit Seoul 2023 | Amazon Neptune 및 Elastic을 이용한 추천 서비스 및 검색 플랫폼 구축하기
AWS Summit Seoul 2023 | Amazon Neptune 및 Elastic을 이용한 추천 서비스 및 검색 플랫폼 구축하기AWS Summit Seoul 2023 | Amazon Neptune 및 Elastic을 이용한 추천 서비스 및 검색 플랫폼 구축하기
AWS Summit Seoul 2023 | Amazon Neptune 및 Elastic을 이용한 추천 서비스 및 검색 플랫폼 구축하기Amazon Web Services Korea
 
AWS Summit Seoul 2023 | 생성 AI 모델의 임베딩 벡터를 이용한 서버리스 추천 검색 구현하기
AWS Summit Seoul 2023 | 생성 AI 모델의 임베딩 벡터를 이용한 서버리스 추천 검색 구현하기AWS Summit Seoul 2023 | 생성 AI 모델의 임베딩 벡터를 이용한 서버리스 추천 검색 구현하기
AWS Summit Seoul 2023 | 생성 AI 모델의 임베딩 벡터를 이용한 서버리스 추천 검색 구현하기Amazon Web Services Korea
 
AWS Summit Seoul 2023 | 스타트업의 서버리스 기반 SaaS 데이터 처리 및 데이터웨어하우스 구축 사례
AWS Summit Seoul 2023 | 스타트업의 서버리스 기반 SaaS 데이터 처리 및 데이터웨어하우스 구축 사례AWS Summit Seoul 2023 | 스타트업의 서버리스 기반 SaaS 데이터 처리 및 데이터웨어하우스 구축 사례
AWS Summit Seoul 2023 | 스타트업의 서버리스 기반 SaaS 데이터 처리 및 데이터웨어하우스 구축 사례Amazon Web Services Korea
 
AWS Summit Seoul 2023 | Amazon EKS 데이터 전송 비용 절감 및 카오스 엔지니어링 적용 사례
AWS Summit Seoul 2023 | Amazon EKS 데이터 전송 비용 절감 및 카오스 엔지니어링 적용 사례AWS Summit Seoul 2023 | Amazon EKS 데이터 전송 비용 절감 및 카오스 엔지니어링 적용 사례
AWS Summit Seoul 2023 | Amazon EKS 데이터 전송 비용 절감 및 카오스 엔지니어링 적용 사례Amazon Web Services Korea
 
AWS Summit Seoul 2023 | 실시간 CDC 데이터 처리! Modern Transactional Data Lake 구축하기
AWS Summit Seoul 2023 | 실시간 CDC 데이터 처리! Modern Transactional Data Lake 구축하기AWS Summit Seoul 2023 | 실시간 CDC 데이터 처리! Modern Transactional Data Lake 구축하기
AWS Summit Seoul 2023 | 실시간 CDC 데이터 처리! Modern Transactional Data Lake 구축하기Amazon Web Services Korea
 
AWS Summit Seoul 2023 | 12가지 디자인 패턴으로 알아보는 클라우드 네이티브 마이크로서비스 아키텍처
AWS Summit Seoul 2023 | 12가지 디자인 패턴으로 알아보는 클라우드 네이티브 마이크로서비스 아키텍처AWS Summit Seoul 2023 | 12가지 디자인 패턴으로 알아보는 클라우드 네이티브 마이크로서비스 아키텍처
AWS Summit Seoul 2023 | 12가지 디자인 패턴으로 알아보는 클라우드 네이티브 마이크로서비스 아키텍처Amazon Web Services Korea
 
AWS Summit Seoul 2023 | AWS에서 OpenTelemetry 기반의 애플리케이션 Observability 구축/활용하기
AWS Summit Seoul 2023 | AWS에서 OpenTelemetry 기반의 애플리케이션 Observability 구축/활용하기AWS Summit Seoul 2023 | AWS에서 OpenTelemetry 기반의 애플리케이션 Observability 구축/활용하기
AWS Summit Seoul 2023 | AWS에서 OpenTelemetry 기반의 애플리케이션 Observability 구축/활용하기Amazon Web Services Korea
 

More from Amazon Web Services Korea (20)

AWS Modern Infra with Storage Roadshow 2023 - Day 2
AWS Modern Infra with Storage Roadshow 2023 - Day 2AWS Modern Infra with Storage Roadshow 2023 - Day 2
AWS Modern Infra with Storage Roadshow 2023 - Day 2
 
AWS Modern Infra with Storage Roadshow 2023 - Day 1
AWS Modern Infra with Storage Roadshow 2023 - Day 1AWS Modern Infra with Storage Roadshow 2023 - Day 1
AWS Modern Infra with Storage Roadshow 2023 - Day 1
 
Amazon Elasticache - Fully managed, Redis & Memcached Compatible Service (Lev...
Amazon Elasticache - Fully managed, Redis & Memcached Compatible Service (Lev...Amazon Elasticache - Fully managed, Redis & Memcached Compatible Service (Lev...
Amazon Elasticache - Fully managed, Redis & Memcached Compatible Service (Lev...
 
[Keynote] 슬기로운 AWS 데이터베이스 선택하기 - 발표자: 강민석, Korea Database SA Manager, WWSO, A...
[Keynote] 슬기로운 AWS 데이터베이스 선택하기 - 발표자: 강민석, Korea Database SA Manager, WWSO, A...[Keynote] 슬기로운 AWS 데이터베이스 선택하기 - 발표자: 강민석, Korea Database SA Manager, WWSO, A...
[Keynote] 슬기로운 AWS 데이터베이스 선택하기 - 발표자: 강민석, Korea Database SA Manager, WWSO, A...
 
Demystify Streaming on AWS - 발표자: 이종혁, Sr Analytics Specialist, WWSO, AWS :::...
Demystify Streaming on AWS - 발표자: 이종혁, Sr Analytics Specialist, WWSO, AWS :::...Demystify Streaming on AWS - 발표자: 이종혁, Sr Analytics Specialist, WWSO, AWS :::...
Demystify Streaming on AWS - 발표자: 이종혁, Sr Analytics Specialist, WWSO, AWS :::...
 
Amazon EMR - Enhancements on Cost/Performance, Serverless - 발표자: 김기영, Sr Anal...
Amazon EMR - Enhancements on Cost/Performance, Serverless - 발표자: 김기영, Sr Anal...Amazon EMR - Enhancements on Cost/Performance, Serverless - 발표자: 김기영, Sr Anal...
Amazon EMR - Enhancements on Cost/Performance, Serverless - 발표자: 김기영, Sr Anal...
 
Enabling Agility with Data Governance - 발표자: 김성연, Analytics Specialist, WWSO,...
Enabling Agility with Data Governance - 발표자: 김성연, Analytics Specialist, WWSO,...Enabling Agility with Data Governance - 발표자: 김성연, Analytics Specialist, WWSO,...
Enabling Agility with Data Governance - 발표자: 김성연, Analytics Specialist, WWSO,...
 
From Insights to Action, How to build and maintain a Data Driven Organization...
From Insights to Action, How to build and maintain a Data Driven Organization...From Insights to Action, How to build and maintain a Data Driven Organization...
From Insights to Action, How to build and maintain a Data Driven Organization...
 
[Keynote] Accelerating Business Outcomes with AWS Data - 발표자: Saeed Gharadagh...
[Keynote] Accelerating Business Outcomes with AWS Data - 발표자: Saeed Gharadagh...[Keynote] Accelerating Business Outcomes with AWS Data - 발표자: Saeed Gharadagh...
[Keynote] Accelerating Business Outcomes with AWS Data - 발표자: Saeed Gharadagh...
 
Amazon DynamoDB - Use Cases and Cost Optimization - 발표자: 이혁, DynamoDB Special...
Amazon DynamoDB - Use Cases and Cost Optimization - 발표자: 이혁, DynamoDB Special...Amazon DynamoDB - Use Cases and Cost Optimization - 발표자: 이혁, DynamoDB Special...
Amazon DynamoDB - Use Cases and Cost Optimization - 발표자: 이혁, DynamoDB Special...
 
LG전자 - Amazon Aurora 및 RDS 블루/그린 배포를 이용한 데이터베이스 업그레이드 안정성 확보 - 발표자: 이은경 책임, L...
LG전자 - Amazon Aurora 및 RDS 블루/그린 배포를 이용한 데이터베이스 업그레이드 안정성 확보 - 발표자: 이은경 책임, L...LG전자 - Amazon Aurora 및 RDS 블루/그린 배포를 이용한 데이터베이스 업그레이드 안정성 확보 - 발표자: 이은경 책임, L...
LG전자 - Amazon Aurora 및 RDS 블루/그린 배포를 이용한 데이터베이스 업그레이드 안정성 확보 - 발표자: 이은경 책임, L...
 
LG 이노텍 - Amazon Redshift Serverless를 활용한 데이터 분석 플랫폼 혁신 과정 - 발표자: 유재상 선임, LG이노...
LG 이노텍 - Amazon Redshift Serverless를 활용한 데이터 분석 플랫폼 혁신 과정 - 발표자: 유재상 선임, LG이노...LG 이노텍 - Amazon Redshift Serverless를 활용한 데이터 분석 플랫폼 혁신 과정 - 발표자: 유재상 선임, LG이노...
LG 이노텍 - Amazon Redshift Serverless를 활용한 데이터 분석 플랫폼 혁신 과정 - 발표자: 유재상 선임, LG이노...
 
[Keynote] Data Driven Organizations with AWS Data - 발표자: Agnes Panosian, Head...
[Keynote] Data Driven Organizations with AWS Data - 발표자: Agnes Panosian, Head...[Keynote] Data Driven Organizations with AWS Data - 발표자: Agnes Panosian, Head...
[Keynote] Data Driven Organizations with AWS Data - 발표자: Agnes Panosian, Head...
 
AWS Summit Seoul 2023 | Amazon Neptune 및 Elastic을 이용한 추천 서비스 및 검색 플랫폼 구축하기
AWS Summit Seoul 2023 | Amazon Neptune 및 Elastic을 이용한 추천 서비스 및 검색 플랫폼 구축하기AWS Summit Seoul 2023 | Amazon Neptune 및 Elastic을 이용한 추천 서비스 및 검색 플랫폼 구축하기
AWS Summit Seoul 2023 | Amazon Neptune 및 Elastic을 이용한 추천 서비스 및 검색 플랫폼 구축하기
 
AWS Summit Seoul 2023 | 생성 AI 모델의 임베딩 벡터를 이용한 서버리스 추천 검색 구현하기
AWS Summit Seoul 2023 | 생성 AI 모델의 임베딩 벡터를 이용한 서버리스 추천 검색 구현하기AWS Summit Seoul 2023 | 생성 AI 모델의 임베딩 벡터를 이용한 서버리스 추천 검색 구현하기
AWS Summit Seoul 2023 | 생성 AI 모델의 임베딩 벡터를 이용한 서버리스 추천 검색 구현하기
 
AWS Summit Seoul 2023 | 스타트업의 서버리스 기반 SaaS 데이터 처리 및 데이터웨어하우스 구축 사례
AWS Summit Seoul 2023 | 스타트업의 서버리스 기반 SaaS 데이터 처리 및 데이터웨어하우스 구축 사례AWS Summit Seoul 2023 | 스타트업의 서버리스 기반 SaaS 데이터 처리 및 데이터웨어하우스 구축 사례
AWS Summit Seoul 2023 | 스타트업의 서버리스 기반 SaaS 데이터 처리 및 데이터웨어하우스 구축 사례
 
AWS Summit Seoul 2023 | Amazon EKS 데이터 전송 비용 절감 및 카오스 엔지니어링 적용 사례
AWS Summit Seoul 2023 | Amazon EKS 데이터 전송 비용 절감 및 카오스 엔지니어링 적용 사례AWS Summit Seoul 2023 | Amazon EKS 데이터 전송 비용 절감 및 카오스 엔지니어링 적용 사례
AWS Summit Seoul 2023 | Amazon EKS 데이터 전송 비용 절감 및 카오스 엔지니어링 적용 사례
 
AWS Summit Seoul 2023 | 실시간 CDC 데이터 처리! Modern Transactional Data Lake 구축하기
AWS Summit Seoul 2023 | 실시간 CDC 데이터 처리! Modern Transactional Data Lake 구축하기AWS Summit Seoul 2023 | 실시간 CDC 데이터 처리! Modern Transactional Data Lake 구축하기
AWS Summit Seoul 2023 | 실시간 CDC 데이터 처리! Modern Transactional Data Lake 구축하기
 
AWS Summit Seoul 2023 | 12가지 디자인 패턴으로 알아보는 클라우드 네이티브 마이크로서비스 아키텍처
AWS Summit Seoul 2023 | 12가지 디자인 패턴으로 알아보는 클라우드 네이티브 마이크로서비스 아키텍처AWS Summit Seoul 2023 | 12가지 디자인 패턴으로 알아보는 클라우드 네이티브 마이크로서비스 아키텍처
AWS Summit Seoul 2023 | 12가지 디자인 패턴으로 알아보는 클라우드 네이티브 마이크로서비스 아키텍처
 
AWS Summit Seoul 2023 | AWS에서 OpenTelemetry 기반의 애플리케이션 Observability 구축/활용하기
AWS Summit Seoul 2023 | AWS에서 OpenTelemetry 기반의 애플리케이션 Observability 구축/활용하기AWS Summit Seoul 2023 | AWS에서 OpenTelemetry 기반의 애플리케이션 Observability 구축/활용하기
AWS Summit Seoul 2023 | AWS에서 OpenTelemetry 기반의 애플리케이션 Observability 구축/활용하기
 

워크로드 특성에 따른 안전하고 효율적인 Data Lake 운영 방안

  • 1. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. © 2022, Amazon Web Services, Inc. or its affiliates. 워크로드 특성에 따른 안전하고 효율적인 Data Lake 운영 방안 박성훈 Account Growth Lead AWS
  • 2. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. Agenda • Data Lakes 구축의 어려움 • 확장 가능한 S3 Keyspace 설계 • 예기치 않은 사고로부터 데이터 보호 • 비용 최적화 2
  • 3. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. Customers want more value from their data 3 Growing exponentially From new sources Increasingly diverse Used by many people Analyzed by many applications
  • 4. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. Building a Modern Data Strategy Catalog Governance Data Sources People, Apps, and Devices Analytics Machine Learning Databases Data Lakes 4
  • 5. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. The benefits of scalable data lakes 5 모든 데이터를 오픈 형식으로 저장 스토리지를 컴퓨팅에서 분리 스토리지를 엑사바이트까지 비용 효율적으로 확장 분석 및 ML 엔진 선택 Catalog Data lake
  • 6. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. Challenges in building data lakes Challenge #1: Data ingestion 신뢰할 수 있는 데이터 수집 파이프라인을 구축하는 것은 복잡하다 Challenge #2: Data management S3에 데이터를 저장하고 최적화하는데 시간이 많이 걸린다 Challenge #3: Security & governance 세분화된 권한을 관리는 것이 어렵고 오류가 발생하기 쉽다 Amazon S3 AWS Lake Formation Data Catalog AWS Glue ETL Amazon Athena Amazon EMR Amazon Redshift Spectrum Amazon SageMaker Challenge #5: Data sharing 계정 및 조직 간에 공유하는 것은 복잡하다 6 Challenge #4: Integrations 선택한 서비스나 애플리케이션을 통합하는 것이 어렵다
  • 7. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. 신뢰할 수 있는 데이터 수집 파이프라인을 구축하는 것은 복잡하다 Challenges in building data lakes Challenge #3: Security & governance 세분화된 권한을 관리는 것이 어렵고 오류가 발생하기 쉽다 Amazon S3 AWS Lake Formation Data Catalog AWS Glue ETL Amazon Athena Amazon EMR Amazon Redshift Spectrum Amazon SageMaker Challenge #5: Data sharing 계정 및 조직 간에 공유하는 것은 번거로운 작업이다 7 Challenge #2: Data management S3에 데이터를 저장하고 최적화하는데 시간이 많이 걸린다 Challenge #4: Integrations 선택한 서비스나 애플리케이션을 통합하는 것이 어렵다
  • 8. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. © 2022, Amazon Web Services, Inc. or its affiliates. 확장 가능한 S3 Keyspace 설계 8
  • 9. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. Index Performance Baseline 9 Request Method All Regions GET/HEAD 5,500 requests per second PUT/POST/DELETE 3,500 requests per second • 초당 요청은 인덱스 파티션 당 요청입니다. • 접두사 수에는 제한이 없습니다. • 503 Slow Down 오류는 요청 속도를 늦추는 주요 지표입니다.
  • 10. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. Request rates are allocated proportionally 10 Workload 50% PUT and 50% GET operations in a single partition Example 1 Total TPS (50% * 3,500) + (50% * 5,500) = 1,750 + 2,750 = 4,500 TPS Combined
  • 11. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. Request rates are allocated proportionally 11 Workload 50% PUT and 50% GET operations in a single partition Example 1 Total TPS (50% * 3,500) + (50% * 5,500) = 1,750 + 2,750 = 4,500 TPS Combined Workload 30% PUT and 70% GET operations in a single partition Example 2 Total TPS (30% * 3,500) + (70% * 5,500) = 1,050 + 3,850 = 4,900 TPS Combined
  • 12. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. How to Increase Requests per Second • 인덱스를 여러 파티션에 분산 • 인덱스를 분할하는 두 가지 방법 ▪ Auto partitioning ➢고객의 개입 없이 S3에서 수행 ➢시간이 지남에 따라 S3 워크로드가 점차 증가할 때 잘 동작 ▪ Pre-partition request ➢케이스 생성을 통해 지원 ➢S3 워크로드가 빠르게 증가할 때 선호 12
  • 13. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. Auto Partitioning At Work 13
  • 14. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. Optimize Partition Use 2018년 7월 이전 • 접두사 앞에 해시 추가 ▪ examplebucket/232a-2013-26-05-15-00-00/cust1234234/photo001.jpg ▪ examplebucket/232b-2013-26-05-15-00-00/cust1234234/photo002.jpg … ▪ examplebucket/292a-2013-26-05-15-00-00/cust1234234/photo099.jpg • 접두사 앞에 해시를 추가하여 요청이 여러 인덱스 파티션으로 분산 14
  • 15. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. Optimize Partition Use 2018년 7월부터 • Keyspace에 자연명을 사용할 수 있습니다.버킷의 접두사 수에는 제한이 없습니다. • Keyspace 설계 시, 모든 요청이 동일한 인덱스 파티션에 대해 요청을 수행하는 시나리오를 방지해야 합니다. • 워크로드가 여러 인덱스 파티션에 걸쳐 잘 분산될 수 있는 높은 카디널리티 접두사를 사용하는 것이 중요합니다. 15
  • 16. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. Example: Autonomous vehicles 1. 많은 계측 자동차가 중앙에 위치하고 있습니다. 2. 매일 그 자동차들은 운전을 하고 많은 데이터를 수집합니다. 3. 거의 동시에 차고지로 돌아와서 수집한 데이터를 데이터 레이크에 업로드 합니다.
  • 17. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. Example: Autonomous vehicles 17 awsexamplebucket/daily-uploads/<date>/<car>/drive-data 객체 Key 이름 버킷 이름 접두사 객체 이름
  • 18. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. Example: Autonomous vehicles 18 /daily-uploads/20220710/CAR01/drive-data /daily-uploads/20220710/CAR02/drive-data /daily-uploads/20220710/CAR03/drive-data /daily-uploads/20220710/CAR04/drive-data /daily-uploads/20220710/CAR05/drive-data 요구 사항: 3,000 PUTs/sec per car – 15,000 PUTs/sec
  • 19. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. Example: Autonomous vehicles 19 All cars get throttled around 3,500 PUTs/sec (total)
  • 20. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. Example: Autonomous vehicles 20 All cars get throttled around 3,500 PUTs/sec (total) New index prefixes are created, raising max TPS
  • 21. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. Example: Autonomous vehicles 21 /daily-uploads/20220710/CAR01/drive-data /daily-uploads/20220710/CAR02/drive-data /daily-uploads/20220710/CAR03/drive-data /daily-uploads/20220710/CAR04/drive-data /daily-uploads/20220710/CAR05/drive-data 5개의 인덱스 파티션이 만들어질 때 까지 Throttle이 발생합니다.
  • 22. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. Example: Autonomous vehicles 22 /daily-uploads/20220710/CAR01/drive-data /daily-uploads/20220710/CAR02/drive-data /daily-uploads/20220710/CAR03/drive-data /daily-uploads/20220710/CAR04/drive-data /daily-uploads/20220710/CAR05/drive-data 5개의 인덱스 파티션이 만들어질 때 까지 Throttle이 발생합니다.
  • 23. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. Example: Autonomous vehicles 23 /daily-uploads/20220710/CAR01/drive-data /daily-uploads/20220710/CAR02/drive-data /daily-uploads/20220710/CAR03/drive-data /daily-uploads/20220710/CAR04/drive-data /daily-uploads/20220710/CAR05/drive-data 5개의 인덱스 파티션이 만들어질 때 까지 Throttle이 발생합니다.
  • 24. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. Example: Autonomous vehicles 24 /daily-uploads/20220710/CAR01/drive-data /daily-uploads/20220710/CAR02/drive-data /daily-uploads/20220710/CAR03/drive-data /daily-uploads/20220710/CAR04/drive-data /daily-uploads/20220710/CAR05/drive-data S3가 접두사를 기준으로 5개의 인덱스 파티션을 만들었습니다.
  • 25. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. Example: Autonomous vehicles 25 다음 날은… /daily-uploads/20220711/CAR01/drive-data /daily-uploads/20220711/CAR02/drive-data /daily-uploads/20220711/CAR03/drive-data /daily-uploads/20220711/CAR04/drive-data /daily-uploads/20220711/CAR05/drive-data
  • 26. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. Example: Autonomous vehicles 26 /daily-uploads/20220710/CAR01/drive-data /daily-uploads/20220710/CAR02/drive-data /daily-uploads/20220710/CAR03/drive-data /daily-uploads/20220710/CAR04/drive-data /daily-uploads/20220710/CAR05/drive-data
  • 27. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. Example: Autonomous vehicles 27 /daily-uploads/20220711/CAR01/drive-data /daily-uploads/20220711/CAR02/drive-data /daily-uploads/20220711/CAR03/drive-data /daily-uploads/20220711/CAR04/drive-data /daily-uploads/20220711/CAR05/drive-data
  • 28. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. Example: Autonomous vehicles 28 /daily-uploads/<date>/<car>/drive-data
  • 29. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. Example: Autonomous vehicles 29 /daily-uploads/<car>/<date>/drive-data
  • 30. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. Example: Autonomous vehicles 30 /daily-uploads/CAR01/20220711/drive-data /daily-uploads/CAR02/20220711/drive-data /daily-uploads/CAR03/20220711/drive-data /daily-uploads/CAR04/20220711/drive-data /daily-uploads/CAR05/20220711/drive-data
  • 31. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. Example: Autonomous vehicles 31 /daily-uploads/CAR01/20220712/drive-data /daily-uploads/CAR02/20220712/drive-data /daily-uploads/CAR03/20220712/drive-data /daily-uploads/CAR04/20220712/drive-data /daily-uploads/CAR05/20220712/drive-data
  • 32. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. S3 Requests 32 GET s3://mybucket/flight_info/* mybucket Prefix : flight_info Client Sequential read
  • 33. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. S3 Requests on Amazon EMR 33 여러 컨테이너가 동시에 단일 접두사에 읽기 요청을 보냅니다. GET s3://mybucket/flight_info/* mybucket Prefix : flight_info EMR Core/Task Nodes Read in parallel
  • 34. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. S3 Requests on Amazon EMR 34 중복도가 낮은 접두사를 추가하여 요청을 여러 인덱스 파티션으로 분산 GET s3://mybucket/flight_info/* mybucket flight_info/US EMR Core/Task Nodes flight_info/EU Read in parallel
  • 35. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. How does S3 automatically scale request rates? 35 BucketName/prefix: mybucket/flight_info/US/ mybucket/flight_info/EU/ mubucket/ … 3,500 PUT tps 5,500 GET tps mybucket
  • 36. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. How does S3 automatically scale request rates? 36 BucketName/prefix: mybucket/flight_info/US/ mybucket/flight_info/EU/ mubucket/ … mybucket 1st Partition 2nd Partition 3,500 PUT tps 5,500 GET tps 3,500 PUT tps 5,500 GET tps /… /flight_info
  • 37. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. How does S3 automatically scale request rates? 37 BucketName/prefix: mybucket/flight_info/US/ mybucket/flight_info/EU/ mubucket/ … mybucket 1st Partition 2nd Partition 3rd Partition 3,500 PUT tps 5,500 GET tps 3,500 PUT tps 5,500 GET tps 3,500 PUT tps 5,500 GET tps 3,500 PUT tps 5,500 GET tps /flight_info /… /US /EU /…
  • 38. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. © 2022, Amazon Web Services, Inc. or its affiliates. 예기치 않은 사고로부터 데이터 보호 38
  • 39. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. Amazon S3 Versioning 39 Key = cat.jpg PUT • 버전 관리를 사용하는 버킷에 객체를 PUT할 때 비 최신 버전은 덮어쓰지 않습니다. • 실수로 객체를 덮어쓰거나 삭제하는 것을 방지하고, 객체의 이전 버전을 검색할 수 있습니다. • 더 이상 최신 버전이 아닌 객체를 S3 Lifecycle로 이전하거나 삭제할 수 있습니다. Key = cat.jpg Version ID = 2 Key = cat.jpg Version ID = 1
  • 40. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. Amazon S3 Versioning 40 Key = cat.jpg • 버전 관리를 사용하는 버킷에 객체를 PUT할 때 비 최신 버전은 덮어쓰지 않습니다. • 실수로 객체를 덮어쓰거나 삭제하는 것을 방지하고, 객체의 이전 버전을 검색할 수 있습니다. • 더 이상 최신 버전이 아닌 객체를 S3 Lifecycle로 이전하거나 삭제할 수 있습니다. Key = cat.jpg Version ID = 2 Key = cat.jpg Version ID = 1 Key = cat.jpg Version ID = 2 Key = cat.jpg Version ID = 1 DELETE Delete Marker
  • 41. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. Amazon S3 Versioning 41
  • 42. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. S3 Replication 42 Source Destination • 버킷 간에 객체를 복제하는 탄력적이고 저렴한 완전 관리형 기능입니다. • 복제할 위치와 방법을 구성할 수 있는 다양한 기능을 통해 유연성을 제공합니다. • 복제 규칙이 구성되면 원본 버킷의 객체와 메타데이터를 자동으로 복제합니다.
  • 43. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. US East US East Flexible replication 43 Same Region 동일한 AWS 리전 내에서 복제 Cross-Region 다른 AWS 리전으로 복제 Multiple destinations 여러 대상 버킷에 복제 US East US West Account A Cross-account 서로 다른 AWS 계정 간 복제
  • 44. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. AWS Backup for S3 44 • AWS 서비스 및 하이브리드 워크로드의 데이터 보호를 중앙 집중화하고 자동화 정책을 기반으로 대규모 데이터 보호를 간편하고 비용 효율적으로 수행할 수 있는 완전 관리형 서비스입니다. • 클릭 한 번으로 Amazon S3에 저장된 애플리케이션 데이터를 특정 시점으로 쉽게 복원할 수 있습니다. • 데이터 보호에 대한 규정 준수 또는 비즈니스 정책을 지원하는 데 도움이 됩니다.
  • 45. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. AWS Backup for S3 용어 의미 RPO(Recovery Point Objective) 복구 시점 목표 RTO(Recovery Time Objective) 복구에 걸리는 시간 목표 스냅샷(Snapshot) 특정 시점의 데이터 상태 스냅샷 백업(Snapshot Backup) 특정 시점 만을 백업하기 때문에 복원도 해당 시점으로만 가능 연속 백업(Continuous Backup) 첫 번째 전체 백업 (Full Backup) 후 지속적으로 증분 백업을 수행하므로 복원할 수 있는 시점이 광범위 PiTR(Point-in-Time-Recovery) 지정한 특정 시간으로 복구. 지속적 백업으로 가능 백업 용어 정리
  • 46. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. AWS Backup for S3 46
  • 47. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. AWS Backup for S3 47
  • 48. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. AWS Backup for S3 48
  • 49. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. S3 Lifecycle 49 Lifecycle Configuration을 사용하여 • 데이터를 보다 비용 효율적인 스토리지 클래스로 이동 • 객체 사용 기간에 따라 만료시켜 시간에 따른 스토리지 지출 관리 데이터를 보다 비용 효율적인 스토리지 클래스로 이동
  • 50. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. S3 Lifecycle 50 더 이상 보존할 필요가 없는 데이터 세트의 자동 삭제 Lifecycle Configuration을 사용하여 • 각 객체의 Noncurrent Versions 삭제 • 만료된 객체의 Delete Markers 삭제 • Incomplete Multipart-Uploads 삭제
  • 51. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. S3 Lifecycle 51 더 이상 보존할 필요가 없는 데이터 세트의 자동 삭제
  • 52. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. Amazon S3 Object Lock 52 S3 Object Lock을 사용하여 객체를 write once, read many(WORM) 모델을 사용하여 저장 거버넌스 모드 규정 준수 모드 • 특별한 권한이 없는 한 사용자는 객체 버전을 덮어쓰거나 삭제하거나 잠금 설정을 변경할 수 없음 • 필요에 따라 일부 사용자에게 보관 설정을 변경하거나 객체를 삭제할 수 있는 권한을 부여할 수 있음 • 보호된 객체 버전은 AWS 계정의 루트 사용자를 포함한 어떤 사용자도 덮어쓰거나 삭제할 수 없음 • 객체를 잠그면 보관 모드를 변경할 수 없으며 보관 기간을 줄일 수 없음
  • 53. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. Amazon S3 Object Lock 53 S3 Object Lock을 사용하여 객체를 write once, read many(WORM) 모델을 사용하여 저장 거버넌스 모드 규정 준수 모드 • 특별한 권한이 없는 한 사용자는 객체 버전을 덮어쓰거나 삭제하거나 잠금 설정을 변경할 수 없음 • 필요에 따라 일부 사용자에게 보관 설정을 변경하거나 객체를 삭제할 수 있는 권한을 부여할 수 있음 • 보호된 객체 버전은 AWS 계정의 루트 사용자를 포함한 어떤 사용자도 덮어쓰거나 삭제할 수 없음 • 객체를 잠그면 보관 모드를 변경할 수 없으며 보관 기간을 줄일 수 없음 Object Lock은 고정된 시간 동안 또는 무기한으로 객체의 삭제 또는 덮어쓰기를 방지하는 데 도움이 될 수 있지만 데이터 레이크 데이터 스토어로 사용되는 S3 버킷에 적용하는 것은 아주 신중히 고려해야 합니다.
  • 54. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. © 2022, Amazon Web Services, Inc. or its affiliates. 비용 최적화 54
  • 55. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. S3 Intelligent-Tiering Storage Class 55 • 세 가지 액세스 계층 간에 자동으로 객체 이동 • 클라우드에서 가장 낮은 스토리지 비용을 실현하기 위한 비동기식 아카이빙 옵션 • 성능 영향, 운영 오버헤드, 수명주기 비용 또는 검색 비용 없음 • 99.9% 의 가용성과 99.999999999% 의 내구성을 제공하도록 설계
  • 56. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. Frequent Access tier Infrequent Access tier Archive Instant Access tier +30 days +60 days S3 Intelligent-Tiering automatically optimizes cost in three access tiers 새로 추가된 Archive Instant Access Tier로 최대 68% 비용할인
  • 57. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. Use S3 Intelligent-Tiering by default for data with unknown or changing access patterns Milliseconds access (automatic) Minutes to hours (optional) Frequent Access tier Infrequent Access tier Archive Instant Access tier Deep Archive Access tier Archive Access tier
  • 58. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. Considerations for using S3 Intelligent-Tiering Storage Class 58 • Amazon EMR에서 Hive, Spark, 그리고 Presto 와 같은 오픈 소스 프레임워크 ▪ 작업 대상에 Archive Access Tier에 있는 객체가 있는 경우 작업 실패 • Amazon Athena와 Amazon Redshift Spectrum ▪ Query는 오류 없이 결과 값을 반환하지만 Archive Access Tier에 있는 객체들은 건너뜁니다. 따라서, 예상과 다른 결과 값을 얻을 수 있으므로 Archive Access Tier 사용 시 주의 필요
  • 59. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. Amazon S3 Storage Lens overview 59 • 조직 차원의 가시성 • 29개의 스토리지 사용량 및 활동 지표 • 리전, 스토리지 클래스, 버킷 및 접두사별로 드릴다운 • 비용 효율성 및 데이터 보호 모범 사례를 위한 권장 사항 • 통합된 S3 콘솔 경험
  • 60. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. Example Insights from S3 Storage Lens 60 S3 Storage Lens를 사용하여 계정 또는 전체 AWS 조직에서 % noncurrent version bytes 및 % incomplete MPU bytes를 확인할 수 있습니다.
  • 61. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. © 2022, Amazon Web Services, Inc. or its affiliates. Takeaways 61
  • 62. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. Takeaways 62 워크로드의 I/O 패턴을 고려한 Keyspace 설계
  • 63. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. Takeaways 63 워크로드의 I/O 패턴을 고려한 Keyspace 설계 S3가 제공하는 기능들과 AWS Backup을 활용한 데이터 보호
  • 64. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. Takeaways 64 S3 스토리지 클래스와 분석 도구를 활용한 비용 최적화 워크로드의 I/O 패턴을 고려한 Keyspace 설계 S3가 제공하는 기능들과 AWS Backup을 활용한 데이터 보호
  • 65. AWS DATA SPECIAL WEBINAR © 2022, Amazon Web Services, Inc. or its affiliates. Thank you! © 2022, Amazon Web Services, Inc. or its affiliates. 박성훈