SlideShare a Scribd company logo
1 of 46
Download to read offline
AWS DATA ROADSHOW 2023
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
© 2023, Amazon Web Services, Inc. or its affiliates.
Data Road Show
Powering your analytics with serverless capabilities
2023/06/22
AWS DATA ROADSHOW 2023
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
© 2023, Amazon Web Services, Inc. or its affiliates.
Redshift Deep-dive
with new feature
Dokyun, Kim
WWSO ACE Specialist
AWS DATA ROADSHOW 2023
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Agenda
1. Session Intro (5 Min)
2. Redshift 및 Redshift Serverless (15 Min)
3. Redshift ML (10 Min)
4. Redshift Stream Ingestion (10 Min)
5. Redshift Auto-Copy (Preview) (10 Min)
6. Summary - Moving towards zero-ETL Concept (5 Min)
3
AWS DATA ROADSHOW 2023
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
© 2023, Amazon Web Services, Inc. or its affiliates.
Session Intro
© 2022, Amazon Web Services, Inc. or its Affiliates. 5
포괄적이면서 개방적인 AWS 서비스
데이터 이동
분석
데이터 레이크 인프라 & 관리
데이터, 시각화, 참여 & 기계 학습
+ 그 외 다양한
Redshift
EMR
(Spark & Hadoop)
Athena
OpenSearch
Service
Kinesis Data
Analytics
AWS Glue
(Spark & Python)
S3/Glacier AWS Glue
Lake
Formation
QuickSight SageMaker Comprehend Lex Polly Rekognition Translate
Database Migration Service | Snowball | Snowmobile | Kinesis Data Streams | Kinesis Data Firehose | Managed Streaming for Apache Kafka
Pinpoint
Data
Exchange
AWS DATA ROADSHOW 2023
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Amazon Redshift 고객의 요구 사항에 따라 계속해서 혁신 중
모든 데이터
분석
모든 규모에서
최고의 가격
성능 제공
누구나 쉽게
분석 가능
RA3
nodes &
managed
storage
Concurrency
scaling for
reads and
writes
Security,
governance
& compliance
Workload
management
enhancements
SQL
enhancements
& migration
support
Serverless Automated DW
management
materialized
views
Data API AWS
CloudFormation
templates
Amazon
Redshift
Advisor
Grafana
Plugin
Query
editor v2
Data sharing Amazon
Redshift ML
AWS Data
Exchange
integration
Federated
query
SUPER data
type with
JSON
Geospatial
enhancements
Aurora Zero
ETL with
Redshift
(Preview)
Redshift
Streaming
Ingestion
Apache Spark
Connector
Multi-AZ
Deployment
(Preview)
Data Sharing
Access Control
via AWS Lake
Formation
(Preview)
Condition
column
Mask column
ID
Geo-
location Name Phone number
123 WA Ana 123-456-3568
124 NY Alice 123-457-****
125 WA Bruce 123-457-3569
126 CA Chris 123-457-****
130 CA Sharon 123-457-****
Dynamic Data
Masking
(Preview)
Auto Copy
from S3
(Preview)
AWS DATA ROADSHOW 2023
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Session Target
Architecture
Moving towards zero-ETL for years
Zero
ETL
No data movement,
data copying
Secure and consistent
data sharing
Data Lake
analytics
ML in
SQL
Use your favorite
BI tool
Spark application
development
Auto Ingestion of
S3 files
7
Amazon Redshift
Serverless
Amazon S3 data
lake & Files
ML and
analytics
services
(SageMaker)
Streaming data
services
Amazon Redshift
Provision
Data sharing
Stream Ingestion
Auto Copy (Preview)
Redshift ML
AWS DATA ROADSHOW 2023
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. 8
AWS DATA ROADSHOW 2023
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
© 2023, Amazon Web Services, Inc. or its affiliates.
Get insights from data in seconds
Get started with no modifications
Pay for what you use
Compute provisioning
Automated patching
Routine maintenance
Backup and recovery
Automatic scaling
Automatic failover
Security and industry compliance
Advanced monitoring
YOU
focus on
insights
takes care of
the rest
Experience consistently high performance
Amazon
Redshift
Serverless
9
AWS DATA ROADSHOW 2023
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Redshift – 이제 선택의 폭이 더 많아졌습니다.
Amazon Redshift Data API
JDBC/ODBC
Tools
Your
applications
Amazon S3 Data Lake
Amazon Redshift Serverless
Intelligent
and
dynamic
compute
management
ML-based
workload monitoring
Automatic tuning
Automatic scaling
Automatic
workload management
Pay for use
Performance at scale
Automatic maintenance
AWS Lambda, AWS Cloud9, Java, Go, PowerShell,
Node.js, C#, Python, and Ruby
RA3
compute
nodes
Leader node
Amazon Redshift
managed storage
Provisioned Cluster Serverless Multi Endpoint
Data Sharing
(암호화 기반)
[RA3 의 특장점]
- Node / Storage 분리
- Node 당 : 128T (16P확장가능)
- Data sharing
[Serverless 특장점 ]
- 사용시간 만큼만 과금
- Base RPU 에 따른 Computing 설정
- 불필요한 관리 요소 자동화
1 2
Spectrum
Spectrum Spectrum
AWS DATA ROADSHOW 2023
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Redshift Serverless 는..
데이터 웨어하우스 클러스터를 관리할 필요
없이 분석 실행 및 확장
단순화된 사용자 경험
데이터 웨어하우스 용량을 자동으로
프로비저닝 및 확장하여 일관되게 빠른
성능 제공
지능적이고 동적인 컴퓨팅
Amazon Redshift의 풍부한 SQL 기능,
원활한 데이터 레이크 통합 및 규모에 맞는
업계 최고의 가격 성능 활용
모든 Redshift 의 기능과 성능
초당 워크로드 기간에 대해서만 계산 용량에 대한
비용을 지불합니다.
“사용한 만큼 지불”
“별도의 Cluster 관리 없이 ”, “다양한 Workload에 자동으로 대응되며”
“모든 기능”을, “사용한 만큼만 비용 지불”
AWS DATA ROADSHOW 2023
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Pay for use
2.00:00 2:05:00 2.10:00 2.15:00
2:00:00
-2:03:00
2:00:30
-2:02:30
2:07:00
-2:08:10
Q1
Q2
Q3
Q4
2:12:00
-2:13:20
2:01:30
-2:03:00
Q5
Pay for the compute capacity only for the workload duration (metered on a per-second basis)
Queries Query execution time
Q1, Q2, Q3 3 minutes
Q4 1 minute 10 seconds
Q5 1 minute and 20 seconds
Total charges 5 minutes and 30 seconds
No charges for idleness!
2:01:30
-2:03:00
2:01:30
-2:03:00
AWS DATA ROADSHOW 2023
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Namespace properties (데이타 베이스 기본 환경 부분)
1
Workgroup properties (자원 할당 부분)
2
보다 손쉽게 Redshift Serverless 를 시작 하실수 있습니다 -1
Default
Workgroup
(32 RPU)
Default
Namespace
ENDPOINT
AWS DATA ROADSHOW 2023
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Namespace properties
1
Workgroup properties
2
Serverless endpoint 생성
3
Query Editor 와 같은
Tool 로 Redshift
Serverless 연결
4
보다 손쉽게 Redshift Serverless 를 시작 하실수 있습니다 -2
AWS DATA ROADSHOW 2023
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Computing 관리 – RPU 기준 사용한 시간 비용 지불
RPU 128 (Default)
R P U
Base RPU 이상 필요시 Scale 됨
AWS DATA ROADSHOW 2023
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
BASE RPU 맛보기
[ 미사용시 ]
[ SQL 수행시 ]
AWS DATA ROADSHOW 2023
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
성능과 비용 통제가 가능합니다
AWS DATA ROADSHOW 2023
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Redshift Serverless 를 활용한 다양한 Architecture 구성 가능
Data science
Marketing
Serverless endpoint
Finance
Provisioned cluster
Sales
Serverless endpoint
Provisioned cluster
AWS DATA ROADSHOW 2023
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Demo-1
Iris_train
1) Producer Side (Redshift-provision) 에서 , 데이타 쉐어링 설정을 한다
2) Consumer Side (Serverless-workgroup01) 에서,
데이타 쉐어링 관련 설정을 하고, 데이타 확인한다
3) Redshift Serverless 에 자원 사용을 확인한다.
Iris_test
Amazon Redshift
Serverless
Amazon S3
data lake &
Files
ML and analytics
services
(SageMaker)
Streaming data
services
Amazon Redshift
Provision
Data sharing
Stream Ingestion
Auto Copy
Redshift ML
iris_data_test_auto_copy
AWS DATA ROADSHOW 2023
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. 20
AWS DATA ROADSHOW 2023
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
© 2023, Amazon Web Services, Inc. or its affiliates.
친숙한 SQL 명령을 사용하여
웨어하우스 내에서 ML 모델 생성,
교육 및 구현
SQL 을 활용하여 ML task 를
수행 가능합니다.
빠르게 예측 이 가능합니다.
ML 에 대한 사전 경험이 없이
가능합니다
Amazon
Redshift ML
predictions per week in the warehouse
D A T A S C I E N C E F O R E V E R Y O N E
21
AWS DATA ROADSHOW 2023
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
ML 분석 방법
22
Sagemaker Notebook - Python Sagemaker Autopilot
AWS DATA ROADSHOW 2023
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Bring your model to Amazon Redshift ML
S Q L 에 서 원 격 S A G E M A K E R E N D P O I N T 호 출
Amazon
Redshift
Amazon
SageMaker
C R E A T E M O D E L
P R E D I C T
SageMaker 에서 모델을 생성하고,
훈련하고 , 배포 합니다.
SageMaker 의 External function
을 통해서 Redshift 에서 활용
가능합니다
Redshift 에서 해당 model 을 호출
할수 있습니다.
SageMaker 의 전체 flexibility 와
algorithm 을 사용가능합니다.
CREATE MODEL remote_customer_ltv
FUNCTION customer_ltv(
integer,integer)
RETURNS float4
SAGEMAKER ‘…’
IAM_ROLE ‘…’;
SELECT n.id, n.firstName, n.lastName,
customer_ltv(n.age,c.zip)
AS activity_prediction
FROM new_customers n
WHERE n.marital_status = ‘single’
Amazon
Redshift
Amazon
SageMaker
AWS DATA ROADSHOW 2023
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
복잡하고 반복 적인 ML 작업을 , 보다 간편하게 진행 가능합니다.
Redshift ML
Collect and
prepare
training data
Choose or build
a ML algorithm
Set up and
manage
environments
for training
Train, debug,
and tune
models
Deploy model
in production
Manage
training runs
Monitor models Validate
predictions
Scale and
manage the
production
environment
Build
Prepare Train & Tune Deploy & Manage
Collect and
load data into
your data
warehouse
Train
Amazon SageMaker
automatically tunes and
trains the best
ML model
Deploy
Amazon Redshift ML
automatically deploys
the ML model
Predict
Use SQL queries to make
predictions like projected
churn, pricing, and risk
Amazon Redshift
machine learning
Analyze data and do high-
performance reporting Create
Use the “create model”
command in SQL to create
the ML model in
Amazon Redshift
AWS DATA ROADSHOW 2023
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Redshift ML 는 어떻케 동작 할까요?
Amazon
Redshift
CREATE MODEL customer_churn
FROM (SELECT c.age, c.zip,
c.monthly_spend, c.monthly_cases,
c.active AS label
FROM customer_info_table c)
TARGET label
FUNCTION predict_customer_churn Amazon
SageMaker
Runs Autopilot
and returns model
SELECT n.id, n.firstName, n.lastName,
predict_customer_churn(n.age,c.zip,..)
AS activity_prediction
FROM new_customers n
WHERE n.marital_status = ‘single’
전적으로 Amazon Redshift에서 실행됨
Amazon
Redshift
T R A I N
P R E D I C T
간단한 SQL Command 로 모델
생성/훈련/Deploy 까지 수행됩니다
SageMaker 의 Autopilot 을 활용하여
모델의 자동 선택 및 전처리 작업들이
자동으로 수행됩니다.
훈련된 모델은 Amazon Redshift 데이터
웨어하우스의 SageMaker Neo에 의해
컴파일되어 SQL을 사용하여 예측할 수
있습니다
AWS DATA ROADSHOW 2023
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Amazon Redshift ML 의장점
• E A S I L Y T R A I N A N D U S E M L I N S Q L Q U E R I E S W I T H A M A Z O N S A G E M A K E R
Simple
SQL 로 모델을 생성하고 예측 할수
있습니다
Automatic
ML모델을 자동 사전 처리,
생성 .교육 조정 배포
Flexible
가장 적합한 ML 알고리즘을 찾아서
훈련 합니다.(e.g., XGBoost)
Performant
모델은 SageMaker Neo 로 컴파일 되어,
Redshift 에 배포 됩니다, 예측은
Redshift local 에서 효율적으로
진행됩니다,
Secure
데이타 거버넌스 관리에 대해
걱정할 필요가 없습니다, 데이타는
VPC 안에서 관리 됩니다.
Cost optimized
Training 부분에 대해서만, 비용이
발생하게 됩니다.
AWS DATA ROADSHOW 2023
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Demo-2
Amazon Redshift
Serverless
Amazon S3
data lake &
Files
ML and analytics
services
(SageMaker)
Streaming data
services
Amazon Redshift
Provision
Data sharing
Stream Ingestion
Auto Copy
Redshift ML
Iris_train
1) 쉐어링 된 iris provision 테이블을 활용해서 Redshift ML 을 수행한다
2) ML 이 수행되면 함수로, provision 의 iris_test 데이타를 검증한다
(Demo-1 에서 쉐어링 기능을 활용한다)
Iris_test
AWS DATA ROADSHOW 2023
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. 28
AWS DATA ROADSHOW 2023
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
© 2023, Amazon Web Services, Inc. or its affiliates.
Amazon
Redshift
Streaming
Ingestion
스트림 데이타를 실시간
분석을 위해 DW 로
자동으로 유입 하는 기능
Amazon
Redshift
Amazon Kinesis
Data Streams
Amazon MSK
Kinesis or Kafka
producer
Amazon Kinesis
Data Streams
29
AWS DATA ROADSHOW 2023
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Why Streaming Data ?
Source: Perishable insights, Mike Gualtieri, Forrester
Real timeSeconds Minutes Hours Days Months
Value
of
data
to
decision-
making
Preventive
/Predictive
(방어/예측)
Actionable
(실행력)
Reactive
(반응하는)
Historical
Time critical decisions Traditional “batch” business intelligence
Information half-life
in decision-making
AWS DATA ROADSHOW 2023
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
과거 Stream data Redshift ingestion 소개 방식
H T T P S : / / A W S . A M A Z O N . C O M / K O / K I N E S I S / D A T A - F I R E H O S E /
H T T P S : / / D O C S . A W S . A M A Z O N . C O M / K O _ K R / F I R E H O S E / L A T E S T / D E V / W H A T - I S - T H I S - S E R V I C E . H T M L
AWS DATA ROADSHOW 2023
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Amazon Redshift streaming
ingestion support
A m a z o n S 3 에 서 준 비 하 지 않 고 A m a z o n
K i n e s i s D a t a S t r e a m s ( K D S ) 및 A m a z o n
M a n a g e d S t r e a m i n g f o r A p a c h e
K a f k a ( A m a z o n M S K ) 에 서 데 이 터
웨 어 하 우 스 로 스 트 리 밍 데 이 터 를 직 접
수 집 합 니 다
친 숙 한 S Q L 을 사 용 하 여 풍 부 한 분 석 을
수 행 하 고 E L T 파 이 프 라 인 을 쉽 게 생 성 및
관 리
여 러 소 스 에 서 대 량 의 스 트 리 밍 데 이 터 를
처 리 하 여 몇 초 만 에 통 찰 력 을 얻 을 수
있 습 니 다
NEW [GENERAL AVAILABILITY]
Ingest streaming data into your data warehouse for real-time analytics
Amazon Redshift Streaming ingestion
Amazon
Kinesis
Data Streams
Amazon
Managed
Kafka Service
Amazon Redshift
Real-time
Materialized
View
Streaming
Table
Permanent
Tables
AWS DATA ROADSHOW 2023
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Streaming Ingestion Steps
Create External Schema
CREATE EXTERNAL SCHEMA mskdemo
FROM MSK
IAM_ROLE 'arn:aws:iam::123459007471:role/RedshiftImmersionRoleusw1'
AUTHENTICATION none
CLUSTER_ARN 'arn:aws:kafka:us-west-1:123459007471:cluster/MSKCluster-MSK/807707f7-
f857-4360-9ef2-b8726addd372-2';
Create Materialized View to ingest from topic/stream
CREATE materialized VIEW stg_orders diststyle even sortkey
(refresh_time) auto refresh yes AS
SELECT *,
Json_parse(kafka_value) AS payload
FROM mskdemo.orders
WHERE Can_json_parse(kafka_value);
Use MV to populate regular tables or MV on MVs
AWS DATA ROADSHOW 2023
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Demo-3
Amazon Redshift
Serverless
Amazon S3
data lake &
Files
ML and analytics
services
(SageMaker)
Streaming data
services
Amazon Redshift
Provision
Data sharing
Stream Ingestion
Auto Copy
Redshift ML
1) Kinesis 를 확인한다
2) 임의로 데이타를 유입한다 (Python Code 활용)
3) External 로 지정한다.
4) Materialized view 를 생성한다 (auto option)
5) 데이타 유입을 확인한다.
6) Grafana 를 통해서 데이타 유입을 확인 가능함.
AWS DATA ROADSHOW 2023
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. 35
AWS DATA ROADSHOW 2023
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
© 2023, Amazon Web Services, Inc. or its affiliates.
Simple, low-code data ingestion
Avoid re-ingestion and manual tracking of
loaded files
Easily convert your existing COPY
statements into automatic ingestion jobs
Automatic ingestion of new data from
Amazon S3 based on user defined
configurations
Redshift auto-copy
from Amazon S3
[PREVIEW]
Simplified & automated file ingestion from
Amazon S3 into Amazon Redshift
Amazon S3
Redshift
Copy Job
Amazon
Redshift
Table
Continuously
monitoring S3
folder
New file(s)
detected Ingestion
automatically
starts
AWS DATA ROADSHOW 2023
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Ingesting data into analytics systems is complex
M U L T I P L E S O U R C E S Y S T E M S R E Q U I R E S E P A R A T E & C O M P L E X M A N U A L D A T A P I P E L I N E S
Data Sources
Operational databases
Streaming data
Data lake
Analytics
Expensive and cumbersome
to build and maintain ETL jobs
Complex reconstruction of the data
especially with schema changes
Incomplete, inconsistent, and stale
views of data, limiting insights
Manual data pipelines
File storage
X
X
X
AWS DATA ROADSHOW 2023
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Redshift auto-copy
from Amazon S3
[PREVIEW]
Simplified & automated file ingestion from
Amazon S3 into Amazon Redshift
Amazon S3
Redshift
Copy Job
Amazon
Redshift Table
Continuously
monitoring S3
folder
New file(s)
detected
Ingestion automatically
starts
지 속 적 인 파 일 수 집 파 이 프 라 인 을
설 정 하 기 위 해 사 용 자 지 정 빌 드
또 는 타 사 솔 루 션 이 필 요 하 지
않 습 니 다 .
데 이 터 엔 지 니 어 링 기 술 을
보 유 하 거 나 반 복 적 이 고 점 진 적 인
수 집 요 구 사 항 에 대 한 외 부 지 원 에
의 존 할 필 요 성 을 줄 임 으 로 써 L O B
사 용 자 의 생 산 성 을 향 상 시 킵 니 다 .
복 사 문 을 기 본 적 으 로 R e d s h i f t 에
저 장 하 고 , 새 파 일 을 만 들 때
자 동 으 로 또 는 수 동 으 로 실 행 할 수
있 는 복 사 문 을 다 시 사 용 할 수 있 는
방 법 을 제 공 합 니 다 .
AWS DATA ROADSHOW 2023
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Redshift auto-copy jobs
Amazon S3의 Redshift 자동 복사가 새로운
데이터베이스 개체를 소개되었습니다 : COPY JOB
COPY target_table
FROM s3://path-to-your-folder
[COPY PARAMETERS]
JOB CREATE <job_name>
1. 사용자는 복사 문을 복사 작업으로 쉽게 변환할
수 있습니다.
2. 지정된 S3 경로에서 새 파일이 탐지될 때 복사
작업을 자동으로 트리거 됩니다.
3. COPY 작업은 로드한 파일을 추적하고 나중에
다시 로드하지 않도록 합니다.
• Copy 작업은 , 일반적인 Redshift 의 Copy 명령을
사용합니다. S3에서 복사만 복사 작업에서
지원됩니다.
NOTE: Only one copy job can be
created for the same S3 path + target
table pair in a database.
AWS DATA ROADSHOW 2023
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Demo-4
Amazon Redshift
Serverless
Amazon S3
data lake &
Files
ML and analytics
services
(SageMaker)
Streaming data
services
Amazon Redshift
Provision
Data sharing
Stream Ingestion
Auto Copy
Redshift ML
1) S3 에 넣을 데이타를 확인한다
2) AUTO COPY 명령어를 수행한다
3) 빈폴더에 데이타를 Load 한다
4) 데이타 저장을 확인한다.
AWS DATA ROADSHOW 2023
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. 41
AWS DATA ROADSHOW 2023
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
© 2023, Amazon Web Services, Inc. or its affiliates.
Target Architecture Summary
AWS DATA ROADSHOW 2023
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Session Target
Architecture
Moving towards
“Zero-ETL” for years
Zero
ETL
No data movement,
data copying
Secure and consistent
data sharing
Data Lake
analytics
ML in
SQL
Use your favorite
BI tool
Spark application
development
Auto Ingestion of
S3 files
Amazon Redshift
Serverless
Amazon S3 data
lake & Files
ML and
analytics
services
(SageMaker)
Streaming data
services
43
Amazon
Redshift
Data sharing
Stream Ingestion
Auto Copy
Redshift ML
AWS DATA ROADSHOW 2023
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Analyze all your data across data stores,
organizations, third party data for
powerful analytics
Zero
ETL!
No data
movement
Secure and consistent
data sharing
Data Lake
analytics
No data
duplication
ML in
SQL
Use your favorite
BI tool
Spark application
development
Auto
Ingestion of
S3 files
Data ingestion
Query data where it lives
Federated Queries
Amazon Redshift
data lake queries
Operational
databases
BI and analytics apps
Connect apps to analyze and visualize your data
Amazon S3 data lake
Keep up to exabytes of data in Amazon S3
SQL
Amazon
Redshift ML
Amazon Redshift
ML and
analytics services
Analyze open standards-
based data formats
Data sharing
Data marketplaces for
third-party data
Amazon S3 Amazon Redshift Auto-ingestion / Informatica data loader
Amazon
Redshift
integration
for Apache
Spark
Redshift producer and
consumer clusters
Streaming ingestion
Kinesis Data
Streams, MSK
Amazon Aurora Zero-ETL to Amazon Redshift
Data Lake export
[PREVIEW]
AWS DATA ROADSHOW 2023
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Gartner
Database Management System(Amazon Redshift)
Magic Quadrant Survey
설문에 약 10 분 가량의 시간이 소요 됩니다.
AWS DATA ROADSHOW 2023
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Thank you!
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.

More Related Content

What's hot

Amazon Redshift 아키텍처 및 모범사례::김민성::AWS Summit Seoul 2018
Amazon Redshift 아키텍처 및 모범사례::김민성::AWS Summit Seoul 2018Amazon Redshift 아키텍처 및 모범사례::김민성::AWS Summit Seoul 2018
Amazon Redshift 아키텍처 및 모범사례::김민성::AWS Summit Seoul 2018
Amazon Web Services Korea
 
천만 사용자를 위한 AWS 클라우드 아키텍쳐 진화하기- AWS Summit Seoul 2017
천만 사용자를 위한 AWS 클라우드 아키텍쳐 진화하기- AWS Summit Seoul 2017천만 사용자를 위한 AWS 클라우드 아키텍쳐 진화하기- AWS Summit Seoul 2017
천만 사용자를 위한 AWS 클라우드 아키텍쳐 진화하기- AWS Summit Seoul 2017
Amazon Web Services Korea
 

What's hot (20)

Amazon OpenSearch - Use Cases, Security/Observability, Serverless and Enhance...
Amazon OpenSearch - Use Cases, Security/Observability, Serverless and Enhance...Amazon OpenSearch - Use Cases, Security/Observability, Serverless and Enhance...
Amazon OpenSearch - Use Cases, Security/Observability, Serverless and Enhance...
 
Amazon Elasticache - Fully managed, Redis & Memcached Compatible Service (Lev...
Amazon Elasticache - Fully managed, Redis & Memcached Compatible Service (Lev...Amazon Elasticache - Fully managed, Redis & Memcached Compatible Service (Lev...
Amazon Elasticache - Fully managed, Redis & Memcached Compatible Service (Lev...
 
Amazon Aurora Deep Dive (김기완) - AWS DB Day
Amazon Aurora Deep Dive (김기완) - AWS DB DayAmazon Aurora Deep Dive (김기완) - AWS DB Day
Amazon Aurora Deep Dive (김기완) - AWS DB Day
 
워크로드 특성에 따른 안전하고 효율적인 Data Lake 운영 방안
워크로드 특성에 따른 안전하고 효율적인 Data Lake 운영 방안워크로드 특성에 따른 안전하고 효율적인 Data Lake 운영 방안
워크로드 특성에 따른 안전하고 효율적인 Data Lake 운영 방안
 
Amazon Redshift 아키텍처 및 모범사례::김민성::AWS Summit Seoul 2018
Amazon Redshift 아키텍처 및 모범사례::김민성::AWS Summit Seoul 2018Amazon Redshift 아키텍처 및 모범사례::김민성::AWS Summit Seoul 2018
Amazon Redshift 아키텍처 및 모범사례::김민성::AWS Summit Seoul 2018
 
Amazon DocumentDB vs MongoDB 의 내부 아키텍쳐 와 장단점 비교
Amazon DocumentDB vs MongoDB 의 내부 아키텍쳐 와 장단점 비교Amazon DocumentDB vs MongoDB 의 내부 아키텍쳐 와 장단점 비교
Amazon DocumentDB vs MongoDB 의 내부 아키텍쳐 와 장단점 비교
 
AWS Summit Seoul 2023 | 롯데면세점이 고객에게 차별화된 경험을 제공하는 방법: AWS Native 서비스를 활용한 초개인...
AWS Summit Seoul 2023 | 롯데면세점이 고객에게 차별화된 경험을 제공하는 방법: AWS Native 서비스를 활용한 초개인...AWS Summit Seoul 2023 | 롯데면세점이 고객에게 차별화된 경험을 제공하는 방법: AWS Native 서비스를 활용한 초개인...
AWS Summit Seoul 2023 | 롯데면세점이 고객에게 차별화된 경험을 제공하는 방법: AWS Native 서비스를 활용한 초개인...
 
AWS Summit Seoul 2023 | 가격은 저렴, 성능은 최대로! 확 달라진 Amazon EC2 알아보기
AWS Summit Seoul 2023 | 가격은 저렴, 성능은 최대로! 확 달라진 Amazon EC2 알아보기AWS Summit Seoul 2023 | 가격은 저렴, 성능은 최대로! 확 달라진 Amazon EC2 알아보기
AWS Summit Seoul 2023 | 가격은 저렴, 성능은 최대로! 확 달라진 Amazon EC2 알아보기
 
AWS Backup을 이용한 데이터베이스의 백업 자동화와 편리한 복구방법
AWS Backup을 이용한 데이터베이스의 백업 자동화와 편리한 복구방법AWS Backup을 이용한 데이터베이스의 백업 자동화와 편리한 복구방법
AWS Backup을 이용한 데이터베이스의 백업 자동화와 편리한 복구방법
 
AWS Summit Seoul 2023 | Amazon Neptune 및 Elastic을 이용한 추천 서비스 및 검색 플랫폼 구축하기
AWS Summit Seoul 2023 | Amazon Neptune 및 Elastic을 이용한 추천 서비스 및 검색 플랫폼 구축하기AWS Summit Seoul 2023 | Amazon Neptune 및 Elastic을 이용한 추천 서비스 및 검색 플랫폼 구축하기
AWS Summit Seoul 2023 | Amazon Neptune 및 Elastic을 이용한 추천 서비스 및 검색 플랫폼 구축하기
 
Demystify Streaming on AWS - 발표자: 이종혁, Sr Analytics Specialist, WWSO, AWS :::...
Demystify Streaming on AWS - 발표자: 이종혁, Sr Analytics Specialist, WWSO, AWS :::...Demystify Streaming on AWS - 발표자: 이종혁, Sr Analytics Specialist, WWSO, AWS :::...
Demystify Streaming on AWS - 발표자: 이종혁, Sr Analytics Specialist, WWSO, AWS :::...
 
코리안리 - 데이터 분석 플랫폼 구축 여정, 그 시작과 과제 - 발표자: 김석기 그룹장, 데이터비즈니스센터, 메가존클라우드 ::: AWS ...
코리안리 - 데이터 분석 플랫폼 구축 여정, 그 시작과 과제 - 발표자: 김석기 그룹장, 데이터비즈니스센터, 메가존클라우드 ::: AWS ...코리안리 - 데이터 분석 플랫폼 구축 여정, 그 시작과 과제 - 발표자: 김석기 그룹장, 데이터비즈니스센터, 메가존클라우드 ::: AWS ...
코리안리 - 데이터 분석 플랫폼 구축 여정, 그 시작과 과제 - 발표자: 김석기 그룹장, 데이터비즈니스센터, 메가존클라우드 ::: AWS ...
 
AWS Summit Seoul 2023 | AWS Graviton과 함께하는 계획문제 최적화 애플리케이션 개발
AWS Summit Seoul 2023 | AWS Graviton과 함께하는 계획문제 최적화 애플리케이션 개발AWS Summit Seoul 2023 | AWS Graviton과 함께하는 계획문제 최적화 애플리케이션 개발
AWS Summit Seoul 2023 | AWS Graviton과 함께하는 계획문제 최적화 애플리케이션 개발
 
DMS와 SCT를 활용한 Oracle에서 Open Source DB로의 전환
DMS와 SCT를 활용한 Oracle에서 Open Source DB로의 전환DMS와 SCT를 활용한 Oracle에서 Open Source DB로의 전환
DMS와 SCT를 활용한 Oracle에서 Open Source DB로의 전환
 
AWS Summit Seoul 2023 | 삼성전자/쿠팡의 대규모 트래픽 처리를 위한 클라우드 네이티브 데이터베이스 활용
AWS Summit Seoul 2023 | 삼성전자/쿠팡의 대규모 트래픽 처리를 위한 클라우드 네이티브 데이터베이스 활용AWS Summit Seoul 2023 | 삼성전자/쿠팡의 대규모 트래픽 처리를 위한 클라우드 네이티브 데이터베이스 활용
AWS Summit Seoul 2023 | 삼성전자/쿠팡의 대규모 트래픽 처리를 위한 클라우드 네이티브 데이터베이스 활용
 
AWS Summit Seoul 2023 | 갤럭시 규모의 서비스를 위한 Amazon DynamoDB의 역할과 비용 최적화 방법
AWS Summit Seoul 2023 | 갤럭시 규모의 서비스를 위한 Amazon DynamoDB의 역할과 비용 최적화 방법AWS Summit Seoul 2023 | 갤럭시 규모의 서비스를 위한 Amazon DynamoDB의 역할과 비용 최적화 방법
AWS Summit Seoul 2023 | 갤럭시 규모의 서비스를 위한 Amazon DynamoDB의 역할과 비용 최적화 방법
 
AWS Summit Seoul 2023 | Snowflake: 모든 데이터 워크로드를 위한 하나의 클라우드 데이터 플랫폼
AWS Summit Seoul 2023 | Snowflake: 모든 데이터 워크로드를 위한 하나의 클라우드 데이터 플랫폼AWS Summit Seoul 2023 | Snowflake: 모든 데이터 워크로드를 위한 하나의 클라우드 데이터 플랫폼
AWS Summit Seoul 2023 | Snowflake: 모든 데이터 워크로드를 위한 하나의 클라우드 데이터 플랫폼
 
[보험사를 위한 AWS Data Analytics Day] 4_신한금융그룹의 데이터 댐_Do...
[보험사를 위한 AWS Data Analytics Day] 4_신한금융그룹의 데이터 댐_Do...[보험사를 위한 AWS Data Analytics Day] 4_신한금융그룹의 데이터 댐_Do...
[보험사를 위한 AWS Data Analytics Day] 4_신한금융그룹의 데이터 댐_Do...
 
천만 사용자를 위한 AWS 클라우드 아키텍쳐 진화하기- AWS Summit Seoul 2017
천만 사용자를 위한 AWS 클라우드 아키텍쳐 진화하기- AWS Summit Seoul 2017천만 사용자를 위한 AWS 클라우드 아키텍쳐 진화하기- AWS Summit Seoul 2017
천만 사용자를 위한 AWS 클라우드 아키텍쳐 진화하기- AWS Summit Seoul 2017
 
Amazon RDS Proxy 집중 탐구 - 윤석찬 :: AWS Unboxing 온라인 세미나
Amazon RDS Proxy 집중 탐구 - 윤석찬 :: AWS Unboxing 온라인 세미나Amazon RDS Proxy 집중 탐구 - 윤석찬 :: AWS Unboxing 온라인 세미나
Amazon RDS Proxy 집중 탐구 - 윤석찬 :: AWS Unboxing 온라인 세미나
 

Similar to Amazon Redshift Deep Dive - Serverless, Streaming, ML, Auto Copy (New features) - 발표자: 김도균, ACE Specialist, WWSO, AWS ::: AWS Data Roadshow 2023

Similar to Amazon Redshift Deep Dive - Serverless, Streaming, ML, Auto Copy (New features) - 발표자: 김도균, ACE Specialist, WWSO, AWS ::: AWS Data Roadshow 2023 (20)

KB국민카드 - 클라우드 기반 분석 플랫폼 혁신 여정 - 발표자: 박창용 과장, 데이터전략본부, AI혁신부, KB카드│강병억, Soluti...
KB국민카드 - 클라우드 기반 분석 플랫폼 혁신 여정 - 발표자: 박창용 과장, 데이터전략본부, AI혁신부, KB카드│강병억, Soluti...KB국민카드 - 클라우드 기반 분석 플랫폼 혁신 여정 - 발표자: 박창용 과장, 데이터전략본부, AI혁신부, KB카드│강병억, Soluti...
KB국민카드 - 클라우드 기반 분석 플랫폼 혁신 여정 - 발표자: 박창용 과장, 데이터전략본부, AI혁신부, KB카드│강병억, Soluti...
 
데이터 분석가를 위한 신규 분석 서비스 - 김기영, AWS 분석 솔루션즈 아키텍트 / 변규현, 당근마켓 소프트웨어 엔지니어 :: AWS r...
데이터 분석가를 위한 신규 분석 서비스 - 김기영, AWS 분석 솔루션즈 아키텍트 / 변규현, 당근마켓 소프트웨어 엔지니어 :: AWS r...데이터 분석가를 위한 신규 분석 서비스 - 김기영, AWS 분석 솔루션즈 아키텍트 / 변규현, 당근마켓 소프트웨어 엔지니어 :: AWS r...
데이터 분석가를 위한 신규 분석 서비스 - 김기영, AWS 분석 솔루션즈 아키텍트 / 변규현, 당근마켓 소프트웨어 엔지니어 :: AWS r...
 
VUCA 시대의 디지털 네이티브 리더가 알아야할 AWS의 기술 ::: AWS ExecLeaders Korea 2023
VUCA 시대의 디지털 네이티브 리더가 알아야할 AWS의 기술 ::: AWS ExecLeaders Korea 2023 VUCA 시대의 디지털 네이티브 리더가 알아야할 AWS의 기술 ::: AWS ExecLeaders Korea 2023
VUCA 시대의 디지털 네이티브 리더가 알아야할 AWS의 기술 ::: AWS ExecLeaders Korea 2023
 
[보험사를 위한 AWS Data Analytics Day] 5_KB금융그룹과 계열사의 AWS 기ᄇ...
[보험사를 위한 AWS Data Analytics Day] 5_KB금융그룹과 계열사의 AWS 기ᄇ...[보험사를 위한 AWS Data Analytics Day] 5_KB금융그룹과 계열사의 AWS 기ᄇ...
[보험사를 위한 AWS Data Analytics Day] 5_KB금융그룹과 계열사의 AWS 기ᄇ...
 
[보험사를 위한 AWS Data Analytics Day] 5_KB금융그룹과 계열사의 AWS 기ᄇ...
[보험사를 위한 AWS Data Analytics Day] 5_KB금융그룹과 계열사의 AWS 기ᄇ...[보험사를 위한 AWS Data Analytics Day] 5_KB금융그룹과 계열사의 AWS 기ᄇ...
[보험사를 위한 AWS Data Analytics Day] 5_KB금융그룹과 계열사의 AWS 기ᄇ...
 
사례로 알아보는 Database Migration Service : 데이터베이스 및 데이터 이관, 통합, 분리, 분석의 도구 - 발표자: ...
사례로 알아보는 Database Migration Service : 데이터베이스 및 데이터 이관, 통합, 분리, 분석의 도구 - 발표자: ...사례로 알아보는 Database Migration Service : 데이터베이스 및 데이터 이관, 통합, 분리, 분석의 도구 - 발표자: ...
사례로 알아보는 Database Migration Service : 데이터베이스 및 데이터 이관, 통합, 분리, 분석의 도구 - 발표자: ...
 
AWS Summit Seoul 2023 | AWS 마이그레이션을 통한 엔카닷컴의 DT 전략
AWS Summit Seoul 2023 | AWS 마이그레이션을 통한 엔카닷컴의 DT 전략AWS Summit Seoul 2023 | AWS 마이그레이션을 통한 엔카닷컴의 DT 전략
AWS Summit Seoul 2023 | AWS 마이그레이션을 통한 엔카닷컴의 DT 전략
 
AWS Summit Seoul 2023 | Amazon Redshift Serverless를 활용한 LG 이노텍의 데이터 분석 플랫폼 혁신 과정
AWS Summit Seoul 2023 | Amazon Redshift Serverless를 활용한 LG 이노텍의 데이터 분석 플랫폼 혁신 과정AWS Summit Seoul 2023 | Amazon Redshift Serverless를 활용한 LG 이노텍의 데이터 분석 플랫폼 혁신 과정
AWS Summit Seoul 2023 | Amazon Redshift Serverless를 활용한 LG 이노텍의 데이터 분석 플랫폼 혁신 과정
 
[보험사를 위한 AWS Data Analytics Day] 6_Data Analytics의 현재와 미래-토ᄉ...
[보험사를 위한 AWS Data Analytics Day] 6_Data Analytics의 현재와 미래-토ᄉ...[보험사를 위한 AWS Data Analytics Day] 6_Data Analytics의 현재와 미래-토ᄉ...
[보험사를 위한 AWS Data Analytics Day] 6_Data Analytics의 현재와 미래-토ᄉ...
 
AWS Summit Seoul 2023 | MongoDB Atlas와 함께하는 Developer Data Platform
AWS Summit Seoul 2023 | MongoDB Atlas와 함께하는 Developer Data PlatformAWS Summit Seoul 2023 | MongoDB Atlas와 함께하는 Developer Data Platform
AWS Summit Seoul 2023 | MongoDB Atlas와 함께하는 Developer Data Platform
 
AWS Summit Seoul 2023 | 당신만 모르고 있는 AWS 컨트롤 타워 트렌드
AWS Summit Seoul 2023 | 당신만 모르고 있는 AWS 컨트롤 타워 트렌드AWS Summit Seoul 2023 | 당신만 모르고 있는 AWS 컨트롤 타워 트렌드
AWS Summit Seoul 2023 | 당신만 모르고 있는 AWS 컨트롤 타워 트렌드
 
AWS Summit Seoul 2023 |Datadog을 활용한 AWS 서버리스 Observability
AWS Summit Seoul 2023 |Datadog을 활용한 AWS 서버리스 ObservabilityAWS Summit Seoul 2023 |Datadog을 활용한 AWS 서버리스 Observability
AWS Summit Seoul 2023 |Datadog을 활용한 AWS 서버리스 Observability
 
[Keynote] 슬기로운 AWS 데이터베이스 선택하기 - 발표자: 강민석, Korea Database SA Manager, WWSO, A...
[Keynote] 슬기로운 AWS 데이터베이스 선택하기 - 발표자: 강민석, Korea Database SA Manager, WWSO, A...[Keynote] 슬기로운 AWS 데이터베이스 선택하기 - 발표자: 강민석, Korea Database SA Manager, WWSO, A...
[Keynote] 슬기로운 AWS 데이터베이스 선택하기 - 발표자: 강민석, Korea Database SA Manager, WWSO, A...
 
AWS Summit Seoul 2023 | 천만 사용자 서비스를 위한 Amazon SageMaker 활용 방법 진화하기
AWS Summit Seoul 2023 | 천만 사용자 서비스를 위한 Amazon SageMaker 활용 방법 진화하기AWS Summit Seoul 2023 | 천만 사용자 서비스를 위한 Amazon SageMaker 활용 방법 진화하기
AWS Summit Seoul 2023 | 천만 사용자 서비스를 위한 Amazon SageMaker 활용 방법 진화하기
 
데이터 분석플랫폼을 위한 데이터 전처리부터 시각화까지 한번에 보기 - 노인철 AWS 솔루션즈 아키텍트 :: AWS Summit Seoul ...
데이터 분석플랫폼을 위한 데이터 전처리부터 시각화까지 한번에 보기 - 노인철 AWS 솔루션즈 아키텍트 :: AWS Summit Seoul ...데이터 분석플랫폼을 위한 데이터 전처리부터 시각화까지 한번에 보기 - 노인철 AWS 솔루션즈 아키텍트 :: AWS Summit Seoul ...
데이터 분석플랫폼을 위한 데이터 전처리부터 시각화까지 한번에 보기 - 노인철 AWS 솔루션즈 아키텍트 :: AWS Summit Seoul ...
 
AWS Summit Seoul 2023 | 스타트업의 서버리스 기반 SaaS 데이터 처리 및 데이터웨어하우스 구축 사례
AWS Summit Seoul 2023 | 스타트업의 서버리스 기반 SaaS 데이터 처리 및 데이터웨어하우스 구축 사례AWS Summit Seoul 2023 | 스타트업의 서버리스 기반 SaaS 데이터 처리 및 데이터웨어하우스 구축 사례
AWS Summit Seoul 2023 | 스타트업의 서버리스 기반 SaaS 데이터 처리 및 데이터웨어하우스 구축 사례
 
AWS Summit Seoul 2023 | 플로 AWS All-in 전략을 통해 음원서비스의 혁신을 이루다
AWS Summit Seoul 2023 | 플로 AWS All-in 전략을 통해 음원서비스의 혁신을 이루다AWS Summit Seoul 2023 | 플로 AWS All-in 전략을 통해 음원서비스의 혁신을 이루다
AWS Summit Seoul 2023 | 플로 AWS All-in 전략을 통해 음원서비스의 혁신을 이루다
 
AWS Summit Seoul 2023 | Confluent와 함께하는 실시간 데이터와 클라우드 여정
AWS Summit Seoul 2023 | Confluent와 함께하는 실시간 데이터와 클라우드 여정AWS Summit Seoul 2023 | Confluent와 함께하는 실시간 데이터와 클라우드 여정
AWS Summit Seoul 2023 | Confluent와 함께하는 실시간 데이터와 클라우드 여정
 
AWS Summit Seoul 2023 | 12가지 디자인 패턴으로 알아보는 클라우드 네이티브 마이크로서비스 아키텍처
AWS Summit Seoul 2023 | 12가지 디자인 패턴으로 알아보는 클라우드 네이티브 마이크로서비스 아키텍처AWS Summit Seoul 2023 | 12가지 디자인 패턴으로 알아보는 클라우드 네이티브 마이크로서비스 아키텍처
AWS Summit Seoul 2023 | 12가지 디자인 패턴으로 알아보는 클라우드 네이티브 마이크로서비스 아키텍처
 
AWS Summit Seoul 2023 | 혁신의 키워드는 '조직'과 '문화' - 하이브리드 클라우드 플랫폼과 agile 조직이 만드는 혁신
AWS Summit Seoul 2023 | 혁신의 키워드는 '조직'과 '문화' - 하이브리드 클라우드 플랫폼과 agile 조직이 만드는 혁신AWS Summit Seoul 2023 | 혁신의 키워드는 '조직'과 '문화' - 하이브리드 클라우드 플랫폼과 agile 조직이 만드는 혁신
AWS Summit Seoul 2023 | 혁신의 키워드는 '조직'과 '문화' - 하이브리드 클라우드 플랫폼과 agile 조직이 만드는 혁신
 

More from Amazon Web Services Korea

More from Amazon Web Services Korea (11)

AWS Modern Infra with Storage Roadshow 2023 - Day 2
AWS Modern Infra with Storage Roadshow 2023 - Day 2AWS Modern Infra with Storage Roadshow 2023 - Day 2
AWS Modern Infra with Storage Roadshow 2023 - Day 2
 
AWS Modern Infra with Storage Roadshow 2023 - Day 1
AWS Modern Infra with Storage Roadshow 2023 - Day 1AWS Modern Infra with Storage Roadshow 2023 - Day 1
AWS Modern Infra with Storage Roadshow 2023 - Day 1
 
From Insights to Action, How to build and maintain a Data Driven Organization...
From Insights to Action, How to build and maintain a Data Driven Organization...From Insights to Action, How to build and maintain a Data Driven Organization...
From Insights to Action, How to build and maintain a Data Driven Organization...
 
[Keynote] Accelerating Business Outcomes with AWS Data - 발표자: Saeed Gharadagh...
[Keynote] Accelerating Business Outcomes with AWS Data - 발표자: Saeed Gharadagh...[Keynote] Accelerating Business Outcomes with AWS Data - 발표자: Saeed Gharadagh...
[Keynote] Accelerating Business Outcomes with AWS Data - 발표자: Saeed Gharadagh...
 
SK Telecom - 망관리 프로젝트 TANGO의 오픈소스 데이터베이스 전환 여정 - 발표자 : 박승전, Project Manager, ...
SK Telecom - 망관리 프로젝트 TANGO의 오픈소스 데이터베이스 전환 여정 - 발표자 : 박승전, Project Manager, ...SK Telecom - 망관리 프로젝트 TANGO의 오픈소스 데이터베이스 전환 여정 - 발표자 : 박승전, Project Manager, ...
SK Telecom - 망관리 프로젝트 TANGO의 오픈소스 데이터베이스 전환 여정 - 발표자 : 박승전, Project Manager, ...
 
AWS Summit Seoul 2023 | 생성 AI 모델의 임베딩 벡터를 이용한 서버리스 추천 검색 구현하기
AWS Summit Seoul 2023 | 생성 AI 모델의 임베딩 벡터를 이용한 서버리스 추천 검색 구현하기AWS Summit Seoul 2023 | 생성 AI 모델의 임베딩 벡터를 이용한 서버리스 추천 검색 구현하기
AWS Summit Seoul 2023 | 생성 AI 모델의 임베딩 벡터를 이용한 서버리스 추천 검색 구현하기
 
AWS Summit Seoul 2023 | Amazon EKS 데이터 전송 비용 절감 및 카오스 엔지니어링 적용 사례
AWS Summit Seoul 2023 | Amazon EKS 데이터 전송 비용 절감 및 카오스 엔지니어링 적용 사례AWS Summit Seoul 2023 | Amazon EKS 데이터 전송 비용 절감 및 카오스 엔지니어링 적용 사례
AWS Summit Seoul 2023 | Amazon EKS 데이터 전송 비용 절감 및 카오스 엔지니어링 적용 사례
 
AWS Summit Seoul 2023 | 실시간 CDC 데이터 처리! Modern Transactional Data Lake 구축하기
AWS Summit Seoul 2023 | 실시간 CDC 데이터 처리! Modern Transactional Data Lake 구축하기AWS Summit Seoul 2023 | 실시간 CDC 데이터 처리! Modern Transactional Data Lake 구축하기
AWS Summit Seoul 2023 | 실시간 CDC 데이터 처리! Modern Transactional Data Lake 구축하기
 
AWS Summit Seoul 2023 | AWS에서 OpenTelemetry 기반의 애플리케이션 Observability 구축/활용하기
AWS Summit Seoul 2023 | AWS에서 OpenTelemetry 기반의 애플리케이션 Observability 구축/활용하기AWS Summit Seoul 2023 | AWS에서 OpenTelemetry 기반의 애플리케이션 Observability 구축/활용하기
AWS Summit Seoul 2023 | AWS에서 OpenTelemetry 기반의 애플리케이션 Observability 구축/활용하기
 
AWS Summit Seoul 2023 | 클라우드의 경계를 허무는 AWS Hybrid Cloud Services
AWS Summit Seoul 2023 | 클라우드의 경계를 허무는 AWS Hybrid Cloud ServicesAWS Summit Seoul 2023 | 클라우드의 경계를 허무는 AWS Hybrid Cloud Services
AWS Summit Seoul 2023 | 클라우드의 경계를 허무는 AWS Hybrid Cloud Services
 
AWS Summit Seoul 2023 | 기업 고객 대상 기계학습 기반 콜센터 도입을 위한 여정
AWS Summit Seoul 2023 | 기업 고객 대상 기계학습 기반 콜센터 도입을 위한 여정AWS Summit Seoul 2023 | 기업 고객 대상 기계학습 기반 콜센터 도입을 위한 여정
AWS Summit Seoul 2023 | 기업 고객 대상 기계학습 기반 콜센터 도입을 위한 여정
 

Recently uploaded

Grid Layout (Kitworks Team Study 장현정 발표자료)
Grid Layout (Kitworks Team Study 장현정 발표자료)Grid Layout (Kitworks Team Study 장현정 발표자료)
Grid Layout (Kitworks Team Study 장현정 발표자료)
Wonjun Hwang
 
파일 업로드(Kitworks Team Study 유현주 발표자료 240510)
파일 업로드(Kitworks Team Study 유현주 발표자료 240510)파일 업로드(Kitworks Team Study 유현주 발표자료 240510)
파일 업로드(Kitworks Team Study 유현주 발표자료 240510)
Wonjun Hwang
 

Recently uploaded (6)

오픈소스 위험 관리 및 공급망 보안 솔루션 'Checkmarx SCA' 소개자료
오픈소스 위험 관리 및 공급망 보안 솔루션 'Checkmarx SCA' 소개자료오픈소스 위험 관리 및 공급망 보안 솔루션 'Checkmarx SCA' 소개자료
오픈소스 위험 관리 및 공급망 보안 솔루션 'Checkmarx SCA' 소개자료
 
도심 하늘에서 시속 200km로 비행할 수 있는 미래 항공 모빌리티 'S-A2'
도심 하늘에서 시속 200km로 비행할 수 있는 미래 항공 모빌리티 'S-A2'도심 하늘에서 시속 200km로 비행할 수 있는 미래 항공 모빌리티 'S-A2'
도심 하늘에서 시속 200km로 비행할 수 있는 미래 항공 모빌리티 'S-A2'
 
[OpenLAB] AWS reInvent를 통해 바라본 글로벌 Cloud 기술동향.pdf
[OpenLAB] AWS reInvent를 통해 바라본 글로벌 Cloud 기술동향.pdf[OpenLAB] AWS reInvent를 통해 바라본 글로벌 Cloud 기술동향.pdf
[OpenLAB] AWS reInvent를 통해 바라본 글로벌 Cloud 기술동향.pdf
 
Grid Layout (Kitworks Team Study 장현정 발표자료)
Grid Layout (Kitworks Team Study 장현정 발표자료)Grid Layout (Kitworks Team Study 장현정 발표자료)
Grid Layout (Kitworks Team Study 장현정 발표자료)
 
파일 업로드(Kitworks Team Study 유현주 발표자료 240510)
파일 업로드(Kitworks Team Study 유현주 발표자료 240510)파일 업로드(Kitworks Team Study 유현주 발표자료 240510)
파일 업로드(Kitworks Team Study 유현주 발표자료 240510)
 
클라우드 애플리케이션 보안 플랫폼 'Checkmarx One' 소개자료
클라우드 애플리케이션 보안 플랫폼 'Checkmarx One' 소개자료클라우드 애플리케이션 보안 플랫폼 'Checkmarx One' 소개자료
클라우드 애플리케이션 보안 플랫폼 'Checkmarx One' 소개자료
 

Amazon Redshift Deep Dive - Serverless, Streaming, ML, Auto Copy (New features) - 발표자: 김도균, ACE Specialist, WWSO, AWS ::: AWS Data Roadshow 2023

  • 1. AWS DATA ROADSHOW 2023 © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. © 2023, Amazon Web Services, Inc. or its affiliates. Data Road Show Powering your analytics with serverless capabilities 2023/06/22
  • 2. AWS DATA ROADSHOW 2023 © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. © 2023, Amazon Web Services, Inc. or its affiliates. Redshift Deep-dive with new feature Dokyun, Kim WWSO ACE Specialist
  • 3. AWS DATA ROADSHOW 2023 © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Agenda 1. Session Intro (5 Min) 2. Redshift 및 Redshift Serverless (15 Min) 3. Redshift ML (10 Min) 4. Redshift Stream Ingestion (10 Min) 5. Redshift Auto-Copy (Preview) (10 Min) 6. Summary - Moving towards zero-ETL Concept (5 Min) 3
  • 4. AWS DATA ROADSHOW 2023 © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. © 2023, Amazon Web Services, Inc. or its affiliates. Session Intro
  • 5. © 2022, Amazon Web Services, Inc. or its Affiliates. 5 포괄적이면서 개방적인 AWS 서비스 데이터 이동 분석 데이터 레이크 인프라 & 관리 데이터, 시각화, 참여 & 기계 학습 + 그 외 다양한 Redshift EMR (Spark & Hadoop) Athena OpenSearch Service Kinesis Data Analytics AWS Glue (Spark & Python) S3/Glacier AWS Glue Lake Formation QuickSight SageMaker Comprehend Lex Polly Rekognition Translate Database Migration Service | Snowball | Snowmobile | Kinesis Data Streams | Kinesis Data Firehose | Managed Streaming for Apache Kafka Pinpoint Data Exchange
  • 6. AWS DATA ROADSHOW 2023 © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Amazon Redshift 고객의 요구 사항에 따라 계속해서 혁신 중 모든 데이터 분석 모든 규모에서 최고의 가격 성능 제공 누구나 쉽게 분석 가능 RA3 nodes & managed storage Concurrency scaling for reads and writes Security, governance & compliance Workload management enhancements SQL enhancements & migration support Serverless Automated DW management materialized views Data API AWS CloudFormation templates Amazon Redshift Advisor Grafana Plugin Query editor v2 Data sharing Amazon Redshift ML AWS Data Exchange integration Federated query SUPER data type with JSON Geospatial enhancements Aurora Zero ETL with Redshift (Preview) Redshift Streaming Ingestion Apache Spark Connector Multi-AZ Deployment (Preview) Data Sharing Access Control via AWS Lake Formation (Preview) Condition column Mask column ID Geo- location Name Phone number 123 WA Ana 123-456-3568 124 NY Alice 123-457-**** 125 WA Bruce 123-457-3569 126 CA Chris 123-457-**** 130 CA Sharon 123-457-**** Dynamic Data Masking (Preview) Auto Copy from S3 (Preview)
  • 7. AWS DATA ROADSHOW 2023 © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Session Target Architecture Moving towards zero-ETL for years Zero ETL No data movement, data copying Secure and consistent data sharing Data Lake analytics ML in SQL Use your favorite BI tool Spark application development Auto Ingestion of S3 files 7 Amazon Redshift Serverless Amazon S3 data lake & Files ML and analytics services (SageMaker) Streaming data services Amazon Redshift Provision Data sharing Stream Ingestion Auto Copy (Preview) Redshift ML
  • 8. AWS DATA ROADSHOW 2023 © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. 8
  • 9. AWS DATA ROADSHOW 2023 © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. © 2023, Amazon Web Services, Inc. or its affiliates. Get insights from data in seconds Get started with no modifications Pay for what you use Compute provisioning Automated patching Routine maintenance Backup and recovery Automatic scaling Automatic failover Security and industry compliance Advanced monitoring YOU focus on insights takes care of the rest Experience consistently high performance Amazon Redshift Serverless 9
  • 10. AWS DATA ROADSHOW 2023 © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Redshift – 이제 선택의 폭이 더 많아졌습니다. Amazon Redshift Data API JDBC/ODBC Tools Your applications Amazon S3 Data Lake Amazon Redshift Serverless Intelligent and dynamic compute management ML-based workload monitoring Automatic tuning Automatic scaling Automatic workload management Pay for use Performance at scale Automatic maintenance AWS Lambda, AWS Cloud9, Java, Go, PowerShell, Node.js, C#, Python, and Ruby RA3 compute nodes Leader node Amazon Redshift managed storage Provisioned Cluster Serverless Multi Endpoint Data Sharing (암호화 기반) [RA3 의 특장점] - Node / Storage 분리 - Node 당 : 128T (16P확장가능) - Data sharing [Serverless 특장점 ] - 사용시간 만큼만 과금 - Base RPU 에 따른 Computing 설정 - 불필요한 관리 요소 자동화 1 2 Spectrum Spectrum Spectrum
  • 11. AWS DATA ROADSHOW 2023 © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Redshift Serverless 는.. 데이터 웨어하우스 클러스터를 관리할 필요 없이 분석 실행 및 확장 단순화된 사용자 경험 데이터 웨어하우스 용량을 자동으로 프로비저닝 및 확장하여 일관되게 빠른 성능 제공 지능적이고 동적인 컴퓨팅 Amazon Redshift의 풍부한 SQL 기능, 원활한 데이터 레이크 통합 및 규모에 맞는 업계 최고의 가격 성능 활용 모든 Redshift 의 기능과 성능 초당 워크로드 기간에 대해서만 계산 용량에 대한 비용을 지불합니다. “사용한 만큼 지불” “별도의 Cluster 관리 없이 ”, “다양한 Workload에 자동으로 대응되며” “모든 기능”을, “사용한 만큼만 비용 지불”
  • 12. AWS DATA ROADSHOW 2023 © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Pay for use 2.00:00 2:05:00 2.10:00 2.15:00 2:00:00 -2:03:00 2:00:30 -2:02:30 2:07:00 -2:08:10 Q1 Q2 Q3 Q4 2:12:00 -2:13:20 2:01:30 -2:03:00 Q5 Pay for the compute capacity only for the workload duration (metered on a per-second basis) Queries Query execution time Q1, Q2, Q3 3 minutes Q4 1 minute 10 seconds Q5 1 minute and 20 seconds Total charges 5 minutes and 30 seconds No charges for idleness! 2:01:30 -2:03:00 2:01:30 -2:03:00
  • 13. AWS DATA ROADSHOW 2023 © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Namespace properties (데이타 베이스 기본 환경 부분) 1 Workgroup properties (자원 할당 부분) 2 보다 손쉽게 Redshift Serverless 를 시작 하실수 있습니다 -1 Default Workgroup (32 RPU) Default Namespace ENDPOINT
  • 14. AWS DATA ROADSHOW 2023 © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Namespace properties 1 Workgroup properties 2 Serverless endpoint 생성 3 Query Editor 와 같은 Tool 로 Redshift Serverless 연결 4 보다 손쉽게 Redshift Serverless 를 시작 하실수 있습니다 -2
  • 15. AWS DATA ROADSHOW 2023 © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Computing 관리 – RPU 기준 사용한 시간 비용 지불 RPU 128 (Default) R P U Base RPU 이상 필요시 Scale 됨
  • 16. AWS DATA ROADSHOW 2023 © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. BASE RPU 맛보기 [ 미사용시 ] [ SQL 수행시 ]
  • 17. AWS DATA ROADSHOW 2023 © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. 성능과 비용 통제가 가능합니다
  • 18. AWS DATA ROADSHOW 2023 © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Redshift Serverless 를 활용한 다양한 Architecture 구성 가능 Data science Marketing Serverless endpoint Finance Provisioned cluster Sales Serverless endpoint Provisioned cluster
  • 19. AWS DATA ROADSHOW 2023 © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Demo-1 Iris_train 1) Producer Side (Redshift-provision) 에서 , 데이타 쉐어링 설정을 한다 2) Consumer Side (Serverless-workgroup01) 에서, 데이타 쉐어링 관련 설정을 하고, 데이타 확인한다 3) Redshift Serverless 에 자원 사용을 확인한다. Iris_test Amazon Redshift Serverless Amazon S3 data lake & Files ML and analytics services (SageMaker) Streaming data services Amazon Redshift Provision Data sharing Stream Ingestion Auto Copy Redshift ML iris_data_test_auto_copy
  • 20. AWS DATA ROADSHOW 2023 © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. 20
  • 21. AWS DATA ROADSHOW 2023 © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. © 2023, Amazon Web Services, Inc. or its affiliates. 친숙한 SQL 명령을 사용하여 웨어하우스 내에서 ML 모델 생성, 교육 및 구현 SQL 을 활용하여 ML task 를 수행 가능합니다. 빠르게 예측 이 가능합니다. ML 에 대한 사전 경험이 없이 가능합니다 Amazon Redshift ML predictions per week in the warehouse D A T A S C I E N C E F O R E V E R Y O N E 21
  • 22. AWS DATA ROADSHOW 2023 © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. ML 분석 방법 22 Sagemaker Notebook - Python Sagemaker Autopilot
  • 23. AWS DATA ROADSHOW 2023 © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Bring your model to Amazon Redshift ML S Q L 에 서 원 격 S A G E M A K E R E N D P O I N T 호 출 Amazon Redshift Amazon SageMaker C R E A T E M O D E L P R E D I C T SageMaker 에서 모델을 생성하고, 훈련하고 , 배포 합니다. SageMaker 의 External function 을 통해서 Redshift 에서 활용 가능합니다 Redshift 에서 해당 model 을 호출 할수 있습니다. SageMaker 의 전체 flexibility 와 algorithm 을 사용가능합니다. CREATE MODEL remote_customer_ltv FUNCTION customer_ltv( integer,integer) RETURNS float4 SAGEMAKER ‘…’ IAM_ROLE ‘…’; SELECT n.id, n.firstName, n.lastName, customer_ltv(n.age,c.zip) AS activity_prediction FROM new_customers n WHERE n.marital_status = ‘single’ Amazon Redshift Amazon SageMaker
  • 24. AWS DATA ROADSHOW 2023 © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. 복잡하고 반복 적인 ML 작업을 , 보다 간편하게 진행 가능합니다. Redshift ML Collect and prepare training data Choose or build a ML algorithm Set up and manage environments for training Train, debug, and tune models Deploy model in production Manage training runs Monitor models Validate predictions Scale and manage the production environment Build Prepare Train & Tune Deploy & Manage Collect and load data into your data warehouse Train Amazon SageMaker automatically tunes and trains the best ML model Deploy Amazon Redshift ML automatically deploys the ML model Predict Use SQL queries to make predictions like projected churn, pricing, and risk Amazon Redshift machine learning Analyze data and do high- performance reporting Create Use the “create model” command in SQL to create the ML model in Amazon Redshift
  • 25. AWS DATA ROADSHOW 2023 © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Redshift ML 는 어떻케 동작 할까요? Amazon Redshift CREATE MODEL customer_churn FROM (SELECT c.age, c.zip, c.monthly_spend, c.monthly_cases, c.active AS label FROM customer_info_table c) TARGET label FUNCTION predict_customer_churn Amazon SageMaker Runs Autopilot and returns model SELECT n.id, n.firstName, n.lastName, predict_customer_churn(n.age,c.zip,..) AS activity_prediction FROM new_customers n WHERE n.marital_status = ‘single’ 전적으로 Amazon Redshift에서 실행됨 Amazon Redshift T R A I N P R E D I C T 간단한 SQL Command 로 모델 생성/훈련/Deploy 까지 수행됩니다 SageMaker 의 Autopilot 을 활용하여 모델의 자동 선택 및 전처리 작업들이 자동으로 수행됩니다. 훈련된 모델은 Amazon Redshift 데이터 웨어하우스의 SageMaker Neo에 의해 컴파일되어 SQL을 사용하여 예측할 수 있습니다
  • 26. AWS DATA ROADSHOW 2023 © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Amazon Redshift ML 의장점 • E A S I L Y T R A I N A N D U S E M L I N S Q L Q U E R I E S W I T H A M A Z O N S A G E M A K E R Simple SQL 로 모델을 생성하고 예측 할수 있습니다 Automatic ML모델을 자동 사전 처리, 생성 .교육 조정 배포 Flexible 가장 적합한 ML 알고리즘을 찾아서 훈련 합니다.(e.g., XGBoost) Performant 모델은 SageMaker Neo 로 컴파일 되어, Redshift 에 배포 됩니다, 예측은 Redshift local 에서 효율적으로 진행됩니다, Secure 데이타 거버넌스 관리에 대해 걱정할 필요가 없습니다, 데이타는 VPC 안에서 관리 됩니다. Cost optimized Training 부분에 대해서만, 비용이 발생하게 됩니다.
  • 27. AWS DATA ROADSHOW 2023 © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Demo-2 Amazon Redshift Serverless Amazon S3 data lake & Files ML and analytics services (SageMaker) Streaming data services Amazon Redshift Provision Data sharing Stream Ingestion Auto Copy Redshift ML Iris_train 1) 쉐어링 된 iris provision 테이블을 활용해서 Redshift ML 을 수행한다 2) ML 이 수행되면 함수로, provision 의 iris_test 데이타를 검증한다 (Demo-1 에서 쉐어링 기능을 활용한다) Iris_test
  • 28. AWS DATA ROADSHOW 2023 © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. 28
  • 29. AWS DATA ROADSHOW 2023 © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. © 2023, Amazon Web Services, Inc. or its affiliates. Amazon Redshift Streaming Ingestion 스트림 데이타를 실시간 분석을 위해 DW 로 자동으로 유입 하는 기능 Amazon Redshift Amazon Kinesis Data Streams Amazon MSK Kinesis or Kafka producer Amazon Kinesis Data Streams 29
  • 30. AWS DATA ROADSHOW 2023 © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Why Streaming Data ? Source: Perishable insights, Mike Gualtieri, Forrester Real timeSeconds Minutes Hours Days Months Value of data to decision- making Preventive /Predictive (방어/예측) Actionable (실행력) Reactive (반응하는) Historical Time critical decisions Traditional “batch” business intelligence Information half-life in decision-making
  • 31. AWS DATA ROADSHOW 2023 © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. 과거 Stream data Redshift ingestion 소개 방식 H T T P S : / / A W S . A M A Z O N . C O M / K O / K I N E S I S / D A T A - F I R E H O S E / H T T P S : / / D O C S . A W S . A M A Z O N . C O M / K O _ K R / F I R E H O S E / L A T E S T / D E V / W H A T - I S - T H I S - S E R V I C E . H T M L
  • 32. AWS DATA ROADSHOW 2023 © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Amazon Redshift streaming ingestion support A m a z o n S 3 에 서 준 비 하 지 않 고 A m a z o n K i n e s i s D a t a S t r e a m s ( K D S ) 및 A m a z o n M a n a g e d S t r e a m i n g f o r A p a c h e K a f k a ( A m a z o n M S K ) 에 서 데 이 터 웨 어 하 우 스 로 스 트 리 밍 데 이 터 를 직 접 수 집 합 니 다 친 숙 한 S Q L 을 사 용 하 여 풍 부 한 분 석 을 수 행 하 고 E L T 파 이 프 라 인 을 쉽 게 생 성 및 관 리 여 러 소 스 에 서 대 량 의 스 트 리 밍 데 이 터 를 처 리 하 여 몇 초 만 에 통 찰 력 을 얻 을 수 있 습 니 다 NEW [GENERAL AVAILABILITY] Ingest streaming data into your data warehouse for real-time analytics Amazon Redshift Streaming ingestion Amazon Kinesis Data Streams Amazon Managed Kafka Service Amazon Redshift Real-time Materialized View Streaming Table Permanent Tables
  • 33. AWS DATA ROADSHOW 2023 © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Streaming Ingestion Steps Create External Schema CREATE EXTERNAL SCHEMA mskdemo FROM MSK IAM_ROLE 'arn:aws:iam::123459007471:role/RedshiftImmersionRoleusw1' AUTHENTICATION none CLUSTER_ARN 'arn:aws:kafka:us-west-1:123459007471:cluster/MSKCluster-MSK/807707f7- f857-4360-9ef2-b8726addd372-2'; Create Materialized View to ingest from topic/stream CREATE materialized VIEW stg_orders diststyle even sortkey (refresh_time) auto refresh yes AS SELECT *, Json_parse(kafka_value) AS payload FROM mskdemo.orders WHERE Can_json_parse(kafka_value); Use MV to populate regular tables or MV on MVs
  • 34. AWS DATA ROADSHOW 2023 © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Demo-3 Amazon Redshift Serverless Amazon S3 data lake & Files ML and analytics services (SageMaker) Streaming data services Amazon Redshift Provision Data sharing Stream Ingestion Auto Copy Redshift ML 1) Kinesis 를 확인한다 2) 임의로 데이타를 유입한다 (Python Code 활용) 3) External 로 지정한다. 4) Materialized view 를 생성한다 (auto option) 5) 데이타 유입을 확인한다. 6) Grafana 를 통해서 데이타 유입을 확인 가능함.
  • 35. AWS DATA ROADSHOW 2023 © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. 35
  • 36. AWS DATA ROADSHOW 2023 © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. © 2023, Amazon Web Services, Inc. or its affiliates. Simple, low-code data ingestion Avoid re-ingestion and manual tracking of loaded files Easily convert your existing COPY statements into automatic ingestion jobs Automatic ingestion of new data from Amazon S3 based on user defined configurations Redshift auto-copy from Amazon S3 [PREVIEW] Simplified & automated file ingestion from Amazon S3 into Amazon Redshift Amazon S3 Redshift Copy Job Amazon Redshift Table Continuously monitoring S3 folder New file(s) detected Ingestion automatically starts
  • 37. AWS DATA ROADSHOW 2023 © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Ingesting data into analytics systems is complex M U L T I P L E S O U R C E S Y S T E M S R E Q U I R E S E P A R A T E & C O M P L E X M A N U A L D A T A P I P E L I N E S Data Sources Operational databases Streaming data Data lake Analytics Expensive and cumbersome to build and maintain ETL jobs Complex reconstruction of the data especially with schema changes Incomplete, inconsistent, and stale views of data, limiting insights Manual data pipelines File storage X X X
  • 38. AWS DATA ROADSHOW 2023 © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Redshift auto-copy from Amazon S3 [PREVIEW] Simplified & automated file ingestion from Amazon S3 into Amazon Redshift Amazon S3 Redshift Copy Job Amazon Redshift Table Continuously monitoring S3 folder New file(s) detected Ingestion automatically starts 지 속 적 인 파 일 수 집 파 이 프 라 인 을 설 정 하 기 위 해 사 용 자 지 정 빌 드 또 는 타 사 솔 루 션 이 필 요 하 지 않 습 니 다 . 데 이 터 엔 지 니 어 링 기 술 을 보 유 하 거 나 반 복 적 이 고 점 진 적 인 수 집 요 구 사 항 에 대 한 외 부 지 원 에 의 존 할 필 요 성 을 줄 임 으 로 써 L O B 사 용 자 의 생 산 성 을 향 상 시 킵 니 다 . 복 사 문 을 기 본 적 으 로 R e d s h i f t 에 저 장 하 고 , 새 파 일 을 만 들 때 자 동 으 로 또 는 수 동 으 로 실 행 할 수 있 는 복 사 문 을 다 시 사 용 할 수 있 는 방 법 을 제 공 합 니 다 .
  • 39. AWS DATA ROADSHOW 2023 © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Redshift auto-copy jobs Amazon S3의 Redshift 자동 복사가 새로운 데이터베이스 개체를 소개되었습니다 : COPY JOB COPY target_table FROM s3://path-to-your-folder [COPY PARAMETERS] JOB CREATE <job_name> 1. 사용자는 복사 문을 복사 작업으로 쉽게 변환할 수 있습니다. 2. 지정된 S3 경로에서 새 파일이 탐지될 때 복사 작업을 자동으로 트리거 됩니다. 3. COPY 작업은 로드한 파일을 추적하고 나중에 다시 로드하지 않도록 합니다. • Copy 작업은 , 일반적인 Redshift 의 Copy 명령을 사용합니다. S3에서 복사만 복사 작업에서 지원됩니다. NOTE: Only one copy job can be created for the same S3 path + target table pair in a database.
  • 40. AWS DATA ROADSHOW 2023 © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Demo-4 Amazon Redshift Serverless Amazon S3 data lake & Files ML and analytics services (SageMaker) Streaming data services Amazon Redshift Provision Data sharing Stream Ingestion Auto Copy Redshift ML 1) S3 에 넣을 데이타를 확인한다 2) AUTO COPY 명령어를 수행한다 3) 빈폴더에 데이타를 Load 한다 4) 데이타 저장을 확인한다.
  • 41. AWS DATA ROADSHOW 2023 © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. 41
  • 42. AWS DATA ROADSHOW 2023 © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. © 2023, Amazon Web Services, Inc. or its affiliates. Target Architecture Summary
  • 43. AWS DATA ROADSHOW 2023 © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Session Target Architecture Moving towards “Zero-ETL” for years Zero ETL No data movement, data copying Secure and consistent data sharing Data Lake analytics ML in SQL Use your favorite BI tool Spark application development Auto Ingestion of S3 files Amazon Redshift Serverless Amazon S3 data lake & Files ML and analytics services (SageMaker) Streaming data services 43 Amazon Redshift Data sharing Stream Ingestion Auto Copy Redshift ML
  • 44. AWS DATA ROADSHOW 2023 © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Analyze all your data across data stores, organizations, third party data for powerful analytics Zero ETL! No data movement Secure and consistent data sharing Data Lake analytics No data duplication ML in SQL Use your favorite BI tool Spark application development Auto Ingestion of S3 files Data ingestion Query data where it lives Federated Queries Amazon Redshift data lake queries Operational databases BI and analytics apps Connect apps to analyze and visualize your data Amazon S3 data lake Keep up to exabytes of data in Amazon S3 SQL Amazon Redshift ML Amazon Redshift ML and analytics services Analyze open standards- based data formats Data sharing Data marketplaces for third-party data Amazon S3 Amazon Redshift Auto-ingestion / Informatica data loader Amazon Redshift integration for Apache Spark Redshift producer and consumer clusters Streaming ingestion Kinesis Data Streams, MSK Amazon Aurora Zero-ETL to Amazon Redshift Data Lake export [PREVIEW]
  • 45. AWS DATA ROADSHOW 2023 © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Gartner Database Management System(Amazon Redshift) Magic Quadrant Survey 설문에 약 10 분 가량의 시간이 소요 됩니다.
  • 46. AWS DATA ROADSHOW 2023 © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Thank you! © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.