re:Invent 2020 DAT301 Deep Dive on Amazon Aurora with PostgreSQL Compatibility

© 2020, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Deep dive on Amazon Aurora
with PostgreSQL compatibility
Grant McAlister
Senior Principal Engineer
AWS
D A T 3 0 1

Amazon RDS PostgreSQL universe
Clients
RDS
PostgreSQL
Amazon
Aurora
PostgreSQL
EBS
Amazon
Aurora
storage
Version 9.6/10/11/12 – same extensions
Backup / Recovery – PITR
High availability and durability
Secure – IAM auth
Read replicas
Cross region snapshots
Scale compute – Online scale storage
Cross region replication
Outbound logical replication
Major version upgrade

Base architecture

Aurora storage and replicas
RW
Application Application
Write log
records
Aurora
storage
Availability Zone 3
Availability Zone 2
Availability Zone 1

RW
Write log
records
Read
blocks
Aurora
storage
Availability Zone 3
Availability Zone 2
Availability Zone 1

RO
Application
RW
Application
RO
Application
Async
Invalidation
& Update
Async
invalidation
& update
Write log
records
Read
blocks
Aurora
storage
RO
RO
RO
RO
Availability Zone 3
Availability Zone 2
Availability Zone 1

RO
Application
RW
Application
RO
Application
Async
Invalidation
& Update
Async
invalidation
& update
Write log
records
Read
blocks
RW
Aurora
storage
RO
RO
RO
RO
Availability Zone 3
Availability Zone 2
Availability Zone 1

Availability Zone 2
Availability Zone 1 Availability Zone 3
RO
Application
Fast clones
RW
Application
RW
Reporting
application
Read
blocks
Aurora
storage
Primary storage
Clone storage
Clone

Availability Zone 2
RO
Application
Fast clones
RW
Application
RW
Reporting
application
Write log
records
Read
blocks
Aurora
storage
Primary storage
Clone storage
Clone

Log-based storage

Concurrency: Remove log buffer
Queued work
Log buffer
PostgreSQL Aurora PostgreSQL
Storage
Queued work
Storage
Transaction
Write

Queued work
Log buffer
Storage
A Queued work
Storage
B
Transaction
Write

Queued work
Log buffer
Storage
A
Queued work
Storage
B C D E
Transaction
Write

Queued work
Log buffer
Storage
A
Queued work
Storage
B C D E
2 2 1 0 1
A B C D E
Durability
tracking
Transaction
Write

Queued work
Log buffer
Storage
A
Queued work
Storage
B C D E
2 2 1 0 1
A B C D E
Durability
tracking
Transaction
Write
G F

Queued work
Log buffer
Storage
A
Queued work
Storage
B C D E
2 2 1 0 1
A B C D E
Durability
tracking
Transaction
Write
G
F

Queued work
Log buffer
Storage
A
Queued work
Storage
B C D E
4 3 4 2 4 1
A B C D E F
Durability
tracking
Transaction
Write
G
F

6 5 6 3 5 2 0
A B C D E F G
Queued work
Log buffer
Storage
A
Queued work
Storage
B C D E
Durability
tracking
Transaction
Write
G F

Aurora: Writing less
Aurora
Block in
memory
t-v1
Aurora
storage
Block in
memory
PostgreSQL
t-v1
t-v2
WAL
update t set y = 6
Amazon Simple Storage
Service (Amazon S3)

Aurora
Block in
memory
t-v1
Aurora
storage
Block in
memory
PostgreSQL
t-v1
t-v2
t-v1
t-v2
Full
block
WAL
update t set y = 6
Service (Amazon S3)

Aurora
Block in
memory
t-v1
Aurora
storage
Block in
memory
PostgreSQL
t-v1
t-v2
t-v3
t-v1
t-v2
Full
block
t-v3
WAL
update t set y = 6
Service (Amazon S3)

Aurora
Block in
memory
t-v1
Aurora
storage
Block in
memory
PostgreSQL
t-v1
t-v2
t-v3
Checkpoint
Datafile
t-v1
t-v2
Full
block
t-v3
WAL
Archive
update t set y = 6
Service (Amazon S3)

Aurora
Block in
memory
t-v1
Aurora
storage
Block in
memory
PostgreSQL
t-v1
t-v2
t-v3
Checkpoint
Datafile
t-v1
t-v2
Full
block
t-v3
WAL
Archive
4K
4K
8K
update t set y = 6
Service (Amazon S3)

Aurora
Block in
memory
t-v1
Aurora
storage
Block in
memory
PostgreSQL
t-v1
t-v2
t-v3
Checkpoint
Datafile
t-v1
t-v2
Full
block
t-v3
WAL
Archive
4K
4K
8K
update t set y = 6
Service (Amazon S3)
recovery
in minutes

Aurora
update t set y = 6
Block in
memory
t-v1
Aurora
storage
Block in
memory
PostgreSQL
t-v1
t-v2
t-v3
Checkpoint
Datafile
t-v1
t-v2
Full
block
t-v3
WAL
Archive
4K
4K
8K
update t set y = 6
Service (Amazon S3)
recovery
in minutes

Aurora
update t set y = 6
Block in
memory
t-v1
t-v2
Aurora
storage
t-v1
t-v2
Block in
memory
PostgreSQL
t-v1
t-v2
t-v3
Checkpoint
Datafile
t-v1
t-v2
Full
block
t-v3
WAL
Archive
4K
4K
8K
update t set y = 6
Service (Amazon S3)
recovery
in minutes

Aurora
update t set y = 6
Block in
memory
t-v1
t-v2
t-v3
Aurora
storage
t-v1
t-v2
t-v3
No engine
checkpoint
=
no FPW
Block in
memory
PostgreSQL
t-v1
t-v2
t-v3
Checkpoint
Datafile
t-v1
t-v2
Full
block
t-v3
WAL
Archive
4K
4K
8K
update t set y = 6
Service (Amazon S3)
recovery
in minutes

Aurora
update t set y = 6
Block in
memory
t-v1
t-v2
t-v3
Aurora
storage
t-v1
t-v2
t-v3
No engine
checkpoint
=
no FPW
Block in
memory
PostgreSQL
t-v1
t-v2
t-v3
Checkpoint
Datafile
t-v1
t-v2
Full
block
t-v3
WAL
Archive
4K
4K
8K
update t set y = 6
Service (Amazon S3)
recovery
in minutes continuous
& parallel
coalesce
recovery in
seconds

Aurora
RW
Storage layer
Incoming queue Data
blocks
Update
queue
Hot log
Amazon S3
A

Aurora
RW
Storage layer
Incoming queue Data
blocks
Update
queue
Hot log
Amazon S3
A
C

Aurora
RW
Storage layer
Incoming queue Data
blocks
Update
queue
Hot log
Amazon S3
A C

Aurora
RW
Storage layer
Incoming queue Data
blocks
Update
queue
Hot log
Peer storage
nodes
Amazon S3
A C

Aurora
RW
Storage layer
Incoming queue Data
blocks
Update
queue
Hot log
Peer storage
nodes
Amazon S3
A C
B

Aurora
RW
Storage layer
Incoming queue Data
blocks
Update
queue
Hot log
Peer storage
nodes
Amazon S3
A C
B
B C
A

Aurora
RW
Storage layer
Incoming queue Data
blocks
Update
queue
Hot log
Peer storage
nodes
Coalesce
Amazon S3
A C
B
A B C
B C
A

Aurora backups
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

Aurora backups
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
1

Aurora backups
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
1
16
15
13
12
11
10
8 8 8 8
13
2 2 2 2
4
5
6 6
7 7 7
8
2

Aurora backups
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
1
16
15
13
12
11
10
8 8 8 8
13
2 2 2 2
4
5
6 6
7 7 7
8
8
1 2 3 4 5 6 7
16
15
14
13
12
11
10
9
2

Aurora backups
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
1
16
15
13
12
11
10
8 8 8 8
13
2 2 2 2
4
5
6 6
7 7 7
8
2 6
2

Scaling

RO
Application
Aurora storage scaling
RW
Application
RO
Application
Async
invalidation
& update
Async
invalidation
& update
Write log
records
Read
blocks
Aurora
storage
Availability Zone 3
Availability Zone 2
Availability Zone 1

RO
Application
RW
Application
RO
Application
Async
invalidation
& update
Async
invalidation
& update
Write log
records
Read
blocks
Aurora
storage
Availability Zone 3
Availability Zone 2
Availability Zone 1
64TB

RO
Application
RW
Application
RO
Application
Async
invalidation
& update
Async
invalidation
& update
Write log
records
Read
blocks
Aurora
storage
Availability Zone 3
Availability Zone 2
Availability Zone 1
64TB
128TB

Storage Management – dynamic resizing
new partitions
every hour

new partitions
every hour
drop
existing
create
new

new partitions
every hour
drop
existing
create
new
2 hour
spike

new partitions
every hour
drop
existing
create
new
2 hour
spike drop
existing
create
new

new partitions
every hour
drop
existing
create
new
2 hour
spike drop
existing
create
new
drop
the
spike

new partitions
every hour
drop
existing
create
new
2 hour
spike drop
existing
create
new
drop
the
spike
used space
inside the db
used storage
space
2X extra
storage
costs

new partitions
every hour
drop
existing
create
new
2 hour
spike drop
existing
create
new
drop
the
spike
used space
inside the db
used storage
space

Replication / Data flow

Logical replication support
Amazon Aurora Amazon Kinesis
Amazon EC2

Amazon Aurora
Amazon RDS
Amazon Redshift
Service (Amazon S3)
AWS Database
Migration Service
Amazon DynamoDB

Amazon Aurora PostgreSQL
instance

Amazon Aurora Amazon RDS

Amazon Aurora Amazon Aurora

Data flow – PostgreSQL extensions
Amazon Aurora
PostgreSQL
instance

Amazon Aurora Amazon RDS

Amazon Aurora Amazon Redshift

Amazon Aurora
Service (Amazon S3)
Amazon Aurora
Amazon SageMaker
Amazon Comprehend
AWS Lambda

Global DB –
Cross region replication

12–300 ms
Cross region replicas: PostgreSQL
PostgreSQL
RW
EBS
PostgreSQL
RO
EBS
Update
Region A Region B

12–300 ms
Cross region replicas: PostgreSQL
PostgreSQL
RW
EBS
PostgreSQL
RO
EBS
Update
Extra expense
Region A Region B

Replication
agents
Region B
Region A
Availability Zone 3
Availability Zone 3
Amazon Aurora Global Database
Aurora storage
RO
Application
RW
Application
RO
Application
Replication
servers Aurora storage

Replication
agents
Region B
Region A
Availability Zone 3
Availability Zone 3
Aurora storage
RO
Application
RW
Application
RO
Application
Replication
DR

Replication
agents
Region B
Region A
Availability Zone 3
Availability Zone 3
Aurora storage
RO
Application
RW
Application
RO
Application
Replication
RO

Replication
agents
Region B
Region A
Availability Zone 3
Availability Zone 3
Aurora storage
RO
Application
RW
Application
RO
Application
Replication
RO
RO
Application
RO

Region B
Region A
Availability Zone 3
Availability Zone 3
Aurora storage
RO
Application
RW
Application
RO
Application
Aurora storage
RO
RO
Application
RO
RW

Region A
Availability Zone 3
Aurora storage
RO
Application
RW
Application
RO
Application
Replication
servers
Region B
Availability Zone 3
Replication
agents Aurora storage
R
O
R
O
Application
R
O
Region C
Availability Zone 3
Replication
R
O
R
O
Region D
Availability Zone 3
Replication

Performance

Non-uniform memory access
R5 instance
Memory
Socket 1
Memory
Socket 2
NUMA
Local access Remote access

Graviton2 – Uniformity
Memory
Socket 1
R6g instance
Local access

Graviton2 – vCPU
R5 instance
R6g instance

0
25
50
75
100
125
1 2 4
Queries
Per
Second
(QPS)
Connections
1000 row in memory range scan with 3-level nested loop
r6g.large r5.large
Graviton2

Graviton2
0
5,000
10,000
15,000
20,000
25,000
30,000
35,000
40,000
45,000
50,000
0 10 20 30 40 50 60
nopm
# virtual users
HammerDB – 16 warehouses
r6g.xlarge r5.xlarge

Graviton2
-
500
1,000
1,500
2,000
2,500
3,000
3,500
1 2 4 8 16 32 64 128 256
Queries
Per
Second
(QPS)
Connections
1000 row in memory range scan with 3-level nested loop
r6g.16xlarge r5.16xlarge r5.24xlarge

Application
Aurora – Heterogeneous clusters
RO
Aurora
storage
Availability Zone 3
Availability Zone 2
Availability Zone 1
RO
RW

Application
RO
Aurora
storage
Availability Zone 3
Availability Zone 2
Availability Zone 1
RO
RW modify

Application
RO
Aurora
storage
Availability Zone 3
Availability Zone 2
Availability Zone 1
RO RW
failover

Application
RO
Aurora
storage
Availability Zone 3
Availability Zone 2
Availability Zone 1
RO RW
modify
modify

Migration

Methods
• AWS Database Migration Service (AWS DMS)
• PostgreSQL: pg_dump/pg_restore
• PostgreSQL Logical Replication (including pglogical)
• Amazon RDS PostgreSQL: Snapshot import
• Amazon RDS PostgreSQL: Read replica
Migration to Aurora

Migration: Read replica
Amazon RDS
PostgreSQL instance
Service
--replication-source-identifier

Snapshot Amazon Aurora
PostgreSQL instance
Amazon RDS
PostgreSQL instance
Service
--replication-source-identifier

Catchup via PostgreSQL asynchronous replication
Amazon Aurora
PostgreSQL instance
Amazon RDS
PostgreSQL instance
Service

Amazon Aurora
PostgreSQL instance
Amazon RDS
PostgreSQL instance
Service
promote-read-replica-db-cluster
--db-cluster-identifier

Amazon Aurora
PostgreSQL instance
Service

Thank you!

re:Invent 2020 DAT301 Deep Dive on Amazon Aurora with PostgreSQL Compatibility

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Similar to re:Invent 2020 DAT301 Deep Dive on Amazon Aurora with PostgreSQL Compatibility

Similar to re:Invent 2020 DAT301 Deep Dive on Amazon Aurora with PostgreSQL Compatibility (20)

Recently uploaded

Recently uploaded (20)

re:Invent 2020 DAT301 Deep Dive on Amazon Aurora with PostgreSQL Compatibility

Editor's Notes