MirrorMaker: Beyond the Basics with Mickael Maison

MirrorMaker:
Beyond the Basics
Mickael Maison
1

2
How to run MirrorMaker in production?
1. Start the connectors 2. Operate in production

1. Hub and Spoke
2. Disaster Recovery
3

6
MirrorSource
Connector
Kafka Connect
Topics
MirrorSource

7
MirrorSource
Connector
Kafka Connect
Topics Topics
MirrorSource

8
MirrorSource
Connector
Kafka Connect
Topics Topics
Topics
Configs
ACLs
MirrorSource

9
Kafka Connect
Tasks
Partitions Partitions
MirrorSource
MirrorSource
Connector

10
Kafka Connect
Partitions Partitions
MirrorSource
OffsetSyncs
MirrorSource
Connector
Tasks

11
MirrorSource - OffsetSync
42 43 45
44 SourceTask
my-topic-0 my-topic-0
offset-syncs

12
SourceTask
offset-syncs
0
my-topic-0 42 ➔ 0
Current Offset: 42
42 43 45
44

13
SourceTask
offset-syncs
0 1
Current Offset: 43
my-topic-0 42 ➔ 0
42 43 45
44

14
SourceTask
offset-syncs
0 1
Current Offset: 44
my-topic-0 42 ➔ 0
42 43 45
44
Control Record

15
1 2
0
SourceTask
offset-syncs
Current Offset: 45
my-topic-0 42 ➔ 0
my-topic-0 45 ➔ 2
42 43 45
44

17
MirrorCheckpoint
MirrorCheckpoint
Connector
Kafka Connect
Groups

18
MirrorCheckpoint
Groups
Kafka Connect
MirrorCheckpoint
Connector

19
MirrorCheckpoint
Tasks
Groups
OffsetSyncs Checkpoints
Kafka Connect
MirrorCheckpoint
Connector

20
MirrorCheckpoint
Groups Groups
OffsetSyncs Checkpoints
Kafka Connect
MirrorCheckpoint
Connector
Tasks

21
MirrorCheckpoint - Offset Translation
offset-syncs
Commits
group1 my-topic-0 42
Commits
my-topic-0 42 ➔ 0
my-topic-0 45 ➔ 2
CheckpointTask

22
offset-syncs
Commits
Checkpoints
my-topic-0 42 ➔ 0
my-topic-0 45 ➔ 2
CheckpointTask
group1 my-topic-0 0

23
offset-syncs
Commits
Commits
my-topic-0 42 ➔ 0
my-topic-0 45 ➔ 2
CheckpointTask
group1 my-topic-0 0
group2 my-topic-0 5

25
MirrorHeartbeat
MirrorHeartbeat
Connector
Kafka Connect
Task
heartbeats

27
Building a Scenario
Which connectors do you need?

28
Building a Scenario
What features are required?

29
What monitoring do you need?
Building a Scenario

30
What monitoring do you need?
What processes do you need to put in place?
Building a Scenario

34
Hub and Spoke Scenario
MirrorSource
Kafka Connect
FR UK
mm2-offset-syncs.UK.internal
sales
FR.sales
IT.sales
sales

35
Hub and Spoke - Boilerplate
"name": "FR->UK",
"connector.class": "org.apache.kafka.connect.mirror.MirrorSourceConnector",
"key.converter": "org.apache.kafka.connect.converters.ByteArrayConverter",
"value.converter": "org.apache.kafka.connect.converters.ByteArrayConverter",

36
Hub and Spoke - Boilerplate #2
"source.cluster.alias": "FR",
"target.cluster.alias": "UK",
"source.cluster.bootstrap.servers": "FR-kafka0:9092",
"target.cluster.bootstrap.servers": "UK-kafka0:9092",
"replication.factor": "-1",
"offset-syncs.topic.replication.factor": "-1",

37
Hub and Spoke - Key configs
"sync.topic.con
fi
gs.enabled": "false",
"sync.topic.acls.enabled": "false",
"topics": "sales",
"tasks.max": "10",

38
Hub and Spoke - Monitoring
• Validate initial setup
• MirrorSourceConnector Metrics
• byte-rate/record-count
• record-age-ms
• replication-latency-ms

39
Hub and Spoke - Processes
• Keep monitoring
• No further changes required

41
Disaster Recovery Scenario
MirrorSource
Kafka Connect
A B
mm2-offset-syncs.A.internal
sales sales
MirrorCheckpoint
A.checkpoints.internal

42
Disaster Recovery - Source
"name": "A->B - Source",
"connector.class": "org.apache.kafka.connect.mirror.MirrorSourceConnector",

43
"source.cluster.alias": "A",
"target.cluster.alias": "B",
"source.cluster.bootstrap.servers": "A-kafka0:9092",
"target.cluster.bootstrap.servers": "B-kafka0:9092",
"replication.factor": "-1",
"offset-syncs.topic.replication.factor": "-1",

44
"replication.policy.class": "org.apache.kafka.connect.mirror.IdentityReplicationPolicy",
"offset-syncs.topic.location": "target",
"topics": "sales.*,inventory.*,"
"tasks.max": "10",

45
Disaster Recovery - Checkpoint
"name": "A->B - Checkpoint",
"connector.class": "org.apache.kafka.connect.mirror.MirrorCheckpointConnector",

46
"source.cluster.alias": "A",
"target.cluster.alias": "B",
"source.cluster.bootstrap.servers": "A-kafka0:9092",
"target.cluster.bootstrap.servers": "B-kafka0:9092",
"checkpoints.topic.replication.factor": "-1",

47
"replication.policy.class": "org.apache.kafka.connect.mirror.IdentityReplicationPolicy",
"offset-syncs.topic.location": "target",
"sync.group.offsets.enabled": "true",
"groups": "sales.*,inventory.*,"
"tasks.max": "10"

48
Disaster Recovery - Monitoring
MirrorSourceConnector Metrics
• byte-rate/record-count
• record-age-ms
• replication-latency-ms
MirrorCheckpointConnector Metrics
• checkpoint-latency-ms

49
Disaster Recovery - Processes
• Exercise failover
• Define conditions for failover
• Prepare failback process

51
MirrorMaker Exactly Once - New in 3.5
• exactly.once.source.support on Workers
https://kafka.apache.org/documentation/#connect_exactlyoncesource

52
Offset Management
REST APIs for:
• listing offsets - New in 3.5
• deleting offsets
• updating offsets
https://cwiki.apache.org/confluence/display/KAFKA/KIP-875%3A+First-class+offsets+support+in+Kafka+Connect

53
Source Cluster Tag - New in 3.5
• add.source.alias.to.metrics (default from 4.0)
kafka.connect.mirror:type=MirrorSourceConnector
source=FR
target=UK
topic=FR.sales
partition=0

54
11 Chapters available in early access
https://www.oreilly.com/library/view/kafka-connect/9781098126520/
https://www.redhat.com/en/engage/build-data-pipelines-20220603

55
https://kafka.apache.org/documentation/#georeplication
https://red.ht/TryKafka
Thank you
https://mas.to/@MickaelMaison
https://twitter.com/MickaelMaison

MirrorMaker: Beyond the Basics with Mickael Maison

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Similar to MirrorMaker: Beyond the Basics with Mickael Maison

Similar to MirrorMaker: Beyond the Basics with Mickael Maison (20)

More from HostedbyConfluent

More from HostedbyConfluent (20)

Recently uploaded

Recently uploaded (20)

MirrorMaker: Beyond the Basics with Mickael Maison