The Nuts and Bolts of Kafka Streams---An Architectural Deep Dive

The Nuts and Bolts of Kafka Streams:
An Architectural Deep Dive
Matthias J. Sax
Software Engineer | Apache Kafka Committer and PMC member
Twitter/𝕏 @MatthiasJSax

2
10,000ft View
The DSL Program
(let’s go down the rabbit hole)

Program
3
StreamsBuilder builder = …
KStream words = builder.stream(…);
KTable result = words.groupBy(…)
.count();
result.toStream().to(…);
Topology t = builder.build();

Program
4
.count();
(Sub-)Topology
src
grpBy
snk
src
cnt
snk
shuffle
input
result
log
1
2
3
4
1
2 3
4

Program
5
.count();
1
2
3
4
1
2 3
4
(Sub-)Topology
src
grpBy
snk
src
cnt
snk
shuffle
input
result
log

(Sub-)Topology
6
src
grpBy
snk
src
cnt
snk
shuffle
input
result
log

(Sub-)Topology Tasks
src
grpBy
snk
src
cnt
snk
shuffle
input
result
log
7
shuffle-0
input-0
result-1
shuffle-1
0_0 0_1
1_0 1_1
input-1
result-0
log-1
log-0

(Sub-)Topology Tasks
src
grpBy
snk
src
cnt
snk
shuffle
input
result
log
8
shuffle-0
input-0
result-1
shuffle-1
0_0 0_1
1_0 1_1
input-1
result-0
log-1
log-0

Instance B
Instance A
9
Kafka Streams Instances and StreamThreads
KafkaStreams streamsClient = new KafkaStreams(…); // num.stream.threads
streamsClient.start();
streamsClient.addStreamThread();
streamsClient.removeStreamThread();
// error handling: uncaught exception handler

10
StreamThreads and Tasks
KafkaConsumer KafkaProducer
Kafka Cluster
1_0 1_1
0_0
0_1

11
Main Processing Loop
while (running)
records = mainConsumer.poll() // config: poll.ms
// max.poll.records
// fetch configs
addRecordsToTask(records); // no deserialization
// config: buffered.records.per.partition
while (keepProcessing)
for each task:
if (task.isReady) // data available for all inputs?
task.process(nRecords) // -> ts-extraction
// -> (de)serialization + exception-handling
maybePunctuate()
maybeCommit() // config: commit.interval.ms [ctx.commit()]
adjust nRecords

12
while (running)
// max.poll.records
// fetch configs
for each task:
maybePunctuate()
adjust nRecords max.poll.interval.ms

13
while (running)
// max.poll.records
// fetch configs
for each task:
maybePunctuate()

14
Task Execution
1_1
src
cnt
snk
Record
Buffer
Record
Buffer
Record
Buffer
“head” records
(deserialized)
- exception handling
- ts-extraction
max.task.idle.ms
src.process(record)
ctx.forward(r) {
cntProcessor.process(r)
}
store.put(…) {
changelogger.put(…)
}
sink.process(record) {
recordCollector.send(…)
}

15
Task Execution
1_1
src
cnt
snk
Record
Buffer
Record
Buffer
Record
Buffer
“head” records
(deserialized)
- ts-extraction
max.task.idle.ms
src.process(record)
ctx.forward(r) {
}
store.put(…) {
}
}
depth-first
execution

16
Task Execution
1_1
src
cnt
snk
Record
Buffer
Record
Buffer
Record
Buffer
“head” records
(deserialized)
- ts-extraction
max.task.idle.ms
src.process(record)
ctx.forward(r) {
}
store.put(…) {
}
}
depth-first
execution
RecordCollector
• Serialization
• Error handling
• Partitioning
KafkaProducer

17
while (running)
// max.poll.records
// fetch configs
for each task:
maybePunctuate()

18
while (running)
// max.poll.records
// fetch configs
for each task:
maybePunctuate()

Committing
19
At-least-once:
• flush state stores
• flush producer
• avoid data
• get offset / consumer position
• record buffers
• commitSync()
Exactly-once:

Committing
20
At-least-once:
• flush producer
• avoid data
• get offset / consumer position
• record buffers
• commitSync()
Exactly-once:
• flush producer
• avoid data
• get offsets / consumer position
• record buffers
• addOffsetsToTransaction()
• commitTransaction()
• configs:
• transaction.timeout.ms

21
while (running)
// max.poll.records
// fetch configs
for each task:
maybePunctuate()

22
while (running)
// max.poll.records
// fetch configs
for each task:
maybePunctuate()
transaction.timeout.ms

Fault-Tolerance, High-Availability, and Scaling
23

Instance A
24
State Stores and Changelog Topics
Task 1_1
cnt
log-1

Instance A
25
Task 1_1
cnt
log-1

26
log-1
Instance B
Task 1_1
restore

27
log-1
Instance B
Task 1_1
cnt

Restore Consumer
28
KafkaConsumer (restore)
no consumer group
read changelog topics
used to restore state
no offset commits
while (running) {
mainConsumer.poll()
if (restoring)
restoreConsumer.poll()
restoreState()
continue;
processActiveTasks()
}

Instance A
29
Standby Tasks and High-Availability
Task 1_1
cnt
log-1

Instance A
30
Task 1_1
cnt
log-1
Instance B
Standby 1_1
restore

Instance A
31
Task 1_1
cnt
log-1
Instance B
Standby 1_1
restore
config: num.standby.tasks

Restore Consumer
32
KafkaConsumer (restore)
no consumer group
read changelog topics
used to restore state
no offset commits
while (running) {
mainConsumer.poll()
if (restoring)
restoreState()
continue;
else
updateStandbys()
processActiveTasks()
}

33
Smooth Scaling with ”Warmup” Tasks
Instance A
Task 1_0
cnt
log-0
Task 1_1
cnt
log-1

34
Instance A
Task 1_0
cnt
log-0
Instance B
Standby 1_1
(warmup)
restore
Task 1_1
cnt
log-1

35
Instance A
Task 1_0
cnt
log-0
Instance B
Task 1_1
cnt
log-1

36
Instance A
Task 1_0
cnt
log-0
Instance B
Task 1_1
cnt
log-1
config: max.warmup.replicas

GlobalKTables/Stores and Threading
37

Instance B
Instance A
38
Global State Stores and GlobalStreamThread
builder.globalTable(…); // or .addGlobalStore(…)
KafkaStreams streamsClient = new KafkaStreams(…);
streamsClient.start()
GlobalStreamThread

GlobalStreamThread
39
KafkaConsumer (global)
no consumer group
reads all global topic partitions
no offset commits
Global StateStore updating

GlobalStreamThread
40
KafkaConsumer (global)
no consumer group
reads all global topic partitions
no offset commits
Global StateStore updating
// bootstrap global state
start() {
while(!endOffsetsReached)
globalConsumer.poll()
updateGlobalState()
}
// start StreamThreads
// regular processing
while(running) {
globalConsumer.poll()
updateGlobalState()
}

Thread Refactoring Project
(https://cwiki.apache.org/confluence/pages/viewpage.action?pageId=263429334)
41

Instance B
Instance A
42
Thread Refactoring – StateUpdaterThread (AK 3.7 ?)
GlobalStreamThread
StateUpdaterThread

Instance B
Instance A
43
Thread Refactoring – Phase 2
Decouple consumer and processing threads (WIP)
GlobalStreamThread ProcessingThread
StateUpdaterThread

The Nuts and Bolts of Kafka Streams---An Architectural Deep Dive

Recommended

Recommended

More Related Content

Similar to The Nuts and Bolts of Kafka Streams---An Architectural Deep Dive

Similar to The Nuts and Bolts of Kafka Streams---An Architectural Deep Dive (20)

More from HostedbyConfluent

More from HostedbyConfluent (20)

Recently uploaded

Recently uploaded (20)

The Nuts and Bolts of Kafka Streams---An Architectural Deep Dive