Apache Kafka Nedir?

Dağıtık Akış Platformu
- Apache Kafka -
Emre Baykal
/misterbykl
@misterbykl

İçerik
• Apache Kafka
• Neden kullanalım?
• Nedir?
• Nasıl çalışır?
• Neye yarar?
• Kafka Connect
• Kafka Streams
• ?!?!?!

• Büyük Veri
• Gerçek Zamanlı Veri - data streams
• Olaylar - alarm, press, tick gibi tetikleme sonucu
• Sensörler
• IoT
• Dağıtık Sistemler - ölçeklenebilir
Neden Kullanalım?

• Açık kaynak - Apache, Confluent
• Mesajlaşma sistemi, mq, akan veri, gerçek zamanlı
• Dağıtık (distributed)
• Parçalanabilen (partitioned)
• Çoklanabilen (replicated)
• Pub-sub
• Kümelenebilir (cluster): >= 1 sunucu
• Fault-tolerant
• Kayıtları ‘topic’ler halinde tutar
Nedir?
kafka.apache.org

• Topic: Producer tarafından yayınlanan mesajlar ( key, value, timestamp)
• Producer: Kayıtlandığı ‘topic’ için mesaj üretir
• Consumer: Kayıtlandığı ‘topic’den mesaj okur
• Broker: Kafka kümesini oluşturan kafka sunucuları ( >=1 )
• Partition: Sıralı, değişmez (immutable), sona eklemeli kayıtlar dizisi.
İçerisindeki her kayıt bir ‘offset’ değerine sahip. (Paralelleme,
ölçeklendirme)
• Replica: Partition kopyası
Nedir?

Nasıl Çalışır?
• Zookeeper
• Broker’lar arası koordinasyon
• Lider seçimi
• Offset takibi

Nasıl Çalışır?
michael-noll.com

Nasıl Çalışır?
• Retention (alı koyma, saklama)
• Offset: Geçmiş Şimdi
• Consumer
• Consumer group
kafka.apache.org kafka.apache.org

Yani?
• Mesajlaşma && depolama && gerçek zamanlı (streaming) veri
• DFS, geçmişe ait veri (historical data)
• ‘subscribe’, gelecek veri (future data)
• (Streaming data pipeline)

• Diğer sistemler ile entegrasyon
• Veri akışına yeni sistemler ekleme
• i) Confluent. ii) Certified. iii) Community.
KafkaConnect
Data
Source
K
C
o
n
n
e
c
t
Kafka
Cluster
Data
Sink
K
C
o
n
n
e
c
t
App

KafkaConnect
• Source Connectors = import
RDBMS. Couchbase. Blockchain. Cassandra. FTP.
Kinesis. MongoDB. MQTT. RabbitMQ. Solr. Redis.
Twitter…
• Sink Connectors = export
Elasticsearch. S3(A). HDFS. BigQuery(G). PubSub(G).
Hazelcast. DocumentDB. HBase…

• Akış üzerinde işlemler
yapabilmeyi ve gerçek zamanlı
uygulamalar (stream-
processing-applications)
geliştirmeyi sağlar
• Kafka kümesine bağlı; üzerinde
çalışır
• Bir kütüphanedir (Kafka Streams
API)
• Dağıtık. Ölçeklenebilir. Hata
toleranslı.
KafkaStreams
conﬂuent.io

KafkaStreams
Data
Source
K
C
o
n
n
e
c
t
Kafka
Cluster
Data
Sink
K
C
o
n
n
e
c
t
App

KafkaStreams
Data
Source
K
C
o
n
n
e
c
t
Kafka
Cluster
Data
Sink
K
C
o
n
n
e
c
t
App
KStreams

KafkaStreams
Data
Source
K
C
o
n
n
e
c
t
Kafka
Cluster
Data
Sink
K
C
o
n
n
e
c
t
App
KStreams
App
KStreams
App
KStreams

• Stream processor
• 1 in > op > 1 (veya daha fazla) out
• map, filter, join, aggregation
• Join: in1 + in2 = out1
• Aggregation: comb(in[1…n]) = out1
• Stateful (join, agg) vs Stateless (filter)
KafkaStreams
conﬂuent.io

KafkaStreams
• Time
• Event-time: Oluşturulma zamanı
• Processing-time: İşlenme zamanı
Kai Wähner,

KafkaStreams
• Grouping: Aynı anahtara (key) sahip kayıtların gruplanması (partitioned-
keyed)
• Windowing: Gruplanan kayıtların kontrolü (sub-grouping)
ör. geç mesajlar
• join, aggregation
Kai Wähner,

KafkaStreams + (Machine Learning || Deep Learning)
map
ﬁlter ﬁlter
map
ML with H20.ai DL with deeplearning4j

–Peter Sondergaard, Gartner Research
“Information is the oil of the 21st century,
and analytics is the combustion engine.”

Apache Kafka Nedir?

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Similar to Apache Kafka Nedir?

Similar to Apache Kafka Nedir? (20)

More from AnkaraCloud

More from AnkaraCloud (6)

Apache Kafka Nedir?