Solutions for bi-directional integration between Oracle RDBMS & Apache Kafka

http://guidoschmutz@wordpress.com@gschmutz
Solutions for bi-directional integration
between Oracle RDBMS & Apache Kafka
Guido Schmutz

virtual SOUG Day
sponsored by
Platinum Sponsors Gold Sponsors

Guido
Working at Trivadis for more than 23 years
Consultant, Trainer, Platform Architect for Java,
Oracle, SOA and Big Data / Fast Data
Oracle Groundbreaker Ambassador & Oracle ACE
Director
@gschmutz guidoschmutz.wordpress.com
191st
edition

Agenda
1. Motivation & Introduction
2. Blueprints Oracle RDBMS => Apache Kafka
3. Blueprints Apache Kafka => Oracle RDBMS
4. Summary

Microservices / Modern Applications
• Highly decoupled
• Independently deployable
• Bounded Context/Aggregate (DDD)
• Responsible for their data
• Favour asynchronous, event-driven
interaction over synchronous
• Smart Endpoints and Dump Pipes
• Use Anti-Corruption Layer (ACL) if no fit!
M3M2
ACL
Event
Hub
M1

Microservices / Modern Applications
Integrate with Traditional System
M3M2
ACL
Event
Hub
M1
ACL
Traditional
App
• Highly decoupled
• Independently deployable
• Bounded Context/Aggregate (DDD)
• Responsible for their data
• Favour asynchronous, event-driven
interaction over synchronous
• Smart Endpoints and Dump Pipes
• Use Anti-Corruption Layer (ACL) if no fit!

Apache Kafka – A Streaming Platform
Kafka Cluster
Consumer 1 Consume 2
Broker 1 Broker 2 Broker 3
Zookeeper
Ensemble
ZK 1 ZK 2ZK 3
Schema
Registry
Service 1
Management
Control Center
Kafka Manager
KAdmin
Producer 1 Producer 2
kafkacat
Data Retention:
• Never
• Time (TTL) or Size-based
• Log-Compacted based
Producer3Producer3
ConsumerConsumer 3
Consumer Pulls (Polling Consumer)
Producer Pushes (Polling Consumer)
record
record
record
recordrecord

Order Processing System
Use Case
Customer Microservice
{ }
Customer API CustomerCustomer Logic
{ }
Order API OrderOrder Logic
REST
REST
Event Hub
Order
Customer
(compacted)
Notification Microservice
Notification Logic
“Modern Apps”Traditional Apps (Legacy)
Flat Aggregate
Low Latency High Latency
DB Dataflow
Message
Latency
ACL
Included AdditionalLicense
RDBMS as
“Producer”
RDBMS as
“Consumer”
Customer

MessageMessageMessageMessage
MessageMessage
Properties - Message
Message Message
A1 A2 A3
Message
B1 B2 B3 B4
A1 A2 A3 B []
B1 B2 B3 B4
Table A
A1
A2
A3
Table B
B1
B2
B3
B4
FlatDB Model Aggregate
Flat Aggregate
DB Dataflow
Message
Latency
ACL

Properties - Latency
Traditional System Event
Hub
Data
Flow
RDBMS
latency
latency
Flat Aggregate
DB Dataflow
Message
Latency
ACL

Properties – Anti-Corruption Layer (ACL)
Hub
Data
Flow
RDBMS
Hub
Data
Flow
RDBMS
ACL
ACL
Flat Aggregate
DB Dataflow
Message
Latency
ACL
Examples:
• View Layer
• Storage Procedure
• JSON Support in DB
• …
Examples:
• StreamSets
• Kafka Connect
• Kafka Streams / KSQL
• …
Database Dataflow

Properties – License
• Included
• either part of Oracle RDMBS license
• or part of Kafka open source or Confluent Enterprise Platform
• or additional free software (mostly open source) component
• Additional Commercial Licenses
• an additional component involving license costs
Flat Aggregate
DB Dataflow
Message
Latency
ACL

Blueprints Oracle RDBMS =>
Apache Kafka

Blueprints Oracle RDBMS => Apache Kafka (DB-K)
{ }
{ }
REST
REST
Event Hub
Customer
Order
(compacted)
Customer
(compacted)
Notification Logic
Schema
Registry
DB-K_1: Polling of RDBMS table/view
DB-K_2: Change Data Capture (CDC) on RDBMS
DB-K_3: Polling of RDBMS API
DB-K_4: Produce to Event Hub from RDBMS
DB-K_5: RDBMS Queue with bridge to Event Hub
https://github.com/gschmutz/various-demos/tree/master/bidirectional-integration-oracle-kafka

Event
Hub
Stream Data
Integration
API
Applications / Data Sources
Data FlowRDBMS
Application
Logic
Stream Data
Integration & Analytics
Stream
Analytics
Data Flow

Event
Hub
Stream Data
Integration
API
Data FlowRDBMS
Application
Logic
Stream Data
Stream
Analytics
Data Flow
Flat Aggregate
DB Dataflow
Message
Latency
ACL
Kafka Connect with JDBC Source Connector
JDBC Connector part of Confluent Open Source Platform

Kafka Connect & JDBC Connector
• Many connectors available
• Single Message Transforms (SMT)
• declarative style, simple data flows
• framework is part of Apache Kafka
https://www.confluent.io/hub

DB-K_1 – Configure JDBC Connector
#!/bin/bash
curl -X "POST" "http://192.168.69.138:8083/connectors"
-H "Content-Type: application/json"
-d $'{
"name": "jdbc-driver-source",
"config": {
"connector.class": "JdbcSourceConnector",
"connection.url":"jdbc:oracle:thin//oracle-db:1521/XEPDB1",
"mode": "timestamp",
"timestamp.column.name":”modified_at",
"table.whitelist":”order",
"validate.non.null":"false",
"topic.prefix":”orderprocessing_",
"key.converter":"org.apache.kafka.connect.json.JsonConverter",
"key.converter.schemas.enable": "false",
"value.converter":"org.apache.kafka.connect.json.JsonConverter",
"value.converter.schemas.enable": "false",
"name": "jdbc-driver-source",
"transforms":"createKey,extractInt",
"transforms.createKey.type":"org.apache.kafka.connect.transforms.ValueToKey",
"transforms.createKey.fields":"id",
"transforms.extractInt.type":"org.apache.kafka.connect.transforms.ExtractField$Key",
"transforms.extractInt.field":"id"
}
}'

Stream Data
Stream
Analytics
Event
Hub
Stream Data
Integration
API
Data Flow
Application / Data Sources
Data Flow
Application
Logic
RDBMS
Redo Log
REST to
Event Hub

Stream Data
Stream
Analytics
Event
Hub
Stream Data
Integration
API
Data Flow
Data Flow
Application
Logic
RDBMS
Redo Log
REST to
Event Hub
Rest Proxy
Using Oracle GoldenGate
Flat Aggregate
DB Dataflow
Message
Latency
ACL
Alternatives:
StreamSets Data Collector
Qlik Replicate
Debezium
…

Event
Hub
Stream Data
Integration
API
Data Flow
RDBMS
Application
Logic
API
Stream Data
Stream
Analytics
Data Flow

Event
Hub
Stream Data
Integration
API
Data Flow
RDBMS
Application
Logic
API
Stream Data
Stream
Analytics
Data Flow
StreamSets invokes Oracle Rest Data Service
Flat Aggregate
DB Dataflow
Message
Latency
ACL
Included AdditionalLicense Oracle Rest Data Service is part of Oracle RDBMS, StreamSets is Open Source
Alternatives:
NiFi
KafkaConnect
…

Oracle REST Data Services (ORDS)
• ORDS maps HTTP(S) verbs (GET, POST, PUT, DELETE, etc.) to database transactions and
returns any results formatted using JSON
• simplifies development of modern REST interfaces on top of Oracle Database and Oracle
Database 18c JSON Document Store
• deployment on WebLogic, Tomcat, Docker, Standalone (for development)
https://www.oracle.com/database/technologies/appdev/rest.html

DB-K_3 – Setup ORDS (I)
ORDS.ENABLE_SCHEMA(
p_enabled => TRUE,
p_schema => 'ORDER_PROCESSING',
p_url_mapping_type => 'BASE_PATH',
p_url_mapping_pattern => 'order_processing',
p_auto_rest_auth => FALSE);
ORDS.DEFINE_MODULE(
p_module_name => 'order_processing',
p_base_path => '/orders/',
p_items_per_page => 25,
p_status => 'PUBLISHED',
p_comments => NULL);
ORDS.DEFINE_TEMPLATE(
p_pattern => 'changes/:offset',
p_priority => 0,
p_etag_type => 'HASH',
p_etag_query => NULL,
p_comments => NULL);

DB-K_3 – Setup ORDS (II)
ORDS.DEFINE_HANDLER(
p_pattern => 'changes/:offset',
p_method => 'GET',
p_source_type => 'resource/lob',
p_source => q'[
'SELECT 'application/json', json_object('orderId' VALUE po.id,
'orderDate' VALUE po.order_date,
'orderMode' VALUE po.order_mode,
'customer' VALUE
json_object('firstName' VALUE cu.first_name,
'lastName' VALUE cu.last_name
'emailAddress' VALUE cu.email),
'lineItems' VALUE (SELECT json_arrayagg(
json_object('ItemNumber' VALUE li.id,
'Product' VALUE
json_object('id' VALUE li.product_id,
'name' VALUE li.product_name,
'unitPrice' VALUE li.unit_price),
'quantity' VALUE li.quantity))
FROM order_item_t li WHERE po.id = li.order_id),
'offset' VALUE TO_CHAR(po.modified_at, 'YYYYMMDDHH24MISS'))
FROM order_t po LEFT JOIN customer_t cu ON (po.customer_id = cu.id)
WHERE po.modified_at > TO_DATE(:offset, 'YYYYMMDDHH24MISS')]'

StreamSets Data Collector
• GUI-based, drag-and drop Data
Flow Pipelines
• Both stream and batch
processing
• custom sources, sinks,
processors
• Monitoring and Error Detection
https://streamsets.com/products/sdc

DB-K_4: Produce to Event Hub from Kafka
Event
Hub
Stream Data
Integration
API
RDBMS
Application
Logic
API
Stream Data
Stream
Analytics
Data Flow
REST to
Event Hub

Event
Hub
Stream Data
Integration
API
RDBMS
Application
Logic
API
Stream Data
Stream
Analytics
Data Flow
REST to
Event Hub
Flat Aggregate
DB Dataflow
Message
Latency
ACL
Native Kafka Producer using Java in DB
Doesn’t feel right!
1st Java in DB and 2nd “dual write” problem

Event
Hub
Stream Data
Integration
API
RDBMS
Application
Logic
API
Stream Data
Stream
Analytics
Data Flow
REST to
Event Hub
Rest Proxy
?
Flat Aggregate
DB Dataflow
Message
Latency
ACL
Invoke REST Proxy from PL/SQL
1st Invoking a REST Service from DB not
well-supported & 2nd ”dual write” problem
Confluent REST Proxy is part of Confluent Open Source Platform

Stream Data
Stream
Analytics
Event
Hub
Stream Data
Integration
API
Data Flow
Data Flow
Application
Logic
RDBMS
Queue

Oracle Advanced Queuing & Kafka Connect JMS
Stream Data
Stream
Analytics
Event
Hub
Stream Data
Integration
API
Data Flow
Data Flow
Application
Logic
RDBMS
QueueAQ
Flat Aggregate
DB Dataflow
Message
Latency
ACL
Included AdditionalLicense Oracle Advanced Queuing is part of Oracle RDBMS

BEGIN
dbms_aqadm.create_queue_table (
queue_table => 'ORDER_QT',
queue_payload_type => 'SYS.AQ$_JMS_TEXT_MESSAGE',
sort_list => 'PRIORITY,ENQ_TIME',
multiple_consumers => FALSE,
message_grouping => dbms_aqadm.none
);
END;
/
DB-K_5 – Setup AQ and Kafka Connect (I)
BEGIN
dbms_aqadm.create_queue (
queue_name => 'ORDER_AQ',
queue_table => 'ORDER_QT',
max_retries => 1,
retry_delay => 2, -- seconds
retention_time => 60*60*24*7 -- 1w
);
END;
/
BEGIN
dbms_aqadm.start_queue(
queue_name => 'ORDER_AQ',
enqueue => TRUE,
dequeue => TRUE
);
END;
/

curl -X "POST" "$DOCKER_HOST_IP:8083/connectors"
-H "Content-Type: application/json"
--data '{
"name": "jms-source",
"config": {
"name": "jms-source",
"connector.class": "com.datamountaineer...JMSSourceConnector",
"connect.jms.initial.context.factory":
"oracle.jms.AQjmsInitialContextFactory",
"connect.jms.initial.context.extra.params":
"db_url=jdbc:oracle:thin:@//192.168.73.86:1521/XEPDB1,java.naming.security.princ
ipal=order_processing,java.naming.security.credentials=order_processing",
"tasks.max": "1",
"connect.jms.connection.factory": "ConnectionFactory",
"connect.jms.url": "jdbc:oracle:thin:@//192.168.73.86:1521/XEPDB1",
"connect.jms.kcql": "INSERT INTO order SELECT * FROM order_aq WITHTYPE QUEUE
WITHCONVERTER=`com.datamountaineer.streamreactor.connect.converters.source.JsonS
impleConverter`"
}
}'
DB-K_5 – Setup AQ and Kafka Connect (I)

Oracle AQ with Kafka API & MirrorMaker
Stream Data
Stream
Analytics
Event
Hub
Stream Data
Integration
API
Data Flow
Data Flow
Application
Logic
RDBMS
Queue
Flat Aggregate
DB Dataflow
Message
Latency
ACL
AQ (Kafka API)
Oracle is working on a Kafka API
for Advanced Queuing

Blueprints Apache Kafka =>
Oracle RDBMS

Blueprints Apache Kafka => Oracle RDBMS (K-DB)
{ }
{ }
REST
REST
Event Hub
Order
(compacted)
Customer
(compacted)
Notification Logic
Schema
Registry
K-DB_1: Write to RDBMS table/view
K-DB_2: Write over RDBMS API
K-DB_3: Consume from Event Hub
K-DB_4: Event Hub with bridge to RDBMS Queue
Customer

Event
Hub
Stream Data
Integration
API
Data FlowRDBMS
Application
Logic
Stream Data
Stream
Analytics
Data Flow

Event
Hub
Stream Data
Integration
API
Data FlowRDBMS
Application
Logic
Stream Data
Stream
Analytics
Data Flow
Flat Aggregate
DB Dataflow
Message
Latency
ACL
Kafka Connect and JDBC Sink Connector

Event
Hub
Stream Data
Integration
API
Data Flow
RDBMS
Application
Logic
API
Stream Data
Stream
Analytics
Data Flow

Event
Hub
Stream Data
Integration
API
Data Flow
RDBMS
Application
Logic
API
Stream Data
Stream
Analytics
Data Flow
Flat Aggregate
DB Dataflow
Message
Latency
ACL
Kafka Connect invokes Oracle Rest Data Service
Oracle Rest Data Service is part of Oracle RDBMS, REST Connector is Open Source

DB-K_2 – Setup ORDS (I)
ORDS.DEFINE_HANDLER(
p_module_name => 'customer',
p_pattern => 'customer',
p_method => 'POST',
p_source_type => 'plsql/block',
p_source =>
'DECLARE
L_CU CLOB := :body_text;
BEGIN
INSERT INTO customer_t (id, first_name, last_name, title, notification_on, email, slack_handle,
twitter_handle)
SELECT * FROM json_table(L_CU, '$'
COLUMNS (
id NUMBER PATH '$.id',
first_name VARCHAR2 PATH '$.firstName',
last_name VARCHAR2 PATH '$.lastName',
title VARCHAR2 PATH '$.title',
notification_on VARCHAR2 PATH '$.notificationOn',
email VARCHAR2 PATH '$.email',
slack_handle VARCHAR2 PATH '$.slackHandle',
twitter_handle VARCHAR2 PATH '$.twitterHandle'
));
INSERT INTO address_t (customer_id, id, street, nr, city, postcode, country)
SELECT * FROM json_table( ... )

Event
Hub
Stream Data
Integration
API
RDBMS
Application
Logic
API
Stream Data
Stream
Analytics
Data Flow
REST to
Event Hub

Event
Hub
Stream Data
Integration
API
RDBMS
Application
Logic
API
Stream Data
Stream
Analytics
Data Flow
REST to
Event Hub
Oracle SQL Access
to Kafka (OSaK)
K-DB_3: SQL SELECT from Event Hub
Oracle SQL Access to Kafka exposes topic as view
Flat Aggregate
DB Dataflow
Message
Latency
ACL
Currently only supports JSON and delimited text
Blog: Integrating Data-in-Motion with Data-at-Rest using Oracle SQL Access to Kafka Views

K-DB_4: Event Hub with bridge to RDBMS queue
Stream Data
Stream
Analytics
Event
Hub
Stream Data
Integration
API
Data Flow
Data Flow
Application
Logic
RDBMS
Queue

Stream Data
Stream
Analytics
Event
Hub
Stream Data
Integration
API
Data Flow
Data Flow
Application
Logic
RDBMS
QueueAQ
Oracle Advanced Queuing & Kafka Connect JMS
Flat Aggregate
DB Dataflow
Message
Latency
ACL
Included AdditionalLicense Oracle Advanced Queuing is part of Oracle RDBMS

Stream Data
Stream
Analytics
Event
Hub
Stream Data
Integration
API
Data Flow
Data Flow
Application
Logic
RDBMS
QueueAQ (Kafka API)
Oracle is working on a Kafka API
for Advanced Queuing
Oracle AQ with Kafka API & MirrorMaker
Flat Aggregate
DB Dataflow
Message
Latency
ACL

Summary
{ }
{ }
REST
REST
Event Hub
Order
(compacted)
Customer
(compacted)
Notification Logic
Schema
Registry
K-DB_4: Event Hub with bridge to RDBMS Queue
https://github.com/gschmutz/various-demos/tree/master/bidirectional-integration-oracle-kafka
Customer

Bulk Source
Ref Architecture
Data Platform
Service
Event
Stream
Bulk
Data
Flow
Event Source
Location
DB
Extract
File
Weather
DB
IoT
Data
Mobile
Apps
Social
File Import / SQL Import
Consumer
BI Apps
Data Science
Workbench
Enterprise
App
Enterprise Data
Warehouse
SQL / Search
SQL
“Native” Raw
RDBMS
“SQL” / Search
Service
Event
Hub
Hadoop ClusterdHadoop ClusterBig Data Platform
SQL
Export
Storage
Storage
Raw
Refined/
UsageOpt
Microservice Cluster
Stream Processing Cluster
Stream
Processor
Model /
State
Edge Node
Rules
Event Hub
Storage
Governance
Data Catalog
Rules
Engine
Parallel
Processing
Query
Engine
Microservice Data
{ }
API
Event
Stream
Event Stream
Modern Data Platform
Event Stream

Bulk Source
Ref Architecture
Data Platform
Service
Event
Stream
Bulk
Data
Flow
Event Source
Location
DB
Extract
File
Weather
DB
IoT
Data
Mobile
Apps
Social
File Import / SQL Import
Consumer
BI Apps
Data Science
Workbench
Enterprise
App
Enterprise Data
Warehouse
SQL / Search
SQL
“Native” Raw
RDBMS
“SQL” / Search
Service
sEvent
Hub
Hadoop ClusterdHadoop ClusterBig Data Platform
SQL
Export
Storage
Storage
Raw
Refined/
UsageOpt
Microservice Cluster
Stream Processing Cluster
Stream
Processor
Model /
State
Edge Node
Rules
Event Hub
Storage
Governance
Data Catalog
Rules
Engine
Parallel
Processing
Query
Engine
Microservice Data
{ }
API
Event
Stream
Event Stream
Modern Data Platform
Event Stream

Solutions for bi-directional integration between Oracle RDBMS & Apache Kafka

Solutions for bi-directional integration between Oracle RDBMS & Apache Kafka

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Similar to Solutions for bi-directional integration between Oracle RDBMS & Apache Kafka

Similar to Solutions for bi-directional integration between Oracle RDBMS & Apache Kafka (20)

More from Guido Schmutz

More from Guido Schmutz (20)

Recently uploaded

Recently uploaded (20)

Solutions for bi-directional integration between Oracle RDBMS & Apache Kafka