Webinar Back to Basics 3 - Introduzione ai Replica Set

Back to Basics 2017 : Webinar 3
Introduzione ai Replica Set
Massimo Brignoli
Principal Solutions Architect
MongoDB
@massimobrignoli
massimo@mongodb.com
V1.0

Riassunto della Parti 1 e 2
• Perché esistono i NoSQL
• I Tipi di database NoSQL
• Le funzionalità chiave di MongoDB
• Come installare MongoDB
• Come eseguire le operazioni CRUD di base
• Come creare gli indici
• Come usare la funzione explain()
• MongoDB Compass e MongoDB Atlas

Agenda
• Durabilità dei Dati
• L’approccio di MongoDB: i Replica Set
• Il ciclo di vita di un Replica Set
• Come scrivere codice quando si usa un replica set

Replica Sets
• Replica set – da 2 a 50 repliche
• Replica sets crea un self-healing ‘shard’
• Data center awareness
• Replica sets indirizza:
• Alta affidabilità
• Durabilità e Consistenza
• Manutenzione (e.g., HW swaps)
• Disaster Recovery
Application
Driver
Primary
Secondary
Secondary
Replication

Replica Sets – Workload Isolation
• Replica sets abilitano la separazione dei workload
• Esempio: workload operazionale sul nodo primario e il
workload analitico sui nodi secondari
eCommerce Application
MongoDB Primary
In-memory Storage Engine
MongoDB Secondary
WiredTiger Storage Engine
User Data
Sessions, Cart,
Recommendations
MongoDB Secondary
WiredTiger Storage Engine
Persisted
User Data

Node 1
Node 2 Node 3
Replica Set - Creazione

Node 1
(Primary)
Node 2 Node 3
Replica Set - Inizializzazione
 rs.initiate()

Node 1
(Primary)
Node 2
(Secondary)
Node 3
Replication
Heartbeat
Replica Set – Secondo nodo
 rs.initiate()
 rs.add(“nodo2”)

Node 1
(Primary)
Node 2
(Secondary)
Node 3
(Secondary)
Replication Replication
Heartbeat
Replica Set –Terzo nodo
 rs.initiate()

Node 2
(Secondary)
Node 3
(Secondary)
Heartbeat
Primary Election
Node 1
(Primary)
Replica Set – Failure Primary

Node 1
(Primary)
Node 2
(Primary)
Node 3
(Secondary)
Heartbeat
Replication
Replica Set - Failover

Node 2
(Primary)
Node 3
(Secondary)
Heartbeat
Replication
Node 1
(Recovery)
Replication
Replica Set - Recovery

Node 2
(Primary)
Node 3
(Secondary)
Heartbeat
Replication
Node 1
(Secondary)
Replication
Replica Set - Recovered

Node 1
(Primary)
Node 2
(Secondary)
Node 3
(Secondary)
Application
Driver
Read and write
Strong Consistency

Node 1
(Primary)
Node 2
(Secondary)
Node 3
(Secondary)
Application
Driver
Eventual Consistency
Read Read
Read and write

Improved Tunable Consistency
• maxStalenessMS
• Decide come e quando reindirizzare le query alle repliche
secondarie
• Legge dalle repliche solo se sono all’interno di una finestra di
consistenza definita
• Migliora la qualità dei dati mentre si scalano le letture sui
secondari
• readConcern “linearizable” per la consistenza più forte
• Assicura che un nodo sia il primario al momentEnsure that a o
della lettura
• Assicura che I dati ritornati non saranno mai rollbackati se un
altro nodo è eletto come primario

Architettura Replicazione Oplog

Durabilità – writeConcern
Può perdere dati in caso
di caduta del primario
senza nessuna notifica.

Durabilità – writeConcern
In caso di caduta del
Primary garantisce la
non perdita di dati, in
quanto già replicati su
un altro nodo.

Secondario fa tail dell’oplog

Partiziona i batch per collection

Informa il Primary dell’optime

Driver Responsibilities
https://github.com/mongodb/mongo-python-driver
Driver
Authentication
& Security
Python<->BSON
Error handling &
Recovery
Wire
Protocol
Topology
Management
Connection Pool

Inizializzare MongoClient
c = MongoClient( "host1, host2",
replicaSet="replset" )

Vista Client Side
Secondary
host2
Secondary
host3
Primary
host1
Mongo
Client
MongoClient( "host1, host2",

Vista Client Side
Secondary
host2
Secondary
host3
Primary
host1
Mongo
Client
Monitor
Thread 1
Monitor
Thread 2
{ ismaster : False,
secondary: True,
hosts : [ host1, host2, host3 ] }

Il Comando ismaster
>>> pprint.pprint( db.command( "ismaster"
))
{u'hosts': [u'JD10Gen-old.local:27017',
u'JD10Gen-old.local:27018',
u'JD10Gen-old.local:27019'],
u'ismaster' : False,
u'secondary': True,
u'setName' : u'replset',
…}

Topologia
Current
Topology
ismaster
New
Topology

Vista Client Side
Secondary
host2
Secondary
host3
Primary
host1
Mongo
Client
Monitor
Thread 1
Monitor
Thread 2

Vista Client Side
Secondary
host2
Secondary
host3
Primary
host1
Mongo
Client
Monitor
Thread 1
Monitor
Thread 2
Monitor
Thread 3

Vista Client Side
Secondary
host2
Secondary
host3
Primary
host1
Mongo
Client
Monitor
Thread 1
Monitor
Thread 2
Monitor
Thread 3
Your
Code

Facciamo una insert
c = MongoClient( "host1, host2",
client.db.col.insert_one( { "a" : "b" } )

Insert si blocca
Secondary
host2
Secondary
host3
Primary
host1
Mongo
Client
Monitor
Thread 1
Monitor
Thread 2
Monitor
Thread 3
Your
Code
Insert

Risposta ismaster da Host 1
Secondary
host2
Secondary
host3
Primary
host1
Mongo
Client
Monitor
Thread 1
Monitor
Thread 2
Monitor
Thread 3
Your
Code
Insert
ismaster

Ora la scrittura può procedere
Secondary
host2
Secondary
host3
Primary
host1
Mongo
Client
Monitor
Thread 1
Monitor
Thread 2
Monitor
Thread 3
Your
Code
Insert Insert

Più tardi, il server host3 risponde
Secondary
host2
Secondary
host3
Primary
host1
Mongo
Client
Monitor
Thread 1
Monitor
Thread 2
Monitor
Thread 3
Your
Code

Steady State
Secondary
host2
Secondary
host3
Primary
host1
Mongo
Client
Monitor
Thread 1
Monitor
Thread 2
Monitor
Thread 3
Your
Code

La vita Interviene
Secondary
host2
Secondary
host3
Primary
host1
Mongo
Client
Monitor
Thread 1
Monitor
Thread 2
Monitor
Thread 3
Your
Code
✖

Il Monitor può non essersi accordo
Secondary
host2
Secondary
host3
Primary
host1
Mongo
Client
Monitor
Thread 1
Monitor
Thread 2
Monitor
Thread 3
Your
Code
✖
Insert
ConnectionFailure

Quindi riprova
Secondary
host2
Secondary
host3
Mongo
Client
Monitor
Thread 1
Monitor
Thread 2
Monitor
Thread 3
Your
Code
✖
Insert

Controlla il Primary
Secondary
host2
Secondary
host3
Mongo
Client
Monitor
Thread 1
Monitor
Thread 2
Monitor
Thread 3
Your
Code
✖
Insert

Host 2 è il Primary
Primary
host2
Secondary
host3
Mongo
Client
Monitor
Thread 1
Monitor
Thread 2
Monitor
Thread 3
Your
Code
✖
Insert

Steady State
Primary
host2
Secondary
host3
Secondary
host1
Mongo
Client
Monitor
Thread 1
Monitor
Thread 2
Monitor
Thread 3
Your
Code

Cosa significa? - Connect
import pymongo
client = pymongo.MongoClient()
try:
client.admin.command( "ismaster" )
except pymongo.errors.ConnectionFailure, e :
print( "Cannot connect: %s" % e )

Cosa Significa? - Queries
import pymongo
def find_with_recovery( collection, query ) :
try:
return collection.find_one( query )
except pymongo.errors.ConnectionFailure, e :
logging.info( "Connection failure : %s" e )
return collection.find_one( query )

Cosa significa? - Inserts
def insert_with_recovery( collection, doc ) :
doc[ "_id" ] = ObjectId()
try:
collection.insert_one( doc )
except pymongo.errors.ConnectionFailure, e:
logging.info( "Connection error: %s" % e )
collection.insert_one( doc )
except DuplicateKeyError:
pass

Cosa Significa? - Updates
collection.update( { "_id" : 1 },
{ "$inc" : { "counter" : 1
}})

Approfondimenti
• Jess Jiryu Davis ha una versione approfondita di questo talk
https://emptysqua.re/blog/server-discovery-and-monitoring-in-mongodb-
drivers/
• Specifiche del server discovery e monitoring
https://github.com/mongodb/specifications/blob/master/source/server-
discovery-and-monitoring/server-discovery-and-monitoring.rst

Ultimo Webinar : Sharding
• Come costruire un cluster altamente scalabile e performante
• Come rimuovere i colli di bottiglia in scrittura
• Come scegliere la chiave di partizionamento
Martedì, 27 Giugno 2017, ore 11:00.

Webinar Back to Basics 3 - Introduzione ai Replica Set

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Similar to Webinar Back to Basics 3 - Introduzione ai Replica Set

Similar to Webinar Back to Basics 3 - Introduzione ai Replica Set (20)

More from MongoDB

More from MongoDB (20)

Recently uploaded

Recently uploaded (20)

Webinar Back to Basics 3 - Introduzione ai Replica Set

Editor's Notes