NoSQL: onde, como e por quê? Cassandra e MongoDB

NoSQL: onde, como e por quê? Rodrigo Hjort [email_address]

Universo digital em expansão Fonte: IDC White Paper, "The Diverse and Exploding Digital Universe", 2008.

Os modelos transacionais ,[object Object]

BASE otimista, aceitando que a consistência esteja em um “estado de fluxo” http://queue.acm.org/detail.cfm?id=1394128 Possibilita a escalabilidade horizontal...

NoSQL = Not Only SQL http://nosql-database.org/ distribuídos não relacionais horizontalmente escaláveis esquemas flexíveis replicáveis APIs simples

Zoologia dos bancos NoSQL Wide Column Store / Column Families Key-Value Store Document Store NoSQL Database

[object Object],Teorema de Brewer: CAP ,[object Object]

Disponibilidade : toda operação tem uma resposta

Partição : sistema continua operante mesmo enfrentando partições na rede Consistência Consistency Disponibilidade Availability Partição Partition Tolerance

I. Consistência e Disponibilidade ,[object Object],C A

II. Consistência e Partição ,[object Object],C P

III. Disponibilidade e Partição ,[object Object],A P

“ A high performance, scalable, distributed storage and processing system for structured and unstructured data.”

Cassandra: um breve histórico Bigtable Dynamo

Um novo modelo de dados Row schema-less schema-optional

Exemplo: modelagem do Twitter Users Following Followers @paul segue @brigitte desde 22/08/2010 john name: John Doe pass: swordfish joined: 20091115 paul name: Paul Lane pass: thepass joined: 20091129 john paul: 20091204 brigitte: 20100815 paul john: 20091205 debora: 20100729 brigitte: 20100822 john tom: 20091128 paul: 20091205 brigitte john: 20100815 paul: 20100822

Exemplo: modelagem do Twitter Statuses (Tweets) Timeline Userline Tweets do @john Tweets dos usuários que o @paul segue data/hora tweet 12345 user: john body: Nuvem privada do @serpro! retweets: 123 12346 user: brigitte john 20100116083155: 12346 paul 20100116083002: 12345 20100116083155: 12346 john 20100116083002: 12345 20100118235914: 23457 brigitte 20100116083155: 12346 tweet body: Acabei de #acordar. tags acordar: 1

CQL (Query Language) CREATE COLUMNFAMILY users ( KEY varchar PRIMARY KEY, name varchar, pass varchar, joined bigint); INSERT INTO users (KEY, name, pass) VALUES ('jsmith', 'John Smith', 'changeme') USING CONSISTENCY QUORUM; SELECT * FROM users WHERE KEY = 'jsmith'; u'jsmith' | u'pass',u'changeme' SELECT name..pass FROM users WHERE KEY >= 'h' LIMIT 10; CREATE INDEX users_joined_idx ON users (joined); DELETE joined FROM users where KEY = 'jsmith';

“ It took two weeks to perform ALTER TABLE on the statuses [tweets] table.” – Twitter

Particionamento e replicação Fixed Circular Space (Ring) Virtual Nodes Consistent Hashing (MD5) ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Ajuste de parâmetros (N, R, W) ,[object Object]

Ajuste por requisição (R, W) ,[object Object]

Read repair ack cliente réplica réplica réplica coordenador

Comunicação entre os nós Gossip-Based Protocol

Relacional versus NoSQL Dados do benchmark ,[object Object],MySQL ,[object Object]

escrita: ~300 ms Cassandra ,[object Object]

escrita: ~0,12 ms Leitura 23x mais rápida! Escrita 2500x mais rápida!

“ MongoDB (from "humongous") is a scalable, high-performance, open source, powerful, document-oriented database written in C++.”

O modelo de dados Relacional (Tabular) Orientado a Documentos

NoSQL: onde, como e por quê? Cassandra e MongoDB

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Viewers also liked

Viewers also liked (20)

Similar to NoSQL: onde, como e por quê? Cassandra e MongoDB

Similar to NoSQL: onde, como e por quê? Cassandra e MongoDB (20)

Recently uploaded

Recently uploaded (6)

NoSQL: onde, como e por quê? Cassandra e MongoDB

Editor's Notes