Apache Cassandra
Une base de donnée pour des applications scalables et résistantes
Sylvain Lebresne (DataStax)
Webinar Big...
Big Data
2/18
Un peu d'histoire
3/18
Job Trends
4/18
Quelques utilisateurs
5/18
Industries et Cas d'utilisations
Tout ce qui requiert scalibilité et/ou haute disponibilité.
Finance
Media sociaux
Diverti...
Pourquoi Apache Cassandra?
Entièrement distribué, pas de SPOF
Multi-master, multi-DC
Scale linéairement
Performance de hau...
Disponibilité
"There is no such thing as standby infrastructure: there stuff you always use and
stuff that won't work when...
Partitionnement classique avec SPOF
9/18
Entièrement distribué, pas de SPOF
10/18
Tolérance aux pannes sur le terrain
11/18
Ajout de capacité transparent, sans interruption de service
Pas de SPOF, même temporairement -- Pas de "primary" replica
R...
Quid de la performance?
"Log-structured storage engine" pour minimisé les I/O aléatoires
Excellente performance en lecture...
Performance
http://vldb.org/pvldb/vol5/p1724_tilmannrabl_vldb2012.pdf
14/18
Scalabilité linéaire
http://techblog.netflix.com/2011/11/benchmarking-cassandra-scalability-on.html
15/18
Cassandra Query Language
CREATE TABLE users (
username text PRIMARY KEY,
fullname text,
password text,
email text,
picture...
DataStax
www.datastax.com
DataStax Entreprise Edition
DataStax OpsCenter
Support 24/7
Formation, conseil, documentation .....
Pour aller plus loin
Merci!
cassandra.apache.org
www.datastax.com/docs
planetcassandra.org
·
·
·
18/18
Upcoming SlideShare
Loading in …5
×

Webinar Big Data Paris

679 views

Published on

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
679
On SlideShare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
7
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Webinar Big Data Paris

  1. 1. Apache Cassandra Une base de donnée pour des applications scalables et résistantes Sylvain Lebresne (DataStax) Webinar Big Data Paris // 11 Mars 2014
  2. 2. Big Data 2/18
  3. 3. Un peu d'histoire 3/18
  4. 4. Job Trends 4/18
  5. 5. Quelques utilisateurs 5/18
  6. 6. Industries et Cas d'utilisations Tout ce qui requiert scalibilité et/ou haute disponibilité. Finance Media sociaux Divertissement Énergie Sécurité Advertising Commerce en ligne ... · · · · · · · · Time series data Messagerie Ad tracking Data mining Stream d'activité Sessions utilisateur ... · · · · · · · 6/18
  7. 7. Pourquoi Apache Cassandra? Entièrement distribué, pas de SPOF Multi-master, multi-DC Scale linéairement Performance de haut niveau Larger-than-memory datasets Durable Cache intégré Consistence "réglable" · · · · · · · · 7/18
  8. 8. Disponibilité "There is no such thing as standby infrastructure: there stuff you always use and stuff that won't work when you need it" -- Ben Black: founder, Boundary; ex-AWS "The biggest problem with failover is that you're almost never using it until it really hurts. It's like backup that you never test" -- Rick Branson: instagram, ex-DataStax · · 8/18
  9. 9. Partitionnement classique avec SPOF 9/18
  10. 10. Entièrement distribué, pas de SPOF 10/18
  11. 11. Tolérance aux pannes sur le terrain 11/18
  12. 12. Ajout de capacité transparent, sans interruption de service Pas de SPOF, même temporairement -- Pas de "primary" replica Réplication synchonous/asynchronous configurable Tolère les pannes de façon transparente "smart" réplication pour éviter les pannes corrélées · · · · · 12/18
  13. 13. Quid de la performance? "Log-structured storage engine" pour minimisé les I/O aléatoires Excellente performance en lecture et en écriture "Row-level" isolation à l'aide d'algorithme non bloquant Compression Cache intégré · · · · · 13/18
  14. 14. Performance http://vldb.org/pvldb/vol5/p1724_tilmannrabl_vldb2012.pdf 14/18
  15. 15. Scalabilité linéaire http://techblog.netflix.com/2011/11/benchmarking-cassandra-scalability-on.html 15/18
  16. 16. Cassandra Query Language CREATE TABLE users ( username text PRIMARY KEY, fullname text, password text, email text, picture_profile blob, ) INSERT INTO users (username, fullname, password, email) VALUES ('tsmith', 'Tom Smith', 'Pa55wd!', 'tsmith@gmail.com') SELECT * FROM users WHERE username='tsmith' CQL Syntaxe familière, mais a dénormalisation est la norme (pas de jointure ni de sous-requêtes) Pour ne savoir plus, cherchez "the state of CQL" sur youtube. · · 16/18
  17. 17. DataStax www.datastax.com DataStax Entreprise Edition DataStax OpsCenter Support 24/7 Formation, conseil, documentation ... · Certified Cassandra Built-in Analytics Built-in Search Entreprise Security - - - - · · · 17/18
  18. 18. Pour aller plus loin Merci! cassandra.apache.org www.datastax.com/docs planetcassandra.org · · · 18/18

×