Cassandra Trip Brasil

621 views

Published on

0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
621
On SlideShare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
10
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

Cassandra Trip Brasil

  1. 1. NoSQL & Cassandra Edward Ribeiro 2013
  2. 2. Agenda • Big Data • Cloud Computing • NoSQL • Teorema CAP • Cassandra – Arquitetura e Modelo de Dados
  3. 3. Os SGBDs relacionais reinam soberanos por mais de 30 anos...
  4. 4. Big Data
  5. 5. O que é Big Data? • “Uma coleção de dados tão grande e complexa que se torna difícil (N.E: as vezes impossível) processá-la usando ferramentas de bancos de dados atuais ou aplicações tradicionais de processamento de dados.” ● Genoma Humano ● Cliques em sites ● Redes sociais ● etc
  6. 6. O quão “Big” é Big Data? eBay possui: ● 4.000.000.000 de registros/dia ● 2.000.000.000.000 de registros em uma tabela de eventos ● 6 PB de dados compactados para 1.2 PB Fonte: 14th Int'l Workshop on High Perf Transaction Sys, 2011
  7. 7. OK, mas lembre-se...
  8. 8. Seu site é um grande sucesso Escalabilidade E agora???
  9. 9. A solução Academia Indústria
  10. 10. Computação em Nuvem
  11. 11. Computação em Nuvem
  12. 12. Data Centers
  13. 13. NoSQL
  14. 14. NoSQL ● Alta escalabilidade ● Partição de dados ● Scale Out > Scale Up ●Alta vazão (throughput) ●Sem Relational ● schemaless (alguns!) ●Sem Transações ACID (ainda!)
  15. 15. NoSQL ●Sem SQL ● MongoDB e Cassandra possuem ling. de consulta derivada, direta ou indiretamente, do SQL ●Arquitetura Distribuída ● Clusters LAN ● Hardware de prateleira
  16. 16. Teorema CAP
  17. 17. Cassandra ● Banco NoSQL de código fonte aberto criado pelo Facebook; ● Mantido pela fundação Apache e por empresas como DataStax http://www.slideshare.net/jbellis/cassandra-summit-2013- keynote
  18. 18. Cassandra - Quem usa? ● Twitter ● Netflix ● Nasa ● Adobe ● IBM ● etc
  19. 19. Cassandra - Desempenho
  20. 20. "Bigtable: A Distributed Storage System for Structured Data", Fay Chang, Jeffrey Dean, Sanjay Ghemawat, Wilson C. Hsieh, Deborah A. Wallach, Mike Burrows, Tushar Chandra, Andrew Fikes, and Robert E. Gruber in OSDI'06: Seventh Symposium on Operating System Design and Implementation, Seattle, WA, November, 2006.
  21. 21. Cassandra – Modelo de Dados 1920011 FC: dados-pessoaisRowKey FC: acessos Família de Colunas Família de Colunas Nome: “Bruno” Idade: 11 a-2013-08-12Nome: “Bruno” a-2013-09-05 2000852 FC: dados-pessoais FC: acessos Nome: “Bruno” CPF: 1111111111111 a-2013-02-01Nome: “Gi” ...
  22. 22. Arquitetura Memtable Disco RAM Write Operation SSTable Files Read Operation Flush Log File
  23. 23. "Dynamo: amazon's highly available key-value store", Giuseppe DeCandia, Deniz Hastorun, Madan Jampani, Gunavardhan Kakulapati, Avinash Lakshman, Alex Pilchin, Swaminathan Sivasubramanian, Peter Vosshall, Werner Vogels in SIGOPS Oper. Syst. Rev., New York, NY, USA, October, 2007.
  24. 24. Hashing Consistente ID = 23 ID = 90 ID = 203 ID = 350 ID = 112 100
  25. 25. É o fim dos SGBDs relacionais?

×