Cassandra e Hadoop - Adilson Carvalho - eBehavior

887 views

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
887
On SlideShare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
5
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Cassandra e Hadoop - Adilson Carvalho - eBehavior

  1. 2. O que a gente faz <ul><ul><li>Rastreamento </li></ul></ul><ul><ul><li>Recomendação </li></ul></ul>
  2. 3. Hadoop
  3. 4. Hadoop... <ul><li>Problema: </li></ul><ul><ul><li>Arquivos muito grandes para o servidor do Mahout </li></ul></ul><ul><ul><li>O servidor não conseguia mais calcular a estratégia de recomendação </li></ul></ul><ul><ul><li>Processo de geração dos dados de entrada muito pesado para o SQL Server </li></ul></ul><ul><li>Necessidade: </li></ul><ul><ul><li>Adoção de Framework para computação distribuída que tenha agendamento de tarefas e storage distribuídos </li></ul></ul>
  4. 5. Hadoop... <ul><li>Estratégia: </li></ul><ul><ul><li>Adoção do Hadoop </li></ul></ul><ul><li>Vantagens </li></ul><ul><ul><li>File System distribuído e replicado </li></ul></ul><ul><ul><li>Distribuição de processamento no Cluster </li></ul></ul><ul><ul><li>Tolerância a falhas </li></ul></ul><ul><ul><li>Redução do processamento para gerar recomendação </li></ul></ul><ul><li>Desvantagens </li></ul><ul><ul><li>Curva de aprendizado </li></ul></ul>
  5. 6. Cassandra
  6. 7. Cassandra... <ul><li>Problema: </li></ul><ul><ul><li>Exaustão dos recursos de banco de dados relacional </li></ul></ul><ul><li>Necessidade: </li></ul><ul><ul><li>Remover do SQL Server itens de baixa latência </li></ul></ul><ul><li>****REPETIR DESENHO DO CENÁRIO HADOOP </li></ul>
  7. 8. Cassandra... <ul><li>Estratégia: </li></ul><ul><ul><li>Adoção do Cassandra </li></ul></ul><ul><li>Vantagens </li></ul><ul><ul><li>Compatibilidade e interoperabilidade com o Hadoop </li></ul></ul><ul><ul><li>Altas taxas de leitura/gravação </li></ul></ul><ul><ul><li>File System distribuído e replicado </li></ul></ul><ul><ul><li>Distribuição de processamento no Cluster </li></ul></ul><ul><ul><li>Tolerância a falhas </li></ul></ul><ul><ul><li>Redução do processamento para gerar recomendação </li></ul></ul><ul><li>Desvantagens </li></ul><ul><ul><li>Curva de aprendizado </li></ul></ul><ul><ul><li>Incompatibilidade entre clientes Java e .Net </li></ul></ul>
  8. 9. obrigado Adilson Carvalho [email_address] Twitter: @lcadilson

×