Hadoop - TDC FLN 2013

643 views

Published on

Published in: Technology
  • Be the first to comment

  • Be the first to like this

Hadoop - TDC FLN 2013

  1. 1. Hadoop: [ Aquele título chato, longo… ](aka “Hadoop para DBAs”)Aldrin Leal, <aldrin@ingenieux.com.br>
  2. 2. Globalcode – Open4educationAgendaIntroduçãoMotivação para o HadoopHadoop: Passado Presente e FuturoConceituando HadoopO Ecosistema HadoopMas e ai?
  3. 3. Globalcode – Open4educationIntroduçãoAldrin LealProtrollProjetos / Experiência em HadoopOutras Áreas:CloudALM
  4. 4. Globalcode – Open4educationMotivação para o HadoopFontes de Informação Esparsas, não estruturadaDocumentosRecibosVolume de Coleta de Dados
  5. 5. Globalcode – Open4educationMotivação para o HadoopAspectos-Chave:Lei de MoorePreçoLatênciaLargura de BandaSeek Time
  6. 6. Globalcode – Open4educationMotivação para o HadoopOutros Aspectos-Chave:Computação DistribuídaTolerância a Falha
  7. 7. Globalcode – Open4educationMotivação para o HadoopLimitações:Volume de DadosOnlineStorm / YARN / ImpalaModeloSawzall / BigTable
  8. 8. Globalcode – Open4educationHadoop: PassadoPresente e FuturoDoug CuttingAltavistaYahooLucene / Solr, e…NutchPapers:MapReduceGFS
  9. 9. Globalcode – Open4educationHadoop: PassadoPresente e FuturoDistros Hadoop:Hortonworks (Microsoft)ClouderaAmazon Web ServicesIntelHadoop as a ServiceMRv1 vs YARNYARN:ImpalaMPICHStorm
  10. 10. Globalcode – Open4educationConceituando HadoopPlataformaSepara funções:Armazenagem (Namenode, Datanode)Processamento (Tasktracker)Coordenação (JobTracker)Tolerância a Falha:Fator de ReplicaçãoTask Attempts
  11. 11. Globalcode – Open4educationConceituando HadoopOtimizaçãoVários BotõesExecução EspeculativaDivisão de Responsabilidades
  12. 12. Globalcode – Open4educationConceituando HadoopMapReduceMappersReducersCombiners / Partitioners
  13. 13. Globalcode – Open4educationConceituando Hadoop
  14. 14. Globalcode – Open4educationConceituando HadoopModelo FlexívelVários Cases Implementáveis (leia a veja!)“Corrida do Big Data”
  15. 15. Globalcode – Open4educationDemoUm pequeno job mapreduce (parte I)MapperReducerOutputCollectorDriver, Tool, ConfigurableJob, JobConfFileSystemsudo (apt-get|yum) install mercurial&& hg clonehttp://bitbucket.org/ingenieux/hadoop-filesystem-indexer-demo
  16. 16. Globalcode – Open4educationEcosistema HadoopDistrosHadoop Streaming (Scripting)HBaseK/V Distribuído, com SLAValores Esparsos, Alta PerformanceHive / Pig / HCatalogSQL e PerlSchema Unificado
  17. 17. Globalcode – Open4educationDemoUm job mapreduce um pouco maior 
  18. 18. Globalcode – Open4educationMas e ai? Como começarGestão de Clusters (“Hadoop Operations”)WhirrChef / puppetOpsWorksDesenvolvimento (“Hadoop Definitive Guide”)ScriptingJava / CascadingHive / PigCiência de Dados (“Coursera ”)
  19. 19. Globalcode – Open4educationConclusão:É faroeste!Mas tem uns pontos para se nortearMuitas mudanças, ritmo rápidoDiversas Oportunidades
  20. 20. Globalcode – Open4educationDúvidas?
  21. 21. Globalcode – Open4educationObrigado

×