Big DataMsc. Mauro C. Pichiliani (pichiliani@uol.com.br)                 @pichiliani                                      ...
Explosão de dados     Twitter:         1 bilhão de mensagens por semana         Recorde: 6.939 mensagens por segundo   ...
Infográficos               3
Fontes de dados   Principais áreas: metereologia, genômica, simulações, biologia,    pesquisa ambiental, pesquisas na int...
Hardware?            5
O que é Big Data?   Não é um produto, aplicação, plataforma, solução ou mesmo algo    tangível. Está mais para um conceit...
Explicação diática de Big Data   O vídeo “How big is Big Data?” produzido pela EMC explica com    desenhos o que é Big Da...
Big Data – possibilidades    Desbloquear o potencial dos dados       Análise, mineração, descoberta de tendências, etc  ...
Trabalhando com Big Data   Resumindo o trabalho a ser feito com Big Data:                                                ...
Manipulando Big Data   Muitos argumentos indicando que tecnologias atuais não suportam    novas tendências               ...
Problemas com o RDBMS                        11
Conclusão   Explosão de dados na era atual   Big Data foca em muitos dados de formatos variados   Há enorme potencial p...
Upcoming SlideShare
Loading in...5
×

BigData

5,245

Published on

Apresentação de Mauro Pichiliani durante o 7Masters - Encontro iMasters de Especialistas em Banco de Dados - março/2012

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
5,245
On Slideshare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
38
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

BigData

  1. 1. Big DataMsc. Mauro C. Pichiliani (pichiliani@uol.com.br) @pichiliani 1
  2. 2. Explosão de dados Twitter:  1 bilhão de mensagens por semana  Recorde: 6.939 mensagens por segundo  WallMart: 1 milhão de transações de cliente por segundo  Facebook: 40 bilhões de fotos  IDC: universo digital terá 20 zettabytes de dados em 2020  1 zettabyte = 1 bilhão de terabyes  IBM: 2,5 quintilhões de dados por dia  90% dos dados do mundo criados no últimos 2 anos 2
  3. 3. Infográficos 3
  4. 4. Fontes de dados Principais áreas: metereologia, genômica, simulações, biologia, pesquisa ambiental, pesquisas na internet, finanças, dados de negócios, política, jornalismo e outras Origem: dispositivos móveis, sensores, logs de software, câmeras, microfones, RFID e redes de sensores Produção voluntária: Facebook, Twitter, Linkedin e outras mídias sociais Produção automática: sensores Características: variedades de dados e velocidade de geração Nota: dados em excesso não é novidade Porém tirar vantagem expressiva ao explorar grandes bases de dados é o foco do Big Data 4
  5. 5. Hardware? 5
  6. 6. O que é Big Data? Não é um produto, aplicação, plataforma, solução ou mesmo algo tangível. Está mais para um conceito. Algumas definições: Wikipedia: “(…) big data consists of datasets that grow so large that they become awkward to work with using on-hand database management tools. Difficulties include capture, storage, search, sharing, analytics, and visualizing” IBM: “The data that comes from everywhere: from sensors used to gather climate information, posts to social media sites, digital pictures and videos posted online, transaction records of online purchases, and from cell phone GPS” Richard Dobbs e Jaques Bugin: “Big data refers to datasets whose size is beyond the ability of typical database software tools to capture, store, manage and analyze” IMPORTANTE: Big Data não é apenas sobre tamanho dos dados! Com certeza é uma buzzword! 6
  7. 7. Explicação diática de Big Data O vídeo “How big is Big Data?” produzido pela EMC explica com desenhos o que é Big Data Fonte: http://www.youtube.com/watch?v=qD5S6yZXaVI 7
  8. 8. Big Data – possibilidades Desbloquear o potencial dos dados  Análise, mineração, descoberta de tendências, etc  Visualizações  Uso estratégico dos dados Potencial é superior ao que se tinha antes Exemplos:  Análise de dados do setor de automação residencial  Análise para campanhas políticas (case do Obama)  Aprofundamento do foco na pessoa por suas preferências (grafo do Facebook) Novamente, foco na estratégia 8
  9. 9. Trabalhando com Big Data Resumindo o trabalho a ser feito com Big Data: 9
  10. 10. Manipulando Big Data Muitos argumentos indicando que tecnologias atuais não suportam novas tendências 10
  11. 11. Problemas com o RDBMS 11
  12. 12. Conclusão Explosão de dados na era atual Big Data foca em muitos dados de formatos variados Há enorme potencial para estratégias e táticas fundamentais para o negócio/aplicação Características indicam que RDBMS tradicional não suporta Big Data Big Table é uma das abordagens que vem se despontando para trabalhar com Big Data NoSQL classifica abordagens para armazenamento e manipulação de dados de forma diferente dos RDBMS Big Data, Big Table e NoSQL são termos em evidência que ainda vão ser muito discutidos e analisados 12
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×