SlideShare a Scribd company logo
1 of 56
Download to read offline
Robson Motta | robson@chaordic.com.br
Big Data e MapReduce
Admirável mundo novo
Mais de
200 milhões
page views mensais
116 milhões
de pedidos
3 bilhões
de visitas
em produtos
700 milhões
de recomendações
geradas diariamente
Como
armazenar?
Como
processar?
Como
visualizar?
Como
monitorar?
Sumário
• A Chaordic
• Chaordic + Big Data + Cloud
• Dos eventos às recomendações
• A vida não é bela: surgem os desafios
• Visualizando e monitorando
• Futuro?
+
Como tudo começou
Como fazemos
Como
fazemos?
+
• Volume
• Velocidade
• Variedade
quantidade
de dados
tempo de
processamento
2010
16 M
eventos 3 dias
quantidade
de dados
tempo de
processamento
2010 2014
16 M
eventos
4500 M
eventos3 dias
quantidade
de dados
tempo de
processamento
2010 2014
16 M
eventos
4500 M
eventos3 dias 7 horas
Arquitetura
Onsite
DashboardEngine
Mail
Platform
Como
armazenar?
Node 1
Node 3
Node 2Node...
"Batch" Cassandra Cluster
Availability Zone - 2
Node 1
Node 3
Node 2Node...
"Online" Cassandra Cluster
Availability Zone - 1
Online Service Tier Batch Service Tier
Como
processar?
MapReduce
Um novo paradigma
que permite e facilita
a implementação de
algoritmos distribuídos
Data
Robson Motta
Raul Seixas
Ed Motta
Reginaldo Rossi
Nelson Mandela
Valentino Rossi
Map
Motta, 1
Seixas, 1
Motta, 1
Rossi, 1
Mandela, 1
Rossi, 1
Mandela, (1)
Motta, (1, 1)
Rossi, (1, 1)
Seixas, (1)
Reduce
Mandela, (1)
Motta, (1, 1)
Rossi, (1, 1)
Seixas, (1)
Mandela, 1
Motta, 2
Rossi, 2
Seixas, 1
Como
processar?
Data
A - B
Cadeira - D
Cadeira - E
Cadeira - E
F - A
Map
A, (B, F)
B, (A)
Cadeira, (D, E, E)
D, (Cadeira)
E, (Cadeira,Cadeira)
F, (A)
Reduce
A, [B, F]
B, [A]
Cadeira, [E, D]
D, [Cadeira]
E, [Cadeira]
F, [A]
Como
processar?
Hadoop: HDFS e Hadoop MapReduce
• Escalável
• Custo reduzido
• Flexível
• Tolerante a falha
Como
processar?
Engine
3
Como
processar?
Engine
Core
Platform
EC2 + EMR
S3
Uploader
5
64
2
1
recomendações
eventos
recomendações
eventos
pré
processamento
processamento
pós
processamento
● produtos vistos
● cliques
● pedidos
etc.
• Itens muito populares
• Eventos inesperados
• Clientes diferentes
• Sazonalidade
• Ausência de eventos
Desafios
Desafios
Desafios
R$ 270,81
Usuário entrou
na página para
comprar a boneca...
...e sugerimos que ele
levasse junto um pneu
Compras
conjuntas?
Desafios
+
Compras
conjuntas?
Desafios
+
31
Dados
consistentes?
Desafios
+
Dados
consistentes?
Desafios
+
Bot gerando
eventos?
Desafios
+
Bot gerando
eventos?
Desafios
+
Kit da
própria loja?
Desafios
+
Desafios
+
Kit da
própria loja?
Destaques
simultâneos?
Desafios
+
Reduziram
de preço?
Desafios
+
Reduziram
de preço?
Desafios
+
...só o pneu
Quando
reduziu?
Desafios
+
Quando
reduziu?
Desafios
+
Conclusão...
Desafios
+
Promoção de pneu
no dia das crianças
Desafios
+
Visualizando
e monitorando
Visualizar
e monitorar
• Consultas em bases não relacionais
• Acompanhamento de desempenho
• Visualização de logs
• Acompanhamento de custos
Visualizar
KINESIS STORM
Real Time Big Data Processing
Futuro
SHARK
In Memory Big Data Processing
Futuro
Robson Motta
robson@chaordic.com.br
/chaordic.com.br

More Related Content

Viewers also liked (7)

NoSQL and MapReduce
NoSQL and MapReduceNoSQL and MapReduce
NoSQL and MapReduce
 
TDC2016SP - Trilha BigData
TDC2016SP - Trilha BigDataTDC2016SP - Trilha BigData
TDC2016SP - Trilha BigData
 
TDC2016SP - Trilha BigData
TDC2016SP - Trilha BigDataTDC2016SP - Trilha BigData
TDC2016SP - Trilha BigData
 
Query Languages for Document Stores
Query Languages for Document StoresQuery Languages for Document Stores
Query Languages for Document Stores
 
Epicentro - João Bosco
Epicentro - João BoscoEpicentro - João Bosco
Epicentro - João Bosco
 
Query mechanisms for NoSQL databases
Query mechanisms for NoSQL databasesQuery mechanisms for NoSQL databases
Query mechanisms for NoSQL databases
 
Design in Tech Report 2017
Design in Tech Report 2017Design in Tech Report 2017
Design in Tech Report 2017
 

Similar to Chaordic - BigData e MapReduce - Robson Motta

Similar to Chaordic - BigData e MapReduce - Robson Motta (20)

Detecção de Fraudes em Licitações Usando Batch Analytics com WSO2
Detecção de Fraudes em Licitações Usando Batch Analytics com WSO2Detecção de Fraudes em Licitações Usando Batch Analytics com WSO2
Detecção de Fraudes em Licitações Usando Batch Analytics com WSO2
 
Big Data na Nuvem
Big Data na NuvemBig Data na Nuvem
Big Data na Nuvem
 
TDC 2017 - Borg até o Prometheus: Site Reliability Engineering
TDC 2017 - Borg até o Prometheus: Site Reliability EngineeringTDC 2017 - Borg até o Prometheus: Site Reliability Engineering
TDC 2017 - Borg até o Prometheus: Site Reliability Engineering
 
Digital Transformation: Como a nuvem da AWS pode ajudar o seu negócio
Digital Transformation: Como a nuvem da AWS pode ajudar o seu negócioDigital Transformation: Como a nuvem da AWS pode ajudar o seu negócio
Digital Transformation: Como a nuvem da AWS pode ajudar o seu negócio
 
Utilizando a nuvem para proteger o mercado financeiro com segurança, agilidad...
Utilizando a nuvem para proteger o mercado financeiro com segurança, agilidad...Utilizando a nuvem para proteger o mercado financeiro com segurança, agilidad...
Utilizando a nuvem para proteger o mercado financeiro com segurança, agilidad...
 
O futuro do big data
O futuro do big dataO futuro do big data
O futuro do big data
 
Big data: Conceitos e Desafios
Big data: Conceitos e DesafiosBig data: Conceitos e Desafios
Big data: Conceitos e Desafios
 
TDC2016POA | Trilha BigData - Orquestrando Hadoop, Cassandra e MongoDB com o ...
TDC2016POA | Trilha BigData - Orquestrando Hadoop, Cassandra e MongoDB com o ...TDC2016POA | Trilha BigData - Orquestrando Hadoop, Cassandra e MongoDB com o ...
TDC2016POA | Trilha BigData - Orquestrando Hadoop, Cassandra e MongoDB com o ...
 
Cassandra Trip Brasil
Cassandra Trip BrasilCassandra Trip Brasil
Cassandra Trip Brasil
 
Ecossistema Microsoft por trás dos maiores apps de saúde do Brasil
Ecossistema Microsoft por trás dos maiores apps de saúde do BrasilEcossistema Microsoft por trás dos maiores apps de saúde do Brasil
Ecossistema Microsoft por trás dos maiores apps de saúde do Brasil
 
SQL SAT Salvador - Arquitetando Data Lake Multicloud
SQL SAT Salvador - Arquitetando Data Lake MulticloudSQL SAT Salvador - Arquitetando Data Lake Multicloud
SQL SAT Salvador - Arquitetando Data Lake Multicloud
 
Como funciona a Internet
Como funciona a InternetComo funciona a Internet
Como funciona a Internet
 
Apresentação
ApresentaçãoApresentação
Apresentação
 
Big Data: O que é? e por onde começar?
Big Data: O que é? e por onde começar?Big Data: O que é? e por onde começar?
Big Data: O que é? e por onde começar?
 
BigData MapReduce
BigData MapReduceBigData MapReduce
BigData MapReduce
 
BigData
BigDataBigData
BigData
 
BIGDATA: Da teoria à Pratica
BIGDATA: Da teoria à PraticaBIGDATA: Da teoria à Pratica
BIGDATA: Da teoria à Pratica
 
Computação em nuvem
Computação em nuvemComputação em nuvem
Computação em nuvem
 
Treinamento hadoop - dia1
Treinamento hadoop - dia1Treinamento hadoop - dia1
Treinamento hadoop - dia1
 
Minha Vida Fiap - Desenvolvimento
Minha Vida Fiap - DesenvolvimentoMinha Vida Fiap - Desenvolvimento
Minha Vida Fiap - Desenvolvimento
 

More from Chaordic

More from Chaordic (8)

Chaordic Mail | ES
Chaordic Mail | ESChaordic Mail | ES
Chaordic Mail | ES
 
Chaordic | Quick Presentation | ES
Chaordic | Quick Presentation | ESChaordic | Quick Presentation | ES
Chaordic | Quick Presentation | ES
 
Chaordic OnSite | ES
Chaordic OnSite | ESChaordic OnSite | ES
Chaordic OnSite | ES
 
Chaordic Institucional | ES
Chaordic Institucional | ESChaordic Institucional | ES
Chaordic Institucional | ES
 
Chaordic | Personalização de ofertas para e-commerce
Chaordic | Personalização de ofertas para e-commerceChaordic | Personalização de ofertas para e-commerce
Chaordic | Personalização de ofertas para e-commerce
 
Resumo do Congresso Experiência do Cliente 2013
Resumo do Congresso Experiência do Cliente 2013 Resumo do Congresso Experiência do Cliente 2013
Resumo do Congresso Experiência do Cliente 2013
 
O caminho para a personalização eficaz
O caminho para a personalização eficazO caminho para a personalização eficaz
O caminho para a personalização eficaz
 
Taxa de conversão no e-commerce
Taxa de conversão no e-commerceTaxa de conversão no e-commerce
Taxa de conversão no e-commerce
 

Chaordic - BigData e MapReduce - Robson Motta