Treinamento hadoop - dia1

Alexandre Uehara
Alexandre UeharaConsultor Inovação at Inovação
Treinamento Hadoop
Alexandre Uehara
● Analista Desenvolvedor (E-commerce)
● Coordenador Trilha Big Data (TDC 2013
São Paulo, TDC 2014 Florianópolis)
http://www.thedevelopersconference.com.
br/tdc/2013/saopaulo/trilha-bigdata#programacao
● Geek e nerd, trabalha com Python,
Java, C, BigData, NoSQL, e outras
coisas mais que aparecem no dia a dia
Nossa
Agenda:
7 dias!!!
Dia 1:
Introdução
Conceitos Básicos
Big Data
→ O que é?
→ 4 V's
→ Por que
agora?
→ Onde Usar?
→ Desafio
→ BI x Big Data
→Profissional de
Big Data
→ Ferramentas
→ Dicas
Dia 2 e 3:
Map Reduce e
Hadoop
→ História
(Google)
→ Conceito
MapReduce
→ Hadoop
→ Cases
Dia 4
Outras
Ferramentas
→ Ecossistema
→ Ferramentas
→ Distribuições
Hadoop
→ Hadoop na
Nuvem
→ NoSQL Tipos
→ NoSQL
Exemplos
→ Data Science
→ Machine
Learning
Dia 5, 6 e 7
Hands-on
→ Python
→ Hadoop
Por favor
Perguntem…
Não fiquem
com dúvidas
Aproveitem!!!
Treinamento hadoop - dia1
Treinamento hadoop - dia1
Treinamento hadoop - dia1
E, o que é Big Data?
Treinamento hadoop - dia1
"Das 65 empresas brasileiras
entrevistadas, três em cada
quatro organizações têm
atividades em andamento e uma
em cada quatro ou está com um
projeto piloto ou em
implementação de projeto,
enquanto as restantes ainda
lutam para entender a
tecnologia e suas aplicações."
IBM and Oxford University
Treinamento hadoop - dia1
Antes de mais nada:
"Big Data não é
nenhuma ferramenta,
nenhuma tecnologia
é um CONCEITO."
“Big data se trata de um conceito, no
qual o foco é o grande armazenamento de
dados e maior velocidade. Podemos dizer
que o big data se baseia em 4V’s
velocidade, volume, variedade e valor”
Wikipedia
http://pt.wikipedia.org/wiki/Big_data
Treinamento hadoop - dia1
Treinamento hadoop - dia1
VOLUME:
O Big Data envolve
modelos de
persistência da
ordem de petabytes ou
zetabytes de dados
geralmente não
estruturados
Treinamento hadoop - dia1
VELOCIDADE
Processamento
de dados
Armazenamento
Análise de
dados
Treinamento hadoop - dia1
VARIEDADE:
Dados não estruturados
Dados semi-estruturados
Diferentes fontes
Diferentes formatos
Treinamento hadoop - dia1
VALOR
Objetivo do
Negócio
Benefício
Tomada de
decisão
Treinamento hadoop - dia1
Por que agora?
Treinamento hadoop - dia1
Treinamento hadoop - dia1
90% dos dados
disponíveis no
mundo foram
gerados apenas
nos dois anos
anteriores.
IDC Digital Universe
8 bits:
IDC Digital Universe
8 bits: 1 byte
IDC Digital Universe
8 bits: 1 byte
1024 bytes:
IDC Digital Universe
8 bits: 1 byte
1024 bytes: 1 kilobyte
IDC Digital Universe
8 bits: 1 byte
1024 bytes: 1 kilobyte
1024 kilobytes:
IDC Digital Universe
8 bits: 1 byte
1024 bytes: 1 kilobyte
1024 kilobytes: 1 megabyte
IDC Digital Universe
8 bits: 1 byte
1024 bytes: 1 kilobyte
1024 kilobytes: 1 megabyte
1024 megabytes:
IDC Digital Universe
8 bits: 1 byte
1024 bytes: 1 kilobyte
1024 kilobytes: 1 megabyte
1024 megabytes: 1 gigabyte
IDC Digital Universe
8 bits: 1 byte
1024 bytes: 1 kilobyte
1024 kilobytes: 1 megabyte
1024 megabytes: 1 gigabyte
1024 gigabytes:
IDC Digital Universe
8 bits: 1 byte
1024 bytes: 1 kilobyte
1024 kilobytes: 1 megabyte
1024 megabytes: 1 gigabyte
1024 gigabytes: 1 terabyte
IDC Digital Universe
8 bits: 1 byte
1024 bytes: 1 kilobyte
1024 kilobytes: 1 megabyte
1024 megabytes: 1 gigabyte
1024 gigabytes: 1 terabyte
1014 terabytes:
IDC Digital Universe
8 bits: 1 byte
1024 bytes: 1 kilobyte
1024 kilobytes: 1 megabyte
1024 megabytes: 1 gigabyte
1024 gigabytes: 1 terabyte
1014 terabytes: 1 petabyte
IDC Digital Universe
8 bits: 1 byte
1024 bytes: 1 kilobyte
1024 kilobytes: 1 megabyte
1024 megabytes: 1 gigabyte
1024 gigabytes: 1 terabyte
1014 terabytes: 1 petabyte
1024 petabytes:
IDC Digital Universe
8 bits: 1 byte
1024 bytes: 1 kilobyte
1024 kilobytes: 1 megabyte
1024 megabytes: 1 gigabyte
1024 gigabytes: 1 terabyte
1014 terabytes: 1 petabyte
1024 petabytes: 1 exabyte
IDC Digital Universe
8 bits: 1 byte
1024 bytes: 1 kilobyte
1024 kilobytes: 1 megabyte
1024 megabytes: 1 gigabyte
1024 gigabytes: 1 terabyte
1014 terabytes: 1 petabyte
1024 petabytes: 1 exabyte
1024 exabytes:
IDC Digital Universe
8 bits: 1 byte
1024 bytes: 1 kilobyte
1024 kilobytes: 1 megabyte
1024 megabytes: 1 gigabyte
1024 gigabytes: 1 terabyte
1014 terabytes: 1 petabyte
1024 petabytes: 1 exabyte
1024 exabytes: 1 zetabyte
IDC Digital Universe
8 bits: 1 byte
1024 bytes: 1 kilobyte
1024 kilobytes: 1 megabyte
1024 megabytes: 1 gigabyte
1024 gigabytes: 1 terabyte
1014 terabytes: 1 petabyte
1024 petabytes: 1 exabyte
1024 exabytes: 1 zetabyte
Ou seja até 2015:
quase 8 zetabytes
IDC Digital Universe
Treinamento hadoop - dia1
Treinamento hadoop - dia1
• Processadores mais
rápidos
• Alta capacidade de
memória acessível
• Novas tecnologias de
armazenamento e
processamento desenhadas
especialmente para grandes
volumes de dados,
incluindo dados não
estruturados
• Processamento paralelo,
clustering, virtualização,
grandes ambientes de grid,
alta conectividade e
grandes resultados.
• Computação em nuvem e
outras alocações de
recursos flexíveis
Tecnologia
O que é Big Data...
O que é Big Data...
Mas onde
usar?
Sistema de
Recomendações
GPS
GPS
Cidades
Inteligentes
http://exame.abril.com.br/tecnologia/noticias/5-cidades-que-usam-big-data-para-melhorar-vida-dos-
moradores
Internet of
Things
Redes Sociais
Mercado Financeiro:
conhecer o consumidor,
análise de dados para identificar os riscos de
mercado
Google Flu Trends - http://www.google.org/flutrends/br/#BR
Treinamento hadoop - dia1
Treinamento hadoop - dia1
Big Data:
capturar,
armazenar,
buscar,
compartilhar,
analisar e
visualizar
Maior desafio:
Maior desafio:
Privacidade
Maior desafio:
"Ao mesmo tempo em que estamos animados com
as novas perspectivas de negócio
possibilitadas pela coleta exaustiva de
dados, também estamos preocupados com o
fato de muitas empresas armazenarem grande
quantidade de dados pessoais
desnecessariamente. Defendemos que as
empresas adotem uma atitude de
“datensparsamkeit” e armazenem apenas o
mínimo de informações pessoais necessárias
sobre seus clientes."
http://thoughtworks.fileburst.com/assets/technology-radar-
jan-2014-pt.pdf
Treinamento hadoop - dia1
BI x Big Data
"O Big Data é uma evolução do
BI, e ambos devem caminhar
juntos no futuro."
Carlos Tunes, líder de soluções de SW
para Business Analytics da IBM Brasil
"A diferença é o dinamismo,
multiplicidade e o tamanho"
Big Data
não vai "matar"
o BI
'Data Warehouse' será
necessário para armazenar
dados estruturados
Previsão:
BI servirá para casos
específicos, enquanto o Big
Data permitirá uma leitura
mais geral da situação
Ou seja:
Como se BI fosse a foto e o Big
Data o filme – algo mais completo,
que permite agregar todos os bancos de
dados estruturados e os não
estruturados, como vídeos, imagens e
textos.
Quem é o profissional de Big Data?
Cientista de Dados
(Data Scientist)
Que
ferramenta
preciso
aprender?
Treinamento hadoop - dia1
Treinamento hadoop - dia1
E se eu quiser saber mais?
IBM Big Data Univeristy
http://bigdatauniversity.com/courses/
Coursera
https://www.coursera.org/
● Big Data in Education,
● Web Intelligence and Big Data,
● Machine Learning,
● Introduction to Recommender Systems, etc...
EDX
https://www.edx.
org/course/caltechx/cs1156x/learning-data/1120
Learning From Data
Real-Time Big Data Analytics:
Emerging Architecture
Hadoop: The Definitive
Guide
Big Data Now: 2012
Edition
Alguns links
● http://www.thedevelopersconference.com.br/tdc/2013/saopaulo/trilha-bigdata#programacao
● http://www.infoq.com/bigdata/
● http://www.infoq.com/br/bigdata
● http://blog.matthewrathbone.com/2013/01/05/a-quick-guide-to-hadoop-map-reduce-frameworks.html
● http://developer.yahoo.com/hadoop/tutorial/
● http://blog.mortardata.com/post/40602271238/7-books-to-supercharge-your-data-education
● http://hortonworks.com/hadoop-training/register-for-hadoop-training/
● https://education.emc.com/guest/campaign/data_science.aspx
Resumo, Big Data...
E, mais 2
dicas...
Treinamento hadoop - dia1
Treinamento hadoop - dia1
Alexandre Uehara
@AleUehara
linkedin.com/in/aleuehara
uehara.alexandre@gmail.com
slideshare.net/aleuehara
1 of 91

More Related Content

What's hot(20)

Arquitetura para solução Big Data – open sourceArquitetura para solução Big Data – open source
Arquitetura para solução Big Data – open source
Felipe RENZ - MBA TI / Big 2.3K views
Hadoop, Big Data e Cloud ComputingHadoop, Big Data e Cloud Computing
Hadoop, Big Data e Cloud Computing
Amazon Web Services LATAM2.9K views
Hadoop - Mãos à massa! Qcon2014Hadoop - Mãos à massa! Qcon2014
Hadoop - Mãos à massa! Qcon2014
Thiago Santiago2.5K views
Big DataBig Data
Big Data
Randy Ambrosio Qj882 views
OS CINCO Vs DO BIG DATAOS CINCO Vs DO BIG DATA
OS CINCO Vs DO BIG DATA
Leonardo Dias6.7K views
Data Lakes com Hadoop e Spark: Agile Analytics na práticaData Lakes com Hadoop e Spark: Agile Analytics na prática
Data Lakes com Hadoop e Spark: Agile Analytics na prática
Ricardo Wendell Rodrigues da Silveira3.3K views
Big Data - O que é o hadoop, map reduce, hdfs e hiveBig Data - O que é o hadoop, map reduce, hdfs e hive
Big Data - O que é o hadoop, map reduce, hdfs e hive
Flavio Fonte, PMP, ITIL53.1K views
Bigdata - Leandro WanderleyBigdata - Leandro Wanderley
Bigdata - Leandro Wanderley
Leandro Couto1.7K views
Pentaho, Hadoop , Big Data e Data LakesPentaho, Hadoop , Big Data e Data Lakes
Pentaho, Hadoop , Big Data e Data Lakes
Ambiente Livre757 views
Seminário HadoopSeminário Hadoop
Seminário Hadoop
Ivanilton Polato1.7K views
Hadoop - Primeiros passosHadoop - Primeiros passos
Hadoop - Primeiros passos
Sensedia14.9K views
Proposta de arquitetura HadoopProposta de arquitetura Hadoop
Proposta de arquitetura Hadoop
Adriano Rodrigo Guerreiro Laranjeira1.1K views
BigDataBigData
BigData
Alexandra Joca883 views

Viewers also liked(20)

Qlikview com Google MapsQlikview com Google Maps
Qlikview com Google Maps
carlos_h_ramos1.2K views
Apresentação - QlikViewApresentação - QlikView
Apresentação - QlikView
JDSBD1.5K views
QlikBrandQlikBrand
QlikBrand
Guilherme Torres631 views
PentahoPentaho
Pentaho
Tiago Barreto4.8K views
SpagoBI - Plataforma BI livre e abertaSpagoBI - Plataforma BI livre e aberta
SpagoBI - Plataforma BI livre e aberta
Fabrício Basto4.8K views
Conceitos gerais de etl - QlikviewConceitos gerais de etl - Qlikview
Conceitos gerais de etl - Qlikview
Roberto Oliveira2.3K views
Documento SpagoBIDocumento SpagoBI
Documento SpagoBI
Grendene S/A2.9K views
Vixteam IDEA 9 Data AnalyticsVixteam IDEA 9 Data Analytics
Vixteam IDEA 9 Data Analytics
VIXTEAM7.3K views
Gestão administrativa de pessoalGestão administrativa de pessoal
Gestão administrativa de pessoal
Rodrigo Cristóvão7.5K views
Sql saturday325Sql saturday325
Sql saturday325
demetrioi588 views
Business AnalyticsBusiness Analytics
Business Analytics
Petronio Candido1.6K views
Self Service BI com Power BISelf Service BI com Power BI
Self Service BI com Power BI
Vithor da Silva e Silva927 views

Similar to Treinamento hadoop - dia1(20)

Big data, e eu com isso?Big data, e eu com isso?
Big data, e eu com isso?
Alexandre Uehara853 views
Palestra Big Data SCTIPalestra Big Data SCTI
Palestra Big Data SCTI
Bruna Pereira463 views
Big Data - Conceitos BásicosBig Data - Conceitos Básicos
Big Data - Conceitos Básicos
Christiano Anderson4.3K views
Big Data Latinoware 2014Big Data Latinoware 2014
Big Data Latinoware 2014
Christiano Anderson1.1K views
BIG DATABIG DATA
BIG DATA
Marcos Luiz Lins Filho1.6K views
Big Data, o que é isso?Big Data, o que é isso?
Big Data, o que é isso?
Ambiente Livre4.5K views
Palestra Introdução a Big DataPalestra Introdução a Big Data
Palestra Introdução a Big Data
Amtera Semantic Systems5K views
Big DataBig Data
Big Data
Carlos Silva2.6K views
aula1 - Bigdata.pdfaula1 - Bigdata.pdf
aula1 - Bigdata.pdf
Cyberboy115 views
Big Data Week São Paulo 2017 Big Data Week São Paulo 2017
Big Data Week São Paulo 2017
Thiago Santiago447 views
Bigdata alexandre v2Bigdata alexandre v2
Bigdata alexandre v2
alexculpado881 views
Big DataBig Data
Big Data
Suzana Viana Mota261 views
Big Data e profissionais da informaçãoBig Data e profissionais da informação
Big Data e profissionais da informação
Fabiana Andrade Pereira346 views

More from Alexandre Uehara(20)

Metodologia Ágil - Acelera ImpactoMetodologia Ágil - Acelera Impacto
Metodologia Ágil - Acelera Impacto
Alexandre Uehara132 views
Métodos Ágeis - ESPM 2018 (Inovação)Métodos Ágeis - ESPM 2018 (Inovação)
Métodos Ágeis - ESPM 2018 (Inovação)
Alexandre Uehara125 views
Inovação - Google Campus 2018Inovação - Google Campus 2018
Inovação - Google Campus 2018
Alexandre Uehara79 views
Scrum para RH e Financeiro (Alelo)Scrum para RH e Financeiro (Alelo)
Scrum para RH e Financeiro (Alelo)
Alexandre Uehara590 views
FintechFintech
Fintech
Alexandre Uehara295 views
ChatbotChatbot
Chatbot
Alexandre Uehara1.1K views
Machine learning for dummiesMachine learning for dummies
Machine learning for dummies
Alexandre Uehara2.1K views

Treinamento hadoop - dia1