SlideShare a Scribd company logo
1 of 137
Download to read offline
Especialização em 
ARQUITETURA DE NUVEM 
Disciplina: Big Data 
Carga Horária: 20h 
Prof. Marcos Luiz Lins Filho 
Setembro/2014
.:: Programação ::. 
 1ᵒ Dia (17/09) – Apresentação e Motivação 
– Apresentação da Disciplina (Estrutura, Materiais, Avaliação) 
– Histórico e conceitos de Big Data 
– Tipos e Fontes de Dados 
– Estudos de Caso – Vídeo e Slides 
– Os 4 desafios do Big Data (Atividade) 
 2ᵒ Dia (18/09) – Infraestrutura de Big Data 
– Considerações sobre Cloud Computing, Internet das Coisas e SOLOMO 
– Arquitetura e Governança de Big Data 
– Bases de dados Relacionais, NoSQL e in-memory 
– Hadoop e seus agregados 
– Atividade 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: Programação ::. 
 3ᵒ Dia (19/09) – Análise de Big Data 
– O que é? 
– Oportunidades e Dificuldades da Análise de Big Data 
– Atividade 
 4ᵒ Dia (20/09) – Big Data no Futuro 
– Novas tendências (BYOD, Consumerização, Crowdsourcing e 
Crowdfunding, Gamificação) 
– Futuro do Big Data 
– Encerramento da Disciplina 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: 1° Dia – 17/09/2014 
Apresentação AApprreesseennttaaççããoo ee MMoottiivvaaççããoo ppaarraa 
eessttuuddaarr BBIIGG DDAATTAA 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: Por que Big Data? 
Fonte: Bruno Domingues, Big Data com AWS e Intel, 2014 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: Por que Big Data? 
Fonte: Bruno Domingues, Big Data com AWS e Intel, 2014 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: Histórico do Big Data 
 Se divide em dois momentos 
 Expansão no campo científico e de negócios basicamente através do 
uso do termo Big Data de forma técnica e acadêmica (1984 – 2007) 
 Difusão do termo já com viés tecnológico e econômico, estudo de 
tecnologias, desenvolvimento de ferramentas para análise de dados 
etc (meados de 2008) 
Fonte: Francis X. Diebold: A Personal Perspective on the Origin(s) and Development of “Big Data”: The Phenomenon, the Term, and the 
Discipline, August 2012 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: Histórico do Big Data 
 Se divide em dois momentos 
 Expansão no campo científico e de negócios basicamente através do 
uso do termo Big Data de forma técnica e acadêmica (1984 – 2007) 
 (Tilly, 1984) usa pela primeira vez o termo Big Data em textos 
acadêmicos; 
 Uma primeira pesquisa publicada em 1987 relativa a uma técnica 
de programação chamada small code, big data; 
 Em 1989 e 1993 pesquisas começam a tratar de aplicações de Big 
Data; 
 (Laney , 2001) publica trabalho com o título os 3 V´s do Big Data 
(Volume, Variedade e Velocidade) 
Fonte: Francis X. Diebold: A Personal Perspective on the Origin(s) and Development of “Big Data”: The Phenomenon, the Term, and the 
Discipline, August 2012 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: Histórico do Big Data 
 Se divide em dois momentos 
 Difusão do termo já com viés tecnológico e econômico, estudo de 
tecnologias, desenvolvimento de ferramentas para análise de dados 
etc (meados de 2008) 
 (Lohr, 2008) Jornalista do New York Times publicou artigo em que 
citava que cientistas de computação e executivos da indústria já 
enxergavam que o termo Big Data saia da esfera acadêmica e já 
começava a trazer resultados econômicos. 
 A Wired publica em junho de 2008 um artigo “The Petabyte Age: 
because more isn’t just more, more is different”, que apresenta as 
oportunidades e implicações do Big Data 
 (Lohr, 2012) – Início do uso do termo Big data pela IBM em 2008 
na sua estratégia de Marketing. Em 2011, no Twitter. Em 2012, 
com a publicação do 1ᵒ ebook sobre tecnologias de Big Data. 
Fonte: Francis X. Diebold: A Personal Perspective on the Origin(s) and Development of “Big Data”: The Phenomenon, the Term, and the 
Discipline, August 2012 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: Histórico do Big Data 
 Dilbert, 2012 
Fonte: Dilbert, 2012 – Disponível em: http://dilbert.com/strips/comic/2012-07-29/ 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: Motivação para o Big Data 
“A verdadeira questão não é que você está 
coletando grandes quantidades de dados, mas 
sim o que você faz com eles. As organizações 
terão que ser capazes de aproveitar os dados 
relevantes e usá-los para tomar as melhores 
decisões.” (IDC, 2011) 
Fonte: IDC. Big Data Analytics: Future Architectures, Skills and Roadmaps for the CIO, September 2011 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: Conceitos ..: O que é Big Data? 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
FONTE: EMC
.:: Definição de Big Data 
 Não há unanimidade quanto a definição de Big Data, apesar de 
haver consenso quanto a sua força modificadora no contexto 
de dados (Joyanes, 2013) 
 Alguns conceitos: 
 (Gartner, 2012) “Big Data é tudo que ultrapassa as capacidades de 
hardware e de ferramentas de softwares de captura, gerenciamento e 
processamento de dados num tempo razoável para os usuários” 
(McKinsey, 2011; Deloitte, 2012) 
 (IDC, 2011) “Big Data é uma nova geração de tecnologias, 
arquiteturas e estratégias para capturar e analisar grandes volumes de 
dados provenientes de fontes múltiplas e heterogêneas com o objetivo 
de extrair valor econômico desses dados” 
 Há que se separar a definição mercadológica dada ao Big 
Data da origem do problema (Quebra de Paradigma) 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: De onde vem a necessidade de quebrar paradigma? 
 Aumento na quantidade de Dados Científicos 
 Maior demanda por Computação Distribuída 
 Limitação dos Bancos de Dados Relacionais 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: De onde vem a necessidade de quebrar paradigma? 
 Aumento na quantidade de Dados Científicos 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: EMC
.:: De onde vem a necessidade de quebrar paradigma? 
 Maior demanda por Computação Distribuída 
Fonte: http://www.inf.ufsc.br/~frank/INE5418/1.Fundamentos-Slides.pdf 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: De onde vem a necessidade de quebrar paradigma? 
 Maior demanda por Computação Distribuída 
Computação distribuída significa pegar uma 
tarefa, dividi-la em pedaços menores e dar cada 
pedaço a um servidor diferente, depois pegar cada 
resultado, uni-los (de maneira coerente) e 
Processamento X Distribuição (Divisão) 
Integridade e Disponibilidade em Cloud Computing 
Fonte: https://under-linux.org/entry.php?b=2603 
apresentá-lo. 
Dificuldade 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: De onde vem a necessidade de quebrar paradigma? 
 Limitações dos Bancos de Dados Relacionais 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: IMD
.:: Definição de Big Data 
 O que mais se utiliza como definição remete ao trabalho de 
(Laney, 2001) sobre os 3 V´s do Big Data (Volume, Variedade e 
Velocidade) ; 
 “Big Data são os grandes conjuntos de dados que possuem 
três características principais: volume, velocidade e 
variedade.” 
Fonte: IBM 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: Volume, Velocidade e Variedade 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: Volume, Velocidade e Variedade 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: + 3 V’s do Big Data 
VVaalloorr 
VVeerraacciiddaaddee 
VViiaabbiilliiddaaddee 
Fonte: http://cio.uol.com.br/opiniao/2012/05/11/o-caos-conceitual-e-os-5-vs-do-big-data/ 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: Curiosidades 
 From “Using Private Cloud to solve Big Data problems”, disponível em 
https://www.panasas.com/sites/default/files/uploads/docs/Panasas_Private_Cloud_Storage_by%20Intersect360_wp_1074.PDF 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: Curiosidades 
 Fonte: “Big Data and the Web: Algorithms for Data Intensive Scalable Computing”, Ph.D Thesis, Gianmarco 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: Fontes e Tipos de Dados 
 Os dados são de 3 tipos 
– Estruturados 
– Semi-estruturados 
– Não estruturados 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: Joyanes, 2013
.:: Fontes e Tipos de Dados 
 Estruturados 
– Dados que possuem esquema de campos fixos 
– Formato bem definido 
– Normalmente armazenado em BD Relacionais 
– Conhecimento prévio da estrutura dos dados 
– São gerados em uma ordem especificada 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: Joyanes, 2013
.:: Fontes e Tipos de Dados 
 Semi-estruturados 
– Possuem um fluxo lógico 
– O formato pode ser bem definido, mas não necessariamente é fixo 
– Não possui fácil compreensão por parte do usuário leigo 
– Tem como característica marcante o uso de etiquetas e marcadores 
para separar elementos dos dados 
– Regras complexas para manipulação dos dados 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: Joyanes, 2013
.:: Fontes e Tipos de Dados 
 Não estruturados 
– Sem tipo predefinido; 
– Não possuem estrutura uniforme (ex. Documentos, objetos); 
– Pouco ou nenhum controle sobre eles; 
– Dificuldade de “manipulação” para extração de informação 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: Joyanes, 2013
.:: Fontes e Tipos de Dados 
 De onde vem os dados do Big Data? 
– Web e Redes Sociais (clicks, cookies, twitter, facebook) 
– Mobilidade 
– Internet das Coisas (RFID/NFC, Sensores, GPS e Telemetria) 
– Biometria (Reconhecimento fácil, impressão digital, dados genéticos) 
– Dados gerados por pessoas (Voz, email, SMS, etc) 
– Dados gerados por governos, institutos de pesquisas e empresas 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: Soares, 2012
.:: Fontes e Tipos de Dados 
 Dados da WEB 
– Maior fonte de Big Data utilizada na atualidade; 
– Facilidade para mapear comportamento e fazer predição 
– Possui conhecimento importante para tomada de decisão pelas 
empresas 
– Gera informação objetiva e de impacto, que é dificil de se obter sem 
uma comunicação direta 
– Possibilidade de captura de diversos tipos de eventos (Compras, 
visualização de produtos e vídeos, buscas etc) 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: Joyanes, 2013
.:: Fontes e Tipos de Dados 
 Dados de Texto 
– Tipo mais comum e “simples” de dados 
– Origina-se praticamente em todas as fontes de dados do Big Data 
– Pode ser tratado como um tipo de dado “Estruturado” 
– Estruturado + Muitas fontes = DIFICULDADE 
– Possui ferramentas e aparato científico bem estruturado para análise 
– Processamento de linguagem natural 
– Análise sintática 
– Mineração de texto 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: Joyanes, 2013
.:: Fontes e Tipos de Dados 
 Dados de Sensores 
– Peças chave da Internet das Coisas 
– Monitoramento Autônomo e Ubíquo 
– Complexidade de manipulação dos sensores 
– Captura muito influenciada por fatores externos (Ex. Delay) 
– Dados normalmente estruturados, mas já há redes de sensores com 
dados não estruturados 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: Joyanes, 2013
.:: Fontes e Tipos de Dados 
 Dados de Geolocalização 
– Localização e Tempo são dois atributos de grande VALOR (Ex. Google 
Location History) 
– Possibilildades diversas para desenvolvimento de aplicações 
– Muito sensível para o Big Data em Volume e Velocidade 
– Binômio crítico com relação a questão de privacidade 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: Joyanes, 2013
.:: Fontes e Tipos de Dados 
 Dados de RFID e NFC 
– Sofrem também efeito da privacidade 
– NFC foi criada para comunicação entre objetos próximos e com pouca 
transmissão de dados 
– Inclusão de NFC em celulares mudou a perspectiva do trafégo de dados 
(Ex. Pagamentos, controle de acesso) 
Qual a diferença então entre Redes de 
Sensores e RFID/NFC? 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: Joyanes, 2013
.:: Fontes e Tipos de Dados 
 Dados de Redes Sociais 
– Tão complexo que criou um novo ramo na análise de dados: Análise 
Social 
– Volume de dados para análise de um único indivíduo na rede 
– Amplitude gerando complexidade: (Ex: Eu - Meus amigos - Amigos 
dos meus Amigos) 
– Dados crescendo indefinidamente e de forma heterogênea 
– Como separar o joio do trigo nesse dilúvio de dados? 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: Joyanes, 2013
.:: Palavra-chave - Tecnologia 
IInntteeggrraaççããoo 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: Palavra-chave – Mercado / Negócios 
EEssttrraattééggiiaa 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: E a gestão? 
OO qquuee mmuuddaa?? 
TTOOMMAADDAA DDEE 
DDEECCIISSÃÃOO 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: E a gestão? 
BBII 
xx 
BBIIGG DDAATTAA 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: E a gestão? 
BBII 
• Bases de dados e Datawarehouse 
Cubo OLAP (On-line Analytical Processing) 
• Ferramentas OLAP 
• Mineração de Dados 
• Sistemas de apoio a decisão 
• Relatórios 
• Visualização 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: E a gestão? 
BI x BBIIGG DDAATTAA 
Dados transacionais Dados transacionais + outros 
dados 
Decisão baseada Decisão baseada em dados em 
dados passados tempo real 
Análise Intuitiva Análise voltada a predição 
Universo de dados limitado Universo de dados ilimitado 
Busca analisar dados Busca aprendizado a partir dos 
dados 
AA ddiiffeerreennççaa eessttáá nnooss 33VV’’ss 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: Estudos de Caso 
VVííddeeoo:: TThhee aaggee ooff BBiigg DDaattaa 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: BBC, 2013
.:: Estudos de Caso 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: INFO, 2014
.:: Estudos de Caso 
 Ferramenta Match Analytics 
– Coleta e Análise de informações de treino e jogos 
– Analisa desde esquema tático até informação de precisão de chutes 
– Avalia situações de jogo e predizem o melhor treinamento para cada 
jogador 
– Possui interface que facilita o uso inclusive pelos jogadores 
– Roda sob a plataforma HANA da SAP 
– De quebra, faz análise de redes sociais analisando sentimento de 
torcedores com relação ao desempenho da equipe e dos atletas 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: INFO, 2014
.:: Estudos de Caso 
 ROLLS ROYCE 
– Inclusão de sensores nos motores 
– Informação em tempo real de peças 
– Vantagem competitiva: Substituição de produto por SERVIÇO 
 SMART METERS - IBM 
– Medições de consumo de energia 
– Sensores enviam dados em tempo real 
– Hábitos de consumo e mudança de estratégias com premiação 
– Criação das chamadas Smart Grids 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: JOYANES, 2013
.:: Estudos de Caso 
 GOOGLE - FluTrends 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: GOOGLE
.:: Estudos de Caso 
 GOOGLE - FluTrends 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: GOOGLE
.:: O 4 desafios do Big Data 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: AMAZON AWS
.:: Os 4 desafios do Big Data (Atividade) 
 Dividir a turma em grupos de 5 alunos 
 Cada grupo será responsável por estudar uma ferramenta específica e 
preparar uma apresentação para discussão em sala 
 Ferramentas de Aquisição (Facebook Scribe, FluentD, Apache 
Flume, Apache Chukwa) 
 Ferramentas de Aquisição de uma API (Facebook Likes, Tweets, 
Google Analytics) 
 Crawlers (Apache Nutch, Crawler4J, Scrapy (python), Anemone 
(ruby)) 
 Armazenamento (Cassandra, Neo4J, MongoDB, Hbase, Redis) 
 Análise (Rstudio, Matlab, Julia, Ipython) 
 Processamento de Stream (Splunk, Amazon Kinesis) 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: 2° Dia – 18/09/2014 
IInnffrraaeessttrruuttuurraa ddee BBIIGG DDAATTAA 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: Cloud Computing, IoT e SoLoMo 
 O que Cloud Computing tem a ver com Big Data? 
 Nova infraestrutura para computação sob demanda 
 Tornou o Big Data mais próximo da realidade 
 Big Data evolui em paralelo com a consolidação da computação em 
Nuvem 
 SoLoMo e IoT convergem com Cloud Computing e Big Data 
criando novas perspectivas para as empresas 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: Cloud Computing, IoT e SoLoMo 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: NIST, 2011
.:: Cloud Computing, IoT e SoLoMo 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: CONTROL4.COM
.:: Cloud Computing, IoT e SoLoMo 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: IBM, 2012
.:: Arquitetura e Governança de Big Data 
 Arquitetura de Big Data da Oracle 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: Oracle, 2012
.:: Arquitetura e Governança de Big Data 
 Arquitetura de Big Data da Oracle 
• Sistema de Armazenamento e Gestão de Dados 
• Hadoop Distributed File System (HDFS) 
• Cloudera Manager 
• Bancos de Dados 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: Oracle, 2012 
• Oracle NoSQL 
• Apache Hbase 
• Apache Cassandra 
• Apache Hive (ETL)
.:: Arquitetura e Governança de Big Data 
 Arquitetura de Big Data da Oracle 
• Processamento 
• MapReduce 
• Apache Hadoop 
• Integração de Dados 
• Oracle Big Data Connectors, Oracle Loader for Hadoop, Oracle 
Data Integrator 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: Oracle, 2012 
• Análises Estatísticas 
• Oracle Enterprise R
.:: Arquitetura e Governança de Big Data 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: IHBW, 2012
.:: Arquitetura e Governança de Big Data 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: Soares, 2013
.:: Arquitetura e Governança de Big Data 
 Fontes de Big Data 
 Dados tradicionais das empresas 
 Datos gerados por máquinas (M2M) e Internet das Coisas 
 Dados sociais 
 Dados de Biometría e genética 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: Soares, 2013 
 Dados pessoais e dados gerados por pessoas
.:: Arquitetura e Governança de Big Data 
 Bases de Dados 
 SQL 
 NoSQL (Not only SQL) 
 In-memory 
 Legadas 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: Soares, 2013 
 Tendência de DBaaS (Database as a Service) 
 Amazon RDS, DynamoDB, SImpleDB, PostgreSQL 
 Xeround(MySQL) 
 Salesforce Database.com (Oracle) 
 Google App Engine (NoSQL)
.:: Arquitetura e Governança de Big Data 
 Datawarehouses e Data Marts 
 Surgimento de novos Datawarehouses e Data Marts para tratar dados 
de Big Data 
 Uso massivo de ferramentas de ETL (Extraction, Transformation, Load) 
 Novas ferramentas de inteligência de negócio, relatórios e visualização 
de informações 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: Soares, 2013 
 Adaptar infraestrutura para soluções Híbridas 
 Integrar Hadoop e NoSQL as tecnologias tradicionais
.:: Arquitetura e Governança de Big Data 
 Componentes do Hadoop 
 Surgimento de diversas distribuições devido a plataforma ser de código 
aberto 
 Necessidade de definir um caminho a seguir 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: Soares, 2013 
 Integração de Dados 
 Movimentação de dados brutos (DB1 + DB2 = DBNew) 
 Replicação de dados (Sincronismo) 
 Federação de dados (Vários dados separados = Um único dado)
.:: Arquitetura e Governança de Big Data 
 Gov. de Big Data = Gov. de TI + Gov. de Informação + Big Data 
 Organização 
 Metadados 
 Privacidade 
 Qualidade dos Dados 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: Soares, 2013 
 Integração com processos de negócios 
 Integração com dados mestres 
 Gestão do ciclo de vida da informação
.:: Arquitetura e Governança de Big Data 
 Deve se relacionar diretamente com as iniciativas de 
Governança da Informação já existentes na empresa 
 Metadados – Definir bons metadados para evitar dados em 
duplicidade 
 Políticas de Privacidade – Definir políticas de privacidade ao mesmo 
tempo que busca alavancar análise de mídias sociais 
 Qualidade dos dados – Definir o nível de qualidade dos dados (Volume 
e Velocidade) 
 Gerenciamento do ciclo de vida da Informação – Definir bem as 
políticas de arquivamento (Armazenamento x Custos) 
 Manejo – Recrutar grandes administradores de Dados para evitar 
dados inconsistentes (Ex. Setor de Petróleo – adm de dados sísmicos e 
metadados) 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: Soares, 2013
.:: Bases de Dados - Relacionais, NoSQL e in-memory 
 BD Relacionais 
 Largamente utilizados atualmente pelas empresas 
 Utiliza relações (tabelas) como elementos básicos 
 Tabelas compostas por linhas e colunas 
 Faz uso de restrições para manutenção de integridade 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: Soares, 2013 
(chaves) 
 Utiliza NORMALIZAÇÃO 
 SQL é a linguagem de consulta 
 Os SGBDs relacionais implementam outras funções 
(controle de concorrência, segurança, controle de 
transações, recuperação de falhas etc)
.:: Bases de Dados - Relacionais, NoSQL e in-memory 
 BD Relacionais – Limitações 
ESCALABILIDADE 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: Soares, 2013 
é a maior
.:: Bases de Dados - Relacionais, NoSQL e in-memory 
 BD Relacionais – Limitações 
Servidor 
BD 
Servidor 
Servidor 
BD 
Servidor 
Fonte: Ricardo Brito - UFC, 2012 
Aplicação 
BD BD BD 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: Bases de Dados - Relacionais, NoSQL e in-memory 
 BDs No SQL 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: Bases de Dados - Relacionais, NoSQL e in-memory 
 BDs No SQL 
 De volta ao passado… (Sistemas de Arquivos) 
 Estrutura mais flexível 
 Melhor adaptado para questões de escalabilidade 
 Não veio para acabar com o Modelo Relacional 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: Soares, 2013 
 Abandonou a NORMALIZAÇÃO 
 São livres de esquemas de tabelas e sem JOINs 
 Iniciou em 2004 Big Table (Google), 2007 Dynamo 
(Amazon), 2008 Cassandra (Facebook) 
 Escalabilidade Linear, Acesso rápido, Manipulação de 
dados não estruturados
.:: Bases de Dados - Relacionais, NoSQL e in-memory 
 Dividida em 4 Categorias 
 Orientadas a Chave-valor 
 Orientadas a documentos 
 Orientadas a colunas (BigTable) 
 Orientada a grafos 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: Soares, 2013
.:: Bases de Dados - Relacionais, NoSQL e in-memory 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: Imasters
.:: Bases de Dados - Relacionais, NoSQL e in-memory 
 Bases de Dados orientadas a chave-valor 
 Uso do conceito de tabela hash (chave única identificando 
um valor) 
 Simplicidade 
 Maior escalabilidade 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: Soares, 2013 
 Consultas O(1) independente do volume de dados 
 Problemas???
.:: Bases de Dados - Relacionais, NoSQL e in-memory 
 Entendendo Tabela Hash 
Fonte: Prof. Thales Castro, 2011 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
 Exemplo:
.:: Bases de Dados - Relacionais, NoSQL e in-memory 
 Bases de Dados orientadas a Chave-Valor 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: Bases de Dados - Relacionais, NoSQL e in-memory 
 Bases de Dados orientadas a documentos 
 Parecido com o modelo chave-valor, porém mais complexo 
 Contém todas as informações em um único documento 
 Consulta utilizando métodos avançados (MapReduce) 
 Livres de Esquemas 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: Soares, 2013 
 Utiliza identificadores únicos universais (UUID) 
 Usa JSON (JavaScript Object Notation) para intercâmbio de dados
.:: Bases de Dados - Relacionais, NoSQL e in-memory 
 Bases de Dados orientadas a documentos 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: Yuri Adams, 2011
.:: Bases de Dados - Relacionais, NoSQL e in-memory 
 Bases de Dados orientadas a documentos 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: Bases de Dados - Relacionais, NoSQL e in-memory 
 Bases de Dados orientadas colunas (BigTable) 
 Keyspace = Databases / Schemas 
 Colum Family = Tabelas 
 Colunas = Registros 
 Um mega BD Chave-valor 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: Soares, 2013 
 Ponto forte: Velocidade e Escalabilidade 
 Ponto fraco: Complexidade na forma de armazenamento
.:: Bases de Dados - Relacionais, NoSQL e in-memory 
 Bases de Dados orientadas colunas (BigTable) 
Fonte: Otávio Gonçalves, TDC 2012 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: Bases de Dados - Relacionais, NoSQL e in-memory 
 Bases de Dados orientadas colunas (BigTable) 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: Bases de Dados - Relacionais, NoSQL e in-memory 
 Bases de Dados orientadas a grafos 
 Armazenamento em forma de grafos (nós e arcos) 
 Possui ACID (Atomicidade, Consistência, Isolamento, 
Durabilidade) 
 Os dados do registros são armazenados nos vértices 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: Soares, 2013 
 Os relacionamentos são armazenados nas arestas 
 Muito utilizado em redes sociais 
 Utiliza a teoria dos grafos para obter informações 
 Flexibilidade em quantidade de atributos e longitude de 
buscas 
 Relacionamentos fazem parte dos dados, não da estrutura
.:: Bases de Dados - Relacionais, NoSQL e in-memory 
Fonte: Eder Ignatowicz, 2012 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: Bases de Dados - Relacionais, NoSQL e in-memory 
 Bases de Dados orientadas a grafos 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: Bases de Dados - Relacionais, NoSQL e in-memory 
 Bases de Dados in-memory 
 Avanços na tecnologia de memórias 
 Aumento da capacidade associada a redução de custos 
 Necessidade de acelerar buscas, leitura e gravação em BD 
 Arquitetura distinta da que utiliza discos 
 Redução considerável do tempo de processamento 
 Bom para grandes volumes de dados 
 Usa memória principal para armazenamento 
 Objetivo: Responder em tempo real sem ter que perder tempo 
acessando discos (LENTO) 
Fonte: Joyanes, 2013 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: Bases de Dados - Relacionais, NoSQL e in-memory 
 Bases de Dados in-memory 
 Duas categorias principais: 
 Tecnologia In-memory pura 
 Carrega todos os dados na Memória RAM antes de 
utilizar 
 Tecnologia in-memory just-in-time 
 Carrega somente os dados necessários para uma 
consulta particular 
 Libera os dados de acordo com o padrão de uso 
 JIT + Bases de Dados em colunas = Maior 
Desempenho 
Fonte: Joyanes, 2013 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: Bases de Dados - Relacionais, NoSQL e in-memory 
 Por que na memória? 
Barramento de alta 
velocidade conectado 
diretamente ao 
processador 
MEMÓRIA 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: IBM, 2012 
X 
DISCOS 
Um ou mais barramentos
.:: Bases de Dados - Relacionais, NoSQL e in-memory 
 Bases de Dados in-memory – Propriedades 
 ACID 
 Atomicidade: Transações atômicas (Se falha parte, falha o todo e 
BD não se altera); 
 Consistência: Transações não alteram a consistência do BD 
(Respeitar integridade – Ex: chaves); 
 Isolamento: Uma transação não pode interferir em outra (Paralelo 
= Sequencial); 
 Durabilidade: Depois de confirmada uma transação deve 
permanecer confirmada; 
Fonte: WIKI 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: Bases de Dados - Relacionais, NoSQL e in-memory 
 Bases de Dados in-memory – Propriedades 
 Armazenamento em colunas – Recuperação de Informação 
Fonte: Soares, B. e Boscarioli, C., Modelo de Banco de Dados Colunar: Características, Aplicações e Exemplos de Sistemas, 2013 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: Bases de Dados - Relacionais, NoSQL e in-memory 
 Bases de Dados in-memory – Propriedades 
 Armazenamento em colunas – Recuperação de Informação 
Fonte: Soares, B. e Boscarioli, C., Modelo de Banco de Dados Colunar: Características, Aplicações e Exemplos de Sistemas, 2013 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: Bases de Dados - Relacionais, NoSQL e in-memory 
 Bases de Dados in-memory – Propriedades 
 Armazenamento em colunas – Recuperação de Informação 
Fonte: Soares, B. e Boscarioli, C., Modelo de Banco de Dados Colunar: Características, Aplicações e Exemplos de Sistemas, 2013 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: Bases de Dados - Relacionais, NoSQL e in-memory 
 Bases de Dados in-memory – Propriedades 
 Armazenamento em colunas – Recuperação de Informação 
Fonte: Soares, B. e Boscarioli, C., Modelo de Banco de Dados Colunar: Características, Aplicações e Exemplos de Sistemas, 2013 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: Bases de Dados - Relacionais, NoSQL e in-memory 
 Bases de Dados in-memory – SAP HANA 
Fonte: SAP, 2012 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: Bases de Dados - Relacionais, NoSQL e in-memory 
 Bases de Dados in-memory – SAP HANA 
Fonte: SAP, 2012 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: Bases de Dados - Relacionais, NoSQL e in-memory 
 Bases de Dados in-memory – SAP HANA 
Fonte: SAP, 2012 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: O framework Hadoop 
“The Apache Hadoop software library is a 
framework that allows for the distributed 
processing of large data sets across clusters 
of computers using a simple Programming 
model 
(Divide to Conquer) 
Fonte: https://under-linux.org/entry.php?b=2603 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: O framework Hadoop 
 Origem do Hadoop 
 Lê um 1TB em 1 disco = 200 seg, em 100 discos em paralelo 
= ~ 2 seg 
 Pesquisas do Google de novos métodos para acesso a 
informação, tratamento de grandes volumes de dados e 
processamento paralelo geraram 3 artigos 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: Joyanes, 2013 
 “The Google File System (GFS)” 
 “MapReduce: Simplified Data Processing on Large Clusters” 
 “Big Table: A Distributed Storage System for Structured Data”
.:: O framework Hadoop 
 The Google File System 
 Sistema de arquivos distribuído e escalável para aplicações com 
grandes volumes de dados distribuídos 
 Tolerante a falhas e que pode ser executado a partir de hardware 
convencional e barato 
 Entrega alto rendimento quando está associado a um grande número 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: Joyanes, 2013 
de clientes
.:: O framework Hadoop 
 Map Reduce 
 Modelo de programação para processamento de grandes conjuntos de 
dados 
 Programas escritos em estilo funcional são paralelizados 
automaticamente 
 Executado em cluster de máquinas básicas 
 Responsável pelo particionamento dos dados de entrada, divisão entre 
as máquinas do cluster, gerenciamento de comunicação e falhas 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: Joyanes, 2013
.:: O algoritmo MapReduce 
 Baseado no conceito de Dividir para Conquistar 
 GRID COMPUTING 
 Várias implementações existentes: Hadoop, Disco, Skynet, 
FileMap e Greenplum; 
Fonte: https://under-linux.org/entry.php?b=2603 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: Algoritmo MapReduce 
Dividido em 3 passos 
 1. Seleciona os dados de entrada 
 2. Aplica as duas operações em sequência (MAP/REDUCE) 
 3. Recupera os dados de saída e obtém a resposta 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: Algoritmo MapReduce 
 Divide uma tarefa em pedaços menores (MAP); 
 Envia as tarefas para os servidores (MAP); 
 Coleta os resultados das tarefas (REDUCE); 
 Processa os resultados obtendo uma resposta única (REDUCE) 
Fonte: https://under-linux.org/entry.php?b=2603 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: Algoritmo MapReduce 
Fonte: Fabiane Nardon, 2013 - QconSP 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: Algoritmo MapReduce 
Fonte: https://under-linux.org/entry.php?b=2603 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: Algoritmo MapReduce 
Fonte: Fabiane Nardon, 2013 - QconSP 
Fonte: Fabiane Nardon, 2013 - QconSP 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: O framework Hadoop 
 Big Table 
 Sistema de armazenamento distribuído para gestão de dados 
estruturados 
 Muitos projetos do Google usando BigTable 
 Desenhado para ser escalável até ordem de petabytes através de 
milhares de servidores 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: Joyanes, 2013 
 O artigo descreve detalhes da plataforma; 
 Várias bases de dados comerciais atualmente seguem características 
desse modelo (CouchDB, MongoDB, Cassandra, Neo4J, Hypertable)
.:: O framework Hadoop 
O que é ??? 
 Inicialmente era uma implementação open source do MapReduce 
 A medida que o projeto foi amadurecendo foram incorporados 
outros componentes para melhorar usabilidade e funcionalidade; 
 Hoje é tido como o Ecossistema completo para resolver de modo 
eficiente e econômico a escalabilidade de dados 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: APACHE HADOOP 
 Open source, escrito em Java 
 Originalmente construído para a distribuição do projeto do motor 
web Apache Nutch
.:: O framework Hadoop 
Composto pelos módulos: 
• Hadoop Common 
• Hadoop MapReduce 
• Hadoop Distributed File System (HDFS) 
• Hadoop YARN 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: Apache Hadoop
.:: O framework Hadoop 
Composto pelos módulos: 
•Hadoop Common: The common utilities that support the other Hadoop 
modules. 
• Hadoop Distributed File System (HDFS™): A distributed file system 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: Apache Hadoop 
that provides high-throughput access to application data. 
• Hadoop YARN: A framework for job scheduling and cluster resource 
management. 
• Hadoop MapReduce: A YARN-based system for parallel processing of 
large data sets.
.:: O framework Hadoop 
O que é HDFS ? 
 Sistema de arquivos distribuído 
 Alta tolerância a falhas 
 Projetado para hardware de baixo custo 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: APACHE HADOOP 
 Provê alta vazão de dados 
 Escalável 
 Portável 
 Baseado no Google File System
.:: O framework Hadoop 
Como funciona HDFS ? 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: APACHE HADOOP
.:: O framework Hadoop 
Como funciona o HDFS ? 
 Arquitetura cliente/servidor 
 Constituído por um NameNode e vários DataNodes 
 Os NameNodes executam as operações no sistema de arquivos, 
coordena acesso a dados e metadados, mantém o sistema de 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: APACHE HADOOP 
nomes 
 Os metadados são mantidos em RAM (Velocidade) 
 Organização hierárquica semelhante a outros sistemas de arquivos 
 Protocolos HDFS sobre TCP/IP e comunicação através de RPC
.:: O framework Hadoop 
Como funciona o HDFS ? 
 Arquivos armazenados em blocos, maiores que os sistemas de 
arquivos normais, normalmente blocos de 64 megas 
 Confiabilidade implementada através de replicação de dados entre 
os DataNodes (3 ou mais) 
 Não se faz cache de dados devido ao tamanho dos blocos e 
Streaming 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: APACHE HADOOP
.:: O framework Hadoop 
Por que FRAMEWORK ?????? 
Por que Ecossistema ?????? 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: APACHE HADOOP
.:: O framework Hadoop 
 Arquitetura Hadoop – Alto nível 
Fonte: Hadoop in Practice, 2012 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: O framework Hadoop 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: Joyanes, 2013
.:: O framework Hadoop 
Fonte: http://opensource.com/life/14/8/intro-apache-hadoop-big-data 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: O framework Hadoop 
Fonte: Hadoop in Practice, 2012 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: O framework Hadoop 
Hadoop - Limitações 
 Alta Disponibilidade 
 O problema do NameNode único e os problemas de 2 NameNodes 
 Segurança 
 Oferece um modelo de segurança, mas por default está desabilitado; 
 Se limita a segurança do HDFS (Permissões e Propriedades) 
 Por default, todos os demais serviços do Hadoop são totalmente “abertos” 
 Autenticação de clientes e Criptografia de dados devem ser configuradas a 
parte (Complexidade) 
Fonte: Hadoop in Practice, 2012 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: O framework Hadoop 
Hadoop - Limitações 
 HDFS 
 Problemas com Alta Disponibilidade, Arquivos Pequenos e compressão 
transparente 
 MapReduce 
 Arquitetura baseada em lotes, ruim para situações de tempo real 
 Tarefas que exigem sincronização global e compartilhamento de dados 
mutáveis não são bons para MapReduce porque é uma arquitetura sem 
compartilhamento; 
Fonte: Hadoop in Practice, 2012 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: O framework Hadoop 
Outro projetos associados ao Hadoop 
Ambari™: A web-based tool for provisioning, managing, and monitoring Apache 
Hadoop clusters which includes support for Hadoop HDFS, Hadoop MapReduce, 
Hive, HCatalog, HBase, ZooKeeper, Oozie, Pig and Sqoop. Ambari also provides a 
dashboard for viewing cluster health such as heatmaps and ability to view 
MapReduce, Pig and Hive applications visually alongwith features to diagnose 
their performance characteristics in a user-friendly manner. 
Cassandra™: A scalable multi-master database with no single points of failure. 
Chukwa™: A data collection system for managing large distributed systems. 
HBase™: A scalable, distributed database that supports structured data storage 
for large tables. 
Fonte: APACHE HADOOP, 2014 
Avro™: A data serialization system. 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: O framework Hadoop 
Outro projetos associados ao Hadoop 
Hive™: A data warehouse infrastructure that provides data summarization and ad 
hoc querying. 
Mahout™: A Scalable machine learning and data mining library. 
Pig™: A high-level data-flow language and execution framework for parallel 
computation. 
Spark™: A fast and general compute engine for Hadoop data. Spark provides a 
simple and expressive programming model that supports a wide range of 
applications, including ETL, machine learning, stream processing, and graph 
computation. 
ZooKeeper™: A high-performance coordination service for distributed applications. 
Fonte: APACHE HADOOP, 2014 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: 3° Dia – 19/09/2014 
AAnnáálliissee ddee BBIIGG DDAATTAA 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: Análise de Big Data 
 O que é ? 
 “É o processo de examinar grandes quantidade de dados de 
uma variedade de tipos para descobrir padrões ocultos, 
correlações desconhecidas e outras informações de interesse 
de forma que essas informações possam trazer vantagens 
competitivas num ambiente de negócios” 
Fonte: Joyanes, 2013 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: Análise de Big Data 
 Oportunidades e Desafios 
 Área de maior complexidade no universo de Big Data 
 Fortemente baseada em modelos estatísticos 
Fonte: Joyanes, 2013 
 Exige recursos humanos muito especializados 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: Análise de Big Data 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: EMC, 2013
.:: Análise de Big Data 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: 4° Dia – 20/09/2014 
Tendências TTeennddêênncciiaass ddee BBIIGG DDAATTAA 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
.:: Novas Tendências 
MMMMííííddddiiiiaaaassss SSSSoooocccciiiiaaaaiiiissss 
MMMMoooobbbbiiiilllliiiiddddaaaaddddeeee 
BBBBiiiigggg DDDDaaaattttaaaa 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
CCCClllloooouuuudddd 
Fonte: Gartner, 2013
.:: Novas Tendências 
 A convergências dessas 4 forças estão gerando: 
 Mudança de comportamento dos usuários 
 Criando novos modelos de negócios 
 Mudando a forma de decidir das empresas e de se relacionar 
com os clientes 
 Consumidores mais ativos e com relacionamento mais 
próximos das empresas, obrigando mudança de cultura 
organizacional 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: Gartner, 2013
.:: Novas Tendências 
 Soma-se a isso novas tendências tecnológicas, sociais, econômicas 
e de consumo 
 BYOD (Bring Your Own Device) 
 Gamificação 
 Crowdsourcing 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: Gartner, 2013 
 Crowdfunding 
 Consumerização (Apontada pelo GARTNER como mais significativa nos próximos 10 anos)
.:: Novas Tendências 
VVííddeeoo:: CCoonnssuummeerriizzaaççããoo 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: Gartner, 2013
.:: Novas Tendências 
 Soma-se a isso novas tendências tecnológicas, sociais, econômicas 
e de consumo 
 BYOD (Bring Your Own Device) 
 Gamificação (Ex. programa de milhagens) 
 Crowdsourcing 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: Gartner, 2013 
 Crowdfunding 
 Consumerização (Apontada pelo GARTNER como mais significativa nos próximos 10 anos)
.:: Big Data tendências 
 Tim O´Reilly criador da Web 2.0 e CEO da editora O´Reilly publicou 
através da conferência Strata as 5 grandes predições para o Big 
Data 
 1ª Arquitetura Padrão para Big Data 
 Decisões de melhores ferramentas para determinados propósitos 
 Definição de regras apropriadas para BD Relacional, Hadoop, NoSQL e 
in-memory 
 Métodos para combinar datawarehouses existentes e bases com 
Hadoop 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: Gartner, 2013
.:: Big Data tendências 
 Tim O´Reilly criador da Web 2.0 e CEO da editora O´Reilly publicou 
através da conferência Strata as 5 grandes predições para o Big 
Data 
 2ª : Hadoop não será a única “oferta” profissional 
 Surgimento de novas ferramentas para processamento de grandes 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: Gartner, 2013 
volumes de dados 
 Ferramentas de nicho 
 Suporte aos dados através de uma linguagem universal estilo SQL 
 3ª : Unificação de Plataformas de Big Data 
 Objetivo de reduzir tempo de processamento em cluster Hadoop
.:: Big Data tendências 
 Tim O´Reilly criador da Web 2.0 e CEO da editora O´Reilly publicou 
através da conferência Strata as 5 grandes predições para o Big 
Data 
 4ª: Governança como centro das atenções 
 Segurança dos dados 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: Gartner, 2013 
 Consistências dos dados 
 Compliance regulatório 
 5ª: Surgimento de Soluções de Análise FIM a FIM 
 Fácil de utilizar 
 Universais
.:: Big data em 2020 
 Visão 360º 
 Insights = 10% estruturados + 90% interação humana 
 Engines de recomendação terão uma visão global de 
preferências, sentimentos e estado atual dos indivíduos 
 Identificação de padrões futuros de forma independente 
Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 
Fonte: Gartner, 2013

More Related Content

What's hot

Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslidesharePalestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslidesharepccdias
 
OS CINCO Vs DO BIG DATA
OS CINCO Vs DO BIG DATAOS CINCO Vs DO BIG DATA
OS CINCO Vs DO BIG DATALeonardo Dias
 
Big Data em 8 perguntas - 09.10.2014 - DATANORTE / GOV RN
Big Data em 8 perguntas -  09.10.2014 - DATANORTE / GOV RNBig Data em 8 perguntas -  09.10.2014 - DATANORTE / GOV RN
Big Data em 8 perguntas - 09.10.2014 - DATANORTE / GOV RNMarcos Luiz Lins Filho
 
Bigdata - Leandro Wanderley
Bigdata - Leandro WanderleyBigdata - Leandro Wanderley
Bigdata - Leandro WanderleyLeandro Couto
 
Big data e mineração de dados
Big data e mineração de dadosBig data e mineração de dados
Big data e mineração de dadosElton Meira
 
O que é BIG DATA e como pode influenciar nossas vidas
O que é BIG DATA e como pode influenciar nossas vidasO que é BIG DATA e como pode influenciar nossas vidas
O que é BIG DATA e como pode influenciar nossas vidasElaine Naomi
 
Big data Instituto Big Data Brasil Crie
Big data Instituto Big Data Brasil CrieBig data Instituto Big Data Brasil Crie
Big data Instituto Big Data Brasil CrieMarcos CAVALCANTI
 
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e PentahoBig Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e PentahoAmbiente Livre
 
Big Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e MercadoBig Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e MercadoHélio Silva
 
Big Data Analytics - Data Science - Aplicação e Tecnologia
Big Data Analytics - Data Science - Aplicação e TecnologiaBig Data Analytics - Data Science - Aplicação e Tecnologia
Big Data Analytics - Data Science - Aplicação e TecnologiaHélio Silva
 
Era da Informação e seus impactos na empresa e sociedade
Era da Informação e seus impactos na empresa e sociedadeEra da Informação e seus impactos na empresa e sociedade
Era da Informação e seus impactos na empresa e sociedadeAlex Silva
 
Governança de Dados e Big Data_v02
Governança de Dados e Big Data_v02Governança de Dados e Big Data_v02
Governança de Dados e Big Data_v02Carlos Barbieri
 
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big DataContexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big DataFabrício Barth
 

What's hot (20)

Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslidesharePalestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
 
OS CINCO Vs DO BIG DATA
OS CINCO Vs DO BIG DATAOS CINCO Vs DO BIG DATA
OS CINCO Vs DO BIG DATA
 
Big Data e NoSQL
Big Data e NoSQLBig Data e NoSQL
Big Data e NoSQL
 
Big Data em 8 perguntas - 09.10.2014 - DATANORTE / GOV RN
Big Data em 8 perguntas -  09.10.2014 - DATANORTE / GOV RNBig Data em 8 perguntas -  09.10.2014 - DATANORTE / GOV RN
Big Data em 8 perguntas - 09.10.2014 - DATANORTE / GOV RN
 
Big Data, JVM e Redes Sociais
Big Data, JVM e Redes SociaisBig Data, JVM e Redes Sociais
Big Data, JVM e Redes Sociais
 
Big Data - Conceitos Básicos
Big Data - Conceitos BásicosBig Data - Conceitos Básicos
Big Data - Conceitos Básicos
 
Big Data
Big DataBig Data
Big Data
 
Bigdata - Leandro Wanderley
Bigdata - Leandro WanderleyBigdata - Leandro Wanderley
Bigdata - Leandro Wanderley
 
Big Data
Big DataBig Data
Big Data
 
Big data e mineração de dados
Big data e mineração de dadosBig data e mineração de dados
Big data e mineração de dados
 
O que é BIG DATA e como pode influenciar nossas vidas
O que é BIG DATA e como pode influenciar nossas vidasO que é BIG DATA e como pode influenciar nossas vidas
O que é BIG DATA e como pode influenciar nossas vidas
 
BigData
BigDataBigData
BigData
 
Big data Instituto Big Data Brasil Crie
Big data Instituto Big Data Brasil CrieBig data Instituto Big Data Brasil Crie
Big data Instituto Big Data Brasil Crie
 
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e PentahoBig Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
 
Big Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e MercadoBig Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e Mercado
 
Big Data Analytics - Data Science - Aplicação e Tecnologia
Big Data Analytics - Data Science - Aplicação e TecnologiaBig Data Analytics - Data Science - Aplicação e Tecnologia
Big Data Analytics - Data Science - Aplicação e Tecnologia
 
Era da Informação e seus impactos na empresa e sociedade
Era da Informação e seus impactos na empresa e sociedadeEra da Informação e seus impactos na empresa e sociedade
Era da Informação e seus impactos na empresa e sociedade
 
Governança de Dados e Big Data_v02
Governança de Dados e Big Data_v02Governança de Dados e Big Data_v02
Governança de Dados e Big Data_v02
 
O que é Data Science?
O que é Data Science?O que é Data Science?
O que é Data Science?
 
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big DataContexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
 

Viewers also liked

Psicologia e Comportamento nas Redes Sociais: da Web 1.0 à Big Data
Psicologia e Comportamento nas Redes Sociais: da Web 1.0 à Big DataPsicologia e Comportamento nas Redes Sociais: da Web 1.0 à Big Data
Psicologia e Comportamento nas Redes Sociais: da Web 1.0 à Big DataLuciana Manfroi
 
Apostila sobre Big Data
Apostila sobre Big DataApostila sobre Big Data
Apostila sobre Big DataFernando Palma
 
Big Data
Big DataBig Data
Big DataNGDATA
 
Quanser coupled tanks_system_specificatons_generic
Quanser coupled tanks_system_specificatons_genericQuanser coupled tanks_system_specificatons_generic
Quanser coupled tanks_system_specificatons_genericUFRN
 
Metodologias no Dia a Dia
Metodologias no Dia a DiaMetodologias no Dia a Dia
Metodologias no Dia a DiaDlcorp, UFRN
 
Introdução a banco de dados
Introdução a banco de dadosIntrodução a banco de dados
Introdução a banco de dadosOdwald Schreder
 
Liga Acadêmica de Pediatria da UFRN - LAPED UFRN - Planejamento 2016.1
Liga Acadêmica de Pediatria da UFRN - LAPED UFRN - Planejamento 2016.1Liga Acadêmica de Pediatria da UFRN - LAPED UFRN - Planejamento 2016.1
Liga Acadêmica de Pediatria da UFRN - LAPED UFRN - Planejamento 2016.1Laped Ufrn
 
Palestra: Big Data Open Source com Hadoop - FLISOL 2014 - Curitiba
Palestra: Big Data Open Source com Hadoop - FLISOL 2014 - CuritibaPalestra: Big Data Open Source com Hadoop - FLISOL 2014 - Curitiba
Palestra: Big Data Open Source com Hadoop - FLISOL 2014 - CuritibaMarcio Junior Vieira
 
TDC2016POA | Trilha Analise de Negocios - Estranho no ninho: Um brasileiro li...
TDC2016POA | Trilha Analise de Negocios - Estranho no ninho: Um brasileiro li...TDC2016POA | Trilha Analise de Negocios - Estranho no ninho: Um brasileiro li...
TDC2016POA | Trilha Analise de Negocios - Estranho no ninho: Um brasileiro li...tdc-globalcode
 
TDC2016POA | Trilha Analise de Negocios - Business Coach, o Analista de Negó...
TDC2016POA | Trilha Analise de Negocios -  Business Coach, o Analista de Negó...TDC2016POA | Trilha Analise de Negocios -  Business Coach, o Analista de Negó...
TDC2016POA | Trilha Analise de Negocios - Business Coach, o Analista de Negó...tdc-globalcode
 
TDC2016POA | Trilha Agile - Beyond borders: aplicando ágil em times distribuídos
TDC2016POA | Trilha Agile - Beyond borders: aplicando ágil em times distribuídosTDC2016POA | Trilha Agile - Beyond borders: aplicando ágil em times distribuídos
TDC2016POA | Trilha Agile - Beyond borders: aplicando ágil em times distribuídostdc-globalcode
 
TDC2016POA | Trilha Analise de Negocios - Inovando em negócios com foco na eX...
TDC2016POA | Trilha Analise de Negocios - Inovando em negócios com foco na eX...TDC2016POA | Trilha Analise de Negocios - Inovando em negócios com foco na eX...
TDC2016POA | Trilha Analise de Negocios - Inovando em negócios com foco na eX...tdc-globalcode
 
TDC2016POA | Trilha Agile - Agilidade além da TI: Um Relato de Experiencia
TDC2016POA | Trilha Agile - Agilidade além da TI: Um Relato de ExperienciaTDC2016POA | Trilha Agile - Agilidade além da TI: Um Relato de Experiencia
TDC2016POA | Trilha Agile - Agilidade além da TI: Um Relato de Experienciatdc-globalcode
 
TDC2016POA | Trilha Agile - CHA com Scrum Master - Conhecimentos, Habilidades...
TDC2016POA | Trilha Agile - CHA com Scrum Master - Conhecimentos, Habilidades...TDC2016POA | Trilha Agile - CHA com Scrum Master - Conhecimentos, Habilidades...
TDC2016POA | Trilha Agile - CHA com Scrum Master - Conhecimentos, Habilidades...tdc-globalcode
 
TDC2016POA | Trilha Agile - Agile Marketing: os resultados alcançados com pri...
TDC2016POA | Trilha Agile - Agile Marketing: os resultados alcançados com pri...TDC2016POA | Trilha Agile - Agile Marketing: os resultados alcançados com pri...
TDC2016POA | Trilha Agile - Agile Marketing: os resultados alcançados com pri...tdc-globalcode
 
TDC2016POA | Trilha Agile - Dual-Track Agile: incluindo o PO e o UX no seu pi...
TDC2016POA | Trilha Agile - Dual-Track Agile: incluindo o PO e o UX no seu pi...TDC2016POA | Trilha Agile - Dual-Track Agile: incluindo o PO e o UX no seu pi...
TDC2016POA | Trilha Agile - Dual-Track Agile: incluindo o PO e o UX no seu pi...tdc-globalcode
 
TDC2016POA | Trilha Analise de Negocios - Como fatiar seu produto em estórias...
TDC2016POA | Trilha Analise de Negocios - Como fatiar seu produto em estórias...TDC2016POA | Trilha Analise de Negocios - Como fatiar seu produto em estórias...
TDC2016POA | Trilha Analise de Negocios - Como fatiar seu produto em estórias...tdc-globalcode
 
TDC2016POA | Trilha Agile - Ágil fora da TI: como expandir o Agil para as are...
TDC2016POA | Trilha Agile - Ágil fora da TI: como expandir o Agil para as are...TDC2016POA | Trilha Agile - Ágil fora da TI: como expandir o Agil para as are...
TDC2016POA | Trilha Agile - Ágil fora da TI: como expandir o Agil para as are...tdc-globalcode
 

Viewers also liked (20)

Psicologia e Comportamento nas Redes Sociais: da Web 1.0 à Big Data
Psicologia e Comportamento nas Redes Sociais: da Web 1.0 à Big DataPsicologia e Comportamento nas Redes Sociais: da Web 1.0 à Big Data
Psicologia e Comportamento nas Redes Sociais: da Web 1.0 à Big Data
 
Big data apresentacao
Big data apresentacaoBig data apresentacao
Big data apresentacao
 
Apostila sobre Big Data
Apostila sobre Big DataApostila sobre Big Data
Apostila sobre Big Data
 
Big Data
Big DataBig Data
Big Data
 
Quanser coupled tanks_system_specificatons_generic
Quanser coupled tanks_system_specificatons_genericQuanser coupled tanks_system_specificatons_generic
Quanser coupled tanks_system_specificatons_generic
 
Metodologias no Dia a Dia
Metodologias no Dia a DiaMetodologias no Dia a Dia
Metodologias no Dia a Dia
 
Historia da inorganica
Historia da inorganicaHistoria da inorganica
Historia da inorganica
 
Introdução a banco de dados
Introdução a banco de dadosIntrodução a banco de dados
Introdução a banco de dados
 
Liga Acadêmica de Pediatria da UFRN - LAPED UFRN - Planejamento 2016.1
Liga Acadêmica de Pediatria da UFRN - LAPED UFRN - Planejamento 2016.1Liga Acadêmica de Pediatria da UFRN - LAPED UFRN - Planejamento 2016.1
Liga Acadêmica de Pediatria da UFRN - LAPED UFRN - Planejamento 2016.1
 
Palestra: Big Data Open Source com Hadoop - FLISOL 2014 - Curitiba
Palestra: Big Data Open Source com Hadoop - FLISOL 2014 - CuritibaPalestra: Big Data Open Source com Hadoop - FLISOL 2014 - Curitiba
Palestra: Big Data Open Source com Hadoop - FLISOL 2014 - Curitiba
 
TDC2016POA | Trilha Analise de Negocios - Estranho no ninho: Um brasileiro li...
TDC2016POA | Trilha Analise de Negocios - Estranho no ninho: Um brasileiro li...TDC2016POA | Trilha Analise de Negocios - Estranho no ninho: Um brasileiro li...
TDC2016POA | Trilha Analise de Negocios - Estranho no ninho: Um brasileiro li...
 
TDC2016POA | Trilha Analise de Negocios - Business Coach, o Analista de Negó...
TDC2016POA | Trilha Analise de Negocios -  Business Coach, o Analista de Negó...TDC2016POA | Trilha Analise de Negocios -  Business Coach, o Analista de Negó...
TDC2016POA | Trilha Analise de Negocios - Business Coach, o Analista de Negó...
 
TDC2016POA | Trilha Agile - Beyond borders: aplicando ágil em times distribuídos
TDC2016POA | Trilha Agile - Beyond borders: aplicando ágil em times distribuídosTDC2016POA | Trilha Agile - Beyond borders: aplicando ágil em times distribuídos
TDC2016POA | Trilha Agile - Beyond borders: aplicando ágil em times distribuídos
 
TDC2016POA | Trilha Analise de Negocios - Inovando em negócios com foco na eX...
TDC2016POA | Trilha Analise de Negocios - Inovando em negócios com foco na eX...TDC2016POA | Trilha Analise de Negocios - Inovando em negócios com foco na eX...
TDC2016POA | Trilha Analise de Negocios - Inovando em negócios com foco na eX...
 
TDC2016POA | Trilha Agile - Agilidade além da TI: Um Relato de Experiencia
TDC2016POA | Trilha Agile - Agilidade além da TI: Um Relato de ExperienciaTDC2016POA | Trilha Agile - Agilidade além da TI: Um Relato de Experiencia
TDC2016POA | Trilha Agile - Agilidade além da TI: Um Relato de Experiencia
 
TDC2016POA | Trilha Agile - CHA com Scrum Master - Conhecimentos, Habilidades...
TDC2016POA | Trilha Agile - CHA com Scrum Master - Conhecimentos, Habilidades...TDC2016POA | Trilha Agile - CHA com Scrum Master - Conhecimentos, Habilidades...
TDC2016POA | Trilha Agile - CHA com Scrum Master - Conhecimentos, Habilidades...
 
TDC2016POA | Trilha Agile - Agile Marketing: os resultados alcançados com pri...
TDC2016POA | Trilha Agile - Agile Marketing: os resultados alcançados com pri...TDC2016POA | Trilha Agile - Agile Marketing: os resultados alcançados com pri...
TDC2016POA | Trilha Agile - Agile Marketing: os resultados alcançados com pri...
 
TDC2016POA | Trilha Agile - Dual-Track Agile: incluindo o PO e o UX no seu pi...
TDC2016POA | Trilha Agile - Dual-Track Agile: incluindo o PO e o UX no seu pi...TDC2016POA | Trilha Agile - Dual-Track Agile: incluindo o PO e o UX no seu pi...
TDC2016POA | Trilha Agile - Dual-Track Agile: incluindo o PO e o UX no seu pi...
 
TDC2016POA | Trilha Analise de Negocios - Como fatiar seu produto em estórias...
TDC2016POA | Trilha Analise de Negocios - Como fatiar seu produto em estórias...TDC2016POA | Trilha Analise de Negocios - Como fatiar seu produto em estórias...
TDC2016POA | Trilha Analise de Negocios - Como fatiar seu produto em estórias...
 
TDC2016POA | Trilha Agile - Ágil fora da TI: como expandir o Agil para as are...
TDC2016POA | Trilha Agile - Ágil fora da TI: como expandir o Agil para as are...TDC2016POA | Trilha Agile - Ágil fora da TI: como expandir o Agil para as are...
TDC2016POA | Trilha Agile - Ágil fora da TI: como expandir o Agil para as are...
 

Similar to Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014

Futurecom - Big data
Futurecom - Big dataFuturecom - Big data
Futurecom - Big dataFelipe Ferraz
 
Big Data e profissionais da informação
Big Data e profissionais da informaçãoBig Data e profissionais da informação
Big Data e profissionais da informaçãoFabiana Andrade Pereira
 
Palestra SCIP - Big Data: Conceitos e Evolução
Palestra SCIP - Big Data: Conceitos e EvoluçãoPalestra SCIP - Big Data: Conceitos e Evolução
Palestra SCIP - Big Data: Conceitos e EvoluçãoSCIP Brasil
 
Um novo "ABC" das TICs: (A)nalytics + (B)ig Data + (C)loud Computing
Um novo "ABC" das TICs: (A)nalytics + (B)ig Data + (C)loud ComputingUm novo "ABC" das TICs: (A)nalytics + (B)ig Data + (C)loud Computing
Um novo "ABC" das TICs: (A)nalytics + (B)ig Data + (C)loud ComputingJosé Carlos Cavalcanti
 
1º Seminário CICTEC - Um Novo ABC das TICs - José Carlos Cavalcanti 22 05 13
1º Seminário CICTEC - Um Novo ABC das TICs - José Carlos Cavalcanti 22 05 131º Seminário CICTEC - Um Novo ABC das TICs - José Carlos Cavalcanti 22 05 13
1º Seminário CICTEC - Um Novo ABC das TICs - José Carlos Cavalcanti 22 05 13cictec
 
Hackathon Inmetrics e Fiap: Desafios do Big Data
Hackathon Inmetrics e Fiap: Desafios do Big DataHackathon Inmetrics e Fiap: Desafios do Big Data
Hackathon Inmetrics e Fiap: Desafios do Big Datainmetrics
 
BIG DATA/ANALYTICS : EDUCATION AND MANAGEMENT OF DATA SCIENTISTS
BIG DATA/ANALYTICS : EDUCATION AND MANAGEMENT OF DATA SCIENTISTSBIG DATA/ANALYTICS : EDUCATION AND MANAGEMENT OF DATA SCIENTISTS
BIG DATA/ANALYTICS : EDUCATION AND MANAGEMENT OF DATA SCIENTISTSVivaldo Jose Breternitz
 
Big Data e suas Vertentes
Big Data e suas VertentesBig Data e suas Vertentes
Big Data e suas VertentesUnicamp
 
Perfil e competências do profissional de informação para a gestão de dados (B...
Perfil e competências do profissional de informação para a gestão de dados (B...Perfil e competências do profissional de informação para a gestão de dados (B...
Perfil e competências do profissional de informação para a gestão de dados (B...Luísa Alvim
 
BIG DATA
BIG DATA BIG DATA
BIG DATA ABEP123
 
Aula Magna Sobre BI & BigData na UNIA, Luanda - Angola
Aula Magna Sobre BI & BigData na UNIA, Luanda - AngolaAula Magna Sobre BI & BigData na UNIA, Luanda - Angola
Aula Magna Sobre BI & BigData na UNIA, Luanda - Angolaalexculpado
 

Similar to Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014 (20)

BIG DATA
BIG DATABIG DATA
BIG DATA
 
Futurecom - Big data
Futurecom - Big dataFuturecom - Big data
Futurecom - Big data
 
Big Data e profissionais da informação
Big Data e profissionais da informaçãoBig Data e profissionais da informação
Big Data e profissionais da informação
 
Workshop / Meetup: Visão geral sobre Big Data
Workshop / Meetup: Visão geral sobre Big DataWorkshop / Meetup: Visão geral sobre Big Data
Workshop / Meetup: Visão geral sobre Big Data
 
Palestra SCIP - Big Data: Conceitos e Evolução
Palestra SCIP - Big Data: Conceitos e EvoluçãoPalestra SCIP - Big Data: Conceitos e Evolução
Palestra SCIP - Big Data: Conceitos e Evolução
 
Qmeeting 2015 Big Data
Qmeeting 2015 Big DataQmeeting 2015 Big Data
Qmeeting 2015 Big Data
 
Big Data Analytics
Big Data AnalyticsBig Data Analytics
Big Data Analytics
 
Um novo "ABC" das TICs: (A)nalytics + (B)ig Data + (C)loud Computing
Um novo "ABC" das TICs: (A)nalytics + (B)ig Data + (C)loud ComputingUm novo "ABC" das TICs: (A)nalytics + (B)ig Data + (C)loud Computing
Um novo "ABC" das TICs: (A)nalytics + (B)ig Data + (C)loud Computing
 
1º Seminário CICTEC - Um Novo ABC das TICs - José Carlos Cavalcanti 22 05 13
1º Seminário CICTEC - Um Novo ABC das TICs - José Carlos Cavalcanti 22 05 131º Seminário CICTEC - Um Novo ABC das TICs - José Carlos Cavalcanti 22 05 13
1º Seminário CICTEC - Um Novo ABC das TICs - José Carlos Cavalcanti 22 05 13
 
Hackathon Inmetrics e Fiap: Desafios do Big Data
Hackathon Inmetrics e Fiap: Desafios do Big DataHackathon Inmetrics e Fiap: Desafios do Big Data
Hackathon Inmetrics e Fiap: Desafios do Big Data
 
BIG data
BIG dataBIG data
BIG data
 
BigData
BigDataBigData
BigData
 
Tcc segurança da informação
Tcc segurança da informaçãoTcc segurança da informação
Tcc segurança da informação
 
BIG DATA/ANALYTICS : EDUCATION AND MANAGEMENT OF DATA SCIENTISTS
BIG DATA/ANALYTICS : EDUCATION AND MANAGEMENT OF DATA SCIENTISTSBIG DATA/ANALYTICS : EDUCATION AND MANAGEMENT OF DATA SCIENTISTS
BIG DATA/ANALYTICS : EDUCATION AND MANAGEMENT OF DATA SCIENTISTS
 
Big Data e suas Vertentes
Big Data e suas VertentesBig Data e suas Vertentes
Big Data e suas Vertentes
 
Palestra do BI ao Big Data
Palestra do BI ao Big DataPalestra do BI ao Big Data
Palestra do BI ao Big Data
 
Perfil e competências do profissional de informação para a gestão de dados (B...
Perfil e competências do profissional de informação para a gestão de dados (B...Perfil e competências do profissional de informação para a gestão de dados (B...
Perfil e competências do profissional de informação para a gestão de dados (B...
 
BIG DATA
BIG DATA BIG DATA
BIG DATA
 
Aula Magna Sobre BI & BigData na UNIA, Luanda - Angola
Aula Magna Sobre BI & BigData na UNIA, Luanda - AngolaAula Magna Sobre BI & BigData na UNIA, Luanda - Angola
Aula Magna Sobre BI & BigData na UNIA, Luanda - Angola
 
Será Mesmo o Cientista de Dados a Profissão do Futuro?
Será Mesmo o Cientista de Dados a Profissão do Futuro?Será Mesmo o Cientista de Dados a Profissão do Futuro?
Será Mesmo o Cientista de Dados a Profissão do Futuro?
 

Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014

  • 1. Especialização em ARQUITETURA DE NUVEM Disciplina: Big Data Carga Horária: 20h Prof. Marcos Luiz Lins Filho Setembro/2014
  • 2. .:: Programação ::. 1ᵒ Dia (17/09) – Apresentação e Motivação – Apresentação da Disciplina (Estrutura, Materiais, Avaliação) – Histórico e conceitos de Big Data – Tipos e Fontes de Dados – Estudos de Caso – Vídeo e Slides – Os 4 desafios do Big Data (Atividade) 2ᵒ Dia (18/09) – Infraestrutura de Big Data – Considerações sobre Cloud Computing, Internet das Coisas e SOLOMO – Arquitetura e Governança de Big Data – Bases de dados Relacionais, NoSQL e in-memory – Hadoop e seus agregados – Atividade Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 3. .:: Programação ::. 3ᵒ Dia (19/09) – Análise de Big Data – O que é? – Oportunidades e Dificuldades da Análise de Big Data – Atividade 4ᵒ Dia (20/09) – Big Data no Futuro – Novas tendências (BYOD, Consumerização, Crowdsourcing e Crowdfunding, Gamificação) – Futuro do Big Data – Encerramento da Disciplina Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 4. .:: 1° Dia – 17/09/2014 Apresentação AApprreesseennttaaççããoo ee MMoottiivvaaççããoo ppaarraa eessttuuddaarr BBIIGG DDAATTAA Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 5. .:: Por que Big Data? Fonte: Bruno Domingues, Big Data com AWS e Intel, 2014 Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 6. .:: Por que Big Data? Fonte: Bruno Domingues, Big Data com AWS e Intel, 2014 Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 7. .:: Histórico do Big Data Se divide em dois momentos Expansão no campo científico e de negócios basicamente através do uso do termo Big Data de forma técnica e acadêmica (1984 – 2007) Difusão do termo já com viés tecnológico e econômico, estudo de tecnologias, desenvolvimento de ferramentas para análise de dados etc (meados de 2008) Fonte: Francis X. Diebold: A Personal Perspective on the Origin(s) and Development of “Big Data”: The Phenomenon, the Term, and the Discipline, August 2012 Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 8. .:: Histórico do Big Data Se divide em dois momentos Expansão no campo científico e de negócios basicamente através do uso do termo Big Data de forma técnica e acadêmica (1984 – 2007) (Tilly, 1984) usa pela primeira vez o termo Big Data em textos acadêmicos; Uma primeira pesquisa publicada em 1987 relativa a uma técnica de programação chamada small code, big data; Em 1989 e 1993 pesquisas começam a tratar de aplicações de Big Data; (Laney , 2001) publica trabalho com o título os 3 V´s do Big Data (Volume, Variedade e Velocidade) Fonte: Francis X. Diebold: A Personal Perspective on the Origin(s) and Development of “Big Data”: The Phenomenon, the Term, and the Discipline, August 2012 Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 9. .:: Histórico do Big Data Se divide em dois momentos Difusão do termo já com viés tecnológico e econômico, estudo de tecnologias, desenvolvimento de ferramentas para análise de dados etc (meados de 2008) (Lohr, 2008) Jornalista do New York Times publicou artigo em que citava que cientistas de computação e executivos da indústria já enxergavam que o termo Big Data saia da esfera acadêmica e já começava a trazer resultados econômicos. A Wired publica em junho de 2008 um artigo “The Petabyte Age: because more isn’t just more, more is different”, que apresenta as oportunidades e implicações do Big Data (Lohr, 2012) – Início do uso do termo Big data pela IBM em 2008 na sua estratégia de Marketing. Em 2011, no Twitter. Em 2012, com a publicação do 1ᵒ ebook sobre tecnologias de Big Data. Fonte: Francis X. Diebold: A Personal Perspective on the Origin(s) and Development of “Big Data”: The Phenomenon, the Term, and the Discipline, August 2012 Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 10. .:: Histórico do Big Data Dilbert, 2012 Fonte: Dilbert, 2012 – Disponível em: http://dilbert.com/strips/comic/2012-07-29/ Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 11. .:: Motivação para o Big Data “A verdadeira questão não é que você está coletando grandes quantidades de dados, mas sim o que você faz com eles. As organizações terão que ser capazes de aproveitar os dados relevantes e usá-los para tomar as melhores decisões.” (IDC, 2011) Fonte: IDC. Big Data Analytics: Future Architectures, Skills and Roadmaps for the CIO, September 2011 Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 12. .:: Conceitos ..: O que é Big Data? Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 FONTE: EMC
  • 13. .:: Definição de Big Data Não há unanimidade quanto a definição de Big Data, apesar de haver consenso quanto a sua força modificadora no contexto de dados (Joyanes, 2013) Alguns conceitos: (Gartner, 2012) “Big Data é tudo que ultrapassa as capacidades de hardware e de ferramentas de softwares de captura, gerenciamento e processamento de dados num tempo razoável para os usuários” (McKinsey, 2011; Deloitte, 2012) (IDC, 2011) “Big Data é uma nova geração de tecnologias, arquiteturas e estratégias para capturar e analisar grandes volumes de dados provenientes de fontes múltiplas e heterogêneas com o objetivo de extrair valor econômico desses dados” Há que se separar a definição mercadológica dada ao Big Data da origem do problema (Quebra de Paradigma) Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 14. .:: De onde vem a necessidade de quebrar paradigma? Aumento na quantidade de Dados Científicos Maior demanda por Computação Distribuída Limitação dos Bancos de Dados Relacionais Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 15. .:: De onde vem a necessidade de quebrar paradigma? Aumento na quantidade de Dados Científicos Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: EMC
  • 16. .:: De onde vem a necessidade de quebrar paradigma? Maior demanda por Computação Distribuída Fonte: http://www.inf.ufsc.br/~frank/INE5418/1.Fundamentos-Slides.pdf Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 17. .:: De onde vem a necessidade de quebrar paradigma? Maior demanda por Computação Distribuída Computação distribuída significa pegar uma tarefa, dividi-la em pedaços menores e dar cada pedaço a um servidor diferente, depois pegar cada resultado, uni-los (de maneira coerente) e Processamento X Distribuição (Divisão) Integridade e Disponibilidade em Cloud Computing Fonte: https://under-linux.org/entry.php?b=2603 apresentá-lo. Dificuldade Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 18. .:: De onde vem a necessidade de quebrar paradigma? Limitações dos Bancos de Dados Relacionais Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: IMD
  • 19. .:: Definição de Big Data O que mais se utiliza como definição remete ao trabalho de (Laney, 2001) sobre os 3 V´s do Big Data (Volume, Variedade e Velocidade) ; “Big Data são os grandes conjuntos de dados que possuem três características principais: volume, velocidade e variedade.” Fonte: IBM Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 20. .:: Volume, Velocidade e Variedade Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 21. .:: Volume, Velocidade e Variedade Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 22. .:: + 3 V’s do Big Data VVaalloorr VVeerraacciiddaaddee VViiaabbiilliiddaaddee Fonte: http://cio.uol.com.br/opiniao/2012/05/11/o-caos-conceitual-e-os-5-vs-do-big-data/ Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 23. .:: Curiosidades From “Using Private Cloud to solve Big Data problems”, disponível em https://www.panasas.com/sites/default/files/uploads/docs/Panasas_Private_Cloud_Storage_by%20Intersect360_wp_1074.PDF Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 24. .:: Curiosidades Fonte: “Big Data and the Web: Algorithms for Data Intensive Scalable Computing”, Ph.D Thesis, Gianmarco Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 25. .:: Fontes e Tipos de Dados Os dados são de 3 tipos – Estruturados – Semi-estruturados – Não estruturados Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: Joyanes, 2013
  • 26. .:: Fontes e Tipos de Dados Estruturados – Dados que possuem esquema de campos fixos – Formato bem definido – Normalmente armazenado em BD Relacionais – Conhecimento prévio da estrutura dos dados – São gerados em uma ordem especificada Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: Joyanes, 2013
  • 27. .:: Fontes e Tipos de Dados Semi-estruturados – Possuem um fluxo lógico – O formato pode ser bem definido, mas não necessariamente é fixo – Não possui fácil compreensão por parte do usuário leigo – Tem como característica marcante o uso de etiquetas e marcadores para separar elementos dos dados – Regras complexas para manipulação dos dados Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: Joyanes, 2013
  • 28. .:: Fontes e Tipos de Dados Não estruturados – Sem tipo predefinido; – Não possuem estrutura uniforme (ex. Documentos, objetos); – Pouco ou nenhum controle sobre eles; – Dificuldade de “manipulação” para extração de informação Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: Joyanes, 2013
  • 29. .:: Fontes e Tipos de Dados De onde vem os dados do Big Data? – Web e Redes Sociais (clicks, cookies, twitter, facebook) – Mobilidade – Internet das Coisas (RFID/NFC, Sensores, GPS e Telemetria) – Biometria (Reconhecimento fácil, impressão digital, dados genéticos) – Dados gerados por pessoas (Voz, email, SMS, etc) – Dados gerados por governos, institutos de pesquisas e empresas Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: Soares, 2012
  • 30. .:: Fontes e Tipos de Dados Dados da WEB – Maior fonte de Big Data utilizada na atualidade; – Facilidade para mapear comportamento e fazer predição – Possui conhecimento importante para tomada de decisão pelas empresas – Gera informação objetiva e de impacto, que é dificil de se obter sem uma comunicação direta – Possibilidade de captura de diversos tipos de eventos (Compras, visualização de produtos e vídeos, buscas etc) Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: Joyanes, 2013
  • 31. .:: Fontes e Tipos de Dados Dados de Texto – Tipo mais comum e “simples” de dados – Origina-se praticamente em todas as fontes de dados do Big Data – Pode ser tratado como um tipo de dado “Estruturado” – Estruturado + Muitas fontes = DIFICULDADE – Possui ferramentas e aparato científico bem estruturado para análise – Processamento de linguagem natural – Análise sintática – Mineração de texto Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: Joyanes, 2013
  • 32. .:: Fontes e Tipos de Dados Dados de Sensores – Peças chave da Internet das Coisas – Monitoramento Autônomo e Ubíquo – Complexidade de manipulação dos sensores – Captura muito influenciada por fatores externos (Ex. Delay) – Dados normalmente estruturados, mas já há redes de sensores com dados não estruturados Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: Joyanes, 2013
  • 33. .:: Fontes e Tipos de Dados Dados de Geolocalização – Localização e Tempo são dois atributos de grande VALOR (Ex. Google Location History) – Possibilildades diversas para desenvolvimento de aplicações – Muito sensível para o Big Data em Volume e Velocidade – Binômio crítico com relação a questão de privacidade Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: Joyanes, 2013
  • 34. .:: Fontes e Tipos de Dados Dados de RFID e NFC – Sofrem também efeito da privacidade – NFC foi criada para comunicação entre objetos próximos e com pouca transmissão de dados – Inclusão de NFC em celulares mudou a perspectiva do trafégo de dados (Ex. Pagamentos, controle de acesso) Qual a diferença então entre Redes de Sensores e RFID/NFC? Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: Joyanes, 2013
  • 35. .:: Fontes e Tipos de Dados Dados de Redes Sociais – Tão complexo que criou um novo ramo na análise de dados: Análise Social – Volume de dados para análise de um único indivíduo na rede – Amplitude gerando complexidade: (Ex: Eu - Meus amigos - Amigos dos meus Amigos) – Dados crescendo indefinidamente e de forma heterogênea – Como separar o joio do trigo nesse dilúvio de dados? Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: Joyanes, 2013
  • 36. .:: Palavra-chave - Tecnologia IInntteeggrraaççããoo Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 37. .:: Palavra-chave – Mercado / Negócios EEssttrraattééggiiaa Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 38. .:: E a gestão? OO qquuee mmuuddaa?? TTOOMMAADDAA DDEE DDEECCIISSÃÃOO Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 39. .:: E a gestão? BBII xx BBIIGG DDAATTAA Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 40. .:: E a gestão? BBII • Bases de dados e Datawarehouse Cubo OLAP (On-line Analytical Processing) • Ferramentas OLAP • Mineração de Dados • Sistemas de apoio a decisão • Relatórios • Visualização Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 41. .:: E a gestão? BI x BBIIGG DDAATTAA Dados transacionais Dados transacionais + outros dados Decisão baseada Decisão baseada em dados em dados passados tempo real Análise Intuitiva Análise voltada a predição Universo de dados limitado Universo de dados ilimitado Busca analisar dados Busca aprendizado a partir dos dados AA ddiiffeerreennççaa eessttáá nnooss 33VV’’ss Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 42. .:: Estudos de Caso VVííddeeoo:: TThhee aaggee ooff BBiigg DDaattaa Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: BBC, 2013
  • 43. .:: Estudos de Caso Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: INFO, 2014
  • 44. .:: Estudos de Caso Ferramenta Match Analytics – Coleta e Análise de informações de treino e jogos – Analisa desde esquema tático até informação de precisão de chutes – Avalia situações de jogo e predizem o melhor treinamento para cada jogador – Possui interface que facilita o uso inclusive pelos jogadores – Roda sob a plataforma HANA da SAP – De quebra, faz análise de redes sociais analisando sentimento de torcedores com relação ao desempenho da equipe e dos atletas Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: INFO, 2014
  • 45. .:: Estudos de Caso ROLLS ROYCE – Inclusão de sensores nos motores – Informação em tempo real de peças – Vantagem competitiva: Substituição de produto por SERVIÇO SMART METERS - IBM – Medições de consumo de energia – Sensores enviam dados em tempo real – Hábitos de consumo e mudança de estratégias com premiação – Criação das chamadas Smart Grids Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: JOYANES, 2013
  • 46. .:: Estudos de Caso GOOGLE - FluTrends Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: GOOGLE
  • 47. .:: Estudos de Caso GOOGLE - FluTrends Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: GOOGLE
  • 48. .:: O 4 desafios do Big Data Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: AMAZON AWS
  • 49. .:: Os 4 desafios do Big Data (Atividade) Dividir a turma em grupos de 5 alunos Cada grupo será responsável por estudar uma ferramenta específica e preparar uma apresentação para discussão em sala Ferramentas de Aquisição (Facebook Scribe, FluentD, Apache Flume, Apache Chukwa) Ferramentas de Aquisição de uma API (Facebook Likes, Tweets, Google Analytics) Crawlers (Apache Nutch, Crawler4J, Scrapy (python), Anemone (ruby)) Armazenamento (Cassandra, Neo4J, MongoDB, Hbase, Redis) Análise (Rstudio, Matlab, Julia, Ipython) Processamento de Stream (Splunk, Amazon Kinesis) Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 50. .:: 2° Dia – 18/09/2014 IInnffrraaeessttrruuttuurraa ddee BBIIGG DDAATTAA Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 51. .:: Cloud Computing, IoT e SoLoMo O que Cloud Computing tem a ver com Big Data? Nova infraestrutura para computação sob demanda Tornou o Big Data mais próximo da realidade Big Data evolui em paralelo com a consolidação da computação em Nuvem SoLoMo e IoT convergem com Cloud Computing e Big Data criando novas perspectivas para as empresas Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 52. .:: Cloud Computing, IoT e SoLoMo Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: NIST, 2011
  • 53. .:: Cloud Computing, IoT e SoLoMo Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: CONTROL4.COM
  • 54. .:: Cloud Computing, IoT e SoLoMo Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: IBM, 2012
  • 55. .:: Arquitetura e Governança de Big Data Arquitetura de Big Data da Oracle Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: Oracle, 2012
  • 56. .:: Arquitetura e Governança de Big Data Arquitetura de Big Data da Oracle • Sistema de Armazenamento e Gestão de Dados • Hadoop Distributed File System (HDFS) • Cloudera Manager • Bancos de Dados Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: Oracle, 2012 • Oracle NoSQL • Apache Hbase • Apache Cassandra • Apache Hive (ETL)
  • 57. .:: Arquitetura e Governança de Big Data Arquitetura de Big Data da Oracle • Processamento • MapReduce • Apache Hadoop • Integração de Dados • Oracle Big Data Connectors, Oracle Loader for Hadoop, Oracle Data Integrator Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: Oracle, 2012 • Análises Estatísticas • Oracle Enterprise R
  • 58. .:: Arquitetura e Governança de Big Data Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: IHBW, 2012
  • 59. .:: Arquitetura e Governança de Big Data Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: Soares, 2013
  • 60. .:: Arquitetura e Governança de Big Data Fontes de Big Data Dados tradicionais das empresas Datos gerados por máquinas (M2M) e Internet das Coisas Dados sociais Dados de Biometría e genética Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: Soares, 2013 Dados pessoais e dados gerados por pessoas
  • 61. .:: Arquitetura e Governança de Big Data Bases de Dados SQL NoSQL (Not only SQL) In-memory Legadas Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: Soares, 2013 Tendência de DBaaS (Database as a Service) Amazon RDS, DynamoDB, SImpleDB, PostgreSQL Xeround(MySQL) Salesforce Database.com (Oracle) Google App Engine (NoSQL)
  • 62. .:: Arquitetura e Governança de Big Data Datawarehouses e Data Marts Surgimento de novos Datawarehouses e Data Marts para tratar dados de Big Data Uso massivo de ferramentas de ETL (Extraction, Transformation, Load) Novas ferramentas de inteligência de negócio, relatórios e visualização de informações Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: Soares, 2013 Adaptar infraestrutura para soluções Híbridas Integrar Hadoop e NoSQL as tecnologias tradicionais
  • 63. .:: Arquitetura e Governança de Big Data Componentes do Hadoop Surgimento de diversas distribuições devido a plataforma ser de código aberto Necessidade de definir um caminho a seguir Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: Soares, 2013 Integração de Dados Movimentação de dados brutos (DB1 + DB2 = DBNew) Replicação de dados (Sincronismo) Federação de dados (Vários dados separados = Um único dado)
  • 64. .:: Arquitetura e Governança de Big Data Gov. de Big Data = Gov. de TI + Gov. de Informação + Big Data Organização Metadados Privacidade Qualidade dos Dados Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: Soares, 2013 Integração com processos de negócios Integração com dados mestres Gestão do ciclo de vida da informação
  • 65. .:: Arquitetura e Governança de Big Data Deve se relacionar diretamente com as iniciativas de Governança da Informação já existentes na empresa Metadados – Definir bons metadados para evitar dados em duplicidade Políticas de Privacidade – Definir políticas de privacidade ao mesmo tempo que busca alavancar análise de mídias sociais Qualidade dos dados – Definir o nível de qualidade dos dados (Volume e Velocidade) Gerenciamento do ciclo de vida da Informação – Definir bem as políticas de arquivamento (Armazenamento x Custos) Manejo – Recrutar grandes administradores de Dados para evitar dados inconsistentes (Ex. Setor de Petróleo – adm de dados sísmicos e metadados) Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: Soares, 2013
  • 66. .:: Bases de Dados - Relacionais, NoSQL e in-memory BD Relacionais Largamente utilizados atualmente pelas empresas Utiliza relações (tabelas) como elementos básicos Tabelas compostas por linhas e colunas Faz uso de restrições para manutenção de integridade Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: Soares, 2013 (chaves) Utiliza NORMALIZAÇÃO SQL é a linguagem de consulta Os SGBDs relacionais implementam outras funções (controle de concorrência, segurança, controle de transações, recuperação de falhas etc)
  • 67. .:: Bases de Dados - Relacionais, NoSQL e in-memory BD Relacionais – Limitações ESCALABILIDADE Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: Soares, 2013 é a maior
  • 68. .:: Bases de Dados - Relacionais, NoSQL e in-memory BD Relacionais – Limitações Servidor BD Servidor Servidor BD Servidor Fonte: Ricardo Brito - UFC, 2012 Aplicação BD BD BD Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 69. .:: Bases de Dados - Relacionais, NoSQL e in-memory BDs No SQL Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 70. .:: Bases de Dados - Relacionais, NoSQL e in-memory BDs No SQL De volta ao passado… (Sistemas de Arquivos) Estrutura mais flexível Melhor adaptado para questões de escalabilidade Não veio para acabar com o Modelo Relacional Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: Soares, 2013 Abandonou a NORMALIZAÇÃO São livres de esquemas de tabelas e sem JOINs Iniciou em 2004 Big Table (Google), 2007 Dynamo (Amazon), 2008 Cassandra (Facebook) Escalabilidade Linear, Acesso rápido, Manipulação de dados não estruturados
  • 71. .:: Bases de Dados - Relacionais, NoSQL e in-memory Dividida em 4 Categorias Orientadas a Chave-valor Orientadas a documentos Orientadas a colunas (BigTable) Orientada a grafos Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: Soares, 2013
  • 72. .:: Bases de Dados - Relacionais, NoSQL e in-memory Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: Imasters
  • 73. .:: Bases de Dados - Relacionais, NoSQL e in-memory Bases de Dados orientadas a chave-valor Uso do conceito de tabela hash (chave única identificando um valor) Simplicidade Maior escalabilidade Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: Soares, 2013 Consultas O(1) independente do volume de dados Problemas???
  • 74. .:: Bases de Dados - Relacionais, NoSQL e in-memory Entendendo Tabela Hash Fonte: Prof. Thales Castro, 2011 Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Exemplo:
  • 75. .:: Bases de Dados - Relacionais, NoSQL e in-memory Bases de Dados orientadas a Chave-Valor Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 76. .:: Bases de Dados - Relacionais, NoSQL e in-memory Bases de Dados orientadas a documentos Parecido com o modelo chave-valor, porém mais complexo Contém todas as informações em um único documento Consulta utilizando métodos avançados (MapReduce) Livres de Esquemas Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: Soares, 2013 Utiliza identificadores únicos universais (UUID) Usa JSON (JavaScript Object Notation) para intercâmbio de dados
  • 77. .:: Bases de Dados - Relacionais, NoSQL e in-memory Bases de Dados orientadas a documentos Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: Yuri Adams, 2011
  • 78. .:: Bases de Dados - Relacionais, NoSQL e in-memory Bases de Dados orientadas a documentos Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 79. .:: Bases de Dados - Relacionais, NoSQL e in-memory Bases de Dados orientadas colunas (BigTable) Keyspace = Databases / Schemas Colum Family = Tabelas Colunas = Registros Um mega BD Chave-valor Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: Soares, 2013 Ponto forte: Velocidade e Escalabilidade Ponto fraco: Complexidade na forma de armazenamento
  • 80. .:: Bases de Dados - Relacionais, NoSQL e in-memory Bases de Dados orientadas colunas (BigTable) Fonte: Otávio Gonçalves, TDC 2012 Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 81. .:: Bases de Dados - Relacionais, NoSQL e in-memory Bases de Dados orientadas colunas (BigTable) Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 82. .:: Bases de Dados - Relacionais, NoSQL e in-memory Bases de Dados orientadas a grafos Armazenamento em forma de grafos (nós e arcos) Possui ACID (Atomicidade, Consistência, Isolamento, Durabilidade) Os dados do registros são armazenados nos vértices Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: Soares, 2013 Os relacionamentos são armazenados nas arestas Muito utilizado em redes sociais Utiliza a teoria dos grafos para obter informações Flexibilidade em quantidade de atributos e longitude de buscas Relacionamentos fazem parte dos dados, não da estrutura
  • 83. .:: Bases de Dados - Relacionais, NoSQL e in-memory Fonte: Eder Ignatowicz, 2012 Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 84. .:: Bases de Dados - Relacionais, NoSQL e in-memory Bases de Dados orientadas a grafos Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 85. .:: Bases de Dados - Relacionais, NoSQL e in-memory Bases de Dados in-memory Avanços na tecnologia de memórias Aumento da capacidade associada a redução de custos Necessidade de acelerar buscas, leitura e gravação em BD Arquitetura distinta da que utiliza discos Redução considerável do tempo de processamento Bom para grandes volumes de dados Usa memória principal para armazenamento Objetivo: Responder em tempo real sem ter que perder tempo acessando discos (LENTO) Fonte: Joyanes, 2013 Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 86. .:: Bases de Dados - Relacionais, NoSQL e in-memory Bases de Dados in-memory Duas categorias principais: Tecnologia In-memory pura Carrega todos os dados na Memória RAM antes de utilizar Tecnologia in-memory just-in-time Carrega somente os dados necessários para uma consulta particular Libera os dados de acordo com o padrão de uso JIT + Bases de Dados em colunas = Maior Desempenho Fonte: Joyanes, 2013 Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 87. .:: Bases de Dados - Relacionais, NoSQL e in-memory Por que na memória? Barramento de alta velocidade conectado diretamente ao processador MEMÓRIA Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: IBM, 2012 X DISCOS Um ou mais barramentos
  • 88. .:: Bases de Dados - Relacionais, NoSQL e in-memory Bases de Dados in-memory – Propriedades ACID Atomicidade: Transações atômicas (Se falha parte, falha o todo e BD não se altera); Consistência: Transações não alteram a consistência do BD (Respeitar integridade – Ex: chaves); Isolamento: Uma transação não pode interferir em outra (Paralelo = Sequencial); Durabilidade: Depois de confirmada uma transação deve permanecer confirmada; Fonte: WIKI Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 89. .:: Bases de Dados - Relacionais, NoSQL e in-memory Bases de Dados in-memory – Propriedades Armazenamento em colunas – Recuperação de Informação Fonte: Soares, B. e Boscarioli, C., Modelo de Banco de Dados Colunar: Características, Aplicações e Exemplos de Sistemas, 2013 Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 90. .:: Bases de Dados - Relacionais, NoSQL e in-memory Bases de Dados in-memory – Propriedades Armazenamento em colunas – Recuperação de Informação Fonte: Soares, B. e Boscarioli, C., Modelo de Banco de Dados Colunar: Características, Aplicações e Exemplos de Sistemas, 2013 Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 91. .:: Bases de Dados - Relacionais, NoSQL e in-memory Bases de Dados in-memory – Propriedades Armazenamento em colunas – Recuperação de Informação Fonte: Soares, B. e Boscarioli, C., Modelo de Banco de Dados Colunar: Características, Aplicações e Exemplos de Sistemas, 2013 Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 92. .:: Bases de Dados - Relacionais, NoSQL e in-memory Bases de Dados in-memory – Propriedades Armazenamento em colunas – Recuperação de Informação Fonte: Soares, B. e Boscarioli, C., Modelo de Banco de Dados Colunar: Características, Aplicações e Exemplos de Sistemas, 2013 Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 93. .:: Bases de Dados - Relacionais, NoSQL e in-memory Bases de Dados in-memory – SAP HANA Fonte: SAP, 2012 Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 94. .:: Bases de Dados - Relacionais, NoSQL e in-memory Bases de Dados in-memory – SAP HANA Fonte: SAP, 2012 Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 95. .:: Bases de Dados - Relacionais, NoSQL e in-memory Bases de Dados in-memory – SAP HANA Fonte: SAP, 2012 Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 96. .:: O framework Hadoop “The Apache Hadoop software library is a framework that allows for the distributed processing of large data sets across clusters of computers using a simple Programming model (Divide to Conquer) Fonte: https://under-linux.org/entry.php?b=2603 Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 97. .:: O framework Hadoop Origem do Hadoop Lê um 1TB em 1 disco = 200 seg, em 100 discos em paralelo = ~ 2 seg Pesquisas do Google de novos métodos para acesso a informação, tratamento de grandes volumes de dados e processamento paralelo geraram 3 artigos Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: Joyanes, 2013 “The Google File System (GFS)” “MapReduce: Simplified Data Processing on Large Clusters” “Big Table: A Distributed Storage System for Structured Data”
  • 98. .:: O framework Hadoop The Google File System Sistema de arquivos distribuído e escalável para aplicações com grandes volumes de dados distribuídos Tolerante a falhas e que pode ser executado a partir de hardware convencional e barato Entrega alto rendimento quando está associado a um grande número Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: Joyanes, 2013 de clientes
  • 99. .:: O framework Hadoop Map Reduce Modelo de programação para processamento de grandes conjuntos de dados Programas escritos em estilo funcional são paralelizados automaticamente Executado em cluster de máquinas básicas Responsável pelo particionamento dos dados de entrada, divisão entre as máquinas do cluster, gerenciamento de comunicação e falhas Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: Joyanes, 2013
  • 100. .:: O algoritmo MapReduce Baseado no conceito de Dividir para Conquistar GRID COMPUTING Várias implementações existentes: Hadoop, Disco, Skynet, FileMap e Greenplum; Fonte: https://under-linux.org/entry.php?b=2603 Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 101. .:: Algoritmo MapReduce Dividido em 3 passos 1. Seleciona os dados de entrada 2. Aplica as duas operações em sequência (MAP/REDUCE) 3. Recupera os dados de saída e obtém a resposta Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 102. .:: Algoritmo MapReduce Divide uma tarefa em pedaços menores (MAP); Envia as tarefas para os servidores (MAP); Coleta os resultados das tarefas (REDUCE); Processa os resultados obtendo uma resposta única (REDUCE) Fonte: https://under-linux.org/entry.php?b=2603 Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 103. .:: Algoritmo MapReduce Fonte: Fabiane Nardon, 2013 - QconSP Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 104. .:: Algoritmo MapReduce Fonte: https://under-linux.org/entry.php?b=2603 Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 105. .:: Algoritmo MapReduce Fonte: Fabiane Nardon, 2013 - QconSP Fonte: Fabiane Nardon, 2013 - QconSP Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 106. .:: O framework Hadoop Big Table Sistema de armazenamento distribuído para gestão de dados estruturados Muitos projetos do Google usando BigTable Desenhado para ser escalável até ordem de petabytes através de milhares de servidores Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: Joyanes, 2013 O artigo descreve detalhes da plataforma; Várias bases de dados comerciais atualmente seguem características desse modelo (CouchDB, MongoDB, Cassandra, Neo4J, Hypertable)
  • 107. .:: O framework Hadoop O que é ??? Inicialmente era uma implementação open source do MapReduce A medida que o projeto foi amadurecendo foram incorporados outros componentes para melhorar usabilidade e funcionalidade; Hoje é tido como o Ecossistema completo para resolver de modo eficiente e econômico a escalabilidade de dados Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: APACHE HADOOP Open source, escrito em Java Originalmente construído para a distribuição do projeto do motor web Apache Nutch
  • 108. .:: O framework Hadoop Composto pelos módulos: • Hadoop Common • Hadoop MapReduce • Hadoop Distributed File System (HDFS) • Hadoop YARN Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: Apache Hadoop
  • 109. .:: O framework Hadoop Composto pelos módulos: •Hadoop Common: The common utilities that support the other Hadoop modules. • Hadoop Distributed File System (HDFS™): A distributed file system Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: Apache Hadoop that provides high-throughput access to application data. • Hadoop YARN: A framework for job scheduling and cluster resource management. • Hadoop MapReduce: A YARN-based system for parallel processing of large data sets.
  • 110. .:: O framework Hadoop O que é HDFS ? Sistema de arquivos distribuído Alta tolerância a falhas Projetado para hardware de baixo custo Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: APACHE HADOOP Provê alta vazão de dados Escalável Portável Baseado no Google File System
  • 111. .:: O framework Hadoop Como funciona HDFS ? Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: APACHE HADOOP
  • 112. .:: O framework Hadoop Como funciona o HDFS ? Arquitetura cliente/servidor Constituído por um NameNode e vários DataNodes Os NameNodes executam as operações no sistema de arquivos, coordena acesso a dados e metadados, mantém o sistema de Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: APACHE HADOOP nomes Os metadados são mantidos em RAM (Velocidade) Organização hierárquica semelhante a outros sistemas de arquivos Protocolos HDFS sobre TCP/IP e comunicação através de RPC
  • 113. .:: O framework Hadoop Como funciona o HDFS ? Arquivos armazenados em blocos, maiores que os sistemas de arquivos normais, normalmente blocos de 64 megas Confiabilidade implementada através de replicação de dados entre os DataNodes (3 ou mais) Não se faz cache de dados devido ao tamanho dos blocos e Streaming Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: APACHE HADOOP
  • 114. .:: O framework Hadoop Por que FRAMEWORK ?????? Por que Ecossistema ?????? Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: APACHE HADOOP
  • 115. .:: O framework Hadoop Arquitetura Hadoop – Alto nível Fonte: Hadoop in Practice, 2012 Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 116. .:: O framework Hadoop Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: Joyanes, 2013
  • 117. .:: O framework Hadoop Fonte: http://opensource.com/life/14/8/intro-apache-hadoop-big-data Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 118. .:: O framework Hadoop Fonte: Hadoop in Practice, 2012 Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 119. .:: O framework Hadoop Hadoop - Limitações Alta Disponibilidade O problema do NameNode único e os problemas de 2 NameNodes Segurança Oferece um modelo de segurança, mas por default está desabilitado; Se limita a segurança do HDFS (Permissões e Propriedades) Por default, todos os demais serviços do Hadoop são totalmente “abertos” Autenticação de clientes e Criptografia de dados devem ser configuradas a parte (Complexidade) Fonte: Hadoop in Practice, 2012 Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 120. .:: O framework Hadoop Hadoop - Limitações HDFS Problemas com Alta Disponibilidade, Arquivos Pequenos e compressão transparente MapReduce Arquitetura baseada em lotes, ruim para situações de tempo real Tarefas que exigem sincronização global e compartilhamento de dados mutáveis não são bons para MapReduce porque é uma arquitetura sem compartilhamento; Fonte: Hadoop in Practice, 2012 Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 121. .:: O framework Hadoop Outro projetos associados ao Hadoop Ambari™: A web-based tool for provisioning, managing, and monitoring Apache Hadoop clusters which includes support for Hadoop HDFS, Hadoop MapReduce, Hive, HCatalog, HBase, ZooKeeper, Oozie, Pig and Sqoop. Ambari also provides a dashboard for viewing cluster health such as heatmaps and ability to view MapReduce, Pig and Hive applications visually alongwith features to diagnose their performance characteristics in a user-friendly manner. Cassandra™: A scalable multi-master database with no single points of failure. Chukwa™: A data collection system for managing large distributed systems. HBase™: A scalable, distributed database that supports structured data storage for large tables. Fonte: APACHE HADOOP, 2014 Avro™: A data serialization system. Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 122. .:: O framework Hadoop Outro projetos associados ao Hadoop Hive™: A data warehouse infrastructure that provides data summarization and ad hoc querying. Mahout™: A Scalable machine learning and data mining library. Pig™: A high-level data-flow language and execution framework for parallel computation. Spark™: A fast and general compute engine for Hadoop data. Spark provides a simple and expressive programming model that supports a wide range of applications, including ETL, machine learning, stream processing, and graph computation. ZooKeeper™: A high-performance coordination service for distributed applications. Fonte: APACHE HADOOP, 2014 Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 123. .:: 3° Dia – 19/09/2014 AAnnáálliissee ddee BBIIGG DDAATTAA Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 124. .:: Análise de Big Data O que é ? “É o processo de examinar grandes quantidade de dados de uma variedade de tipos para descobrir padrões ocultos, correlações desconhecidas e outras informações de interesse de forma que essas informações possam trazer vantagens competitivas num ambiente de negócios” Fonte: Joyanes, 2013 Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 125. .:: Análise de Big Data Oportunidades e Desafios Área de maior complexidade no universo de Big Data Fortemente baseada em modelos estatísticos Fonte: Joyanes, 2013 Exige recursos humanos muito especializados Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 126. .:: Análise de Big Data Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: EMC, 2013
  • 127. .:: Análise de Big Data Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 128. .:: 4° Dia – 20/09/2014 Tendências TTeennddêênncciiaass ddee BBIIGG DDAATTAA Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014
  • 129. .:: Novas Tendências MMMMííííddddiiiiaaaassss SSSSoooocccciiiiaaaaiiiissss MMMMoooobbbbiiiilllliiiiddddaaaaddddeeee BBBBiiiigggg DDDDaaaattttaaaa Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 CCCClllloooouuuudddd Fonte: Gartner, 2013
  • 130. .:: Novas Tendências A convergências dessas 4 forças estão gerando: Mudança de comportamento dos usuários Criando novos modelos de negócios Mudando a forma de decidir das empresas e de se relacionar com os clientes Consumidores mais ativos e com relacionamento mais próximos das empresas, obrigando mudança de cultura organizacional Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: Gartner, 2013
  • 131. .:: Novas Tendências Soma-se a isso novas tendências tecnológicas, sociais, econômicas e de consumo BYOD (Bring Your Own Device) Gamificação Crowdsourcing Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: Gartner, 2013 Crowdfunding Consumerização (Apontada pelo GARTNER como mais significativa nos próximos 10 anos)
  • 132. .:: Novas Tendências VVííddeeoo:: CCoonnssuummeerriizzaaççããoo Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: Gartner, 2013
  • 133. .:: Novas Tendências Soma-se a isso novas tendências tecnológicas, sociais, econômicas e de consumo BYOD (Bring Your Own Device) Gamificação (Ex. programa de milhagens) Crowdsourcing Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: Gartner, 2013 Crowdfunding Consumerização (Apontada pelo GARTNER como mais significativa nos próximos 10 anos)
  • 134. .:: Big Data tendências Tim O´Reilly criador da Web 2.0 e CEO da editora O´Reilly publicou através da conferência Strata as 5 grandes predições para o Big Data 1ª Arquitetura Padrão para Big Data Decisões de melhores ferramentas para determinados propósitos Definição de regras apropriadas para BD Relacional, Hadoop, NoSQL e in-memory Métodos para combinar datawarehouses existentes e bases com Hadoop Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: Gartner, 2013
  • 135. .:: Big Data tendências Tim O´Reilly criador da Web 2.0 e CEO da editora O´Reilly publicou através da conferência Strata as 5 grandes predições para o Big Data 2ª : Hadoop não será a única “oferta” profissional Surgimento de novas ferramentas para processamento de grandes Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: Gartner, 2013 volumes de dados Ferramentas de nicho Suporte aos dados através de uma linguagem universal estilo SQL 3ª : Unificação de Plataformas de Big Data Objetivo de reduzir tempo de processamento em cluster Hadoop
  • 136. .:: Big Data tendências Tim O´Reilly criador da Web 2.0 e CEO da editora O´Reilly publicou através da conferência Strata as 5 grandes predições para o Big Data 4ª: Governança como centro das atenções Segurança dos dados Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: Gartner, 2013 Consistências dos dados Compliance regulatório 5ª: Surgimento de Soluções de Análise FIM a FIM Fácil de utilizar Universais
  • 137. .:: Big data em 2020 Visão 360º Insights = 10% estruturados + 90% interação humana Engines de recomendação terão uma visão global de preferências, sentimentos e estado atual dos indivíduos Identificação de padrões futuros de forma independente Especialização em ARQUITETURA DE NUVEM – Big Data – Set/2014 Fonte: Gartner, 2013