SlideShare a Scribd company logo
1 of 10
Download to read offline
Big Data
Wellington Azevedo
Introdução
• Variedade de dados gerados e armazenados
• Mas apenas ter dados não basta: é importante conseguir e saber usá-los.
É aí que o conceito de Big Data entra em cena.
• Conceito irá contribuir para o cotidiano de empresas, governos e demais
instituições.
Curiosidades
O conceito de Big Data
• A princípio, podemos definir o conceito de Big Data como sendo conjuntos de dados
extremamente amplos e que, por este motivo, necessitam de ferramentas especialmente
preparadas para lidar com grandes volumes, de forma que toda e qualquer informação nestes
meios possa ser encontrada, analisada e aproveitada em tempo hábil.
• Informação é poder, logo com esses dados em mãos poderá entender como melhorar um
produto, como criar uma estratégia de marketing mais eficiente, como cortar gastos, como
produzir mais em menos tempo, como evitar o desperdício de recursos, como superar um
concorrente, como disponibilizar serviços para a um cliente especial de maneira satisfatória
e assim por diante.
• fatores que podem inclusive ser decisivos para o futuro de uma companhia.
• O Big Data é recente ? Data Mining, Business Intelligence e CRM (Customer Relationship
Management).
• Big Data é somente um grande volume de dados ?
Porque Big Data é tão importante?
• Avanços computacionais nos permitem guardar, organizar e analisar.
• Esta longe de parar este grande volume de dados IoT… conexão de vários dispositivos com
a internet.
• As tecnologias atuais nos permitiram - e permitem - aumentar exponencialmente a
quantidade de informações no mundo.
Os V’s do Big Data
• Volume é o que conhecemos.
• Velocidade para dar conta de determinados problemas, o tratamento dos dados (obtenção,
gravação, atualização, enfim) deve ser feito em tempo hábil.
• Variedade os volume de dados que temos hoje são consequência também da diversidade de
informações. Dados estruturados e não-estruturados.
• Veracidade dos dados esses dados são consistentes ?
• “Volume + Velocidade + Variedade + Veracidade”, o resultado tem que gerar algum Valor.
Soluções de Big Data
• Lidar com Volume muito alto de dados, trabalhar com processamento distribuído e
elasticidade.
• Banco de dados “Tradicionais” que exploram o modelo relacional não são adequados a estes
requisitos já que são menos flexíveis.
• ACID deixaram o banco relacional muito popular.
• A elasticidade, por exemplo, pode ser inviabilizada pela atomicidade e pela consistência.
NoSQL
• Histórico
• O NoSQL faz referência às soluções de bancos de dados que possibilitam armazenamento de
diversas formas
• Bancos do tipo são mais flexíveis, sendo inclusive compatíveis com um grupo de premissas
que "compete" com as propriedades ACID: a BASE (Basically Available, Soft state,
Eventually consistency - Basicamente disponível, Estado Leve, Eventualmente consistente).
• Via de regra, escalar (torná-lo maior) um bancos de dados NoSQL é mais fácil e menos
custoso.
• É necessário também contar com ferramentas que permitam o tratamento dos volumes.
Neste ponto, o Hadoop é, de longe, a principal referência.
Hadoop
• O Hadoop é uma plataforma open source desenvolvida especialmente para processamento e
análise de grandes volumes de dados, sejam eles estruturados ou não estruturados.
• Pode-se dizer que o projeto teve início em meados de 2003, esta tecnologia recebeu o nome
de MapReduce.
• O Hadoop é tido como uma solução adequada para Big Data por vários motivos:
• Proporciona economia, já que não exige o pagamento de licenças e suporta hardware
convencional, permitindo a criação de projetos com máquinas consideravelmente mais
baratas;
• O Hadoop conta, por padrão, com recursos de tolerância a falhas, como replicação de
dados;
• O Hadoop é escalável: havendo necessidade de processamento para suportar maior
quantidade de dados, é possível acrescentar computadores sem necessidade de realizar
reconfigurações complexas no sistema.
Referências
[1] http://www.infowester.com/big-data.php acessado em 24/05/2015
[2] http://www.ibm.com/midmarket/br/pt/infografico_bigdata.html em 24/05/2015

More Related Content

What's hot

Pentaho com Hadoop – O Canivete Suíço do Cientistas de Dados para Big Data An...
Pentaho com Hadoop – O Canivete Suíço do Cientistas de Dados para Big Data An...Pentaho com Hadoop – O Canivete Suíço do Cientistas de Dados para Big Data An...
Pentaho com Hadoop – O Canivete Suíço do Cientistas de Dados para Big Data An...Ambiente Livre
 
Business intelligence
Business intelligenceBusiness intelligence
Business intelligenceDavid Willian
 
Palestra: Big Data Open Source com Hadoop - FLISOL 2014 - Curitiba
Palestra: Big Data Open Source com Hadoop - FLISOL 2014 - CuritibaPalestra: Big Data Open Source com Hadoop - FLISOL 2014 - Curitiba
Palestra: Big Data Open Source com Hadoop - FLISOL 2014 - CuritibaMarcio Junior Vieira
 
Arquitetura para solução Big Data – open source
Arquitetura para solução Big Data – open sourceArquitetura para solução Big Data – open source
Arquitetura para solução Big Data – open sourceFelipe RENZ - MBA TI / Big
 
Instituto Infnet - BigData e Hadoop
Instituto Infnet  - BigData e HadoopInstituto Infnet  - BigData e Hadoop
Instituto Infnet - BigData e HadoopThiago Santiago
 
Hackathon Inmetrics e Fiap: Desafios do Big Data
Hackathon Inmetrics e Fiap: Desafios do Big DataHackathon Inmetrics e Fiap: Desafios do Big Data
Hackathon Inmetrics e Fiap: Desafios do Big Datainmetrics
 
BigData, Datamining e NoSql - A Combinação Perfeita
BigData, Datamining e NoSql - A Combinação PerfeitaBigData, Datamining e NoSql - A Combinação Perfeita
BigData, Datamining e NoSql - A Combinação PerfeitaFranklin Dias
 
Governança de Dados e Big Data
Governança de Dados e Big DataGovernança de Dados e Big Data
Governança de Dados e Big DataCarlos Barbieri
 
Introdução ao Data Warehouse
Introdução ao Data WarehouseIntrodução ao Data Warehouse
Introdução ao Data WarehouseMessias Batista
 
Cientista de Dados – Dominando o Big Data com Software Livre
Cientista de Dados – Dominando o Big Data com Software Livre Cientista de Dados – Dominando o Big Data com Software Livre
Cientista de Dados – Dominando o Big Data com Software Livre Ambiente Livre
 
Virtualização de dados para Advanced Analytics e Machine Learning
Virtualização de dados para Advanced Analytics e Machine LearningVirtualização de dados para Advanced Analytics e Machine Learning
Virtualização de dados para Advanced Analytics e Machine LearningDenodo
 
Intelligence, Discovery, Analytics e Data Science: Evolução, Desafios e Oport...
Intelligence, Discovery, Analytics e Data Science: Evolução, Desafios e Oport...Intelligence, Discovery, Analytics e Data Science: Evolução, Desafios e Oport...
Intelligence, Discovery, Analytics e Data Science: Evolução, Desafios e Oport...Mauricio Cesar Santos da Purificação
 
Pentaho, Hadoop , Big Data e Data Lakes
Pentaho, Hadoop , Big Data e Data LakesPentaho, Hadoop , Big Data e Data Lakes
Pentaho, Hadoop , Big Data e Data LakesAmbiente Livre
 
Webinar carreiras dados
Webinar carreiras dadosWebinar carreiras dados
Webinar carreiras dadosMarco Garcia
 

What's hot (20)

Pentaho com Hadoop – O Canivete Suíço do Cientistas de Dados para Big Data An...
Pentaho com Hadoop – O Canivete Suíço do Cientistas de Dados para Big Data An...Pentaho com Hadoop – O Canivete Suíço do Cientistas de Dados para Big Data An...
Pentaho com Hadoop – O Canivete Suíço do Cientistas de Dados para Big Data An...
 
Business intelligence
Business intelligenceBusiness intelligence
Business intelligence
 
Palestra: Big Data Open Source com Hadoop - FLISOL 2014 - Curitiba
Palestra: Big Data Open Source com Hadoop - FLISOL 2014 - CuritibaPalestra: Big Data Open Source com Hadoop - FLISOL 2014 - Curitiba
Palestra: Big Data Open Source com Hadoop - FLISOL 2014 - Curitiba
 
Big data
Big dataBig data
Big data
 
Arquitetura para solução Big Data – open source
Arquitetura para solução Big Data – open sourceArquitetura para solução Big Data – open source
Arquitetura para solução Big Data – open source
 
Instituto Infnet - BigData e Hadoop
Instituto Infnet  - BigData e HadoopInstituto Infnet  - BigData e Hadoop
Instituto Infnet - BigData e Hadoop
 
Treinamento hadoop - dia1
Treinamento hadoop - dia1Treinamento hadoop - dia1
Treinamento hadoop - dia1
 
Big Data Latinoware 2014
Big Data Latinoware 2014Big Data Latinoware 2014
Big Data Latinoware 2014
 
Hackathon Inmetrics e Fiap: Desafios do Big Data
Hackathon Inmetrics e Fiap: Desafios do Big DataHackathon Inmetrics e Fiap: Desafios do Big Data
Hackathon Inmetrics e Fiap: Desafios do Big Data
 
Live - BigData
Live - BigDataLive - BigData
Live - BigData
 
BigData, Datamining e NoSql - A Combinação Perfeita
BigData, Datamining e NoSql - A Combinação PerfeitaBigData, Datamining e NoSql - A Combinação Perfeita
BigData, Datamining e NoSql - A Combinação Perfeita
 
Governança de Dados e Big Data
Governança de Dados e Big DataGovernança de Dados e Big Data
Governança de Dados e Big Data
 
Introdução ao Data Warehouse
Introdução ao Data WarehouseIntrodução ao Data Warehouse
Introdução ao Data Warehouse
 
Cientista de Dados – Dominando o Big Data com Software Livre
Cientista de Dados – Dominando o Big Data com Software Livre Cientista de Dados – Dominando o Big Data com Software Livre
Cientista de Dados – Dominando o Big Data com Software Livre
 
Virtualização de dados para Advanced Analytics e Machine Learning
Virtualização de dados para Advanced Analytics e Machine LearningVirtualização de dados para Advanced Analytics e Machine Learning
Virtualização de dados para Advanced Analytics e Machine Learning
 
Intelligence, Discovery, Analytics e Data Science: Evolução, Desafios e Oport...
Intelligence, Discovery, Analytics e Data Science: Evolução, Desafios e Oport...Intelligence, Discovery, Analytics e Data Science: Evolução, Desafios e Oport...
Intelligence, Discovery, Analytics e Data Science: Evolução, Desafios e Oport...
 
Pentaho, Hadoop , Big Data e Data Lakes
Pentaho, Hadoop , Big Data e Data LakesPentaho, Hadoop , Big Data e Data Lakes
Pentaho, Hadoop , Big Data e Data Lakes
 
Treinamento hadoop - dia3
Treinamento hadoop - dia3Treinamento hadoop - dia3
Treinamento hadoop - dia3
 
Webinar carreiras dados
Webinar carreiras dadosWebinar carreiras dados
Webinar carreiras dados
 
Treinamento hadoop - dia4
Treinamento hadoop - dia4Treinamento hadoop - dia4
Treinamento hadoop - dia4
 

Viewers also liked

Useful Salesforce.com chrome extensions & Snapshots
Useful Salesforce.com chrome extensions & SnapshotsUseful Salesforce.com chrome extensions & Snapshots
Useful Salesforce.com chrome extensions & SnapshotsProQuest
 
Dreamforce 2015 - ProQuest Highlights
Dreamforce 2015 - ProQuest HighlightsDreamforce 2015 - ProQuest Highlights
Dreamforce 2015 - ProQuest HighlightsProQuest
 
Apresentação new sql
Apresentação new sqlApresentação new sql
Apresentação new sqlw_barros
 
Process builder vs Triggers
Process builder vs TriggersProcess builder vs Triggers
Process builder vs TriggersProQuest
 
Salesforce Process builder Vs Workflows
Salesforce Process builder Vs WorkflowsSalesforce Process builder Vs Workflows
Salesforce Process builder Vs WorkflowsPrasanna Deshpande ☁
 
Engine de jogos 2D
Engine de jogos 2DEngine de jogos 2D
Engine de jogos 2Dw_barros
 

Viewers also liked (6)

Useful Salesforce.com chrome extensions & Snapshots
Useful Salesforce.com chrome extensions & SnapshotsUseful Salesforce.com chrome extensions & Snapshots
Useful Salesforce.com chrome extensions & Snapshots
 
Dreamforce 2015 - ProQuest Highlights
Dreamforce 2015 - ProQuest HighlightsDreamforce 2015 - ProQuest Highlights
Dreamforce 2015 - ProQuest Highlights
 
Apresentação new sql
Apresentação new sqlApresentação new sql
Apresentação new sql
 
Process builder vs Triggers
Process builder vs TriggersProcess builder vs Triggers
Process builder vs Triggers
 
Salesforce Process builder Vs Workflows
Salesforce Process builder Vs WorkflowsSalesforce Process builder Vs Workflows
Salesforce Process builder Vs Workflows
 
Engine de jogos 2D
Engine de jogos 2DEngine de jogos 2D
Engine de jogos 2D
 

Similar to Big data

Case RDStation: Construindo DataLakes com Apache Hadoop em cloud agnóstica
Case RDStation: Construindo DataLakes com Apache Hadoop em cloud agnósticaCase RDStation: Construindo DataLakes com Apache Hadoop em cloud agnóstica
Case RDStation: Construindo DataLakes com Apache Hadoop em cloud agnósticaAlessandro Binhara
 
Fundamentos de Banco de Dados.pptx
Fundamentos de Banco de Dados.pptxFundamentos de Banco de Dados.pptx
Fundamentos de Banco de Dados.pptxNatliaGomes72
 
Big Data & Cognitive Lab
Big Data & Cognitive LabBig Data & Cognitive Lab
Big Data & Cognitive LabTenbu
 
Data Management: 5 tendências para alcançar a mudança
Data Management: 5 tendências para alcançar a mudançaData Management: 5 tendências para alcançar a mudança
Data Management: 5 tendências para alcançar a mudançaDenodo
 
Pentaho Hadoop Big Data e Data Lakes
Pentaho Hadoop Big Data e Data LakesPentaho Hadoop Big Data e Data Lakes
Pentaho Hadoop Big Data e Data LakesAmbiente Livre
 
Qual é o futuro da estratégia de dados?
Qual é o futuro da estratégia de dados?Qual é o futuro da estratégia de dados?
Qual é o futuro da estratégia de dados?Denodo
 
Modernizando o papel do Data Lake em uma arquitetura de Data Fabric
Modernizando o papel do Data Lake em uma arquitetura de Data FabricModernizando o papel do Data Lake em uma arquitetura de Data Fabric
Modernizando o papel do Data Lake em uma arquitetura de Data FabricDenodo
 
Palestra Big Data SCTI
Palestra Big Data SCTIPalestra Big Data SCTI
Palestra Big Data SCTIBruna Pereira
 
Big Data Analytics - Data Engineer, Arquitetura, AWS e Mais
Big Data Analytics - Data Engineer, Arquitetura, AWS e MaisBig Data Analytics - Data Engineer, Arquitetura, AWS e Mais
Big Data Analytics - Data Engineer, Arquitetura, AWS e MaisCicero Joasyo Mateus de Moura
 
PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
PostgreSQL em projetos de Business Analytics e Big Data Analytics com PentahoPostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
PostgreSQL em projetos de Business Analytics e Big Data Analytics com PentahoAmbiente Livre
 
Gestão Ágil de Dados com Enterprise Data Fabric
Gestão Ágil de Dados com Enterprise Data FabricGestão Ágil de Dados com Enterprise Data Fabric
Gestão Ágil de Dados com Enterprise Data FabricDenodo
 

Similar to Big data (20)

Big Data
Big DataBig Data
Big Data
 
Case RDStation: Construindo DataLakes com Apache Hadoop em cloud agnóstica
Case RDStation: Construindo DataLakes com Apache Hadoop em cloud agnósticaCase RDStation: Construindo DataLakes com Apache Hadoop em cloud agnóstica
Case RDStation: Construindo DataLakes com Apache Hadoop em cloud agnóstica
 
Fundamentos de Banco de Dados.pptx
Fundamentos de Banco de Dados.pptxFundamentos de Banco de Dados.pptx
Fundamentos de Banco de Dados.pptx
 
Big Data & Cognitive Lab
Big Data & Cognitive LabBig Data & Cognitive Lab
Big Data & Cognitive Lab
 
Data Management: 5 tendências para alcançar a mudança
Data Management: 5 tendências para alcançar a mudançaData Management: 5 tendências para alcançar a mudança
Data Management: 5 tendências para alcançar a mudança
 
Big Data - Hadoop
Big Data - HadoopBig Data - Hadoop
Big Data - Hadoop
 
Pentaho Hadoop Big Data e Data Lakes
Pentaho Hadoop Big Data e Data LakesPentaho Hadoop Big Data e Data Lakes
Pentaho Hadoop Big Data e Data Lakes
 
Qual é o futuro da estratégia de dados?
Qual é o futuro da estratégia de dados?Qual é o futuro da estratégia de dados?
Qual é o futuro da estratégia de dados?
 
Big Data - Conceitos Básicos
Big Data - Conceitos BásicosBig Data - Conceitos Básicos
Big Data - Conceitos Básicos
 
Big Data na Nuvem
Big Data na NuvemBig Data na Nuvem
Big Data na Nuvem
 
Modernizando o papel do Data Lake em uma arquitetura de Data Fabric
Modernizando o papel do Data Lake em uma arquitetura de Data FabricModernizando o papel do Data Lake em uma arquitetura de Data Fabric
Modernizando o papel do Data Lake em uma arquitetura de Data Fabric
 
Palestra Big Data SCTI
Palestra Big Data SCTIPalestra Big Data SCTI
Palestra Big Data SCTI
 
Big data
Big dataBig data
Big data
 
TDC - Planejando data Lake com big data clusters
TDC - Planejando data Lake com big data clustersTDC - Planejando data Lake com big data clusters
TDC - Planejando data Lake com big data clusters
 
Datawarehouse
DatawarehouseDatawarehouse
Datawarehouse
 
Aula BigData.pptx
Aula BigData.pptxAula BigData.pptx
Aula BigData.pptx
 
Big Data Analytics - Data Engineer, Arquitetura, AWS e Mais
Big Data Analytics - Data Engineer, Arquitetura, AWS e MaisBig Data Analytics - Data Engineer, Arquitetura, AWS e Mais
Big Data Analytics - Data Engineer, Arquitetura, AWS e Mais
 
PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
PostgreSQL em projetos de Business Analytics e Big Data Analytics com PentahoPostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
 
TA1 - Slides Acessibilidade.pdf
TA1 - Slides Acessibilidade.pdfTA1 - Slides Acessibilidade.pdf
TA1 - Slides Acessibilidade.pdf
 
Gestão Ágil de Dados com Enterprise Data Fabric
Gestão Ágil de Dados com Enterprise Data FabricGestão Ágil de Dados com Enterprise Data Fabric
Gestão Ágil de Dados com Enterprise Data Fabric
 

Big data

  • 2. Introdução • Variedade de dados gerados e armazenados • Mas apenas ter dados não basta: é importante conseguir e saber usá-los. É aí que o conceito de Big Data entra em cena. • Conceito irá contribuir para o cotidiano de empresas, governos e demais instituições.
  • 4. O conceito de Big Data • A princípio, podemos definir o conceito de Big Data como sendo conjuntos de dados extremamente amplos e que, por este motivo, necessitam de ferramentas especialmente preparadas para lidar com grandes volumes, de forma que toda e qualquer informação nestes meios possa ser encontrada, analisada e aproveitada em tempo hábil. • Informação é poder, logo com esses dados em mãos poderá entender como melhorar um produto, como criar uma estratégia de marketing mais eficiente, como cortar gastos, como produzir mais em menos tempo, como evitar o desperdício de recursos, como superar um concorrente, como disponibilizar serviços para a um cliente especial de maneira satisfatória e assim por diante. • fatores que podem inclusive ser decisivos para o futuro de uma companhia. • O Big Data é recente ? Data Mining, Business Intelligence e CRM (Customer Relationship Management). • Big Data é somente um grande volume de dados ?
  • 5. Porque Big Data é tão importante? • Avanços computacionais nos permitem guardar, organizar e analisar. • Esta longe de parar este grande volume de dados IoT… conexão de vários dispositivos com a internet. • As tecnologias atuais nos permitiram - e permitem - aumentar exponencialmente a quantidade de informações no mundo.
  • 6. Os V’s do Big Data • Volume é o que conhecemos. • Velocidade para dar conta de determinados problemas, o tratamento dos dados (obtenção, gravação, atualização, enfim) deve ser feito em tempo hábil. • Variedade os volume de dados que temos hoje são consequência também da diversidade de informações. Dados estruturados e não-estruturados. • Veracidade dos dados esses dados são consistentes ? • “Volume + Velocidade + Variedade + Veracidade”, o resultado tem que gerar algum Valor.
  • 7. Soluções de Big Data • Lidar com Volume muito alto de dados, trabalhar com processamento distribuído e elasticidade. • Banco de dados “Tradicionais” que exploram o modelo relacional não são adequados a estes requisitos já que são menos flexíveis. • ACID deixaram o banco relacional muito popular. • A elasticidade, por exemplo, pode ser inviabilizada pela atomicidade e pela consistência.
  • 8. NoSQL • Histórico • O NoSQL faz referência às soluções de bancos de dados que possibilitam armazenamento de diversas formas • Bancos do tipo são mais flexíveis, sendo inclusive compatíveis com um grupo de premissas que "compete" com as propriedades ACID: a BASE (Basically Available, Soft state, Eventually consistency - Basicamente disponível, Estado Leve, Eventualmente consistente). • Via de regra, escalar (torná-lo maior) um bancos de dados NoSQL é mais fácil e menos custoso. • É necessário também contar com ferramentas que permitam o tratamento dos volumes. Neste ponto, o Hadoop é, de longe, a principal referência.
  • 9. Hadoop • O Hadoop é uma plataforma open source desenvolvida especialmente para processamento e análise de grandes volumes de dados, sejam eles estruturados ou não estruturados. • Pode-se dizer que o projeto teve início em meados de 2003, esta tecnologia recebeu o nome de MapReduce. • O Hadoop é tido como uma solução adequada para Big Data por vários motivos: • Proporciona economia, já que não exige o pagamento de licenças e suporta hardware convencional, permitindo a criação de projetos com máquinas consideravelmente mais baratas; • O Hadoop conta, por padrão, com recursos de tolerância a falhas, como replicação de dados; • O Hadoop é escalável: havendo necessidade de processamento para suportar maior quantidade de dados, é possível acrescentar computadores sem necessidade de realizar reconfigurações complexas no sistema.
  • 10. Referências [1] http://www.infowester.com/big-data.php acessado em 24/05/2015 [2] http://www.ibm.com/midmarket/br/pt/infografico_bigdata.html em 24/05/2015