SlideShare a Scribd company logo
1 of 11
Download to read offline
Algoritmos de Big Data
com R
Richard Brochini
O que é Big Data?
Grandes quantidades de dados que possam
ser compilados e usados nas tomadas de
decisões e ações.
De onde vem os dados?
●Planilhas de dados
●Sensores
Hoje em dia de qualquer fonte é possível
coletar dados!
●Redes Sociais
O que é mineração de dados?
É a forma que separamos os dados para que
um determinado sistema possa processa-los
Como podemos processar os dados?
Qual linguagem de programação usar?
Qualquer linguagem pode ser usada
para processar dados e gerar relátorios
Por que usar a
●É uma linguagem para desenvolvimento integrado,
para cálculos estatísticos e gráficos.
●O código fonte é aberto, permitindo que você faça
as adaptações necessárias para melhorar a
performance na sua infraestrutura.
●Novas metodologias são incorporadas rapidamente
Quem usa?
- Google usa para fazer o cálculo e análise de campanhas
pagas e para análise de dados de tráfego
- Microsoft usa para recomendar produtos do Xbox e é
utilizado para gerar os relatório da AZURE ML
- Uber usa para calcular métricas dos seus serviços em
tempo real
- Twitter incorporou dentro da sua plataforma como um
Data Science toolbox para melhorar as métricas e
experiências dos usuários
Entendendo a linguagem
Falando sobre Machine Learning
- É um sub-campo da inteligência artificial dedicado ao
desenvolvimento de algoritmos e técnicas que permitem o
computador aprender
- Algumas partes da aprendizagem automática estão
intimamente ligadas à mineração de dados e estatística.
- Sua aplicação prática inclui o processamento de
linguagem natural, motores de buscas, diagnósticos
médicos, bioinformática, reconhecimento de fala,
reconhecimento de escrita, visão computacional e
locomoção de robôs.
Vamos Programar!
Como caso de estudo prático vamos utilizar:
- Twitter como fonte de dados de Big Data
- R como liguagem responsável por minerar e processar os
dados
- O conceito de processamento de linguagem natural de
Machine Learning, usando o algoritmo Bayes através da lib
sentiment.
Contatos
Consultoria e Desenvolvimento
Richard Brochini
E-Mail: Richard@Brochini.com
Site: http://richard.brochini.com/
Linkedin: https://br.linkedin.com/in/richardbrochini

More Related Content

Viewers also liked

Mineração de dados na prática com RapidMiner e Weka
Mineração de dados na prática com RapidMiner e WekaMineração de dados na prática com RapidMiner e Weka
Mineração de dados na prática com RapidMiner e WekaJoão Gabriel Lima
 
Mineração de dados e novas oportunidades de análise para sistemas de informação
Mineração de dados e novas oportunidades de análise para sistemas de informaçãoMineração de dados e novas oportunidades de análise para sistemas de informação
Mineração de dados e novas oportunidades de análise para sistemas de informaçãoDalton Martins
 
Análise de Redes Sociais com Python
Análise de Redes Sociais com PythonAnálise de Redes Sociais com Python
Análise de Redes Sociais com PythonAna Paula Gomes
 
Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em...
Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em...Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em...
Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em...João Gabriel Lima
 
Criando soluções de BI com Pentaho e Dados Abertos @ Pentaho Day 2013
Criando soluções de BI com Pentaho e Dados Abertos @ Pentaho Day 2013Criando soluções de BI com Pentaho e Dados Abertos @ Pentaho Day 2013
Criando soluções de BI com Pentaho e Dados Abertos @ Pentaho Day 2013PentahoBrasil
 
Governança de Dados e Big Data_v02
Governança de Dados e Big Data_v02Governança de Dados e Big Data_v02
Governança de Dados e Big Data_v02Carlos Barbieri
 
Modelos analiticos crm
Modelos analiticos crmModelos analiticos crm
Modelos analiticos crmRamón Díaz
 
Desenvolvendo mvp com python
Desenvolvendo mvp com pythonDesenvolvendo mvp com python
Desenvolvendo mvp com pythonBruno Rocha
 
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big DataContexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big DataFabrício Barth
 
[TDC2016] Apache Cassandra Estratégias de Modelagem de Dados
[TDC2016]  Apache Cassandra Estratégias de Modelagem de Dados[TDC2016]  Apache Cassandra Estratégias de Modelagem de Dados
[TDC2016] Apache Cassandra Estratégias de Modelagem de DadosEiti Kimura
 
BIG DATA & IoT: Tecnologias e  Aplicações
BIG DATA & IoT: Tecnologias e  AplicaçõesBIG DATA & IoT: Tecnologias e  Aplicações
BIG DATA & IoT: Tecnologias e  AplicaçõesAlessandro Binhara
 
Weka – Ferramenta Livre para Mineração de Dados
Weka – Ferramenta Livre para Mineração de DadosWeka – Ferramenta Livre para Mineração de Dados
Weka – Ferramenta Livre para Mineração de DadosRubem Ventura Alves
 
Pentaho Hadoop Big Data e Data Lakes
Pentaho Hadoop Big Data e Data LakesPentaho Hadoop Big Data e Data Lakes
Pentaho Hadoop Big Data e Data LakesAmbiente Livre
 

Viewers also liked (18)

Mineração de dados na prática com RapidMiner e Weka
Mineração de dados na prática com RapidMiner e WekaMineração de dados na prática com RapidMiner e Weka
Mineração de dados na prática com RapidMiner e Weka
 
Bigadata casese opotunidades
Bigadata casese opotunidadesBigadata casese opotunidades
Bigadata casese opotunidades
 
Mineração de dados e novas oportunidades de análise para sistemas de informação
Mineração de dados e novas oportunidades de análise para sistemas de informaçãoMineração de dados e novas oportunidades de análise para sistemas de informação
Mineração de dados e novas oportunidades de análise para sistemas de informação
 
Análise de Redes Sociais com Python
Análise de Redes Sociais com PythonAnálise de Redes Sociais com Python
Análise de Redes Sociais com Python
 
Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em...
Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em...Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em...
Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em...
 
Cases big data
Cases big dataCases big data
Cases big data
 
Criando soluções de BI com Pentaho e Dados Abertos @ Pentaho Day 2013
Criando soluções de BI com Pentaho e Dados Abertos @ Pentaho Day 2013Criando soluções de BI com Pentaho e Dados Abertos @ Pentaho Day 2013
Criando soluções de BI com Pentaho e Dados Abertos @ Pentaho Day 2013
 
Governança de Dados e Big Data_v02
Governança de Dados e Big Data_v02Governança de Dados e Big Data_v02
Governança de Dados e Big Data_v02
 
Modelos analiticos crm
Modelos analiticos crmModelos analiticos crm
Modelos analiticos crm
 
Desenvolvendo mvp com python
Desenvolvendo mvp com pythonDesenvolvendo mvp com python
Desenvolvendo mvp com python
 
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big DataContexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
 
Relatório Utilização da Ferramenta Weka
Relatório Utilização da Ferramenta WekaRelatório Utilização da Ferramenta Weka
Relatório Utilização da Ferramenta Weka
 
[TDC2016] Apache Cassandra Estratégias de Modelagem de Dados
[TDC2016]  Apache Cassandra Estratégias de Modelagem de Dados[TDC2016]  Apache Cassandra Estratégias de Modelagem de Dados
[TDC2016] Apache Cassandra Estratégias de Modelagem de Dados
 
Análise de Problemas Big Data
Análise de Problemas Big DataAnálise de Problemas Big Data
Análise de Problemas Big Data
 
BIG DATA & IoT: Tecnologias e  Aplicações
BIG DATA & IoT: Tecnologias e  AplicaçõesBIG DATA & IoT: Tecnologias e  Aplicações
BIG DATA & IoT: Tecnologias e  Aplicações
 
Weka – Ferramenta Livre para Mineração de Dados
Weka – Ferramenta Livre para Mineração de DadosWeka – Ferramenta Livre para Mineração de Dados
Weka – Ferramenta Livre para Mineração de Dados
 
Mineração de dados
Mineração de dadosMineração de dados
Mineração de dados
 
Pentaho Hadoop Big Data e Data Lakes
Pentaho Hadoop Big Data e Data LakesPentaho Hadoop Big Data e Data Lakes
Pentaho Hadoop Big Data e Data Lakes
 

Hackathon Inmetrics e Fiap: Algoritimos de Big Data com R

  • 1. Algoritmos de Big Data com R Richard Brochini
  • 2. O que é Big Data? Grandes quantidades de dados que possam ser compilados e usados nas tomadas de decisões e ações.
  • 3. De onde vem os dados? ●Planilhas de dados ●Sensores Hoje em dia de qualquer fonte é possível coletar dados! ●Redes Sociais
  • 4. O que é mineração de dados? É a forma que separamos os dados para que um determinado sistema possa processa-los
  • 5. Como podemos processar os dados? Qual linguagem de programação usar? Qualquer linguagem pode ser usada para processar dados e gerar relátorios
  • 6. Por que usar a ●É uma linguagem para desenvolvimento integrado, para cálculos estatísticos e gráficos. ●O código fonte é aberto, permitindo que você faça as adaptações necessárias para melhorar a performance na sua infraestrutura. ●Novas metodologias são incorporadas rapidamente
  • 7. Quem usa? - Google usa para fazer o cálculo e análise de campanhas pagas e para análise de dados de tráfego - Microsoft usa para recomendar produtos do Xbox e é utilizado para gerar os relatório da AZURE ML - Uber usa para calcular métricas dos seus serviços em tempo real - Twitter incorporou dentro da sua plataforma como um Data Science toolbox para melhorar as métricas e experiências dos usuários
  • 9. Falando sobre Machine Learning - É um sub-campo da inteligência artificial dedicado ao desenvolvimento de algoritmos e técnicas que permitem o computador aprender - Algumas partes da aprendizagem automática estão intimamente ligadas à mineração de dados e estatística. - Sua aplicação prática inclui o processamento de linguagem natural, motores de buscas, diagnósticos médicos, bioinformática, reconhecimento de fala, reconhecimento de escrita, visão computacional e locomoção de robôs.
  • 10. Vamos Programar! Como caso de estudo prático vamos utilizar: - Twitter como fonte de dados de Big Data - R como liguagem responsável por minerar e processar os dados - O conceito de processamento de linguagem natural de Machine Learning, usando o algoritmo Bayes através da lib sentiment.
  • 11. Contatos Consultoria e Desenvolvimento Richard Brochini E-Mail: Richard@Brochini.com Site: http://richard.brochini.com/ Linkedin: https://br.linkedin.com/in/richardbrochini