2. O que é Big Data?
Grandes quantidades de dados que possam
ser compilados e usados nas tomadas de
decisões e ações.
3. De onde vem os dados?
●Planilhas de dados
●Sensores
Hoje em dia de qualquer fonte é possível
coletar dados!
●Redes Sociais
4. O que é mineração de dados?
É a forma que separamos os dados para que
um determinado sistema possa processa-los
5. Como podemos processar os dados?
Qual linguagem de programação usar?
Qualquer linguagem pode ser usada
para processar dados e gerar relátorios
6. Por que usar a
●É uma linguagem para desenvolvimento integrado,
para cálculos estatísticos e gráficos.
●O código fonte é aberto, permitindo que você faça
as adaptações necessárias para melhorar a
performance na sua infraestrutura.
●Novas metodologias são incorporadas rapidamente
7. Quem usa?
- Google usa para fazer o cálculo e análise de campanhas
pagas e para análise de dados de tráfego
- Microsoft usa para recomendar produtos do Xbox e é
utilizado para gerar os relatório da AZURE ML
- Uber usa para calcular métricas dos seus serviços em
tempo real
- Twitter incorporou dentro da sua plataforma como um
Data Science toolbox para melhorar as métricas e
experiências dos usuários
9. Falando sobre Machine Learning
- É um sub-campo da inteligência artificial dedicado ao
desenvolvimento de algoritmos e técnicas que permitem o
computador aprender
- Algumas partes da aprendizagem automática estão
intimamente ligadas à mineração de dados e estatística.
- Sua aplicação prática inclui o processamento de
linguagem natural, motores de buscas, diagnósticos
médicos, bioinformática, reconhecimento de fala,
reconhecimento de escrita, visão computacional e
locomoção de robôs.
10. Vamos Programar!
Como caso de estudo prático vamos utilizar:
- Twitter como fonte de dados de Big Data
- R como liguagem responsável por minerar e processar os
dados
- O conceito de processamento de linguagem natural de
Machine Learning, usando o algoritmo Bayes através da lib
sentiment.