Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
Introdução ao Machine Learning
Quem sou?
● Rubens Pinheiro
● Bacharel em Ciências da Computação (UECE)
● Desenvolvedor Front End
● Entusiasta Python
● Se...
Sobre a apresentação
● Introdução
● Ideia e definição básica sobre machine learning
● Exemplo prático
● Regressão
● Classi...
O que é?
“Aprendizagem de máquina é um método de análise de
dados que automatiza a construção de modelos analíticos.
Usand...
Francis Galton
Vox Populi - 1907
? Kg
552kG
510kG
521kG
Francis Galton
Vox Populi - 1907
543,4 Kg
552kG
510kG
490kG
Média de 787 tickets547,4 Kg
Menos de 1% de erro!
Paper dispon...
Quanto mais experiência, mais próximo do acerto
543,4 Kg
552kG510kG
490kG
Dados baseado em experiência!
Criação de um Modelo
Simplificando
Dados
Simplificando
Dados de
aprendizado
Dados de
teste
Treinando o modelo
Dados de
aprendizado
400 Kg
Todas vaquinhas tem o valor de nosso
“prediction target”, que é o peso.
Imp...
Validação do modelo
Modelo
Dados
de teste
? Kg
Predição
501Kg
Escondemos o peso e fazemos que o
Modelo tente prever o valo...
Modelo Dados
de teste
501Kg
Predição
501Kg
Acerto *
Continua o processo
Validação do modelo (acerto)
* Dentro de uma marge...
Modelo Dados
de teste
510Kg
Predição
501Kg
Erro
Corrige o modelo e
continua o processo
Validação do modelo (erro)
“Aprenda...
Modelo Dados
de teste
510Kg
Predição
501Kg
Erro
Corrige o modelo e
continua o processo
Validação do modelo (erro)
“Aprenda...
Formalizando: Regressão
Formalizando: Regressão
Dados
yi` (Valor previsto)
yi (Valor real)
Função
gerada f(x)Resíduo/Erro
Feature
Target
Soma do quadrado residual (RSS)
yi` (Valor previsto)
yi (Valor real)
Resíduo/Erro
Target
Feature
E daí?
● O que queremos?
– Minimizar o erro → Min(RSS)
● Como fazermos?
– Derivando o RSS
Tendo que a derivada da soma res...
Outras técnicas de regressão
Polynomial RegressionKernel Regression
Classificação
Identificar elementos (rótular) baseado em features
?
Classificação
Identificar elementos (rótular) baseado em features
!
Wow!
Such precision!
So fast!
Very Pythonic!
Wow!
Classificação de texto (Tipo)
Artigo Centífico
Romance
Textão de Face
(mimimimi)
Classificação de texto (Análise de sentimento)
?
Quebrando o texto em palavras
bom incrível páia ruim
Treinando o modelo
bom
+1
incrível
+5
4 estrelas
(Texto marcado como bom)(se, fora, amanhã, depois, ...)
Treinando o modelo
(se, fora, amanhã, depois, ...)
páia
-3
ruim
-2
1 estrelas
(Texto marcado como ruim)
Testando o modelo
páia
-3
bom
+1
incrível
+5
Esse carro é bom.
É incrível como o consumo
dele é baixo! Só a direção que
ac...
Testando o modelo
páia
-3
bom
+1
incrível
+5
Esse carro é bom.
É incrível como o consumo
dele é baixo! Só a direção que
ac...
Testando o modelo (erro)
ruim
-2
Eu com esse carro? Pense em
uma vida ruim...
Pontuação total: -2 (Negativo)
5 estrelas
ER...
Testando o modelo (erro)
páia
-2
Eu com esse carro? Pense em
uma vida ruim...
Pontuação total: -2 (Negativo)
5 estrelas
ER...
Outras técnicas de classificação
● Decision Trees
● Clustering
● Deep learning
Ferramentas
Dúvidas
?
Upcoming SlideShare
Loading in …5
×

Introdução ao Machine Learning - XI Pylestras

494 views

Published on

Palestra introdutória sobre aprendizado de máquina (Machine Learning) para o XI Pylestras.

Published in: Technology
  • Login to see the comments

  • Be the first to like this

Introdução ao Machine Learning - XI Pylestras

  1. 1. Introdução ao Machine Learning
  2. 2. Quem sou? ● Rubens Pinheiro ● Bacharel em Ciências da Computação (UECE) ● Desenvolvedor Front End ● Entusiasta Python ● Sempre aprendendo!
  3. 3. Sobre a apresentação ● Introdução ● Ideia e definição básica sobre machine learning ● Exemplo prático ● Regressão ● Classificação ● Ferramentas ● Dúvidas
  4. 4. O que é? “Aprendizagem de máquina é um método de análise de dados que automatiza a construção de modelos analíticos. Usando algoritmos que iterativamente aprendem a partir de dados, o aprendizado de máquina permite que os computadores encontrem 'insights' ocultos sem ser explicitamente programados para onde olhar.” - SAS
  5. 5. Francis Galton Vox Populi - 1907 ? Kg 552kG 510kG 521kG
  6. 6. Francis Galton Vox Populi - 1907 543,4 Kg 552kG 510kG 490kG Média de 787 tickets547,4 Kg Menos de 1% de erro! Paper disponível em: http://galton.org/essays/1900-1911/galton-1907-vox-populi.pdf
  7. 7. Quanto mais experiência, mais próximo do acerto 543,4 Kg 552kG510kG 490kG Dados baseado em experiência!
  8. 8. Criação de um Modelo
  9. 9. Simplificando Dados
  10. 10. Simplificando Dados de aprendizado Dados de teste
  11. 11. Treinando o modelo Dados de aprendizado 400 Kg Todas vaquinhas tem o valor de nosso “prediction target”, que é o peso. Importante: Durante o treino são utilizados como referências, features dos “dados” (as vacas), como a raça da vaca, sua idade, se está prenha, além de outros aspectos que podem ser externos, como a época do ano ou o bioma local. Pode ser usado tudo que influencie no nosso target, o peso.
  12. 12. Validação do modelo Modelo Dados de teste ? Kg Predição 501Kg Escondemos o peso e fazemos que o Modelo tente prever o valor...
  13. 13. Modelo Dados de teste 501Kg Predição 501Kg Acerto * Continua o processo Validação do modelo (acerto) * Dentro de uma margem de erro definida
  14. 14. Modelo Dados de teste 510Kg Predição 501Kg Erro Corrige o modelo e continua o processo Validação do modelo (erro) “Aprenda com seus erros!”
  15. 15. Modelo Dados de teste 510Kg Predição 501Kg Erro Corrige o modelo e continua o processo Validação do modelo (erro) “Aprenda com seus erros!”
  16. 16. Formalizando: Regressão
  17. 17. Formalizando: Regressão Dados yi` (Valor previsto) yi (Valor real) Função gerada f(x)Resíduo/Erro Feature Target
  18. 18. Soma do quadrado residual (RSS) yi` (Valor previsto) yi (Valor real) Resíduo/Erro Target Feature
  19. 19. E daí? ● O que queremos? – Minimizar o erro → Min(RSS) ● Como fazermos? – Derivando o RSS Tendo que a derivada da soma residual dos quadrados ... … dará a função de previsão f(x)` = ax + b
  20. 20. Outras técnicas de regressão Polynomial RegressionKernel Regression
  21. 21. Classificação Identificar elementos (rótular) baseado em features ?
  22. 22. Classificação Identificar elementos (rótular) baseado em features ! Wow! Such precision! So fast! Very Pythonic! Wow!
  23. 23. Classificação de texto (Tipo) Artigo Centífico Romance Textão de Face (mimimimi)
  24. 24. Classificação de texto (Análise de sentimento) ?
  25. 25. Quebrando o texto em palavras bom incrível páia ruim
  26. 26. Treinando o modelo bom +1 incrível +5 4 estrelas (Texto marcado como bom)(se, fora, amanhã, depois, ...)
  27. 27. Treinando o modelo (se, fora, amanhã, depois, ...) páia -3 ruim -2 1 estrelas (Texto marcado como ruim)
  28. 28. Testando o modelo páia -3 bom +1 incrível +5 Esse carro é bom. É incrível como o consumo dele é baixo! Só a direção que achei páia. Pontuação total: +1 +5 -3 = +3 (Positivo) ? estrelas
  29. 29. Testando o modelo páia -3 bom +1 incrível +5 Esse carro é bom. É incrível como o consumo dele é baixo! Só a direção que achei páia. Pontuação total: +1 +5 -3 = +3 (Positivo) 4 estrelas ACERTO
  30. 30. Testando o modelo (erro) ruim -2 Eu com esse carro? Pense em uma vida ruim... Pontuação total: -2 (Negativo) 5 estrelas ERRO Corrige o modelo (Recalculo da pontuação das palavras)
  31. 31. Testando o modelo (erro) páia -2 Eu com esse carro? Pense em uma vida ruim... Pontuação total: -2 (Negativo) 5 estrelas ERRO
  32. 32. Outras técnicas de classificação ● Decision Trees ● Clustering ● Deep learning
  33. 33. Ferramentas
  34. 34. Dúvidas ?

×