Introducao a inteligencia artificial na educacao

990 views
901 views

Published on

Published in: Education
2 Comments
4 Likes
Statistics
Notes
No Downloads
Views
Total views
990
On SlideShare
0
From Embeds
0
Number of Embeds
5
Actions
Shares
0
Downloads
25
Comments
2
Likes
4
Embeds 0
No embeds

No notes for slide

Introducao a inteligencia artificial na educacao

  1. 1. Uma introdução a Machine Learning Guilherme Silveira http://www.caelum.com.br
  2. 2. Uma introdução a Machine Learning Guilherme Silveira http://www.alura.com.br
  3. 3. a idéia problemas perguntas soluções respostas
  4. 4. quem sou eu
  5. 5. casa ==> caelum
  6. 6. decidi ir de carro <== piada
  7. 7. pego o carro...
  8. 8. de camarote de camarote
  9. 9. decidi ir de metrô
  10. 10. quem conhece são paulo? são paulo? quem conhece o metrôem são paulo?
  11. 11. Problema? vista interna
  12. 12. além do trânsito minha vida pessoal
  13. 13. mudança
  14. 14. o preço dos imóveis está caro? Tamanho Preço 100 750000 200 860000 150 977000 140 81900 160 984000 180 1127000 130 638000 80 647000 40 346000
  15. 15. p: qual um preço justo para esse imóvel?
  16. 16. está caro?
  17. 17. regressão linear f(x) = ax + b
  18. 18. planilha preço = 5053x + 57758preço = 5053x + 57758
  19. 19. regressão linear f(x) = ax + b polinômios f(x) = a + bx + cx^2 + ... + dx^n preço = a + ... + dx^npreço = a + ... + dx^n
  20. 20. p: como estimar o valor de algo? possível resposta: regressão possível resposta: regressão p: quanto tempo os alunos precisarão para essa prova? p: qual a nota que o aluno vai tirar na prova final? p: qual será a nota do hipólito na próxima olimpíada?
  21. 21. simplicidade++ bizarro-- bizarro--
  22. 22. função Brad Pitt (a função perfeita?)
  23. 23. e o número de dormitórios? Tamanho Preço 100 750000 200 860000 150 977000 140 81900 160 984000 180 1127000 130 638000 80 647000 40 346000
  24. 24. e o número de dormitórios? Tamanho Dormitório Preço 100 2 750000 200 3 860000 150 4 977000 140 3 81900 160 3 984000 180 4 1127000 130 3 638000 80 3 647000 40 1 346000
  25. 25. bibliotecas http://math.nist.gov/javanumerics/jama/ http://mahout.apache.org/ http://commons.apache.org/math/ google: language + regression
  26. 26. chego no trabalho
  27. 27. abro os emails
  28. 28. p: classificação É spamzis!É spamzis! Não é!Não é! 11 00
  29. 29. treino!
  30. 30. valido!
  31. 31. p: ele é 1? acredito que sim, comacredito que sim, com chance de 78%chance de 78%
  32. 32. classificação humana lista com 1000 itens treino da máquina valida a qualidade 99% de acerto99% de acerto
  33. 33. p: ele é 1? chance de x%chance de x% r: regressão logística
  34. 34. p: o email é spam? p: qual a chance do aluno acertar esse exercício? p: o aluno está com dificuldade? p: o aluno domina o conteúdo? p: qual a chance de essa imagem ser o número 3? ou 8? p: qual a chance de essa imagem ser um cancêr?
  35. 35. nota: simplificações desses problemas
  36. 36. e o cartão de credito?
  37. 37. você gastou 50 dia 30 loja 15 loja 15 loja 15
  38. 38. você gastou 30 dia 30 loja 17 loja 17 loja 17
  39. 39. você gastou 25 dia 30 loja 21 loja 21 loja 21
  40. 40. você gastou 25 dia 30 loja 21 loja 21 loja 21
  41. 41. você gastou 2500 dia 30 loja 7 loja 7 loja 7
  42. 42. dia valor loja 30 30 15 30 35 17 30 100 8 1 37 9 30 2500 7
  43. 43. dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1
  44. 44. dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 treina 37% de acerto37% de acerto valida eu continuoeu continuo roubandoroubando
  45. 45. regressão logística é, em geral, linear ou lerdíssima regularização polinômios outras
  46. 46. dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 87% de acerto87% de acerto treina treina treina treina treina treina dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 o seu telefone tocao seu telefone toca
  47. 47. p: o email é spam? p: essa movimentação é uma fraude? p: qualquer pergunta sim/não como antes? http://neuroph.sourceforge.net/
  48. 48. acesso o “banco.caelum.com.br”
  49. 49. dia valor loja 30 30 MAX PAD 30 35 MUNI TR 30 149 CAELUM 1 499 FACULDADE 30 5 BUTECO o que é isso?o que é isso? o que é isso?o que é isso? alimentaçãoalimentação profissionalprofissional profissionalprofissional
  50. 50. p: a movimentação 15 é?
  51. 51. p: a movimentação 15 é entretenimento ou não? (0 ou 1) p: a movimentação 15 é alimentação ou não? (0 ou 1) p: a movimentação 15 é profissional ou não? (0 ou 1)
  52. 52. dia valor loja categoria 30 30 MAX PAD alimentação 30 35 MUNI TR transporte 30 149 CAELUM profissional 1 499 FACULDADE profissional 30 5 BUTECO alimentação onde estão osonde estão os 0 e 1?0 e 1?
  53. 53. dia valor loja categoria 30 30 MAX PAD 0 30 35 MUNI TR 1 30 149 CAELUM 2 1 499 FACULDADE 2 30 5 BUTECO 0 é 0, 1 ou 2?é 0, 1 ou 2?
  54. 54. dia valor loja categoria 30 30 MAX PAD é 30 35 MUNI TR resto 30 149 CAELUM resto 1 499 FACULDADE é 30 5 BUTECO resto é 0 ou o resto?é 0 ou o resto? 77%77%
  55. 55. dia valor loja categoria 30 30 MAX PAD resto 30 35 MUNI TR é 30 149 CAELUM resto 1 499 FACULDADE resto 30 5 BUTECO é é 1 ou o resto?é 1 ou o resto? 53%53%
  56. 56. dia valor loja categoria 30 30 MAX PAD resto 30 35 MUNI TR resto 30 149 CAELUM é 1 499 FACULDADE é 30 5 BUTECO resto é 2 ou o resto?é 2 ou o resto? 64%64%
  57. 57. dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 1 30 2500 7 0 dia valor loja label 30 30 15 0 30 35 17 1 30 100 8 1 1 37 9 0 30 2500 7 0 dia valor loja label 30 30 15 1 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 77%77% entretenimento alimentação profissional treina você ficou esperando o outro robô aparecer né? 53%53% 64%64% entretenimentoentretenimento
  58. 58. One vs All
  59. 59. p: dentre as categorias A,B,C a qual categoria ele pertence? p: o aluno está motivado, desanimado, desiludido, decepcionado, contente ou malandrão?
  60. 60. o aluno não terminou :(
  61. 61. será que eu poderia ter ajudado ele?
  62. 62. qto tempo em cada exercício? alunos = []alunos << [12, 150, 3, 15]alunos << [4, 170, 32, 25]alunos << [1, 10, 3, 25]alunos << [12, 20, 31, 15]
  63. 63. se ele termina o curso em 3 meses ou não labels = [1, 1, 0, 0] alunos = []alunos << [12, 150, 3, 15]alunos << [4, 170, 32, 25]alunos << [1, 10, 3, 25]alunos << [12, 20, 31, 15]
  64. 64. treina
  65. 65. e o guilherme? guilherme = [6, 140, 25, 10] model.predict(Node.features(guilherme))
  66. 66. adivinhe!
  67. 67. SVM
  68. 68. dados fake labels = [1, 1, 0, 0] alunos = []alunos << [12, 150, 3, 15]alunos << [4, 170, 32, 25]alunos << [1, 10, 3, 25]alunos << [12, 20, 31, 15]
  69. 69. dados reais
  70. 70. dados reais C utilizado ACERTOS NO TREINO PREVISOES COM ACE 0.08 93.18% 85.71% C utilizado ACERTOS NO TREINO PREVISOES 0.001 70.45454545454545 61.9047619 0.04 88.63636363636364 71.4285714 0.08 93.18181818181819 85.7142857 0.2 100.0 100.0
  71. 71. SVM para classificar (0,1, ...)
  72. 72. p: dentre as categorias A,B,C a qual categoria ele pertence? p: o aluno vai desistir do curso? p: essa pessoa tem perfil de terrorista?
  73. 73. grupos de alunos
  74. 74. dificuldade != facilidade user id 15 ?? user id 17 user id 15 ?==? user id 17 333784321236738126783 ?==? 1238793923832178612397
  75. 75. características em comum número de respostas erradas tempo gasto número de exercícios feitos feedbacks dados notas de feedback recebidos likes cursos quantidade de caracteres altura???
  76. 76. joga no plano
  77. 77. olha eles aqui!
  78. 78. chuta um ponto X X
  79. 79. genial X X
  80. 80. melhora X X X X
  81. 81. e melhora... e melhora... e melhora... e melhora... e melhora... e melhora... e melhora...
  82. 82. esses são os grupos
  83. 83. grupos esperados: muitas perguntas, muitos erros poucos erros, poucas perguntas poucos erros, poucas perguntas, ajuda bastante X X X
  84. 84. grupos encontrados: muitas perguntas, poucos erros muitos erros, poucas perguntas muitos erros, poucas perguntas, ajuda bastante entre outros
  85. 85. p: como meus _____ se agrupam? p: como os alunos se comportam? p: como os instrutores se comportam? p: como os exercícios se comportam?
  86. 86. p: como meus clientes se agrupam? p: como meus produtos se agrupam? p: como minhas features se agrupam? p: como os clientes usam o sistema?
  87. 87. resumindo
  88. 88. machine learning regressão linear classificadores redes neurais logistic k-cluster
  89. 89. complexidade deles ricminer.org.br
  90. 90. não dirija
  91. 91. se beber não dirija
  92. 92. eu quero beber e ler eu não quero dirigir
  93. 93. detectando... margem de erromargem de erro
  94. 94. o que você quer saber sobre um cliente? sobre um cliente? o que o cliente quer saber sobre ele mesmo? como os clientes se agrupam? como seus itens se agrupam? quando o cliente fará algo?
  95. 95. nós respondemos 2 levante as suas
  96. 96. obrigado 1 guilherme.silveira@caelum.com.br @guilhermecaelum http://www.alura.com.br

×