Presentación Defensa

  • 81 views
Uploaded on

 

More in: Technology
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
    Be the first to like this
No Downloads

Views

Total Views
81
On Slideshare
0
From Embeds
0
Number of Embeds
0

Actions

Shares
Downloads
0
Comments
0
Likes
0

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n

Transcript

  • 1. Diseño y construcción deuna plataforma declasificación de texto basadaen textmining aplicada sobreuna red de blogs parapor CAMILO ALBERTO LÓPEZ ARAVENAbetazeta networks s.aPROFESORES GUÍA Y CO-GUÍA Sebastián Ríos, Jorge PérezCOMISIÓN Pablo Barceló, Carlos Rebeco
  • 2. 2 • 30
  • 3. Tanalyze r
  • 4. LA Empresa 4 • 30
  • 5. LA Empresa 4 • 30
  • 6. LA Empresa‣ Blogs 4 • 30
  • 7. LA Empresa‣ Blogs‣ 7,5 MILLONES 4 • 30
  • 8. 5 • 30
  • 9. Problemas 5 • 30
  • 10. Problemas‣ ¿qué estamos ofreciendo hoy? 5 • 30
  • 11. Problemas‣ ¿qué estamos ofreciendo hoy?‣ Contenido Generado por Usuarios! 5 • 30
  • 12. 6 • 30
  • 13. Solución y objetivos 6 • 30
  • 14. Solución y objetivos Apoyo al procesamiento de altos volúmenes de información mediante una plataforma de visualización y categorización de contenidos 6 • 30
  • 15. Solución y objetivos ‣ Entender Apoyo al procesamiento de altos volúmenes de información mediante una plataforma de visualización y categorización de contenidos 6 • 30
  • 16. Solución y objetivos ‣ Entender Apoyo al procesamiento de altos ‣ Seleccionar volúmenes de información mediante una plataforma de visualización y categorización de contenidos 6 • 30
  • 17. Solución y objetivos ‣ Entender Apoyo al procesamiento de altos ‣ Seleccionar volúmenes de información mediante una plataforma de visualización y ‣ definir categorización de contenidos 6 • 30
  • 18. Solución y objetivos ‣ Entender Apoyo al procesamiento de altos ‣ Seleccionar volúmenes de información mediante una plataforma de visualización y ‣ definir categorización de contenidos ‣ Construir 6 • 30
  • 19. Solución y objetivos ‣ Entender Apoyo al procesamiento de altos ‣ Seleccionar volúmenes de información mediante una plataforma de visualización y ‣ definir categorización de contenidos ‣ Construir ‣ Evaluar 6 • 30
  • 20. a continuación... 7 • 30
  • 21. a continuación...1. contexto teórico2. desarrollo3. demo4. Evaluación y resultadosexperimentales5. conclusiones y trabajo futuro 7 • 30
  • 22. 8 • 30
  • 23. un poco de contexto ‣ data mining 8 • 30
  • 24. un poco de contexto ‣ data mining 8 • 30
  • 25. un poco de contexto ‣ data mining ‣ text mining 8 • 30
  • 26. un poco de contexto ‣ data mining ‣ text mining ‣ topic modeling 8 • 30
  • 27. 9 • 30
  • 28. LDALATENT DIRICHLET ALLOCATION 9 • 30
  • 29. MO DE LO LDA GE NE R AT IVOLATENT DIRICHLET ALLOCATION 9 • 30
  • 30. 10 • 30
  • 31. medicinTecnología a 10 • 30
  • 32. medicinTecnología a 10 • 30
  • 33. medicinTecnología Google a internet computador byte 10 • 30
  • 34. medicinTecnología Google acerebro internet enfermedad computador paciente byte clínica 10 • 30
  • 35. Tecnología Google internet cerebro computador enfermedad byte paciente clínica 10 • 30
  • 36. Tecnología Google internet computador byte cerebro enfermedad paciente clínica 10 • 30
  • 37. Tecnología Google internet computador byte cerebro enfermedad paciente clínica 10 • 30
  • 38. Tecnología 10 • 30
  • 39. medicinTecnología a 10 • 30
  • 40. medicinTecnología a33% 66% 10 • 30
  • 41. medicinTecnología a33% 66%google clínica cerebro byte enfermedad paciente 10 • 30
  • 42. 11 • 30
  • 43. LD 2 11 • 30
  • 44. Tema 1 Tema 2 Google Google internet internetcomputador computador byte byte medicina medicina clínica clínica paciente LD 2 pacienteenfermedad enfermedad 11 • 30
  • 45. Tema 1 Tema 2 Google Google internet internetcomputador computador byte byte medicina medicina clínica clínica paciente LD 2 pacienteenfermedad enfermedad 11 • 30
  • 46. Tema 1 Tema 2 Google Google internet internetcomputador 10% 30% 75% 95% computador byte byte medicina 90% 70% 25% 5% medicina clínica clínica paciente LD 2 pacienteenfermedad enfermedad 11 • 30
  • 47. Desarrollo
  • 48. 13 • 30
  • 49. Consideraciones 13 • 30
  • 50. Consideraciones áéí 13 • 30
  • 51. Delta lda 14 • 30
  • 52. Tecnologías Pyth DJAN MySqGO on l Delta lda 14 • 30
  • 53. 15 • 30
  • 54. Arquitectura 15 • 30
  • 55. Arquitectura Tanalyzer 15 • 30
  • 56. Arquitectura Tanalyzer Django 15 • 30
  • 57. Arquitectura Tanalyzer Django Mysql 15 • 30
  • 58. Arquitectura Tanalyzer WebService Django Django Mysql 15 • 30
  • 59. Arquitectura Tanalyzer WebService Django Django Mysql 15 • 30
  • 60. Arquitectura Tanalyzer WebService Django Django Mysql interfaz web 15 • 30
  • 61. Tanalyzer Transforma Entrenamie Extracción ción nto y carga Clasificació Webservice Validación n aplicación web 16 • 30
  • 62. Tanalyzer Transforma Entrenamie Extracción ción nto y carga Clasificació Webservice Validación n aplicación web 16 • 30
  • 63. Tanalyzer Transforma Entrenamie Extracción ción nto y carga Clasificació Webservice Validación n aplicación web 16 • 30
  • 64. Tanalyzer Transforma Entrenamie Extracción ción nto y carga Clasificació Webservice Validación nBD aplicación web 16 • 30
  • 65. Tanalyzer Transforma Entrenamie Extracción ción nto y carga Clasificació Webservice Validación nBD aplicación web 16 • 30
  • 66. Tanalyzer Transforma Entrenamie Extracción ción nto y carga Clasificació Webservice Validación nBD aplicación web 16 • 30
  • 67. Tanalyzer Transforma Entrenamie Extracción ción nto y carga Clasificació Webservice Validación nBD aplicación web 16 • 30
  • 68. Tanalyzer Transforma Entrenamie Extracción ción nto y carga Clasificació Webservice Validación nBD aplicación web 16 • 30
  • 69. Tanalyzer Transforma Entrenamie Extracción ción nto y carga Clasificació Webservice Validación nBD aplicación web 16 • 30
  • 70. Tanalyzer Transforma Entrenamie Extracción ción nto y carga Clasificació Webservice Validación nBD aplicación web 16 • 30
  • 71. Demo 17 • 30
  • 72. 18 • 30
  • 73. Evaluación 18 • 30
  • 74. Evaluación ‣ precision 18 • 30
  • 75. Evaluación ‣ precision 18 • 30
  • 76. Evaluación ‣ precision 18 • 30
  • 77. Evaluación ‣ precision ‣ recall 18 • 30
  • 78. Evaluación ‣ precision ‣ recall 18 • 30
  • 79. Evaluación ‣ precision 2 ‣ recall 1 1 ‣ f-measure + precision recall 18 • 30
  • 80. Evaluación ‣ precision ‣ recall ‣ f-measure ‣ quality 18 • 30
  • 81. Evaluación ‣ precision ‣ recall hola tengo cuatro palabras ‣ f-measure ‣ quality 18 • 30
  • 82. Lorem ipsum dolor sit amet, consectetur adipiscing elit. Nam cursus fringilla mi vel posuere. Aenean imperdiet turpis at lectus rutrum nec elementum diam imperdiet. Nullam consectetur interdum libero sit amet congue. Quisque lacinia est non neque scelerisque suscipit. Lorem ipsum dolor sit amet, consectetur adipiscing elit. Nam id lectus nunc, quis fermentum nisl. Pellentesque non nulla nec sapien volutpat mattis ac euismod metus. Pellentesque habitant morbi tristique senectus et netus et malesuada fames ac turpis egestas. Ut malesuada lorem bibendum mauris accumsan sodales. Phasellus tempus porttitor ante, euEvaluación pulvinar felis cursus eget. Duis massa odio, tincidunt in consequat vel, rutrum eu nibh. Duis a egestas velit. Nunc vel ipsum purus. In tempus pharetra ornare. Sed lobortis nulla at ipsum commodo eu varius dolor vulputate. Class aptent taciti sociosqu ad litora torquent per conubia nostra, per inceptos himenaeos. Integer sit amet purus ut elit varius molestie vel eget risus. Aenean sit amet urna id ligula scelerisque consequat. Etiam sed leo metus. Pellentesque habitant morbi tristique senectus et netus et malesuada fames ac turpis egestas. Etiam diam neque, cursus vitae viverra ut, malesuada ac augue. ‣ precision Etiam sapien orci, venenatis et rhoncus et, venenatis at metus. Sed iaculis sollicitudin tortor vel pulvinar. Nullam rutrum vehicula ligula eget congue. Suspendisse erat purus, euismod at mattis non, tincidunt in metus. ‣ recall Cras magna est, lacinia non euismod ut, placerat in odio. Cras sed risus et sem egestas volutpat. Integer ac malesuada lectus. Ut ac arcu quam, in volutpat urna. Nulla ac tristique nibh. Praesent non erat vel est aliquam mollis ut vitae purus. Curabitur nibh nulla, varius sed egestas pellentesque, egestas quis lorem. Donec euismod, lorem ac eleifend gravida, nibh arcu rhoncus tellus, id ‣ f-measure aliquam urna neque ut mi. Nullam posuere viverra tortor, id varius odio tristique et. Vestibulum sed mi lectus. In hac habitasse platea dictumst. Pellentesque habitant morbi tristique senectus et netus et malesuada fames ac turpis egestas. ‣ quality Donec lacinia felis a sem suscipit luctus. Suspendisse iaculis, purus sit amet adipiscing luctus, nulla est luctus purus, eu auctor mauris mauris volutpat dui. Nam iaculis ullamcorper odio et elementum. Proin porttitor dolor quis lectus laoreet quis tempor urna blandit. Proin vitae metus faucibus turpis tincidunt malesuada in id leo. Donec urna nunc, molestie eget malesuada nec, viverra a mauris. Etiam consectetur felis elit. Cras vitae semper metus. In ac libero aliquam justo euismod fringilla id tempus nulla. Aliquam sit amet quam id velit tempor dignissim. Vivamus faucibus ultrices posuere. Aliquam dolor urna, ullamcorper ac facilisis non, rutrum elementum erat. Sed arcu tortor, tempor gravida molestie id, tempor nec ante. Mauris sodales tempus tellus, ac faucibus purus rhoncus nec. Donec auctor lacus in risus volutpat a mattis massa congue. Nulla facilisi. Nulla diam nibh, vestibulum nec tristique et, iaculis eget est. Phasellus consequat lectus ac velit auctor interdum. Praesent sem metus, imperdiet non suscipit ac, vehicula a felis. Donec scelerisque felis non lacus cursus aliquet. Vestibulum ante ipsum primis in faucibus orci luctus et ultrices posuere cubilia Curae; Praesent sagittis massa a orci consequat condimentum. Nullam dapibus vehicula lectus, id gravida justo volutpat non. Curabitur sit amet nulla eu magna aliquet adipiscing. Praesent 18 • 30 hendrerit pulvinar congue.
  • 83. Evaluación ‣ precision ‣ recall ‣ f-measure Puntaje ‣ quality Palabras 18 • 30
  • 84. Evaluación ‣ precision ‣ recall menos topicos ‣ f-measure ‣ quality menos palabras ‣ alpha ‣ Beta 18 • 30
  • 85. Evaluación cerebro ‣ precision enfermedad ‣ recall paciente ‣ f-measure clínica ‣ quality byte ‣ alpha ‣ Beta 18 • 30
  • 86. Resultados
  • 87. 8 BLOGS 8 temas1600 artículos 20 • 30
  • 88. F4Measure&respecto&a&Alpha& 0,9000$ 0,8000$ 0,7000$ 0,6000$ Alpha$0,5$Valor& 0,5000$ Alpha$0,4$ Alpha$0,3$ 0,4000$ Alpha$0,1$ 0,3000$ Alpha$0,09$ 0,2000$ 0,1000$ 1$ 2$ 3$ 4$ 5$ 6$ 7$ 8$ 9$ 10$11$12$13$14$15$16$17$18$19$20$21$22$23$24$25$26$27$28$29$30$31$32$33$34$ Tolerancia&sobre&distribución&porcentual&de&topics& 21 • 30
  • 89. F4Measure&respecto&a&Beta& 0,9000$ 0,8000$ 0,7000$ 0,6000$ Beta$2$ Beta$1$Valor& 0,5000$ Beta$0,9$ 0,4000$ Beta$0,7$ 0,3000$ Beta$0,5$ Beta$0,4$ 0,2000$ 0,1000$ 1$ 2$ 3$ 4$ 5$ 6$ 7$ 8$ 9$ 10$11$12$13$14$15$16$17$18$19$20$21$22$23$24$25$26$27$28$29$30$31$32$33$34$ Tolerancia&sobre&distribución&porcentual&de&topics& 22 • 30
  • 90. Medidas&respecto&a&Quality& 1,2" 1" 0,8"Valor& 0,6" 0,4" 0,2" 0" 0" 1" 2" 3" 4" 5" 6" 7" 8" 9" 10" 11" 12" 13" 14" 15" 16" 17" 18" 19" Tolerancia&sobre&quality& Precision" Recall" F9Measure" %"documentos"analizados" 23 • 30
  • 91. 1 BLOG 15 temas120 artículos 24 • 30
  • 92. Análisis&de&clasificación&manual&de&topicos&para& FayerWayer& 1,2" 1" 0,8"Valor& 0,6" 0,4" 0,2" 0" 1" 2" 3" 4" 5" 6" 7" 8" 9" 10" 11" 12" 13" 14" 15" 16" 17" 18" 19" 20" 21" 22" 23" 24" 25" 26" 27" 28" 29" 30" 31" 32" 33" 34" Tolerancia&sobre&distribución&porcentual&de&topics& Precision" Recall" F9Measure" 25 • 30
  • 93. 26 • 30
  • 94. Conclusiones 26 • 30
  • 95. Conclusiones ‣ factibilidad 26 • 30
  • 96. Conclusiones ‣ factibilidad ‣ Visualización 26 • 30
  • 97. Conclusiones ‣ factibilidad ‣ Visualización ‣ Exactitud 26 • 30
  • 98. Conclusiones ‣ factibilidad ‣ Visualización ‣ Exactitud ‣ objetivos 26 • 30
  • 99. Conclusiones ‣ entender ‣ factibilidad ‣ Visualización ‣ Exactitud ‣ objetivos 26 • 30
  • 100. Conclusiones ‣ entender ‣ factibilidad ‣ seleccionar ‣ Visualización ‣ Exactitud ‣ objetivos 26 • 30
  • 101. Conclusiones ‣ entender ‣ factibilidad ‣ seleccionar ‣ Visualización ‣ definir ‣ Exactitud ‣ objetivos 26 • 30
  • 102. Conclusiones ‣ entender ‣ factibilidad ‣ seleccionar ‣ Visualización ‣ definir ‣ Exactitud ‣ construir ‣ objetivos 26 • 30
  • 103. Conclusiones ‣ entender ‣ factibilidad ‣ seleccionar ‣ Visualización ‣ definir ‣ Exactitud ‣ construir ‣ objetivos ‣ evaluar 26 • 30
  • 104. 27 • 30
  • 105. Trabajo futuro 27 • 30
  • 106. Trabajo futuro ‣ otros modelos 27 • 30
  • 107. Trabajo futuro ‣ otros modelos ‣ funcionalidad 27 • 30
  • 108. Trabajo futuro ‣ otros modelos ‣ funcionalidad ‣ velocidad 27 • 30
  • 109. Trabajo futuro ‣ otros modelos ‣ funcionalidad ‣ velocidad ‣ mejorar exactitud 27 • 30
  • 110. MUCHASGRACIAS¿ PREGUNTAS ?