Weka

8,082 views

Published on

Weka

  1. 1. Programa Open Source WEKA<br /><ul><li>Introducción.
  2. 2. Instalación del WEKA.
  3. 3. Uso del WEKA.
  4. 4. Repositorios del WEKA.</li></ul>Elaborado por: Jean Sánchez<br />
  5. 5. Introducción<br />El sistema WEKA (WaikatoEnvironmentforKnowledgeAnalysis) fue desarrollado en la Universidad de Waikato en Nueva Zelanda. Está bajo licencia GNU implementado en Java y ha sido probado en Windows, Linux y Macintosh.<br />Implementa algoritmos de minería de datos que pueden aplicarse a bases de datos desde su línea de comando o bien desde su interfaz gráfica.<br />Este sistema incluye una variedad de herramientas para transformar conjuntos de datos.<br />Permite realizar preprocesamientos de datos para transformarlos en un esquema de aprendizaje, a fin de que sus resultados puedan ser analizados. WEKA permite aplicar un método de aprendizaje a conjuntos de datos y analizar los resultados para extraer información. Otra forma es aplicar varios métodos de aprendizaje y comparar sus resultados en orden de escoger una predicción. Estos métodos son llamados clasificadores.<br />La implementación de los esquemas de aprendizaje son los recursos más valiosos de WEKA. Las herramientas para el preprocesamiento de datos, llamados filtros, WEKA centra su atención en los algoritmos de clasificación y filtro, sin embargo, también incluye la implementación de algoritmos para el aprendizaje de reglas de asociación y el agrupamiento de datos (clustering).<br />
  6. 6. Instalación de WEKA<br />Descargar desde la página web de la Universidad de Waikato http://www.cs.waikato.ac.nz/ml/weka/<br />Permitirá la instalación de la máquina virtual java.<br />Comenzará la instalación automática del programa.<br />Se mostraran las ventanas que se muestran a continuación<br />
  7. 7. Instalación de WEKA<br />Se mostrará la siguiente ventana<br />Pulsa siguiente<br />
  8. 8. Instalación de WEKA<br />Se mostrará la siguiente ventana<br />Pulsa Estoy de Acuerdo<br />
  9. 9. Instalación de WEKA<br />Se mostrará la siguiente ventana<br />Pulsa siguiente<br />
  10. 10. Instalación de WEKA<br />Se mostrará la siguiente ventana<br />Pulsa siguiente<br />
  11. 11. Instalación de WEKA<br />Se mostrará la siguiente ventana<br />Pulsa Instalar<br />
  12. 12. Instalación de WEKA<br />Se mostrará la siguiente ventana<br />Pulsa siguiente<br />
  13. 13. Instalación de WEKA<br />Se mostrará la siguiente ventana<br />Pulsa Finalizar<br />
  14. 14. Uso del WEKA<br />La pantalla principal del WEKA se muestra a continuación:<br />
  15. 15. Uso del WEKA<br />Se muestran las 4 opciones posibles interfaces de trabajo con WEKA<br />Explorer: es la opción que permite ejecutar los algoritmos de análisis y comparar resultados sobre un único conjunto de datos. <br />Experimenter: es la opción que permite definir experimentos complejos y almacenar resultados.<br />KnowledgeFlow: es la opción que permite llevar a cabo las mismas operaciones que Experimenter pero representado como un grafo dirigido.<br />Simple Cli: es “Command-Line Interfaz” es una ventana de comandos java para ejecutar las clases WEKA.<br />
  16. 16. Uso del WEKA<br />Explorer:<br />Como se observa con seis subentornos de ejecución:<br />Preprocess: permite el uso de las herramientas y filtros para cargar y manipular los datos.<br />Classification: permite el acceso a las técnicas de clasificación y regresión.<br />Cluster: permite integrar varios métodos de agrupamiento.<br />Associate: permite incluir las reglas de asociación.<br />SelectAttributes: permite aplicar las técnicas de reducción de atributos.<br />Visualize: permite visualizar el comportamiento de los datos.<br />
  17. 17. Uso del WEKA<br />Explorer: Preprocesamiento de Datos.<br /><ul><li>Se pueden importar datos en varios formatos: ARFF, CVS, C.45, binarios.
  18. 18. Los datos pueden provenir desde un URL o de una base de datos (usando JDBC).
  19. 19. Herramientas de preprocesado: Filters.
  20. 20. Filtros para: discretización, normalización, selección de atributos, ...</li></li></ul><li>Uso del WEKA<br />Explorer:<br />Las flores de las plantas Iris (liliáceas) se clasifican a base de las dimensiones de sus pétalos y sépalos<br />Es un problema académico planteado por Fisher en 1936, que consta de las mediciones de 150 ejemplares de tres subclases: Setosa, Versicolor, Virginica.<br />
  21. 21. Uso del WEKA<br />Explorer:<br />Los datos son introducidos como archivos ARFF los cuales poseen las siguientes características:<br />Cabecera con el nombre de la relación:<br />iris<br />@RELATION iris<br />@ATTRIBUTE sepallength REAL<br />@ATTRIBUTE sepalwidth REAL<br />@ATTRIBUTE petallength REAL<br />@ATTRIBUTE petalwidth REAL<br />@ATTRIBUTE class {Iris-setosa,Iris-versicolor,Iris-virginica}<br />@DATA<br />5.1,3.5,1.4,0.2,Iris-setosa<br />4.9,3.0,1.4,0.2,Iris-setosa<br />…<br />5.2,2.7,3.9,1.4,Iris-versicolor<br />5.0,2.0,3.5,1.0,Iris-versicolor<br />…<br />7.2,3.6,6.1,2.5,Iris-virginica<br />6.5,3.2,1.4,2.0,Iris-virginica<br />Declaración de atributos:<br />{a1,a2,..,an} enumerado<br />REAL numérico<br />Conjunto de datos:<br />150 instancias.<br />Ordenadas de 50 en 50.<br />
  22. 22. Uso del WEKA<br />Explorer: Preprocess<br />Pulse para abrir archivo<br />
  23. 23. Uso del WEKA<br />Explorer: Preprocess<br />Pulse para abrir archivo seleccionado<br />
  24. 24. Uso del WEKA<br />Explorer: Preprocess<br />
  25. 25. Uso del WEKA<br />Explorer: Preprocess<br />Pulse sobre el atributo class<br />
  26. 26. Uso del WEKA<br />Explorer: Preprocess<br />Pulse sobre la opción Visualiza todo<br />
  27. 27. Uso del WEKA<br />Explorer: Preprocess<br />Como se observa los cinco atributos de las plantas Iris:<br />sepallenght: longitud del sépalo.<br />sepalwidth: anchura del sépalo.<br />petallenght: longitud del pétalo.<br />petalwidth: anchura del pétalo.<br />class: especies que componen la planta Iris.<br />
  28. 28. Uso del WEKA<br />Explorer: Preprocess<br />Pulse sobre el atributo petalwidth<br />
  29. 29. Uso del WEKA<br />Explorer: Preprocess<br />Pulse sobre la opción Elegir<br />
  30. 30. Uso del WEKA<br />Explorer: Preprocess<br />Pulse sobre la opción de la herramienta de preprocesamineto no supervisada<br />
  31. 31. Uso del WEKA<br />Explorer: Preprocess<br />Pulse sobre la opción de la herramienta de preprocesamineto no supervisada para el tratamiento de los atributos<br />
  32. 32. Uso del WEKA<br />Explorer: Preprocess<br />Pulse sobre la opción de filtros<br />
  33. 33. Uso del WEKA<br />Explorer: Preprocess<br />Marca sobre la opciones filtros que considere necesarias y pulsa Esta bien<br />
  34. 34. Uso del WEKA<br />Explorer: Preprocess<br />Pulse sobre la opción de la herramienta de preprocesamineto no supervisada para el tratamiento de los atributos escogiendo Discretizar<br />
  35. 35. Uso del WEKA<br />Explorer: Preprocess<br />Pulse sobre la opción aplicar<br />
  36. 36. Uso del WEKA<br />Explorer: Preprocess<br />
  37. 37. Uso del WEKA<br />Explorer: Preprocess<br />Usaremos ahora de la herramienta de preprocesamineto no supervisada para el tratamiento de los atributos escogiendo Discretizar las opciones que posee pulsando sobre el<br />
  38. 38. Uso del WEKA<br />Explorer: Preprocess<br />Colocar en verdadero para hacer iguales el número de las frecuencias. Se puede también modificar cualquiera de las opciones a nuestra conveniencia<br />
  39. 39. Uso del WEKA<br />Explorer: Preprocess<br />En la sección Acerca de se muestra la información sobre la herramienta de Preprocesamiento utilizada.<br />Pulsar sobre la opción esta bien<br />
  40. 40. Uso del WEKA<br />Explorer: Preprocess<br />Pulse sobre la opción aplicar<br />
  41. 41. Uso del WEKA<br />Explorer: Preprocess<br />
  42. 42. Uso del WEKA<br />Explorer: Classify<br />WEKA ofrece cuatro opciones en el Test options:<br />Use trainig set: la muestra es usada para entrenar y probar al mismo tiempo. Los resultados obtenidos no corresponden con la realidad.<br />Supplied test set: los atributos de los datos son escritos en un nuevo archivo de formato ARFF sobre el cual se efectuará la clasificación.<br />Cross-validation: permite dividir la muestra en k partes, sobre estas se procede a entrenar el clasificador con las k-1 partes y evaluar con la parte k actual.<br />Percentagesplit: indica el porcentaje de la muestra que empleara para probar el clasificador.<br />
  43. 43. Uso del WEKA<br />Explorer: Classify<br />Pulsar sobre la opción Elegir<br />
  44. 44. Uso del WEKA<br />Explorer: Classify<br />WEKA ofrece ocho opciones para clasificar:<br />Bayes: métodos basados en el aprendizaje de Bayes.<br />Functions: métodos matemáticos.<br />Lazy: métodos basados en el aprendizaje del perezoso.<br />Meta: métodos que resultan de la combinación de diferentes métodos de aprendizaje.<br />Mi: métodos que aprenden mediante la variación de la densidad de los algoritmos.<br />Misc: métodos que aprenden como si leyeran los datos.<br />Trees: métodos que aprenden mediante arboles de decisión.<br />Rules: métodos que aprenden y esto se puede expresar como reglas.<br />
  45. 45. Uso del WEKA<br />Explorer: Classify (bayes)<br />Pulsar sobre la de filtros<br />
  46. 46. Uso del WEKA<br />Explorer: Classify (bayes)<br />Marca sobre la opciones filtros que considere necesarios y pulsa Esta bien<br />
  47. 47. Uso del WEKA<br />Explorer: Classify (bayes)<br />Pulsar sobre NaiveBayes para que se muestren las opciones que este posee<br />
  48. 48. Uso del WEKA<br />Explorer: Classify (bayes)<br />En la sección Acerca de se muestra la información sobre la herramienta de Clasificación utilizada.<br />Pulsa Esta bien luego de realizar las modificaciones en las opciones de ser necesario.<br />
  49. 49. Uso del WEKA<br />Explorer: Classify (bayes)<br />Pulsar sobre Más opciones con lo cual se desplegara un menú emergente<br />
  50. 50. Uso del WEKA<br />Explorer: Classify (bayes)<br />Pulsa Esta bien luego de realizar las modificaciones en las opciones de ser necesario.<br />
  51. 51. Uso del WEKA<br />Explorer: Classify (bayes)<br />Pulsa sobre Comienzo para que el algoritmo empiece a ejecutarse<br />
  52. 52. Uso del WEKA<br />Explorer: Classify (bayes)<br />Se muestra el resultado del algoritmo, deberás pulsar sobre la ventana deslizante hasta llegar al final de la misma<br />
  53. 53. Uso del WEKA<br />Explorer: Classify (bayes)<br />Se muestra el resultado del algoritmo, deberás pulsar sobre la ventana deslizante hasta llegar al final de la misma<br />
  54. 54. Uso del WEKA<br />Explorer: Classify (bayes)<br />Se muestra el resultado del algoritmo<br />
  55. 55. Uso del WEKA<br />Explorer: Classify (bayes)<br />Pulsando botón contrario del ratón se desplegara la siguiente ventana emergente<br />
  56. 56. Uso del WEKA<br />Explorer: Classify (bayes)<br />Pulsa sobre la opción visualizar los errores clasificados<br />
  57. 57. Uso del WEKA<br />Explorer: Classify (bayes)<br />Pulsa sobre X para cerrar la ventana emergente<br />
  58. 58. Uso del WEKA<br />Explorer: Classify (bayes)<br />Pulsa sobre la opción visualizar la curva marginal<br />
  59. 59. Uso del WEKA<br />Explorer: Classify (bayes)<br />Pulsa sobre X para cerrar la ventana emergente<br />
  60. 60. Uso del WEKA<br />Explorer: Classify (bayes)<br />Pulsa sobre la opción visualizar el umbral de la curva<br />
  61. 61. Uso del WEKA<br />Explorer: Classify (bayes)<br />Pulsa sobre X para cerrar la ventana emergente<br />
  62. 62. Uso del WEKA<br />Explorer: Classify (bayes)<br />Pulsa sobre la opción visualizar la curva de costos<br />
  63. 63. Uso del WEKA<br />Explorer: Classify (bayes)<br />Pulsa sobre X para cerrar la ventana emergente<br />
  64. 64. Uso del WEKA<br />Explorer: Classify (trees)<br />Pulsar sobre la opción Arboles de decisión<br />
  65. 65. Uso del WEKA<br />Explorer: Classify (trees)<br />Pulsar sobre la opción J48 que usa el algoritmo C4.5<br />
  66. 66. Uso del WEKA<br />Explorer: Classify (trees)<br />Pulsar sobre la de filtros<br />
  67. 67. Uso del WEKA<br />Explorer: Classify (trees)<br />Marca sobre la opciones filtros que considere necesarias y pulsa Esta bien<br />
  68. 68. Uso del WEKA<br />Explorer: Classify (trees)<br />Pulsar sobre J48 para que se muestren las opciones que este posee<br />
  69. 69. Uso del WEKA<br />Explorer: Classify (trees)<br />En la sección Acerca de se muestra la información sobre la herramienta de Clasificación utilizada.<br />Pulsa Esta bien luego de realizar las modificaciones en las opciones de ser necesario.<br />
  70. 70. Uso del WEKA<br />Explorer: Classify (trees)<br />Pulsar sobre Más opciones con lo cual se desplegara un menú emergente<br />
  71. 71. Uso del WEKA<br />Explorer: Classify (trees)<br />Pulsa Esta bien luego de realizar las modificaciones en las opciones de ser necesario.<br />
  72. 72. Uso del WEKA<br />Explorer: Classify (trees)<br />Pulsa sobre Comienzo para que el algoritmo empiece a ejecutarse<br />
  73. 73. Uso del WEKA<br />Explorer: Classify (trees)<br />Se muestra el resultado del algoritmo, deberás pulsar sobre la ventana deslizante hasta llegar al final de la misma<br />
  74. 74. Uso del WEKA<br />Explorer: Classify (trees)<br />Se muestra el resultado del algoritmo, deberás pulsar sobre la ventana deslizante hasta llegar al final de la misma<br />
  75. 75. Uso del WEKA<br />Explorer: Classify (trees)<br />Se muestra el resultado del algoritmo<br />
  76. 76. Uso del WEKA<br />Explorer: Classify (trees)<br />Pulsando botón contrario del ratón se desplegara la siguiente ventana emergente<br />
  77. 77. Uso del WEKA<br />Explorer: Classify (trees)<br />Pulsa sobre la opción visualizar Árbol de Decisión<br />
  78. 78. Uso del WEKA<br />Explorer: Classify (trees)<br />Pulsa sobre X para cerrar la ventana emergente<br />
  79. 79. Uso del WEKA<br />Explorer: Classify (trees)<br />Pulsa sobre la opción visualizar los errores clasificados<br />
  80. 80. Uso del WEKA<br />Explorer: Classify (trees)<br />Pulsa sobre X para cerrar la ventana emergente<br />
  81. 81. Uso del WEKA<br />Explorer: Classify (trees)<br />Pulsa sobre la opción visualizar la curva marginal<br />
  82. 82. Uso del WEKA<br />Explorer: Classify (trees)<br />Pulsa sobre X para cerrar la ventana emergente<br />
  83. 83. Uso del WEKA<br />Explorer: Classify (trees)<br />Pulsa sobre la opción visualizar el umbral de la curva<br />
  84. 84. Uso del WEKA<br />Explorer: Classify (trees)<br />Pulsa sobre X para cerrar la ventana emergente<br />
  85. 85. Uso del WEKA<br />Explorer: Classify (trees)<br />Pulsa sobre la opción visualizar la curva de costos<br />
  86. 86. Uso del WEKA<br />Explorer: Classify (trees)<br />Pulsa sobre X para cerrar la ventana emergente<br />
  87. 87. Uso del WEKA<br />Explorer: Classify<br />Principales Algoritmos utilizados en Clasificar<br /><ul><li>BayesNet: Aprende redes Bayesianas.
  88. 88. NaiveBayes: Clasificador discriminador de Bayes.
  89. 89. Id3: Arboles de decisión usando el divide y vencerás.
  90. 90. J48: Arboles de decisión usando el C4.5.
  91. 91. RandomForest: Contruye un bosque aleatorio.
  92. 92. JRip: Construye reglas con el algoritmo RIPPER.
  93. 93. M5Rules: Construye reglas M5 desde árboles.
  94. 94. LinearRegression: Utiliza la regresión lineal.
  95. 95. MultilayerPerceptron: Usa Red Neuronal de Retroprogramación.
  96. 96. RBFNetwork: Usa Red de función en Radio Base.
  97. 97. SMO: Basado en Vectores de Soporte.
  98. 98. Ibk: Usa k vecinos más cercanos.
  99. 99. LWL: Aprendizaje basados en Pesos Locales.
  100. 100. Entre muchos otros…</li></li></ul><li>Uso del WEKA<br />Explorer: Classify<br />Principales Algoritmos utilizados en Clasificar<br /><ul><li>BayesNet: Aprende redes Bayesianas.
  101. 101. NaiveBayes: Clasificador discriminador de Bayes.
  102. 102. Id3: Arboles de decisión usando el divide y vencerás.
  103. 103. J48: Arboles de decisión usando el C4.5.
  104. 104. RandomForest: Contruye un bosque aleatorio.
  105. 105. JRip: Construye reglas con el algoritmo RIPPER.
  106. 106. M5Rules: Construye reglas M5 desde árboles.
  107. 107. LinearRegression: Utiliza la regresión lineal.
  108. 108. MultilayerPerceptron: Usa Red Neuronal de Retroprogramación.
  109. 109. RBFNetwork: Usa Red de función en Radio Base.
  110. 110. SMO: Basado en Vectores de Soporte.
  111. 111. Ibk: Usa k vecinos más cercanos.
  112. 112. LWL: Aprendizaje basados en Pesos Locales.
  113. 113. Entre muchos otros…</li></li></ul><li>Uso del WEKA<br />Explorer: Cluster<br />WEKA ofrece cuatro opciones en el Clustermode:<br />Use trainig set: la muestra es usada para entrenar y probar al mismo tiempo. Los resultados obtenidos no corresponden con la realidad.<br />Supplied test set: los atributos de los datos son escritos en un nuevo archivo de formato ARFF sobre el cual se efectuará la clasificación.<br />Percentagesplit: indica el porcentaje de la muestra que empleara para probar el clasificador.<br />Classestoclusterevaluation: permite escoger el atributo a agrupar<br />
  114. 114. Uso del WEKA<br />Explorer: Cluster<br />Pulsar sobre la opción Elegir<br />
  115. 115. Uso del WEKA<br />Explorer: Cluster<br />WEKA ofrece nueve algoritmos para agrupar datos:<br /><ul><li>CobWeb: utiliza el algoritmo CobWeb.
  116. 116. DBScan: utiliza el algoritmo DBScan.
  117. 117. EM: utiliza el algoritmo EM.
  118. 118. FarthestFirst: utiliza el algoritmo FarthestFirst.
  119. 119. FilteredCluster: agupra los datos arbitrariamente y luego son pasados por un filtro arbitrario.
  120. 120. MakeDensityBasedClusterer: los datos son envueltos en clases y devuelven su distribución y densidad.
  121. 121. OPTICS: utiliza el algoritmo OPTICS.
  122. 122. SimpleKMeans: utiliza el algoritmo de k-medias.
  123. 123. XMeans: utiliza el algoritmo de x-medias.</li></li></ul><li>Uso del WEKA<br />Explorer: Cluster<br />Pulsa sobre la opción filtros<br />
  124. 124. Uso del WEKA<br />Explorer: Cluster<br />Marca sobre la opciones filtros que considere necesarias y pulsa Esta bien<br />
  125. 125. Uso del WEKA<br />Explorer: Cluster<br />Pulsa sobre la opción del algoritmo CobWeb<br />
  126. 126. Uso del WEKA<br />Explorer: Cluster<br />Pulsar sobre CobWeb para que se muestren las opciones que este posee<br />
  127. 127. Uso del WEKA<br />Explorer: Cluster<br />En la sección Acerca de se muestra la información sobre la herramienta de Agrupamiento de datos utilizada.<br />Pulsa Esta bien luego de realizar las modificaciones en las opciones de ser necesario.<br />
  128. 128. Uso del WEKA<br />Explorer: Cluster<br />Pulsa sobre Comienzo para que el algoritmo empiece a ejecutarse<br />
  129. 129. Uso del WEKA<br />Explorer: Cluster<br />Se muestra el resultado del algoritmo, deberás pulsar sobre la ventana deslizante hasta llegar al final de la misma<br />
  130. 130. Uso del WEKA<br />Explorer: Cluster<br />Se muestra el resultado del algoritmo<br />
  131. 131. Uso del WEKA<br />Explorer: Cluster<br />Pulsando botón contrario del ratón se desplegara la siguiente ventana emergente<br />
  132. 132. Uso del WEKA<br />Explorer: Cluster<br />Pulsa sobre la opción visualizar Árbol<br />
  133. 133. Uso del WEKA<br />Explorer: Cluster<br />Pulsa sobre X para cerrar la ventana emergente<br />
  134. 134. Uso del WEKA<br />Explorer: Cluster<br />Pulsa sobre la opción visualizar los grupos formados<br />
  135. 135. Uso del WEKA<br />Explorer: Cluster<br />Pulsa sobre X para cerrar la ventana emergente<br />
  136. 136. Uso del WEKA<br />Explorer: Associate<br />Pulsar sobre la opción Elegir<br />
  137. 137. Uso del WEKA<br />Explorer: Associate<br />WEKA ofrece cinco algoritmos para asociar datos:<br /><ul><li>Apriori: utiliza el algoritmo Apriori.
  138. 138. FilteredAssociator: utiliza el algoritmo que asocia los datos arbitrariamente además de filtrarlos arbitrariamente también.
  139. 139. GeneralizedSequentialPatterns: utiliza el algoritmo GSP
  140. 140. PredictiveApriori: utiliza el algoritmo Apriori para hacer reglas de asociación.
  141. 141. Tertius: utiliza el algoritmo de Tertius.</li></li></ul><li>Uso del WEKA<br />Explorer: Associate<br />Pulsa sobre la opción filtros<br />
  142. 142. Uso del WEKA<br />Explorer: Associate<br />Marca sobre la opciones filtros que considere necesarias y pulsa Esta bien<br />
  143. 143. Uso del WEKA<br />Explorer: Associate<br />Pulsa sobre la opción del algoritmo FilteredAssociator<br />
  144. 144. Uso del WEKA<br />Explorer: Associate<br />Pulsar sobre FilteredAssociator para que se muestren las opciones que este posee<br />
  145. 145. Uso del WEKA<br />Explorer: Associate<br />En la sección Acerca de se muestra la información sobre la herramienta de Asociación de datos utilizada.<br />Pulsa Esta bien luego de realizar las modificaciones en las opciones de ser necesario.<br />
  146. 146. Uso del WEKA<br />Explorer: Associate<br />Pulsa sobre Comienzo para que el algoritmo empiece a ejecutarse<br />
  147. 147. Uso del WEKA<br />Explorer: Associate<br />Se muestra el resultado del algoritmo<br />
  148. 148. Uso del WEKA<br />Explorer: Associate<br />Pulsando botón contrario del ratón se desplegara la siguiente ventana emergente<br />
  149. 149. Uso del WEKA<br />Explorer: Visualize<br />
  150. 150. Uso del WEKA<br />Experimenter:<br />Como se observa con tres subentornos de ejecución:<br />Setup: permite la carga de los archivos así como la creación de los mismos.<br />Run: permite ejecutar el archivo con los algoritmos indicados en Setup.<br />Analyse: permite configurar las pruebas sobre los datos.<br />
  151. 151. Uso del WEKA<br />KnowledgeFlow:<br />Como se observa con ocho subentornos de ejecución:<br />DataSources: permite leer los datos en los diferentes tipos de archivos: ARFF, C45, CVS, LIBSVM, XRFF.<br />DataSkin: permite guardar los datos en los diferentes tipos de archivos: ARFF, C45, CVS, LIBSVM, XRFF.<br />Filters: permite efectuar el preprocesamiento de los datos, se dividen supervisados y no supervisados.<br />Classifiers: permite efectuar la clasificación de los datos, se dividen en: bayes, functions, lazy, meta, mi, misc, trees y rules.<br />Clusterers: permite aplicar las técnicas de agrupamiento de datos.<br />Associations: permite aplicar las técnicas de asociación de los datos.<br />Evaluation: permite evaluar o designar el conjunto de datos para el entrenamiento.<br />Visualization: permite visualizar ya sea como texto o grafico el resultado de los algoritmos.<br />
  152. 152. Uso del WEKA<br />KnowledgeFlow:<br />Como primer paso es necesario cargar los datos. Para esto se debe:<br />1) Pulsar sobre la pestaña de DataSources<br />2) Pulsar sobre la el icono de ArffLoader<br />3) Pulsar doble clic y aparecerá el icono de ArffLoader<br />
  153. 153. Uso del WEKA<br />KnowledgeFlow:<br />Pulsar clic contrario sobre el icono de ArffLoader y aparecerá un menú desplegable sobre este elegirás la opción Configure, esto para indicarle la ubicación del archivo ARFF<br />
  154. 154. Uso del WEKA<br />KnowledgeFlow:<br />Pulsar clic sobre el archivo ARFF de nuestra elección el cual será inmediatamente cargado como fuente de datos<br />
  155. 155. Uso del WEKA<br />KnowledgeFlow:<br />Como segundo paso es necesario evaluar los datos. Para esto se debe:<br />1) Pulsar sobre la pestaña de Evaluation<br />2) Pulsar sobre la el icono de ClassAssigener<br />3) Pulsar doble clic y aparecerá el icono de ClassAssigner<br />ClassAssigner es un algoritmo que divide los datos en grupos (clases)<br />
  156. 156. Uso del WEKA<br />KnowledgeFlow:<br />Pulsar clic contrario aparecerá el menú emergente pulsaras sobre la opción dataSet.<br />
  157. 157. Uso del WEKA<br />KnowledgeFlow:<br />La flecha indica que se efectúa la conexión entre el conjunto de los datos “dataSet” en formato ARFF (icono ArffLoader) y serán evaluados dicho conjunto de datos (icono ClassAssigner)<br />Cada uno de los iconos u objetos sólo se conectaran con los atributos comunes a los mismos, en este caso es común el conjunto de datos “dataSet” y es la única forma de comunicación entre la carga del conjunto de datos (ArffLoader) y la evaluación de los mismos (ClassAsigner).<br />
  158. 158. Uso del WEKA<br />KnowledgeFlow:<br />Pulsar sobre la el icono de CrossValidationFoldMaker<br />Pulsar doble clic y aparecerá el icono de CrossValidationFoldMaker<br />CrossValidationFolderMaker es un algoritmo de evaluación que divide un conjunto de datos al efectuar una validación cruzada, para esto separa el entrenamiento y las pruebas de los datos que son producidas por cada k-partes<br />
  159. 159. Uso del WEKA<br />KnowledgeFlow:<br />Pulsar clic contrario aparecerá el menú emergente pulsaras sobre la opción dataSet.<br />
  160. 160. Uso del WEKA<br />KnowledgeFlow:<br />La flecha indica que se efectúa la conexión entre el conjunto de los datos “dataSet” formados por el método de agrupar en clases (icono ClassAssigner) y serán evaluados dicho conjunto de datos (icono CrossValidationFolderMaker)<br />
  161. 161. Uso del WEKA<br />KnowledgeFlow:<br />Como tercer paso es necesario efectuar la clasificación de los datos. Para esto se debe:<br />1) Pulsar sobre la pestaña de Classifiers<br />2) Pulsar sobre la el icono de SMO<br />3) Pulsar doble clic y aparecerá el icono de SMO<br />SMO es una función que implementa el algoritmo de secuencia mínima optima de John Platt.<br />
  162. 162. Uso del WEKA<br />KnowledgeFlow:<br />Pulsar clic contrario aparecerá el menú emergente pulsaras sobre la opción trainingSet y luego de igual manera pulsaras clic contrario aparecerá el menú emergente y luego pulsaras sobre la opción testSet.<br />
  163. 163. Uso del WEKA<br />KnowledgeFlow:<br />La flecha indica que se efectúa la conexión entre el evaluador (icono CrossValidationFoldMaker) ya sea tanto por entrenamiento de los datos “trainingSet” o por pruebas de los datos “testSet” al clasificador SMO.<br />
  164. 164. Uso del WEKA<br />KnowledgeFlow:<br />Pulsar sobre la el icono de NaiveBayes<br />3) Pulsar doble clic y aparecerá el icono de NaiveBayes<br />NaiveBayes es una función que se usa para estimar las clases<br />
  165. 165. Uso del WEKA<br />KnowledgeFlow:<br />Pulsar clic contrario aparecerá el menú emergente pulsaras sobre la opción trainingSet y luego de igual manera pulsaras clic contrario aparecerá el menú emergente y luego pulsaras sobre la opción testSet.<br />
  166. 166. Uso del WEKA<br />KnowledgeFlow:<br />La flecha indica que se efectúa la conexión entre el evaluador (icono CrossValidationFoldMaker) ya sea tanto por entrenamiento de los datos “trainingSet” o por pruebas de los datos “testSet” al clasificador NaiveBayes.<br />
  167. 167. Uso del WEKA<br />KnowledgeFlow:<br />Como cuarto es necesario efectuar la visualización de los datos. Para esto se debe:<br />1) Pulsar sobre la pestaña de Visualization<br />2) Pulsar sobre la el icono de TextViewer<br />3) Pulsar doble clic y aparecerá el icono de TextViewer<br />TextViewer es un visualizador que permite observar por pantalla los resultados generales del experimento<br />
  168. 168. Uso del WEKA<br />KnowledgeFlow:<br />Pulsar clic contrario aparecerá el menú emergente pulsaras sobre la opción text<br />
  169. 169. Uso del WEKA<br />KnowledgeFlow:<br />La flecha indica que se efectúa la conexión entre el clasificador (icono MSO) que envía el resultado tipo texto “text” al visualizador TextViewer<br />Pulsar TextViewer y luego pulsar doble clic y aparecerá el icono de TextViewer<br />
  170. 170. Uso del WEKA<br />KnowledgeFlow:<br />Pulsar clic contrario aparecerá el menú emergente pulsaras sobre la opción text<br />
  171. 171. Uso del WEKA<br />KnowledgeFlow:<br />La flecha indica que se efectúa la conexión entre el clasificador (icono NaiveBayes) que envía el resultado tipo texto “text” al visualizador TextViewer<br />
  172. 172. Uso del WEKA<br />KnowledgeFlow:<br />Como quinto paso es necesario cargar los datos. <br />Pulsar clic contrario sobre los datos (icono titanic.txt) aparecerá un menú emergente donde escogerás la opción Startloading, con esto se iniciará la carga de los datos en el modelo creado.<br />
  173. 173. Uso del WEKA<br />KnowledgeFlow:<br />Pulsar clic contrario aparecerá el menú emergente pulsaras sobre la opción ShowResults<br />
  174. 174. Uso del WEKA<br />KnowledgeFlow:<br />Estos son los resultados en forma de texto del clasificador implementado.<br />
  175. 175. Uso del WEKA<br />KnowledgeFlow:<br />Pulsar clic contrario aparecerá el menú emergente pulsaras sobre la opción ShowResults<br />
  176. 176. Uso del WEKA<br />KnowledgeFlow:<br />Estos son los resultados en forma de texto del clasificador implementado.<br />
  177. 177. Uso del WEKA<br />KnowledgeFlow:<br />Pulsar sobre la el icono de J48<br />Pulsar doble clic y aparecerá el icono de J48<br />J48 es una función que genera un árbol de decisión usando el algoritmo C4.5<br />
  178. 178. Uso del WEKA<br />KnowledgeFlow:<br />Pulsar clic contrario aparecerá el menú emergente pulsaras sobre la opción trainingSet y luego de igual manera pulsaras clic contrario aparecerá el menú emergente y luego pulsaras sobre la opción testSet.<br />
  179. 179. Uso del WEKA<br />KnowledgeFlow:<br />Como sexto paso y para efectuar comparación con los algoritmos de árboles de decisión, es necesario volver a cargar los datos. <br />Pulsar clic contrario sobre los datos (icono titanic.txt) aparecerá un menú emergente donde escogerás la opción Startloading, con esto se iniciará la carga de los datos en el modelo creado.<br />
  180. 180. Uso del WEKA<br />KnowledgeFlow:<br />Pulsar clic contrario aparecerá el menú emergente pulsaras sobre la opción ShowResults<br />
  181. 181. Uso del WEKA<br />KnowledgeFlow:<br />Estos son los resultados en forma de texto del clasificador implementado.<br />
  182. 182. Uso del WEKA<br />KnowledgeFlow:<br />Pulsar clic contrario aparecerá el menú emergente pulsaras sobre la opción ShowResults<br />
  183. 183. Uso del WEKA<br />KnowledgeFlow:<br />Este es el resultado en forma de árbol del clasificador implementado.<br />
  184. 184. Uso del WEKA<br />SimpleCLI:<br />Como se observa con los siete comandos posibles son:<br />java <classname> <args>.<br />break.<br />kill.<br />cls.<br />history.<br />exit.<br />help <command><br />
  185. 185. Repositorios de WEKA<br />SimpleCLI:<br />Como se observa con los siete comandos posibles son:<br />java <classname> <args>.<br />break.<br />kill.<br />cls.<br />history.<br />exit.<br />help <command><br />

×