• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
Dataminig con Weka. Caso: Árboles de decisión
 

Dataminig con Weka. Caso: Árboles de decisión

on

  • 681 views

Este documento expone un ejemplo de cómo generar un árbol de decisión empleando WEKA. ...

Este documento expone un ejemplo de cómo generar un árbol de decisión empleando WEKA.

WEKA que es la herramienta libre de Datamining seleccionada para éste trabajo y el algoritmo de árbol de decisión que constituye una de las técnicas de toma de decisiones más empleadas en Datamining.

Se trabajará sobre una base de datos clásica incluida en el propio programa. Se trata de una base de datos llamada WEATHER.ARFF , en la que se pretende determinar cuáles son los factores que hacen que una cierta persona practique o no el tenis.

Cada instancia de la base de datos se corresponde con un cierto día en el que la persona se plantea si jugar o no al tenis, y recoge los siguientes atributos:

• Aspecto del cielo: {soleado, cubierto, lluvioso}.
• Temperatura: medida en grados.
• Humedad: medida en %.
• Viento: {si, no}.
• Juega al tenis: {si, no}.

Statistics

Views

Total Views
681
Views on SlideShare
681
Embed Views
0

Actions

Likes
0
Downloads
22
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    Dataminig con Weka. Caso: Árboles de decisión Dataminig con Weka. Caso: Árboles de decisión Presentation Transcript

    • WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKAUniversidad Nacional de Piura – Perú y Universidad Laica «Eloy Alfaro» de Manabí - Ecuador. Datamining – Árboles de DecisiónÁRBOL DE DECISIÓNDataminingconSoftware LibreCristhian Iván Jacho Castillo, Efraín Chilán Santana, ErnestoEnmanuel Pazmiño, Jorge Iván Pincay Ponce
    • WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKAUniversidad Nacional de Piura – Perú y Universidad Laica «Eloy Alfaro» de Manabí - Ecuador. Datamining – Árboles de Decisión
    • WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKAUniversidad Nacional de Piura – Perú y Universidad Laica «Eloy Alfaro» de Manabí - Ecuador. Datamining – Árboles de DecisiónWEKA• Weka es un conjunto de librerías JAVA para la extracciónde conocimientos desde bases de datos. Desarrolladobajo licencia GPL.• Las prácticas presentadas en éste documento serealizaron en WEKA (Waikato Environment forKnowledge Analysis) Versión 3.5.8. Cuyos créditos (c)1999 – 2008 pertenecen a la The University of WaikatoHamilton, New Zealand«es el proceso de analizar los datos desdediferentes perspectivas y resumirla eninformación útil, información que puede serutilizada para aumentar los ingresos, reducelos costos, o ambos». (UCLA Anderson, 2009.)DATAMINING
    • WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKAUniversidad Nacional de Piura – Perú y Universidad Laica «Eloy Alfaro» de Manabí - Ecuador. Datamining – Árboles de DecisiónObjetivos de la Práctica: GENERAR DE UN ÁRBOL DEDECISIÓN• Este documento expone un ejemplo de cómo generar un árbol de decisión empleandoWEKA.• WEKA que es la herramienta libre de Datamining seleccionada para éste trabajo y elalgoritmo de árbol de decisión que constituye una de las técnicas de toma dedecisiones más empleadas en Datamining.• Se trabajará sobre una base de datos clásica incluida en el propio programa. Se tratade una base de datos llamada WEATHER.ARFF, en la que se pretende determinarcuáles son los factores que hacen que una cierta persona practique o no el tenis.• Cada instancia de la base de datos se corresponde con un cierto día en el que lapersona se plantea si jugar o no al tenis, y recoge los siguientes atributos:• Aspecto del cielo: {soleado, cubierto, lluvioso}.• Temperatura: medida en grados.• Humedad: medida en %.• Viento: {si, no}.• Juega al tenis: {si, no}.
    • WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKAUniversidad Nacional de Piura – Perú y Universidad Laica «Eloy Alfaro» de Manabí - Ecuador. Datamining – Árboles de DecisiónWeather.arff
    • WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKAUniversidad Nacional de Piura – Perú y Universidad Laica «Eloy Alfaro» de Manabí - Ecuador. Datamining – Árboles de DecisiónMATERIALES UTILIZADOSLos materiales corresponden a los recursos de software empleados:Prácticas de DataminigWEKA (Waikato Environment for Knowledge Analysis) Versión 3.5.8. Cuyos créditos (c) 1999 –2008 pertenecen a la The University of Waikato.JRE (Java Runtime Edition) versión 1.7 de 64 Bits.JDK (Java Development Kit) 1.7 de 64 Bits, aunque realmente para las prácticas mostradas solose usó JRE y no el JDK.Opcionanlmente Weka incorpora una versión reducida de JRE que garantiza la funcionalidadal menos de Weka.Sistema operativoMicrosoft Windows 8 Enterprise, versión de 64 Bits.La Base de Datos del EjemploSe trabajará sobre una base de datos clásica incluida en el propio programa. Se trata de unabase de datos llamada WEATHER.ARFF, en la que se pretende determinar cuáles son losfactores que hacen que una cierta persona practique o no el tenis.
    • WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKAUniversidad Nacional de Piura – Perú y Universidad Laica «Eloy Alfaro» de Manabí - Ecuador. Datamining – Árboles de DecisiónPrincipales Características de WEKA• 49 herramientas de preprocesamiento de datos• 76 algoritmos de clasificación / regresión• 8 algoritmos de agrupamiento• 15 atributos/subconjunto evaluadores + 10 algoritmos de búsqueda paraconfigurar la selección.• 3 algoritmos para encontrar reglas de asociación• 3 interfaces gráficas de usuario- "The Explorer" (análisis exploratorio de datos)- " The Experimenter” (entorno experimental)- "El KnowledgeFlow" (nuevo modelo de proceso inspirado interfaz)Diversas fuentes de datos (ASCII, JDBC).• Distintas herramientas de minería de datos: reglas de asociación (a priori,Tertius, ...), agrupación/segmentación/conglomerado (Cobweb, EM y k-medias),clasificación (redes neuronales, reglas y árboles de decisión, aprendizajeBayesiona) y regresión (Regresión lineal, SVM..).• Manipulación de datos (pick & mix, muestreo, combinación y separación).• Combinación de modelos (Bagging, Boosting…)
    • WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKAUniversidad Nacional de Piura – Perú y Universidad Laica «Eloy Alfaro» de Manabí - Ecuador. Datamining – Árboles de DecisiónÁrboles de decisiónEl algoritmo de árboles de decisión de es unalgoritmo híbrido que incorpora distintosmétodos para crear un árbol, y admite variastareas de análisis, incluyendo la regresión, laclasificación y la asociación. El algoritmo deárboles de decisión de admite el modelado delos atributos discretos y continuos (MSDN,2013).
    • WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKAUniversidad Nacional de Piura – Perú y Universidad Laica «Eloy Alfaro» de Manabí - Ecuador. Datamining – Árboles de DecisiónLAS TRESINTERFACES DEWEKA
    • WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKAUniversidad Nacional de Piura – Perú y Universidad Laica «Eloy Alfaro» de Manabí - Ecuador. Datamining – Árboles de DecisiónPantallaPrincipal
    • WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKAUniversidad Nacional de Piura – Perú y Universidad Laica «Eloy Alfaro» de Manabí - Ecuador. Datamining – Árboles de DecisiónApertura delArchivoWeather.arff
    • WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKAUniversidad Nacional de Piura – Perú y Universidad Laica «Eloy Alfaro» de Manabí - Ecuador. Datamining – Árboles de DecisiónVista
    • WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKAUniversidad Nacional de Piura – Perú y Universidad Laica «Eloy Alfaro» de Manabí - Ecuador. Datamining – Árboles de DecisiónResultados
    • WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKAUniversidad Nacional de Piura – Perú y Universidad Laica «Eloy Alfaro» de Manabí - Ecuador. Datamining – Árboles de DecisiónÁrbol
    • WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKAUniversidad Nacional de Piura – Perú y Universidad Laica «Eloy Alfaro» de Manabí - Ecuador. Datamining – Árboles de DecisiónA modo de finalización:• Propiamente en términos de Datamining, el árbol de decisión al estar basado enalgoritmos de extracción en reglas de asociación, no solo que es eficiente, sino quetambién es escalable. Esta es una característica esencial en la resolución deproblemas de Data Mining, pues permite la utilización extraer información deenormes conjuntos de datos.• Es de vital importancia el conocimiento de técnicas que permitan anticiparse ypredecir los posibles resultados de las decisiones a tomar, “apuntando” siempre atener mayores posibilidades de éxito y una adecuada gestión en administración dediversos frentes.• El manejo de técnicas sencillas y compresibles de cómo llevar a cabo un adecuadoproceso de elección de estrategias y decisiones supone un paso adelante eneficiencia.
    • WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKA - WEKAUniversidad Nacional de Piura – Perú y Universidad Laica «Eloy Alfaro» de Manabí - Ecuador. Datamining – Árboles de DecisiónFuentes• Mark Hall, Eibe Frank, Geoffrey Holmes, & Bernhard P. (2009). TheWEKA Data Mining Software: An Update; SIGKDD Explorations (Vol.XI).• MSDN. (2013). Minería de datos. Recuperado el 31 de Marzo de2013, de http://msdn.microsoft.com/es-ec/library/bb510516.aspx• MSDN. (2013). Referencia técnica del algoritmo de árboles de decisiónde Microsoft. Recuperado el 30 de Marzo de 2013, dehttp://msdn.microsoft.com/es-ec/library/cc645868(v=sql.100).aspxVer video en SkyDrive:https://skydrive.live.com/?cid=a1edc377dca0b10f#cid=A1EDC377DCA0B10F&id=A1EDC377DCA0B10F%21492