SlideShare a Scribd company logo
1 of 33
Download to read offline
Ejemplo en WEKA

    TITANIC
Abarca “Reglas de Asociación y Dependencias” a

    partir de datos sobre el hundimiento del Titanic.

    Los datos se encuentran en el fichero “titanic.arff” y

    corresponden a las características de los 2.201
    pasajeros del Titanic. Estos datos son reales y se han
    obtenido de: quot;Report on the Loss of the ‘Titanic’
    (S.S.)quot; (1990), British Board of Trade Inquiry Report_
    (reprint), Gloucester, UK: Allan Sutton Publishing.
Titanic Database:

    relation titanic

    attribute C {crew,first,second,third}

    attribute age {adu,enf}

    attribute sex {f,m}

    attribute Class {mort,surv}


    Data:

    crew,adu,m,surv

    crew,adu,m,surv

    crew,adu,f,surv

    third,adu,m,mort

    ...

Para este ejemplo sólo se van a considerar cuatro

   variables:
• Clase (0 = tripulación, 1 = primera, 2 = segunda, 3 =
   tercera)
• Edad (1 = adulto, 0 = niño)
• Sexo (1 = hombre, 0 = mujer)
• Sobrevivió (1 = sí, 0 = no)

    Para ello, vamos a ver que reglas de asociación

    interesantes podemos extraer de estos atributos. Para
    ejecutar los métodos en Weka de reglas de
    asociaciación, seleccionamos la ventana de associate.
Entre otros, este sistema de minería de datos provee

    el paquete “WEKA.associations.Apriori” que contiene
    la implementación del algoritmo de aprendizaje de
    reglas de asociación Apriori. Podemos configurar este
    algoritmo con varias opciones: con la opción
    “UpperBoundMinSupport” indicamos el límite superior
    de cobertura requerido para aceptar un conjunto de
    ítems.
    Si no se encuentran conjuntos de ítems suficientes

    para generar las reglas requeridas se va disminuyendo
    el límite hasta llegar al límite inferior (opción
    “LowerBoundMinSupport”).
Con la opción “minMetric” indicamos la confianza

    mínima (u otras métricas dependiendo del criterio de
    ordenación) para mostrar una regla de asociación; y
    con la opción “numRules” indicamos el número de
    reglas que deseamos que aparezcan en pantalla.

    La ordenación de estas reglas en pantalla puede

    configurarse mediante la opción “MetricType”,
    algunas opciones que se pueden utilizar son: confianza
    de la regla, lift (confianza divido por el número de
    ejemplos cubiertos por la parte derecha de la regla), y
    otras más elaboradas.
En cada regla, tenemos la cobertura de la parte izquierda y

    de la regla, así como la confianza de la regla. Podemos
    conocer alguna regla interesante aunque otras los son
    menos. Por ejemplo, la regla 1 indica que, como era de
    esperar toda la tripulación es adulta. La regla 2 nos indica lo
    mismo, pero teniendo en cuenta a los varones.

     Parecidas conclusiones podemos sacar de las reglas 4, 5 y 6.

    La regla 3 nos indica que los varones que murieron fueron en
    su mayoría adultos (97%). La regla 7 destaca que la mayoría
    que murieron fueron adultos (97%). Y finalmente la 10
    informa que la mayoría de los muertos fueron hombres
    (92%).
Cabe destacar que la calidad de las reglas de asociación que

    aprendamos muchas veces viene lastrada por la presencia de
    atributos que estén fuertemente descompensados. Por
    ejemplo, en este caso la escasa presencia de niños provoca
    que no aparezcan en las reglas de asociación, ya que las
    reglas con este ítemset poseen una baja cobertura y son
    filtradas. Podemos mitigar parcialmente este fenómeno si
    cambiamos el método de selección de reglas.

    A CONTINUACION VEREMOS EL COMPORTAMIENTO DE

    LOS DEMAS ALGORITMOS: FiltroAsociado, HotSpot, A
    priori-Predictivo y el Tertius.
Es igual al Apriori normal, devuelve los mismos resultados

    para este
    caso.
Actúa de manera distinta al Usar un valor de conteo mínimo

    para los segmentos, en este caso de 726 instancias, usa
    también un factor máximo de ramificación de 2, y una
    mejora mínima en margen del 1%.

    Con estas métricas para nuestro ejemplo devuelve valores

    de:
    No sobrevivieron el 67.7% (1490/2201)

    De sexo masculino el 78.8% (1364/1731)

     Eran adultos el 79.72% (1329/1667)
    De ambos sexos adultos: 68.74% (1438/2092)

Es más exhaustivo y combina las probabilidades de forma

    distinta.
Consideró 440 hipótesis de las cuales exploró 332, Así:

Usando el “ADTree ” obtenemos los resultados:

El árbol generado para “ADTree” será

Usando“FT” será

El árbol generado para “FT” será

Usando“J48” será

El árbol generado para “J48” será

Usando “LADTree” será

El árbol generado para “LADTree” será

Usando “LMT” será

El árbol generado para “LMT” será

Usando “NBTree” será

El árbol generado para “NBTree” será

Y Usando “REPTree” será

El árbol generado para “REPtree” será

La explicación inicial del ejemplo fue extraída

  de:
http://users.dsic.upv.es/~jorallo/docent/doctora
  t/weka.p

More Related Content

What's hot

Escala de likert
Escala de likertEscala de likert
Escala de likertmorocha
 
Modelo Entidad Relación Extendido.
Modelo Entidad Relación Extendido.Modelo Entidad Relación Extendido.
Modelo Entidad Relación Extendido.nayis2010
 
Programacion Convexa Presentacion Definitivo
Programacion Convexa Presentacion DefinitivoProgramacion Convexa Presentacion Definitivo
Programacion Convexa Presentacion Definitivowadar3
 
UNIDAD III. Solución de Sistemas de Ecuaciones Lineales
UNIDAD III. Solución de Sistemas de Ecuaciones LinealesUNIDAD III. Solución de Sistemas de Ecuaciones Lineales
UNIDAD III. Solución de Sistemas de Ecuaciones LinealesCarlos Santos
 
Construcción de ojiva con geogebra
Construcción de ojiva con geogebraConstrucción de ojiva con geogebra
Construcción de ojiva con geogebraAndrea Gago
 
Introducción a la Programación No Lineal
Introducción a la Programación No LinealIntroducción a la Programación No Lineal
Introducción a la Programación No LinealAngelCarrasquel3
 
Tamaño Optimo de la muestra
Tamaño Optimo de la muestraTamaño Optimo de la muestra
Tamaño Optimo de la muestraAnthony Maule
 
Criptografia 1
Criptografia 1Criptografia 1
Criptografia 1Tensor
 
Estadistica chi cuadrado
Estadistica chi cuadradoEstadistica chi cuadrado
Estadistica chi cuadradoPABLITO Pablo
 
Pruebas de hipótesis para una muestra
Pruebas de hipótesis para una muestraPruebas de hipótesis para una muestra
Pruebas de hipótesis para una muestraAlejandro Ruiz
 
Prueba de independencia (arriba y abajo)
Prueba de independencia (arriba y abajo)Prueba de independencia (arriba y abajo)
Prueba de independencia (arriba y abajo)Henry Cordova
 
Probabilidad y Eventos
Probabilidad y EventosProbabilidad y Eventos
Probabilidad y EventosJose Arteaga
 
Modelo entidad relacion
Modelo entidad relacionModelo entidad relacion
Modelo entidad relacionMaria Garcia
 

What's hot (20)

Escala de likert
Escala de likertEscala de likert
Escala de likert
 
VC4NM73-EQ#6-DSA
VC4NM73-EQ#6-DSAVC4NM73-EQ#6-DSA
VC4NM73-EQ#6-DSA
 
Modelo Entidad Relación Extendido.
Modelo Entidad Relación Extendido.Modelo Entidad Relación Extendido.
Modelo Entidad Relación Extendido.
 
Programacion Convexa Presentacion Definitivo
Programacion Convexa Presentacion DefinitivoProgramacion Convexa Presentacion Definitivo
Programacion Convexa Presentacion Definitivo
 
UNIDAD III. Solución de Sistemas de Ecuaciones Lineales
UNIDAD III. Solución de Sistemas de Ecuaciones LinealesUNIDAD III. Solución de Sistemas de Ecuaciones Lineales
UNIDAD III. Solución de Sistemas de Ecuaciones Lineales
 
Construcción de ojiva con geogebra
Construcción de ojiva con geogebraConstrucción de ojiva con geogebra
Construcción de ojiva con geogebra
 
Práctica en Weka
Práctica en WekaPráctica en Weka
Práctica en Weka
 
Cuadro comparativo
Cuadro comparativoCuadro comparativo
Cuadro comparativo
 
Estimadores
EstimadoresEstimadores
Estimadores
 
Introducción a la Programación No Lineal
Introducción a la Programación No LinealIntroducción a la Programación No Lineal
Introducción a la Programación No Lineal
 
Tamaño Optimo de la muestra
Tamaño Optimo de la muestraTamaño Optimo de la muestra
Tamaño Optimo de la muestra
 
Pruebas de hipótesis e inferencia estadística
Pruebas de hipótesis e inferencia estadísticaPruebas de hipótesis e inferencia estadística
Pruebas de hipótesis e inferencia estadística
 
Criptografia 1
Criptografia 1Criptografia 1
Criptografia 1
 
Estadistica chi cuadrado
Estadistica chi cuadradoEstadistica chi cuadrado
Estadistica chi cuadrado
 
Pruebas de hipótesis para una muestra
Pruebas de hipótesis para una muestraPruebas de hipótesis para una muestra
Pruebas de hipótesis para una muestra
 
Prueba de independencia (arriba y abajo)
Prueba de independencia (arriba y abajo)Prueba de independencia (arriba y abajo)
Prueba de independencia (arriba y abajo)
 
Hipotesis
HipotesisHipotesis
Hipotesis
 
Probabilidad y Eventos
Probabilidad y EventosProbabilidad y Eventos
Probabilidad y Eventos
 
8. probabilidad y variables aleatorias
8.  probabilidad y variables aleatorias8.  probabilidad y variables aleatorias
8. probabilidad y variables aleatorias
 
Modelo entidad relacion
Modelo entidad relacionModelo entidad relacion
Modelo entidad relacion
 

Viewers also liked

Aplicación con Weka Predicciones Meteorológicas
Aplicación con Weka Predicciones MeteorológicasAplicación con Weka Predicciones Meteorológicas
Aplicación con Weka Predicciones MeteorológicasDiana
 
Árboles de Decisión en Weka
Árboles de Decisión en WekaÁrboles de Decisión en Weka
Árboles de Decisión en WekaLorena Quiñónez
 
OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)OpenAnalytics Spain
 
DATA MINING TOOL- ORANGE
DATA MINING TOOL- ORANGEDATA MINING TOOL- ORANGE
DATA MINING TOOL- ORANGENeeraj Goswami
 
Data mining tools (R , WEKA, RAPID MINER, ORANGE)
Data mining tools (R , WEKA, RAPID MINER, ORANGE)Data mining tools (R , WEKA, RAPID MINER, ORANGE)
Data mining tools (R , WEKA, RAPID MINER, ORANGE)Krishna Petrochemicals
 
Hacia una superacion de la fractura tecnico politica - Chubut
Hacia una superacion de la fractura tecnico politica - ChubutHacia una superacion de la fractura tecnico politica - Chubut
Hacia una superacion de la fractura tecnico politica - ChubutFundación CiGob
 
Modulo 3- Curso: Los Blogs como Mecanismo de Apoyo al Docente - Carlos Revilla
Modulo 3- Curso: Los Blogs como Mecanismo de Apoyo al Docente - Carlos RevillaModulo 3- Curso: Los Blogs como Mecanismo de Apoyo al Docente - Carlos Revilla
Modulo 3- Curso: Los Blogs como Mecanismo de Apoyo al Docente - Carlos Revillakhaileh
 
Pilote optimisation sur données MCA®
Pilote optimisation sur données MCA®Pilote optimisation sur données MCA®
Pilote optimisation sur données MCA®ROI\marketing
 
Cci Bordeaux & CCI Libourne Création d'entreprise : suivez le guide 2016-2017
Cci Bordeaux & CCI Libourne Création d'entreprise : suivez le guide 2016-2017Cci Bordeaux & CCI Libourne Création d'entreprise : suivez le guide 2016-2017
Cci Bordeaux & CCI Libourne Création d'entreprise : suivez le guide 2016-2017polenumerique33
 
Sécurité mobile - Passeport de conseils aux voyageurs - ANSSI - 2014
Sécurité mobile - Passeport de conseils aux voyageurs - ANSSI - 2014Sécurité mobile - Passeport de conseils aux voyageurs - ANSSI - 2014
Sécurité mobile - Passeport de conseils aux voyageurs - ANSSI - 2014polenumerique33
 
Encuestas Mori Abr 08 S It.Economica
Encuestas Mori Abr 08 S It.EconomicaEncuestas Mori Abr 08 S It.Economica
Encuestas Mori Abr 08 S It.Economicaguest358d7c
 
Union pour la Méditerranée, les PME avancent leurs pions
Union pour la Méditerranée, les PME avancent leurs pionsUnion pour la Méditerranée, les PME avancent leurs pions
Union pour la Méditerranée, les PME avancent leurs pionsPARIS
 
Un parcours d'animation sur l'enregistrement des naissances en Côte d'Ivoire
Un parcours d'animation sur l'enregistrement des naissances en Côte d'IvoireUn parcours d'animation sur l'enregistrement des naissances en Côte d'Ivoire
Un parcours d'animation sur l'enregistrement des naissances en Côte d'IvoireUNICEF France
 

Viewers also liked (20)

Arboles De Decision Weka
Arboles De Decision WekaArboles De Decision Weka
Arboles De Decision Weka
 
CoSECiVi'15 - Clustering de jugadores de Tetris
CoSECiVi'15 - Clustering de jugadores de TetrisCoSECiVi'15 - Clustering de jugadores de Tetris
CoSECiVi'15 - Clustering de jugadores de Tetris
 
Aplicación con Weka Predicciones Meteorológicas
Aplicación con Weka Predicciones MeteorológicasAplicación con Weka Predicciones Meteorológicas
Aplicación con Weka Predicciones Meteorológicas
 
Árboles de Decisión en Weka
Árboles de Decisión en WekaÁrboles de Decisión en Weka
Árboles de Decisión en Weka
 
OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)
 
DATA MINING TOOL- ORANGE
DATA MINING TOOL- ORANGEDATA MINING TOOL- ORANGE
DATA MINING TOOL- ORANGE
 
Data mining tools (R , WEKA, RAPID MINER, ORANGE)
Data mining tools (R , WEKA, RAPID MINER, ORANGE)Data mining tools (R , WEKA, RAPID MINER, ORANGE)
Data mining tools (R , WEKA, RAPID MINER, ORANGE)
 
Hacia una superacion de la fractura tecnico politica - Chubut
Hacia una superacion de la fractura tecnico politica - ChubutHacia una superacion de la fractura tecnico politica - Chubut
Hacia una superacion de la fractura tecnico politica - Chubut
 
Modulo 3- Curso: Los Blogs como Mecanismo de Apoyo al Docente - Carlos Revilla
Modulo 3- Curso: Los Blogs como Mecanismo de Apoyo al Docente - Carlos RevillaModulo 3- Curso: Los Blogs como Mecanismo de Apoyo al Docente - Carlos Revilla
Modulo 3- Curso: Los Blogs como Mecanismo de Apoyo al Docente - Carlos Revilla
 
French tech-grenoble
French tech-grenobleFrench tech-grenoble
French tech-grenoble
 
Pilote optimisation sur données MCA®
Pilote optimisation sur données MCA®Pilote optimisation sur données MCA®
Pilote optimisation sur données MCA®
 
CAEM 2011 - Workshop Consumer Insights
CAEM 2011 - Workshop Consumer InsightsCAEM 2011 - Workshop Consumer Insights
CAEM 2011 - Workshop Consumer Insights
 
Cci Bordeaux & CCI Libourne Création d'entreprise : suivez le guide 2016-2017
Cci Bordeaux & CCI Libourne Création d'entreprise : suivez le guide 2016-2017Cci Bordeaux & CCI Libourne Création d'entreprise : suivez le guide 2016-2017
Cci Bordeaux & CCI Libourne Création d'entreprise : suivez le guide 2016-2017
 
Sécurité mobile - Passeport de conseils aux voyageurs - ANSSI - 2014
Sécurité mobile - Passeport de conseils aux voyageurs - ANSSI - 2014Sécurité mobile - Passeport de conseils aux voyageurs - ANSSI - 2014
Sécurité mobile - Passeport de conseils aux voyageurs - ANSSI - 2014
 
Stratégie de contenu web
Stratégie de contenu web Stratégie de contenu web
Stratégie de contenu web
 
Encuestas Mori Abr 08 S It.Economica
Encuestas Mori Abr 08 S It.EconomicaEncuestas Mori Abr 08 S It.Economica
Encuestas Mori Abr 08 S It.Economica
 
Union pour la Méditerranée, les PME avancent leurs pions
Union pour la Méditerranée, les PME avancent leurs pionsUnion pour la Méditerranée, les PME avancent leurs pions
Union pour la Méditerranée, les PME avancent leurs pions
 
Humanocomique
HumanocomiqueHumanocomique
Humanocomique
 
Un parcours d'animation sur l'enregistrement des naissances en Côte d'Ivoire
Un parcours d'animation sur l'enregistrement des naissances en Côte d'IvoireUn parcours d'animation sur l'enregistrement des naissances en Côte d'Ivoire
Un parcours d'animation sur l'enregistrement des naissances en Côte d'Ivoire
 
Hommage à Jacques Brel
Hommage à Jacques BrelHommage à Jacques Brel
Hommage à Jacques Brel
 

Similar to Ejemplo Weka Titanic

Practica de estadística actuarial aplicad
Practica de estadística actuarial aplicadPractica de estadística actuarial aplicad
Practica de estadística actuarial aplicadEster Caparros Jané
 
Mineria de datos en weka
Mineria de datos en wekaMineria de datos en weka
Mineria de datos en wekaUri Mon
 
Capítulo 07 interpretación de resultados
Capítulo 07 interpretación de resultadosCapítulo 07 interpretación de resultados
Capítulo 07 interpretación de resultadosSergio Valenzuela Mayer
 
Introduction to R by David Lucy Cap 12-16
Introduction to R by David Lucy Cap 12-16Introduction to R by David Lucy Cap 12-16
Introduction to R by David Lucy Cap 12-16Luis Pons
 
Capítulo 07 interpretación de resultados
Capítulo 07 interpretación de resultadosCapítulo 07 interpretación de resultados
Capítulo 07 interpretación de resultadosSergio Valenzuela Mayer
 
1. laboratorio stadistica
1. laboratorio stadistica1. laboratorio stadistica
1. laboratorio stadisticaFabian White
 
Análisis estadístico de acumulación de tolerancias.
Análisis estadístico de acumulación de tolerancias.Análisis estadístico de acumulación de tolerancias.
Análisis estadístico de acumulación de tolerancias.bryansk7
 
Practica Stata - Modelos Riesgo de Credito.pptx
Practica Stata - Modelos Riesgo de Credito.pptxPractica Stata - Modelos Riesgo de Credito.pptx
Practica Stata - Modelos Riesgo de Credito.pptxssuserc8ee7a
 
Guia para el programa desktop garp
Guia para el programa desktop garpGuia para el programa desktop garp
Guia para el programa desktop garpMildred_Lagos
 
Normalidad uni y multivariante en r
Normalidad uni y multivariante en rNormalidad uni y multivariante en r
Normalidad uni y multivariante en redgar carpio
 
Ejemplo d eun ejercicio en Weka
Ejemplo d eun ejercicio en WekaEjemplo d eun ejercicio en Weka
Ejemplo d eun ejercicio en Wekaluis eduardo
 
A01213521 cine maximos
A01213521 cine maximosA01213521 cine maximos
A01213521 cine maximosAbraham Prado
 

Similar to Ejemplo Weka Titanic (20)

Practica de estadística actuarial aplicad
Practica de estadística actuarial aplicadPractica de estadística actuarial aplicad
Practica de estadística actuarial aplicad
 
Mineria de datos en weka
Mineria de datos en wekaMineria de datos en weka
Mineria de datos en weka
 
Capítulo 07 interpretación de resultados
Capítulo 07 interpretación de resultadosCapítulo 07 interpretación de resultados
Capítulo 07 interpretación de resultados
 
Introduction to R by David Lucy Cap 12-16
Introduction to R by David Lucy Cap 12-16Introduction to R by David Lucy Cap 12-16
Introduction to R by David Lucy Cap 12-16
 
Capítulo 07 interpretación de resultados
Capítulo 07 interpretación de resultadosCapítulo 07 interpretación de resultados
Capítulo 07 interpretación de resultados
 
Kaggle Otto Group
Kaggle Otto GroupKaggle Otto Group
Kaggle Otto Group
 
1. laboratorio stadistica
1. laboratorio stadistica1. laboratorio stadistica
1. laboratorio stadistica
 
P access7
P access7P access7
P access7
 
Mineria de Datos
Mineria de DatosMineria de Datos
Mineria de Datos
 
Análisis estadístico de acumulación de tolerancias.
Análisis estadístico de acumulación de tolerancias.Análisis estadístico de acumulación de tolerancias.
Análisis estadístico de acumulación de tolerancias.
 
Alto spread
Alto spreadAlto spread
Alto spread
 
Practica Stata - Modelos Riesgo de Credito.pptx
Practica Stata - Modelos Riesgo de Credito.pptxPractica Stata - Modelos Riesgo de Credito.pptx
Practica Stata - Modelos Riesgo de Credito.pptx
 
Biología Estructural PEC4
Biología Estructural PEC4Biología Estructural PEC4
Biología Estructural PEC4
 
Minitab basico
Minitab basicoMinitab basico
Minitab basico
 
Guia para el programa desktop garp
Guia para el programa desktop garpGuia para el programa desktop garp
Guia para el programa desktop garp
 
Normalidad uni y multivariante en r
Normalidad uni y multivariante en rNormalidad uni y multivariante en r
Normalidad uni y multivariante en r
 
Algoritmos genéticos
Algoritmos genéticosAlgoritmos genéticos
Algoritmos genéticos
 
Ejemplo d eun ejercicio en Weka
Ejemplo d eun ejercicio en WekaEjemplo d eun ejercicio en Weka
Ejemplo d eun ejercicio en Weka
 
A01213521 cine maximos
A01213521 cine maximosA01213521 cine maximos
A01213521 cine maximos
 
Estratificación
EstratificaciónEstratificación
Estratificación
 

Recently uploaded

International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)GDGSucre
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveFagnerLisboa3
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesFundación YOD YOD
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIAWilbisVega
 
La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafiosFundación YOD YOD
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...silviayucra2
 
9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudianteAndreaHuertas24
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricKeyla Dolores Méndez
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx241521559
 
Hernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxHernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxJOSEMANUELHERNANDEZH11
 
Plan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxPlan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxpabonheidy28
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfsoporteupcology
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdfIsabellaMontaomurill
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan JosephBRAYANJOSEPHPEREZGOM
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíassuserf18419
 
Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024GiovanniJavierHidalg
 

Recently uploaded (16)

International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento Protégeles
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
 
La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafios
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
 
9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx
 
Hernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxHernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptx
 
Plan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxPlan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docx
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdf
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdf
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Joseph
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnología
 
Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024
 

Ejemplo Weka Titanic

  • 1. Ejemplo en WEKA TITANIC
  • 2. Abarca “Reglas de Asociación y Dependencias” a  partir de datos sobre el hundimiento del Titanic. Los datos se encuentran en el fichero “titanic.arff” y  corresponden a las características de los 2.201 pasajeros del Titanic. Estos datos son reales y se han obtenido de: quot;Report on the Loss of the ‘Titanic’ (S.S.)quot; (1990), British Board of Trade Inquiry Report_ (reprint), Gloucester, UK: Allan Sutton Publishing.
  • 3. Titanic Database:  relation titanic  attribute C {crew,first,second,third}  attribute age {adu,enf}  attribute sex {f,m}  attribute Class {mort,surv}  Data:  crew,adu,m,surv  crew,adu,m,surv  crew,adu,f,surv  third,adu,m,mort  ... 
  • 4. Para este ejemplo sólo se van a considerar cuatro  variables: • Clase (0 = tripulación, 1 = primera, 2 = segunda, 3 = tercera) • Edad (1 = adulto, 0 = niño) • Sexo (1 = hombre, 0 = mujer) • Sobrevivió (1 = sí, 0 = no) Para ello, vamos a ver que reglas de asociación  interesantes podemos extraer de estos atributos. Para ejecutar los métodos en Weka de reglas de asociaciación, seleccionamos la ventana de associate.
  • 5.
  • 6. Entre otros, este sistema de minería de datos provee  el paquete “WEKA.associations.Apriori” que contiene la implementación del algoritmo de aprendizaje de reglas de asociación Apriori. Podemos configurar este algoritmo con varias opciones: con la opción “UpperBoundMinSupport” indicamos el límite superior de cobertura requerido para aceptar un conjunto de ítems. Si no se encuentran conjuntos de ítems suficientes  para generar las reglas requeridas se va disminuyendo el límite hasta llegar al límite inferior (opción “LowerBoundMinSupport”).
  • 7.
  • 8. Con la opción “minMetric” indicamos la confianza  mínima (u otras métricas dependiendo del criterio de ordenación) para mostrar una regla de asociación; y con la opción “numRules” indicamos el número de reglas que deseamos que aparezcan en pantalla. La ordenación de estas reglas en pantalla puede  configurarse mediante la opción “MetricType”, algunas opciones que se pueden utilizar son: confianza de la regla, lift (confianza divido por el número de ejemplos cubiertos por la parte derecha de la regla), y otras más elaboradas.
  • 9.
  • 10.
  • 11.
  • 12. En cada regla, tenemos la cobertura de la parte izquierda y  de la regla, así como la confianza de la regla. Podemos conocer alguna regla interesante aunque otras los son menos. Por ejemplo, la regla 1 indica que, como era de esperar toda la tripulación es adulta. La regla 2 nos indica lo mismo, pero teniendo en cuenta a los varones. Parecidas conclusiones podemos sacar de las reglas 4, 5 y 6.  La regla 3 nos indica que los varones que murieron fueron en su mayoría adultos (97%). La regla 7 destaca que la mayoría que murieron fueron adultos (97%). Y finalmente la 10 informa que la mayoría de los muertos fueron hombres (92%).
  • 13. Cabe destacar que la calidad de las reglas de asociación que  aprendamos muchas veces viene lastrada por la presencia de atributos que estén fuertemente descompensados. Por ejemplo, en este caso la escasa presencia de niños provoca que no aparezcan en las reglas de asociación, ya que las reglas con este ítemset poseen una baja cobertura y son filtradas. Podemos mitigar parcialmente este fenómeno si cambiamos el método de selección de reglas. A CONTINUACION VEREMOS EL COMPORTAMIENTO DE  LOS DEMAS ALGORITMOS: FiltroAsociado, HotSpot, A priori-Predictivo y el Tertius.
  • 14. Es igual al Apriori normal, devuelve los mismos resultados  para este caso.
  • 15. Actúa de manera distinta al Usar un valor de conteo mínimo  para los segmentos, en este caso de 726 instancias, usa también un factor máximo de ramificación de 2, y una mejora mínima en margen del 1%. Con estas métricas para nuestro ejemplo devuelve valores  de: No sobrevivieron el 67.7% (1490/2201)  De sexo masculino el 78.8% (1364/1731)   Eran adultos el 79.72% (1329/1667) De ambos sexos adultos: 68.74% (1438/2092) 
  • 16.
  • 17. Es más exhaustivo y combina las probabilidades de forma  distinta.
  • 18. Consideró 440 hipótesis de las cuales exploró 332, Así: 
  • 19. Usando el “ADTree ” obtenemos los resultados: 
  • 20. El árbol generado para “ADTree” será 
  • 22. El árbol generado para “FT” será 
  • 24. El árbol generado para “J48” será 
  • 26. El árbol generado para “LADTree” será 
  • 28. El árbol generado para “LMT” será 
  • 30. El árbol generado para “NBTree” será 
  • 32. El árbol generado para “REPtree” será 
  • 33. La explicación inicial del ejemplo fue extraída  de: http://users.dsic.upv.es/~jorallo/docent/doctora t/weka.p