Práctica en Weka

•Download as PPTX, PDF•

1 like•3,638 views

May Alejandra Montalván

Health & Medicine Technology

Inteligencia Artificial Avanzada

Mayra Montalván
22/04/2009

OBJETIVO
El objetivo de este ejercicio es familiarizarse con el entorno
WEKA para lo cuál se trabajará con una base de datos que
contiene datos sobre medidas médicas de pacientes (todas
mujeres) y en la que se pretende determinar cuáles son los
factores que hacen que una persona se le diagnostique la
enfermedad conocida como Diabetes.

Usando el algoritmo de aprendizaje automático más
conocido como Árboles de Clasificación, procederemos a
realizar el árbol de decisión para tal diagnóstico.

PROBLEMA
Las variables son las mediciones relativas a las del paciente: edad,
embarazo y más información.
 Número de Instancias de la base de datos: 768.
 Número de Atributos: 8 más clase.
 Para cada atributo: (todos con valores numéricos)
1. Número de veces embarazada.
2. Una concentración de glucosa en plasma 2 horas en una prueba de
tolerancia oral a la glucosa.
3. La presión arterial diastólica (mm Hg).
4. Pliegue tricipital espesor (mm)
5. 2-horas de insulina en suero (mu U / ml)
6. Índice de masa corporal (peso en kg / (altura en m) ^ 2)
7. Diabetes pedigrí función
8. Edad (años)
9. Variable de clase (0 ó 1)

PROBLEMA
 Valores de Atributos Faltantes: Ninguno
 Distribución de Clase : (clase con valor 1 es interpretada como: quot;tested
positivequot;)

VALOR DE LA CLASE NÚMERO DE INSTANCIAS

500
0
268
1

Valores en el atributo Clase:
De: 0 A: tested_negative
De: 1 A: tested_positive

UN POCO DE LA BASE DE DATOS
Para visualizar y/o descargar la base de datos original visita
este enlace:

http://www.sc.ehu.es/ccwbayes/docencia/mmcc/files/UCI-
MMCC/diabetes.arff

GENERACIÓN DEL ÁRBOL
Se dispone de los datos recogidos para pronosticar la
aparición de la diabetes en pacientes, que se trata sólo de
mujeres menores de 21 años, para lo cuál procedemos con:
1. Lanzar el Interfaz Explorer en la herramienta WEKA:

GENERACIÓN DEL ÁRBOL
2. Cargar la Base de Datos: Para cargar la base de datos se
utilizará el botón OPEN FILE del interfaz Explorer (pestaña
Preprocess), se seleccionará el directorio data y dentro de él,
el fichero quot;diabetes.arffquot;. El resultado será una pantalla como
la que se muestra en la figura:

GENERACIÓN DEL ÁRBOL
3. En la parte izquierda aparecen los atributos mencionados
anteriomente.
4. Haciendo clic sobre cada uno de los atributos, se muestra
información sobre el mismo en la parte derecha de la
ventana. En el caso de atributos discretos se indica el
número de instancias que toman cada uno de los valores
posibles; y en el caso de atributos reales se muestran los
valores máximo, mínimo, medio y la desviación estándar.

Una vez vistas las posibilidades de representación gráfica, se
probará uno de los algoritmos de aprendizaje automático
incluidos en WEKA: los árboles de decisión.

GENERACIÓN DEL ÁRBOL
5. Para ello se seleccionará la pestaña Classify y se elegirá un
clasificador pulsando el botón Choose. Aparecerá una
estructura de directorios en la que se seleccionará el
directorio trees y dentro del él el algoritmo J48. Se
mantendrán las opciones por defecto del clasificador (J48 –C
0.25 –M 2), tal y como muestra la pantalla siguiente.

GENERACIÓN DEL ÁRBOL
El resto de opciones para el experimento también se
mantendrán en los valores por defecto: activa la opción de
test ‘cross validation’ e inactivas las restantes. Para generar
el árbol se pulsará Start. El resultado será el que muestra la
pantalla siguiente, donde se muestran en modo texto tanto el
árbol generado como la capacidad de clasificación del mismo:

GENERACIÓN DEL ÁRBOL
También es posible visualizar el árbol de decisión de una
forma más legible. Para ello se debe hacer clic con el botón
derecho en la ventana de resultados, sobre el resultado de la
generación del árbol. Aparecerá un menú desplegable:

GENERACIÓN DEL ÁRBOL
Y dentro de ese menú se deberá seleccionar la opción
‘Visualize tree’. El resultado se muestra en la figura
siguiente:

What's hot

DB1 Unidad 10: New SQLFranklin Parrales Bravo

Proyecto de compiladores Sentencia While con Java CUP y JFLEXIvan Luis Jimenez

Ejercicio 2yolymorquecho

Herramientas De Control, Monitoreo Y Acceso A Base De DatosYazmin Ibarra

Unidad no. 2 búsqueda en espacio de estadosMilton Klapp

Taller de Base de Datos - Unidad 6 SQL proceduralJosé Antonio Sandoval Acosta

13 tipos de diagramas uml, la metodología de desarrollo ágil de software y la...Uriel Herrera

Apache cassandralibra_hch

Practicas tablespaces tema5 oracle tablespaceCarlos Ocola Ugarte

Búsqueda Primero el MejorTutor4uDev

Eventos y listeners en Java SwingLaura Folgado Galache

Examen final de base de datos ii solucionadoBertha Canaviri

Integridad99909

Bitácora de base de datosLalo Osorio

Procesos e HilosLuis Feliciano

Lenguaje de definición de datos (ddl)jhon dennis floresmamani

Programación 3: árboles binarios y ordenadosAngel Vázquez Patiño

Vistas en SQLGREINDER MARCHENA & LIZ VASQUEZ

4.2 mecanismos y_funciones_de_los_manejadores_de_dispositivosbeymarlopez

Diagramas de estadosstill01

What's hot (20)

DB1 Unidad 10: New SQL

Proyecto de compiladores Sentencia While con Java CUP y JFLEX

Ejercicio 2

Herramientas De Control, Monitoreo Y Acceso A Base De Datos

Unidad no. 2 búsqueda en espacio de estados

Taller de Base de Datos - Unidad 6 SQL procedural

13 tipos de diagramas uml, la metodología de desarrollo ágil de software y la...

Apache cassandra

Practicas tablespaces tema5 oracle tablespace

Búsqueda Primero el Mejor

Eventos y listeners en Java Swing

Examen final de base de datos ii solucionado

Integridad

Bitácora de base de datos

Procesos e Hilos

Lenguaje de definición de datos (ddl)

Programación 3: árboles binarios y ordenados

Vistas en SQL

4.2 mecanismos y_funciones_de_los_manejadores_de_dispositivos

Diagramas de estados

Similar to Práctica en Weka

ARBOLES DE CLASIFICACIONGabriela Vivanco

407473849-ERROR-TOTAL-pdf.pdfEDUARDOVELASCOSANCHE

Econometría P. 5disenoinstruccional

Estandares para la atencion medica de la diabetes español. ada 2012Ivan Suazo

Actividad 4.c respuestasMelissa Garcia Felix

Clasificación de diabetes - IA - Cano, Eliana.pptxElianaVictoriaCano

Aspectos metodológicos de la Guía de Práctica Clínica sobre Diabetes Tipo 2Plan de Calidad para el SNS

Ejemplo de analisis_descriptivo_de_un_conjunto_de_datosVerónica Melgarejo

Control de calidad externocerdop

Valores normales de laboratorio del r.nBelia Damian

Dispositivos de luz infrarroja cercana para canalizar pacientes pediátricosHospital Pediátrico de Sinaloa

Bioestadistica ma13155Maestros en Linea

Diabeteslimama

¿Porque hacer MBE?mdelaov

Analisis multivariante 2012Maestros en Linea

Sistemas de Control de Calidad Básico e Intermedio para el Laboratorio ClínicoIPN

Dx Dmjoeluagmed

Guia para la atencion de las principales emergencias obstetricas 2da edicionDaniel Ramlho

(2014-10-02) Diabetes aguda y crónica en atención primaria (DOC)UDMAFyC SECTOR ZARAGOZA II

Clinical Trials & Alzheimer's DiseaseMayely Sánchez

Similar to Práctica en Weka (20)

ARBOLES DE CLASIFICACION

407473849-ERROR-TOTAL-pdf.pdf

Econometría P. 5

Estandares para la atencion medica de la diabetes español. ada 2012

Actividad 4.c respuestas

Clasificación de diabetes - IA - Cano, Eliana.pptx

Aspectos metodológicos de la Guía de Práctica Clínica sobre Diabetes Tipo 2

Ejemplo de analisis_descriptivo_de_un_conjunto_de_datos

Control de calidad externo

Valores normales de laboratorio del r.n

Dispositivos de luz infrarroja cercana para canalizar pacientes pediátricos

Bioestadistica ma13155

Diabetes

¿Porque hacer MBE?

Analisis multivariante 2012

Sistemas de Control de Calidad Básico e Intermedio para el Laboratorio Clínico

Dx Dm

Guia para la atencion de las principales emergencias obstetricas 2da edicion

(2014-10-02) Diabetes aguda y crónica en atención primaria (DOC)

Clinical Trials & Alzheimer's Disease

Recently uploaded

Farmacología y farmacocinética a nivel ocularOmarRodrigoGuadarram

Clase 11 Articulaciones de la Cabeza 2024.pdfgarrotamara01

Historia Clínica Quirurgica slide/ppt- rodrigo quevedoMarcosFilho91

Clase 9 Miembro Inferior Osteologia 2024.pdfgarrotamara01

INPSASEL concepto , funciones y caracteristicaseduarhernandez12382

TEORIA de la enfermería de dorothea OREM.pptxMarianaBlanco38

INFECCION DE TRACTO URINARIO (ITU) EN GESTANTESangelojosue

Papalia, D.E., Feldman, R.D., & Martorell, G. (2012). Desarrollo humano. Edit...pizzadonitas

DIAGNÓSTICO clínico biológico inmunológico y ecografico de la gestaciónmirtha44

Tejido Nervioso- Histología-Geneser .pptx Estefania Recalde Mejia

Anatomía de la Esclera y clasificación.MaraBelnZamoraAguila

Epidemiologia 4: Estructura metodologica de un trabajo cientifico, Fases de r...Juan Rodrigo Tuesta-Nole

CASO CLINICO MIOMATOSIS UTERINA.pptx enfermeriaLuzIreneBancesGuevar

planos anatomicos y ejes del cuerpo humanosalvadorrangel8

historia clinica insuficiencia renal cronicaAlexanderVasquezSana

ACCIDENTES CEREBROVASCULARES de suma importanciataliaquispe2

(2024-04-16)DERMATOSCOPIA EN ATENCIÓN PRIMARIA (DOC)UDMAFyC SECTOR ZARAGOZA II

Sala Situacional Nacional - MINSA Perú 2024Miguel Yan Garcia

Avance Tarea-3-Cuidados-Basicos de enfermeria.pptxangelicacardales1

Betty Neuman-YessiAlvarez. TEORISTA EN ENFERMERIAMONICATRINIDAD7

Recently uploaded (20)

Farmacología y farmacocinética a nivel ocular

Clase 11 Articulaciones de la Cabeza 2024.pdf

Historia Clínica Quirurgica slide/ppt- rodrigo quevedo

Clase 9 Miembro Inferior Osteologia 2024.pdf

INPSASEL concepto , funciones y caracteristicas

TEORIA de la enfermería de dorothea OREM.pptx

INFECCION DE TRACTO URINARIO (ITU) EN GESTANTES

Papalia, D.E., Feldman, R.D., & Martorell, G. (2012). Desarrollo humano. Edit...

DIAGNÓSTICO clínico biológico inmunológico y ecografico de la gestación

Tejido Nervioso- Histología-Geneser .pptx

Anatomía de la Esclera y clasificación.

Epidemiologia 4: Estructura metodologica de un trabajo cientifico, Fases de r...

CASO CLINICO MIOMATOSIS UTERINA.pptx enfermeria

planos anatomicos y ejes del cuerpo humano

historia clinica insuficiencia renal cronica

ACCIDENTES CEREBROVASCULARES de suma importancia

(2024-04-16)DERMATOSCOPIA EN ATENCIÓN PRIMARIA (DOC)

Sala Situacional Nacional - MINSA Perú 2024

Avance Tarea-3-Cuidados-Basicos de enfermeria.pptx

Betty Neuman-YessiAlvarez. TEORISTA EN ENFERMERIA

Práctica en Weka

1. Inteligencia Artificial Avanzada Mayra Montalván 22/04/2009

2. OBJETIVO El objetivo de este ejercicio es familiarizarse con el entorno WEKA para lo cuál se trabajará con una base de datos que contiene datos sobre medidas médicas de pacientes (todas mujeres) y en la que se pretende determinar cuáles son los factores que hacen que una persona se le diagnostique la enfermedad conocida como Diabetes. Usando el algoritmo de aprendizaje automático más conocido como Árboles de Clasificación, procederemos a realizar el árbol de decisión para tal diagnóstico.

3. PROBLEMA Las variables son las mediciones relativas a las del paciente: edad, embarazo y más información.  Número de Instancias de la base de datos: 768.  Número de Atributos: 8 más clase.  Para cada atributo: (todos con valores numéricos) 1. Número de veces embarazada. 2. Una concentración de glucosa en plasma 2 horas en una prueba de tolerancia oral a la glucosa. 3. La presión arterial diastólica (mm Hg). 4. Pliegue tricipital espesor (mm) 5. 2-horas de insulina en suero (mu U / ml) 6. Índice de masa corporal (peso en kg / (altura en m) ^ 2) 7. Diabetes pedigrí función 8. Edad (años) 9. Variable de clase (0 ó 1)

4. PROBLEMA  Valores de Atributos Faltantes: Ninguno  Distribución de Clase : (clase con valor 1 es interpretada como: quot;tested positivequot;) VALOR DE LA CLASE NÚMERO DE INSTANCIAS 500 0 268 1 Valores en el atributo Clase: De: 0 A: tested_negative De: 1 A: tested_positive

5. UN POCO DE LA BASE DE DATOS Para visualizar y/o descargar la base de datos original visita este enlace: http://www.sc.ehu.es/ccwbayes/docencia/mmcc/files/UCI- MMCC/diabetes.arff

6. GENERACIÓN DEL ÁRBOL Se dispone de los datos recogidos para pronosticar la aparición de la diabetes en pacientes, que se trata sólo de mujeres menores de 21 años, para lo cuál procedemos con: 1. Lanzar el Interfaz Explorer en la herramienta WEKA:

7. GENERACIÓN DEL ÁRBOL

8. GENERACIÓN DEL ÁRBOL 2. Cargar la Base de Datos: Para cargar la base de datos se utilizará el botón OPEN FILE del interfaz Explorer (pestaña Preprocess), se seleccionará el directorio data y dentro de él, el fichero quot;diabetes.arffquot;. El resultado será una pantalla como la que se muestra en la figura:

9. GENERACIÓN DEL ÁRBOL

10. GENERACIÓN DEL ÁRBOL 3. En la parte izquierda aparecen los atributos mencionados anteriomente. 4. Haciendo clic sobre cada uno de los atributos, se muestra información sobre el mismo en la parte derecha de la ventana. En el caso de atributos discretos se indica el número de instancias que toman cada uno de los valores posibles; y en el caso de atributos reales se muestran los valores máximo, mínimo, medio y la desviación estándar. Una vez vistas las posibilidades de representación gráfica, se probará uno de los algoritmos de aprendizaje automático incluidos en WEKA: los árboles de decisión.

11. GENERACIÓN DEL ÁRBOL 5. Para ello se seleccionará la pestaña Classify y se elegirá un clasificador pulsando el botón Choose. Aparecerá una estructura de directorios en la que se seleccionará el directorio trees y dentro del él el algoritmo J48. Se mantendrán las opciones por defecto del clasificador (J48 –C 0.25 –M 2), tal y como muestra la pantalla siguiente.

12. GENERACIÓN DEL ÁRBOL

13. GENERACIÓN DEL ÁRBOL El resto de opciones para el experimento también se mantendrán en los valores por defecto: activa la opción de test ‘cross validation’ e inactivas las restantes. Para generar el árbol se pulsará Start. El resultado será el que muestra la pantalla siguiente, donde se muestran en modo texto tanto el árbol generado como la capacidad de clasificación del mismo:

14. GENERACIÓN DEL ÁRBOL

15. GENERACIÓN DEL ÁRBOL También es posible visualizar el árbol de decisión de una forma más legible. Para ello se debe hacer clic con el botón derecho en la ventana de resultados, sobre el resultado de la generación del árbol. Aparecerá un menú desplegable:

16. GENERACIÓN DEL ÁRBOL Y dentro de ese menú se deberá seleccionar la opción ‘Visualize tree’. El resultado se muestra en la figura siguiente:

17.

18. FIN DE LA PRESENTACIÓN

Práctica en Weka

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Similar to Práctica en Weka

Similar to Práctica en Weka (20)

Recently uploaded

Recently uploaded (20)

Práctica en Weka