Your SlideShare is downloading. ×
Aplicación de aprendizaje automático en minería de datos en la evaluación del Sistema de Gestión de Cursos
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×

Introducing the official SlideShare app

Stunning, full-screen experience for iPhone and Android

Text the download link to your phone

Standard text messaging rates apply

Aplicación de aprendizaje automático en minería de datos en la evaluación del Sistema de Gestión de Cursos

2,840
views

Published on

Proyecto para la asignatura de Inteligencia Artificial Avanzada

Proyecto para la asignatura de Inteligencia Artificial Avanzada

Published in: Education, Travel

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
2,840
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
48
Comments
0
Likes
0
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. Aplicación de aprendizaje automático en minería de datos en la evaluación del sistema de gestión de cursos de la OUI. Adriana Becerra Susana Guasha Mercy Jiménez ESCUELA DE CIENCIAS DE LA COMPUTACION Inteligencia Artificial Avanzada
  • 2. Resumen
    • La inteligencia artificial influye en la actualidad de manera progresiva mediante las técnicas de aprendizaje automático, la cual se ha difundido en distintos ámbitos de la ciencia y como complemento para la explotación del conocimiento interviene la minería de datos. Se utilizó WEKA versión 3.4.15 y el algoritmo J48, que se aplicó sobre una base de datos histórica que contienen información sobre un sistema de gestión de cursos implementado en la dependencia OUI-Loja, con el propósito de determinar cuál es el nivel de aceptación de los cursos ofertados por el área que desempeña el participante; decisiones que se que se pretenden recomendar luego de hacer un análisis y clasificación de los datos extraídos.
  • 3. Introducción
    • Mediante las técnicas de aprendizaje automatizado surgen investigaciones de gran aporte a la ciencia y las organizaciones en la toma de decisiones, así también la minería de datos se denomina inteligente y uno de sus campos de aplicación es en las empresas. El presente trabajo se aplicó el algoritmo de clasificación J4.8, mediante el API de JAVA usando WEKA 3.4.7, sobre una base de datos que contiene actividades relacionadas con actividades de la OUI-sede Loja, en el sistema de gestión de cursos.
  • 4. Introducción
    • Y como mecanismo de explotación usamos la técnica de minería de datos. Con el fin de determinar cual es el nivel de aceptación de los cursos ofertados, las temáticas más solicitadas por los profesionales, las mismas que se pretenden llevar a cabo luego de hacer un análisis y extracción de  la información más relevante de la base datos  para una  futura conclusión basada en la eficiencia  al momento de clasificar las instancias por parte del algoritmo.
    •  
  • 5. DESARROLLO DE LA INVESTIGACIÓN
  • 6.
    • PREDICCIONES DE LA ACEPTACION DE LOS CURSOS QUE OFRECE LA “OUI”
    • PREDICCION : El nivel de aceptación de los cursos por el área de los participantes.
    • PROBLEMA Y AREA DE APLICACIÓN
    • La OUI-Sede Loja maneja un sistema de gestión de cursos presenciales y en línea, el cual mantiene un registro de información de las capacitaciones y de sus participantes. Sistema que cuenta con una base de datos, donde se registra la información de los participantes, formas de pago, duración de los cursos, temática, etc.
  • 7. OBJETIVO
    • Identificar los patrones de correlación de entre cursos ofertados e interesados en ellos, para apoyar a la toma de decisiones, a partir de una base de conocimiento en torno a perfiles definidos.
  • 8. DESCRIPCIÓN DE LA BASE DE DATOS HISTÓRICA
    • La OUI oferta cursos con diferentes temáticas orientadas en las aéreas (Técnica, Administrativa. Socio-Humanística, Biológica), donde el participante puede inscribirse en línea o presencial, a su vez los inscritos están clasificados por categorías (Participantes, docentes, estudiantes). Culminado el curso obtiene un certificado de participación y/o aprobación.
    • El sistema registra el costo, forma de pago, ubicación de la sala, expositores, acompañantes, duración del curso y responsables organizadores, números de inscritos.
  • 9.
    • Para la construcción del modelo se extrae las variables mas relevantes de la base de datos intraouibd como son:
      • Código: indica la temática del evento
      • area_inscrito: determina el área del participante
      • certificado: que otorga después de la culminación del curso.
      • Modalidad: la forma de inscripción
      • Costo: de acuerdo a la categoría del inscrito.
      • tipo_asistente: particpante, estudiante y docente.
      • número_inscritos: total de inscritos por área
    DESCRIPCIÓN DE LA BASE DE DATOS HISTÓRICA
  • 10. TÉCNICAS DE CLASIFICACIÓN SUPERVISADA Algoritmo de clasificación J48
    • Á rboles de clasificación: Los árboles de clasificación tienen una estructura en forma de árbol, es un método de clasificación supervisada, se construyen mediante el proceso de inducción.
    • Algoritmos de clasificación : I nducen un clasificador para poder resolver el problema.
    • Algoritmo J4.8 : C onsiste en:
    • Escoger el atributo que mejor diferencia las salidas.
    • Crear una rama por cada salida.
    • Dividir las instancias en los correspondientes subgrupos.
    • Terminar cada rama si: todos los miembros tienen la misma clase. Etiquetar esa rama con dicha clase.
  • 11. TÉCNICAS DE CLASIFICACIÓN SUPERVISADA Algoritmo de clasificación J48
    • Sólo hay un miembro o no quedan más atributos, en cuyo casi la rama tendrá etiqueta correspondiente a la mayoría de instancias.
    • Para los subgrupos creados en 3 que no sean terminales, repartirles el algoritmo, dicho árbol puede ser visto por un experto o usado para clasificar posteriores instancias.
    •  
  • 12. ATRIBUTOS Y CLASES PARA LA BASE DE ENTRENAMIENTO Y DE EVALUACIÓN
    • TABLA: info_eventos
    • TABLA: inscritos_cursos
    • TABLA: categorias
    • TABLA: evento_categoria
  • 13. ANALISIS Y MODELADO DE DATOS
    • Estructura del modelo de datos, las variables: Curso, área del participante, documento otorgado, modalidad, costo, tipo de participante, número de inscritos
  • 14. EXPERIMENTACIÓN DEL MODELO
    • Mediante sentencias SQL se realizó la obtención de la base de entrenamiento a partir de la base de datos histórica.
  • 15.
    • presenta el resultado obtenido de la consulta, el cual conforma nuestra base de entrenamiento
  • 16. ESPECIFICACIÓN
    •   Herramientas de la extracción del conocimiento
    • MySql: Mediante las consultas se extrae la información relevante de la base de datos, que servirá para el modelo de la base de entrenamiento.
    •  
    • WEKA: Tiene un conjunto de librerías JAVA para la extracción del conocimiento; desde las bases de datos y así poder realizar tareas de minerías de datos, cuenta con un API, el mismo que nos permite trabajar con el IDE de Java Netbeans. En la aplicación de java se carga la base de entrenamiento y mediante las librerías de weka se puede clasificar los datos en base del algortimo de clasificación.
  • 17. Laboratorio
    • El resultado de la base de entrenamiento determina, que de un conjunto de 69 datos a clasificar, se obtiene un resultado de un 98 % de instancias bien clasificadas y un 1% de instancias mal clasificadas con un margen de error relativo de 37.77%.
  • 18. EVALUACION
    • La evaluación del nivel de aceptación de los cursos por parte de los inscritos se determina mediante los resultados que nos da el algoritmo J48.
  • 19. DISCUCION Y ANÁLISIS DE RESULTADOS
    • Esto significa que el algoritmo aprendió en gran medida para la clasificación con la prueba de test dado que el margen de instancias mal clasificadas es mínimo..
    Algoritmo Resultados con validación cruzada Resultados con la base de datos de prueba J48 Instancias correctamente clasificadas: 98.5075 % Instancias incorrectamente clasificadas: 1.4925 % Error relativo absoluto: 37.77 % Instancias correctamente clasificadas: 100 % Instancias incorrectamente clasificadas: 0 % Error relativo absoluto: 14.7925 %
  • 20. CONCLUSIONES
    • Es importante tener un conocimiento general del tema de análisis para una posterior elección de la herramienta de aprendizaje automático ya sea supervisada o no supervisada que facilite la interpretación de los resultados de manera fácil y completa.
  • 21. CONCLUSIONES
    • La minería de datos es fundamental para la extracción relevante para un posterior análisis, pero es fundamental complementar con técnicas de aprendizaje automático para concluir con un análisis más preciso y fundamentado.
    •  
    • La minería de datos genera conocimiento y mediante el aprendizaje automático se puede evidenciar claramente los resultados siendo este un factor fundamental para la toma de decisiones en una organización.