Analizador de Estructuras de Navegación Aplicando Minería de Uso Web y Minería de Estructura Web   <ul><li>Presenta: </li>...
Agenda <ul><li>Introducción </li></ul><ul><ul><li>Descripción del problema </li></ul></ul><ul><ul><li>Objetivo </li></ul><...
Introducción <ul><li>Cada dia las organizaciones lanzan sus sitios Web a Internet. </li></ul><ul><li>¿Cómo es usado el sit...
Introducción: Descripción del problema <ul><li>Atraer a los usuarios a un sitio Web </li></ul><ul><li>Navegación rápida, i...
Introducción: Objetivo de la tesis <ul><li>Mejorar la navegación de los usuarios de un sitio Web </li></ul><ul><li>Desarro...
Introducción:  Justificación  y Beneficios <ul><li>Beneficios para los administradores de los sitios Web, para mejorar el ...
Introducción: Trabajos relacionados 6 Trabajo Aplica algoritmos de minería de uso Web Aplica algoritmos de minería de estr...
<ul><li>Introducción </li></ul><ul><ul><li>Descripción del problema </li></ul></ul><ul><ul><li>Objetivo </li></ul></ul><ul...
Análisis y diseño <ul><li>Aplicación Web </li></ul><ul><li>JEE 5 </li></ul><ul><li>Patrón de diseño Modelo Vista Controlad...
Análisis y diseño 8
Análisis y diseño <ul><li>Diseño conceptual </li></ul>9
Análisis y diseño <ul><li>Modelo general de la aplicación </li></ul>10
Análisis y diseño <ul><li>Módulo de minería de uso Web </li></ul>11
Análisis y diseño <ul><li>Módulo de minería de estructura Web </li></ul>12
Análisis y diseño <ul><li>Módulo de extracción y reunión de resultados </li></ul>13
Análisis y diseño <ul><li>Módulo visualizador gráfico de resultados </li></ul>14
<ul><li>Introducción </li></ul><ul><ul><li>Descripción del problema </li></ul></ul><ul><ul><li>Objetivo </li></ul></ul><ul...
Características generales de implementación <ul><li>Sistema Operativo Linux Suse 10.2 </li></ul><ul><li>Java 5 Enterprise ...
Implementación <ul><li>Paquete analizadorWebSite </li></ul>16
<ul><li>Introducción </li></ul><ul><ul><li>Descripción del problema </li></ul></ul><ul><ul><li>Objetivo </li></ul></ul><ul...
Pruebas y resultados <ul><li>Pruebas de funcionalidad en base al estándar IEEE 829 </li></ul><ul><li>Análisis del sitio CE...
Pruebas: Cargar la información del sitio Web <ul><li>Información necesaria para analizar un sitio Web </li></ul><ul><ul><l...
Pruebas: Preprocesamiento Selección de las extensiones de archivos a filtrar 19 ‘ gif’, ‘jpg’, ‘ico’, ‘png’, ‘bmp’, ‘dib’,...
Pruebas: Sesionización <ul><li>Peticiones </li></ul><ul><li>Minutos </li></ul><ul><li>Heurístico </li></ul>20
Pruebas: Proceso de minería de uso Web <ul><li>Pruebas extracción de reglas de asociación utilizando los siguientes valore...
Pruebas proceso de minería de estructura Web <ul><li>Recolectar la estructura del sitio Web </li></ul><ul><ul><li>Algoritm...
Pruebas de proceso de minería de estructura Web <ul><li>Extracción de cada página de: </li></ul><ul><ul><li>Caminos inalca...
Procesamiento del grafo y visualización de resultados Grafo de la  estructura del sitio  Web Caminos inalcanzables Reglas ...
Resultados obtenidos Regla de asociación encontrada Probabilidad de que una página B sea  solicitada cuando se visita una ...
Resultados obtenidos con la herramienta Página con camino inalcanzable Es una página Web que no puede ser accedida. Los ca...
<ul><li>Introducción </li></ul><ul><ul><li>Descripción del problema </li></ul></ul><ul><ul><li>Objetivo </li></ul></ul><ul...
Conclusiones <ul><li>Los beneficios de la aplicación de la minería de datos en el estudio de la estructura de navegación d...
Conclusiones <ul><li>El mayor avance en los estudios de minería de uso Web sobre la minería de estructura Web </li></ul><u...
Trabajos futuros <ul><li>Mostrar los patrones de navegación encontrados de forma dinámica dentro de una sección de sugeren...
Preguntas y comentarios
Analizador de Estructuras de Navegación Aplicando Minería de Uso Web y Minería de Estructura Web   Presenta: Ing. Eduardo ...
Upcoming SlideShare
Loading in …5
×

Analizador de Estructuras de Navegación Aplicando Minería de Uso Web y Minería de Estructura Web

2,887 views

Published on

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
2,887
On SlideShare
0
From Embeds
0
Number of Embeds
46
Actions
Shares
0
Downloads
0
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Analizador de Estructuras de Navegación Aplicando Minería de Uso Web y Minería de Estructura Web

  1. 1. Analizador de Estructuras de Navegación Aplicando Minería de Uso Web y Minería de Estructura Web <ul><li>Presenta: </li></ul><ul><li>Ing. Eduardo Ortiz Hernández </li></ul><ul><li>Director de tesis: Dr. Juan Gabriel González Serna </li></ul><ul><li>Codirector: Dr. José Antonio Zárate Marceleño </li></ul>
  2. 2. Agenda <ul><li>Introducción </li></ul><ul><ul><li>Descripción del problema </li></ul></ul><ul><ul><li>Objetivo </li></ul></ul><ul><ul><li>Justificación y beneficios </li></ul></ul><ul><ul><li>Trabajos relacionados </li></ul></ul><ul><li>Análisis y diseño </li></ul><ul><li>Implementación </li></ul><ul><li>Pruebas y resultados </li></ul><ul><li>Conclusiones </li></ul><ul><li>. </li></ul>
  3. 3. Introducción <ul><li>Cada dia las organizaciones lanzan sus sitios Web a Internet. </li></ul><ul><li>¿Cómo es usado el sitio Web? </li></ul><ul><li>La conexión entre las páginas Web -> estructura de navegación. </li></ul>2
  4. 4. Introducción: Descripción del problema <ul><li>Atraer a los usuarios a un sitio Web </li></ul><ul><li>Navegación rápida, intuitiva y natural </li></ul><ul><li>Diseño y estructura de navegación complicada </li></ul><ul><li>Falta de entendimiento de la forma en que los usuarios navegan en el sitio Web </li></ul>3
  5. 5. Introducción: Objetivo de la tesis <ul><li>Mejorar la navegación de los usuarios de un sitio Web </li></ul><ul><li>Desarrollar una herramienta que aplique minería de uso Web y minería de estructura Web sobre un sitio y visualizar los resultados de manera gráfica </li></ul><ul><li>Proporciona la posibilidad de rediseñar la estructura para optimizar la navegación en el sitio Web </li></ul>4
  6. 6. Introducción: Justificación y Beneficios <ul><li>Beneficios para los administradores de los sitios Web, para mejorar el diseño estructural de las páginas </li></ul><ul><li>Beneficios para los usuarios </li></ul>5
  7. 7. Introducción: Trabajos relacionados 6 Trabajo Aplica algoritmos de minería de uso Web Aplica algoritmos de minería de estructura Web Representación gráfica de los resultados Propone recomendacio-nes de estructura del sitio Tesis propuesta Si Si Grafo dinámico en 2D Si ScentViz Si No DiskTree Si WebKIV Si No DiskTree Si Visual Web Mining Si No Grafo en 3D No WEBKVDS Si No Web Graph No Navigation Visualizer No No Grafo dirigido No WebPatterns Si No DiskTree No WebViz Si No Web Graph No
  8. 8. <ul><li>Introducción </li></ul><ul><ul><li>Descripción del problema </li></ul></ul><ul><ul><li>Objetivo </li></ul></ul><ul><ul><li>Justificación y beneficios </li></ul></ul><ul><ul><li>Trabajos relacionados </li></ul></ul><ul><li>Análisis y diseño </li></ul><ul><li>Implementación </li></ul><ul><li>Pruebas y resultados </li></ul><ul><li>Conclusiones </li></ul>Agenda <ul><li>. </li></ul><ul><li>. </li></ul><ul><li>. </li></ul><ul><li>. </li></ul><ul><li>. </li></ul><ul><li>. </li></ul>
  9. 9. Análisis y diseño <ul><li>Aplicación Web </li></ul><ul><li>JEE 5 </li></ul><ul><li>Patrón de diseño Modelo Vista Controlador (MVC) </li></ul>7
  10. 10. Análisis y diseño 8
  11. 11. Análisis y diseño <ul><li>Diseño conceptual </li></ul>9
  12. 12. Análisis y diseño <ul><li>Modelo general de la aplicación </li></ul>10
  13. 13. Análisis y diseño <ul><li>Módulo de minería de uso Web </li></ul>11
  14. 14. Análisis y diseño <ul><li>Módulo de minería de estructura Web </li></ul>12
  15. 15. Análisis y diseño <ul><li>Módulo de extracción y reunión de resultados </li></ul>13
  16. 16. Análisis y diseño <ul><li>Módulo visualizador gráfico de resultados </li></ul>14
  17. 17. <ul><li>Introducción </li></ul><ul><ul><li>Descripción del problema </li></ul></ul><ul><ul><li>Objetivo </li></ul></ul><ul><ul><li>Justificación y beneficios </li></ul></ul><ul><ul><li>Trabajos relacionados </li></ul></ul><ul><li>Análisis y diseño </li></ul><ul><li>Implementación </li></ul><ul><li>Pruebas y resultados </li></ul><ul><li>Conclusiones </li></ul>Agenda <ul><li>. </li></ul><ul><li>. </li></ul><ul><li>. </li></ul><ul><li>. </li></ul><ul><li>. </li></ul><ul><li>. </li></ul><ul><li>. </li></ul>
  18. 18. Características generales de implementación <ul><li>Sistema Operativo Linux Suse 10.2 </li></ul><ul><li>Java 5 Enterprise Edition </li></ul><ul><li>Manejador de base de datos MySQL 5 </li></ul><ul><li>Ambiente de desarrollo NetBeans 6.0 </li></ul><ul><li>Navegador Web Mozilla Firefox 2 </li></ul><ul><li>Framework Struts 2 </li></ul>15
  19. 19. Implementación <ul><li>Paquete analizadorWebSite </li></ul>16
  20. 20. <ul><li>Introducción </li></ul><ul><ul><li>Descripción del problema </li></ul></ul><ul><ul><li>Objetivo </li></ul></ul><ul><ul><li>Justificación y beneficios </li></ul></ul><ul><ul><li>Trabajos relacionados </li></ul></ul><ul><li>Análisis y diseño </li></ul><ul><li>Implementación </li></ul><ul><li>Pruebas y resultados </li></ul><ul><li>Conclusiones </li></ul>Agenda <ul><li>. </li></ul><ul><li>. </li></ul><ul><li>. </li></ul><ul><li>. </li></ul><ul><li>. </li></ul><ul><li>. </li></ul><ul><li>. </li></ul><ul><li>. </li></ul>
  21. 21. Pruebas y resultados <ul><li>Pruebas de funcionalidad en base al estándar IEEE 829 </li></ul><ul><li>Análisis del sitio CENIDET </li></ul><ul><li>Archivos históricos correspondientes al mes de febrero de 2007 </li></ul>17
  22. 22. Pruebas: Cargar la información del sitio Web <ul><li>Información necesaria para analizar un sitio Web </li></ul><ul><ul><li>Proporcionar los </li></ul></ul><ul><ul><li>archivos de bitácora </li></ul></ul><ul><ul><li>Proporcionar la URL </li></ul></ul><ul><ul><li>del sitio Web </li></ul></ul>18 Archivos de bitácora: 272 Mb Total de peticiones: 1,275,279
  23. 23. Pruebas: Preprocesamiento Selección de las extensiones de archivos a filtrar 19 ‘ gif’, ‘jpg’, ‘ico’, ‘png’, ‘bmp’, ‘dib’, ‘jpeg’, ’jpe’, ‘jfif’, ‘tif’, ’tiff’, ‘mp3’, ‘css,’, ‘cab’, ‘swf’. 16.2% del total inicial de peticiones
  24. 24. Pruebas: Sesionización <ul><li>Peticiones </li></ul><ul><li>Minutos </li></ul><ul><li>Heurístico </li></ul>20
  25. 25. Pruebas: Proceso de minería de uso Web <ul><li>Pruebas extracción de reglas de asociación utilizando los siguientes valores: </li></ul><ul><ul><li>5% soporte </li></ul></ul><ul><ul><li>70% confianza </li></ul></ul><ul><li>2 reglas encontradas: </li></ul><ul><ul><li>/subaca/web-dcc/index.html -> /index.html </li></ul></ul><ul><ul><li>(Departamento de Ciencias de la Computación -> homepage ) </li></ul></ul><ul><ul><li>/selección/index.html -> /index.html </li></ul></ul><ul><ul><li>(Proceso de selección -> homepage ) </li></ul></ul>
  26. 26. Pruebas proceso de minería de estructura Web <ul><li>Recolectar la estructura del sitio Web </li></ul><ul><ul><li>Algoritmo de búsqueda: Búsqueda primero por anchura </li></ul></ul><ul><ul><ul><li>Página raíz </li></ul></ul></ul><ul><ul><ul><li>Buscar todas las etiquetas <a href> </li></ul></ul></ul><ul><ul><ul><li>Verificar que el nodo pertenezca al dominio y que no haya sido visitado anteriormente, para agregar en una lista de nodos a visitar. </li></ul></ul></ul>
  27. 27. Pruebas de proceso de minería de estructura Web <ul><li>Extracción de cada página de: </li></ul><ul><ul><li>Caminos inalcanzables </li></ul></ul><ul><ul><li>Grado de hipervínculos globales de salida </li></ul></ul><ul><ul><li>Grado de hipervínculos locales de entrada y salida </li></ul></ul>21
  28. 28. Procesamiento del grafo y visualización de resultados Grafo de la estructura del sitio Web Caminos inalcanzables Reglas de asociación Reporte estructural del sitio Web Grado global de salida Grado local de entrada Grado local de salida 22
  29. 29. Resultados obtenidos Regla de asociación encontrada Probabilidad de que una página B sea solicitada cuando se visita una página A. Grado de hipervínculos globales de salida para cada nodo Visibilidad de la página con páginas de otros sitios Web. Grado de hipervínculos locales de entrada y de salida para cada nodo Mide la conectividad entre las páginas que conforman el sitio Web. Página con mayor grado de hipervínculos de entrada y salida Página con más visibilidad al usuario Página con menor grado de hipervínculos de entrada y salida Página con menos visibilidad al usuario
  30. 30. Resultados obtenidos con la herramienta Página con camino inalcanzable Es una página Web que no puede ser accedida. Los caminos inalcanzables deben ser detectados y mostrados al usuario 24
  31. 31. <ul><li>Introducción </li></ul><ul><ul><li>Descripción del problema </li></ul></ul><ul><ul><li>Objetivo </li></ul></ul><ul><ul><li>Justificación y beneficios </li></ul></ul><ul><ul><li>Trabajos relacionados </li></ul></ul><ul><li>Análisis y diseño </li></ul><ul><li>Implementación </li></ul><ul><li>Pruebas y resultados </li></ul><ul><li>Conclusiones </li></ul>Agenda <ul><li>. </li></ul><ul><li>. </li></ul><ul><li>. </li></ul><ul><li>. </li></ul><ul><li>. </li></ul><ul><li>. </li></ul><ul><li>. </li></ul><ul><li>. </li></ul><ul><li>. </li></ul>
  32. 32. Conclusiones <ul><li>Los beneficios de la aplicación de la minería de datos en el estudio de la estructura de navegación de un sitio Web </li></ul><ul><li>Utilizando los patrones de navegación extraídos mediante minería de uso se obtienen recomendaciones en la estructura del sitio Web </li></ul><ul><li>Utilizando la información del reporte estructural se permite mejorar la conectividad entre las páginas que conforman al sitio </li></ul>25
  33. 33. Conclusiones <ul><li>El mayor avance en los estudios de minería de uso Web sobre la minería de estructura Web </li></ul><ul><li>El desarrollo de una aplicación Web utilizando el patrón de diseño Modelo Vista Controlador (implementado por Struts) </li></ul>26
  34. 34. Trabajos futuros <ul><li>Mostrar los patrones de navegación encontrados de forma dinámica dentro de una sección de sugerencias dentro del sitio Web </li></ul><ul><li>Equilibrar el grado de hipervínculos locales en los nodos dentro del sitio Web de manera automática </li></ul><ul><li>Utilizar los patrones de navegación encontrados y definir que tipo de relación semántica tiene de acuerdo al trabajo de [1] </li></ul>26 [1] Baños Nolasco Matilde, “Metodología para Definir una Arquitectura de Sitios Web Basada en Diseños de Ontologías”, Tesis de Maestría en Ciencias en Ciencias Computacionales, Centro Nacional de Investigación y Desarrollo Tecnológico CENIDET, Cuernavaca, Morelos, 2008.
  35. 35. Preguntas y comentarios
  36. 36. Analizador de Estructuras de Navegación Aplicando Minería de Uso Web y Minería de Estructura Web Presenta: Ing. Eduardo Ortiz Hernández Director de tesis: Dr. Juan Gabriel González Serna Codirector: Dr. José Antonio Zárate Marceleño

×