Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Metodología para la Generación de Explicaciones para Sistemas de Recomendación Sensibles al Contexto

631 views

Published on

Gran parte de la investigación en el área de Sistemas de Recomendación (RS: Recommender Systems) se centra en el estudio de técnicas de recomendación, estas técnicas son dependientes del dominio de aplicación, de la efectividad de la técnica, así como de las métricas para poder evaluarlas. Sin embargo, el estudio de las técnicas de explicación en sistemas de recomendación ha tomado relevancia ya que han demostrado que mejoran la experiencia del usuario.
Utilizar estilos de explicación en un sistema de recomendación ayuda al usuario a entender más rápido la información que le proporciona un RS y a decidir si existe suficiente evidencia para tomar una recomendación como válida, auxiliándolo en el proceso de toma de decisiones. Además, los estilos de explicación proponen varios objetivos como la transparencia, la eficacia, la satisfacción, la persuasión, la eficiencia, la confianza, entre otros.
En esta tesis se diseñó una metodología para construir texto explicativo que depende de la técnica de recomendación y de sus objetivos, esta metodología de explicación proporciona una guía para explicaciones textuales utilizando plantillas con campos variables. Dicha metodología se evalúo en un (CARS: Context-Aware Recommender System) sistema de recomendación sensible al contexto (T-Guia, González 2012) que en su primera versión no cuenta con un servicio para generar explicaciones.
Para evaluar la metodología desarrollada en esta tesis, se aplicaron cuestionarios a usuarios reales, la evaluación de las técnicas de explicación se realizó mediante un prototipo Web que permitió realizar una evaluación centrada en el usuario (UCE: user- centered evaluation) para medir el impacto de las explicaciones en la métrica de confianza. Los resultados demostraron que las explicaciones mediante plantillas explicativas combinadas con imágenes obtuvieron mejores evaluaciones en comparación con las explicaciones presentadas mediante mapas mentales y mapas conceptuales, los resultados obtenidos fueron los siguientes: Explicaciones textuales con una comprensión de 84.71% y confianza de 85.25%, explicaciones mediante mapas mentales con una comprensión de 82.00% y confianza de 80.42% y las explicaciones mediante mapas conceptuales con una comprensión de 76.10% y confianza de 75.50%.

Published in: Engineering
  • Be the first to comment

  • Be the first to like this

Metodología para la Generación de Explicaciones para Sistemas de Recomendación Sensibles al Contexto

  1. 1. Centro Nacional de Investigación y Desarrollo Tecnológico Subdirección Académica Departamento de Ciencias Computacionales TESIS DE MAESTRÍA EN CIENCIAS Metodología para la Generación de Explicaciones para Sistemas de Recomendación Sensibles al Contexto presentada por Lcc. José Israel Galán Martínez como requisito para la obtención del grado de Maestro en Ciencias de la Computación Director de tesis Dr. Juan Gabriel González Serna Codirectora de tesis Dra. Azucena Montes Rendón Cuernavaca, Morelos, México. Febrero de 2014.
  2. 2. i Resumen Gran parte de la investigación en el área de Sistemas de Recomendación (RS: Recommender Systems) se centra en el estudio de técnicas de recomendación, estas técnicas son dependientes del dominio de aplicación, de la efectividad de la técnica, así como de las métricas para poder evaluarlas. Sin embargo, el estudio de las técnicas de explicación en sistemas de recomendación ha tomado relevancia ya que han demostrado que mejoran la experiencia del usuario. Utilizar estilos de explicación en un sistema de recomendación ayuda al usuario a entender más rápido la información que le proporciona un RS y a decidir si existe suficiente evidencia para tomar una recomendación como válida, auxiliándolo en el proceso de toma de decisiones. Además, los estilos de explicación proponen varios objetivos como la transparencia, la eficacia, la satisfacción, la persuasión, la eficiencia, la confianza, entre otros. En esta tesis se diseñó una metodología para construir texto explicativo que depende de la técnica de recomendación y de sus objetivos, esta metodología de explicación proporciona una guía para explicaciones textuales utilizando plantillas con campos variables. Dicha metodología se evalúo en un (CARS: Context-Aware Recommender System) sistema de recomendación sensible al contexto (T-Guia, González 2012) que en su primera versión no cuenta con un servicio para generar explicaciones. Para evaluar la metodología desarrollada en esta tesis, se aplicaron cuestionarios a usuarios reales, la evaluación de las técnicas de explicación se realizó mediante un prototipo Web que permitió realizar una evaluación centrada en el usuario (UCE: user- centered evaluation) para medir el impacto de las explicaciones en la métrica de confianza. Los resultados demostraron que las explicaciones mediante plantillas explicativas combinadas con imágenes obtuvieron mejores evaluaciones en comparación con las explicaciones presentadas mediante mapas mentales y mapas conceptuales, los resultados obtenidos fueron los siguientes: Explicaciones textuales con una comprensión de 84.71% y confianza de 85.25%, explicaciones mediante mapas mentales con una comprensión de 82.00% y confianza de 80.42% y las explicaciones mediante mapas conceptuales con una comprensión de 76.10% y confianza de 75.50%. . .
  3. 3. ii Abstract A great deal of the research in the Recommender Systems area is centered in the study of recommendation techniques; these techniques depend on the context, the effectiveness of the technique as well as on the metrics in order to evaluate them. However, the study of the explanation styles in recommender systems has become relevant because they have shown to improve the user's experience. Using explanation styles in a recommender system helps the user to more rapidly understand the information that is provided by a RS and to decide if there is enough evidence to take a recommender as valid helping the user in the decision making process. In addition, explanation styles propose several objectives such as transparency, effectiveness, satisfaction, persuasion, efficiency, and trust among others. In this thesis it was designed a methodology to build explanatory information that depends on the recommender technique and on its objectives. This explanation methodology provides a guide for textual explanations using templates with variable fields. Such methodology was evaluated in a Context-Aware Recommender System (T-Guia, González 2012) in its first version which does not have a service to generate explanations. In order to evaluate the methodology developed in this thesis, real users answered questionnaires; the evaluation of the explication techniques was carried out by means of a Web prototype which allowed to carry out a user-centered evaluation UCE in order to measure the impact of the explications in the trust metrics. The results showed that the explications by means of explanatory templates in combination with images obtained better evaluations in comparison with explications presented by means of mind maps and concept maps. The results obtained are the following: Textual explanations with a comprehension of 84.71% and trust of 85.25%, explications by means of mind maps with a comprehension of 82.00 and trust of 80.42% and the explications by means of conceptual maps with a comprehension of 76.10% and trust of 75.50%.
  4. 4. iii CONTENIDO 1. Introducción .................................................................................................................... 1 1.1 Introducción ............................................................................................................. 2 1.2 Antecedentes ............................................................................................................ 2 1.3 Planteamiento del problema ..................................................................................... 6 1.4 Objetivo ................................................................................................................... 7 1.5 Justificación ............................................................................................................. 7 1.6 Estructura del documento ........................................................................................ 8 2. Fundamento teórico ......................................................................................................... 9 2.1 Web Semántica ...................................................................................................... 10 2.2 Sistemas de recomendación sensibles al contexto, tipos y técnicas ...................... 12 2.2.1 SR sensibles al contexto ................................................................................. 12 2.2.2 Técnicas de recomendación contextuales ....................................................... 13 2.2.3 SR en ambientes organizacionales ................................................................. 14 2.3 Explicación y Argumentación ............................................................................... 15 2.4 Teoría de la estructura retórica .............................................................................. 17 2.5 Mapas Mentales y Conceptuales ............................................................................ 18 2.5.1 Mapas conceptuales ........................................................................................ 18 2.5.2 Mapas Mentales .............................................................................................. 20 2.6 Taxonomía para la generación de explicaciones en los SR ................................... 23 2.7 Una taxonomía generalizada de estilos de explicaciones para sistemas de recomendaciones tradicionales y sociales ......................................................................... 24 2.8 Diseño y evaluación de explicaciones para sistemas de recomendación ............... 26 2.9 Framework para la generación de Explicaciones Inteligentes ............................... 27 2.10 Explicando recomendaciones de filtrado colaborativo .......................................... 28 2.11 Explicando recomendaciones: Satisfacción vs. Promoción ................................... 30 2.12 Un agente personal de noticias que habla, aprende y explica ................................ 32 2.13 Recomendación y explicación de puntos de interés .............................................. 34 2.14 El valor de los marcadores del discurso que expresan causalidad en español ....... 35 2.15 Marcadores del discurso, variación dialectal y variación social ............................ 37
  5. 5. iv 2.16 Comparativa de trabajos relacionados ................................................................... 38 2.17 Discusión del estado del arte ................................................................................. 39 3. Metodología para la generación de explicaciones en los SR para la generación automática de ontologías ...................................................................................................... 41 3.1 Fase de análisis ...................................................................................................... 43 3.1.1 Actividad: Análisis del funcionamiento de los SR y las técnicas utilizadas .. 43 3.1.2 Actividad: Análisis de los estilos de explicación en los SR ........................... 43 3.2 Fase de Diseño ....................................................................................................... 45 3.2.1 Actividad: Identificación de los objetivos de las explicaciones en los SR ..... 45 3.2.2 Actividad: Definición de la estructura sintáctica de las explicaciones ........... 46 3.2.3 Actividad: Personalización y definición de formas de redacción................... 48 3.2.4 Actividad: Presentación de las explicaciones ................................................. 51 3.2.5 Conclusiones ................................................................................................... 64 3.3 Discusión de la metodología .................................................................................. 65 4. Implementación de la metodología para la generación de explicaciones ..................... 66 4.1 Fase de análisis ...................................................................................................... 67 4.1.1 Actividad: Análisis del funcionamiento del SR y las técnicas utilizadas ....... 67 4.1.2 Actividad: Análisis de los estilos de explicación a implementar ................... 72 4.2 Fase de Diseño ....................................................................................................... 73 4.2.1 Actividad: Identificación de los objetivos de las explicaciones en el SR ...... 73 4.2.2 Actividad: Definición de la estructura sintáctica de las explicaciones ........... 74 4.2.3 Actividad: Personalización y definición de formas de redacción................... 76 4.2.4 Actividad: Definición de la Presentación de las explicaciones ...................... 80 5. Pruebas y resultados ...................................................................................................... 83 5.1 Pruebas realizadas a las plantillas explicativas ...................................................... 84 5.2 Medición del impacto de las explicaciones sobre el usuario ................................. 90 5.2.1 Descripción ..................................................................................................... 90 5.2.2 Condiciones, modelo de investigación e hipótesis ......................................... 91 5.2.3 Elección, reclutamiento y procedimiento experimental ................................. 94 5.2.4 Resultados ....................................................................................................... 98 5.2.5 Concentrado de resultados ............................................................................ 111
  6. 6. v 6. Conclusiones ............................................................................................................... 114 6.1 Comentarios finales ............................................................................................. 115 6.2 Contribuciones ..................................................................................................... 116 6.3 Trabajos futuros ................................................................................................... 116 Glosario .............................................................................................................................. 118 Referencias ......................................................................................................................... 120 Anexo A .............................................................................................................................. 125 Anexo B .............................................................................................................................. 138
  7. 7. vi Índice de figuras Fig. 1.1 Guiado del sistema T-Guía, primera versión ............................................................ 3 Fig. 1.2 Arquitectura del SRSSC T-Guía, segunda versión ................................................... 4 Fig. 1.3 Modelado multidimensional de la base de hechos .................................................... 5 Fig. 2.1 Ontología de Tiempo, utilizada en (González, 2012) ............................................. 12 Fig. 2.2 Conceptual sobre las plantas (Cañas, 2000) ............................................................ 19 Fig. 3.1 Dimensiones para categorizar los estilos explicativos (Friedrich, 2011) ................ 23 Fig. 3.2 Posibles combinaciones de estilos de explicación, (Papadimitriou, y otros, 2011) 25 Fig. 3.3 Explicación de las recomendaciones, (Baltrunas, y otros, 2011). ........................... 34 Fig. 4.1 Metodología para la generación de explicaciones................................................... 42 Fig. 4.2 Relación Causal ....................................................................................................... 47 Fig. 4.3 Explicación de recomendaciones de proveedores de internet (Felfering , y otros, 2006) ..................................................................................................................................... 52 Fig. 4.4 Recomendaciones de lugares para vacacionar, explicaciones escrutables (Czarkowski, 2006) .............................................................................................................. 53 Fig. 4.5 Básica, (Tintarev, 2009) .......................................................................................... 53 Fig. 4.6 No-personalizada, característica elegida al azar, (Tintarev, 2009) ......................... 54 Fig. 4.7 No-Personalizadas, (Tintarev, 2009) ....................................................................... 54 Fig. 4.8 Personalizadas, (Tintarev, 2009). ............................................................................ 54 Fig. 4.9 Explicación de recomendaciones hechas a un usuario registrado, tomada de http://www.amazon.com ....................................................................................................... 55 Fig. 4.10 Explicación de recomendaciones hechas a un usuario no registrado, tomada de http://www.amazon.com ....................................................................................................... 55 Fig. 4.11 Explicaciones en Facebook, tomada del portal https://www.facebook.com ......... 56 Fig. 4.12 Explicaciones de autos recomendados, tomada del portal www. MyProductAdvisor.com ....................................................................................................... 56 Fig. 4.13 Explicaciones inteligentes (Zanker y otros, 2010) ................................................ 57 Fig. 4.14 Explicaciones contextuales (Baltrunas y otros 2011) ........................................... 58 Fig. 4.15 Gráfica compleja, (Herlocker, y otros, 2000)........................................................ 59 Fig. 4.16 Histograma de valoraciones de vecinos, (Herlocker, y otros, 2000) ..................... 59 Fig. 4.17 Explicación mediante mapa mental....................................................................... 63 Fig. 4.18 Explicación mediante mapa conceptual ................................................................ 64 Fig. 5.1 Generación del conjunto de similitudes (Lozano, 2013)......................................... 69 Fig. 5.2 Generación de recomendaciones del Filtrado Colaborativo (Lozano, 2013) .......... 69 Fig. 5.3 Sistema de Recomendación Basado en Contenido (Lozano, 2013) ........................ 71 Fig. 5.4 Generación de Modelo de Conocimiento (Lozano, 2013) ...................................... 71 Fig. 5.5 Extracción de información empleada en las recomendaciones ............................... 73 Fig. 5.6 Objetivos de las explicaciones en el en FindIt! (Rodriguez, 2013) ........................ 74 Fig. 5.7 Estructura de las explicaciones ............................................................................... 75 Fig. 5.8 Elementos contenidos en una explicación ............................................................... 80
  8. 8. vii Fig. 5.9 Ejemplo de explicaciones mediante mapas mentales .............................................. 82 Fig. 5.10 Ejemplo de explicaciones mediante mapas conceptuales ..................................... 82 Fig. 6.1 Modelo de Interacción e hipótesis ........................................................................... 92 Fig. 6.2Primera Etapa Sistema de Registro .......................................................................... 95 Fig. 6.3 Ejemplo de interacción del usuario con las explicaciones ...................................... 96 Fig. 6.4 Ejemplo de evaluación de las explicaciones en el sistema...................................... 96 Fig. 6.5 Número de explicaciones por escenario .................................................................. 97 Fig. 6.6 Texto: Porcentaje obtenido estudiantes G1 ........................................................... 100 Fig. 6.7 Texto: Porcentaje obtenido estudiantes G2 ........................................................... 100 Fig. 6.8Texto: Porcentaje obtenido Profesores ................................................................... 101 Fig. 6.9 Texto: Porcentaje obtenido Empresarios............................................................... 101 Fig. 6.10 Porcentajes obtenidos de las explicaciones textuales por tipo de usuario........... 102 Fig. 6.11 Texto: Comparación de resultados entre tipos de usuario................................... 102 Fig. 6.12 Mapa Mental: Porcentaje obtenido estudiantes G1 ............................................. 103 Fig. 6.13Mapa Mental: Porcentaje obtenido estudiantes G2 .............................................. 103 Fig. 6.14 Mapa Mental: Porcentaje obtenido profesores .................................................... 104 Fig. 6.15 Mapa Mental: Porcentaje obtenido empresarios ................................................. 104 Fig. 6.16 Porcentajes obtenidos de las explicaciones gráficas mediante los mapas mentales, por tipo de usuario .............................................................................................................. 105 Fig. 6.17 Mapas Mentales: Comparación de resultados entre tipos de usuario.................. 105 Fig. 6.18 Mapa Conceptual: Porcentaje obtenido estudiantes G1 ...................................... 106 Fig. 6.19 Mapa Conceptual: Porcentaje obtenido estudiantes G2 ...................................... 106 Fig. 6.20 Mapa Conceptual: Porcentaje obtenido profesores ............................................. 107 Fig. 6.21 Conceptual: Porcentaje obtenido empresarios .................................................... 107 Fig. 6.22 Porcentajes obtenidos de las explicaciones gráficas mediante los mapas conceptuales, por tipo de usuario ....................................................................................... 108 Fig. 6.23 Mapas Conceptuales: Comparación de resultados entre tipos de usuario ........... 108 Fig. 6.24 Resultados por tipo de interfaz explicativa ......................................................... 109 Fig. 6.25 Texto: Comparación entre los grupos de estudiantes .......................................... 109 Fig. 6.26Mental: Comparación entre los grupos de estudiantes ......................................... 110 Fig. 6.27 Conceptual: Comparación entre los grupos de estudiantes ................................. 110 Índice de tablas Tabla 3.1 La media de respuesta de los usuarios de cada interfaz de explicación, se basada en una escala del uno a siete. Las explicaciones 11 y 12 representan el caso base de ninguna información adicional. Las filas sombreadas indican las explicaciones con una r respuesta significativamente diferente de los casos base (Herlocker, y otros, 2000) .......................... 30 Tabla 3.3 Estilo de explicación de libros calificados positivamente .................................... 31 Tabla 3.2 Estilo de explicación de palabra clave.................................................................. 31
  9. 9. viii Tabla 3.4 La explicación muestra las calificaciones de los vecinos de un usuario, (Bilgic, y otros, 2005) ........................................................................................................................... 31 Tabla 3.5 Estilo de explicación influencia, (Bilgic, y otros, 2005). ..................................... 32 Tabla 3.6 Marcadores lingüísticos Causales......................................................................... 36 Tabla 3.7 Comparativa de trabajos relacionados .................................................................. 38 Tabla 3.8 Tabla comparativa "Tipo de información utilizada". .......................................... 39 Tabla 4.1 Objetivos de las Explicaciones ............................................................................. 45 Tabla 4.2 Marcadores Lingüísticos ...................................................................................... 47 Tabla 4.3 Interfaz basada en la organización de la información, (Chen, 2006) ................... 60 Tabla 4.4 Palabras clave que influyeron en una recomendación, (Bilgic, y otros, 2005). ... 61 Tabla 4.5 Explicaciones estilo Palabra Clave, (Bilgic, y otros, 2005) ................................. 61 Tabla 4.6 Explicaciones estilo influencia, (Bilgic, y otros, 2005)........................................ 61 Tabla 5.1Estilos de explicación que se emplearan en el trabajo de tesis .............................. 72 Tabla 6.1 Pruebas para Plantillas basadas en Filtrado Colaborativo .................................... 85 Tabla 6.2 Pruebas para Plantillas basadas en Contenido ...................................................... 85 Tabla 6.3 Distribución de casos de prueba de explicaciones creadas .................................. 85 Tabla 6.4 Condiciones del experimento ............................................................................... 91 Tabla 6.5 Tipos de presentación de las explicaciones .......................................................... 93 Tabla 6.6 Clave de corrección de preguntas NEGATIVAS ................................................. 98 Tabla 6.7 Puntajes máximos y mínimos ............................................................................... 98 Tabla 6.8 Distribución del experimento ............................................................................... 99 Tabla 6.9 Escenario 1: Interfaz textual - Estudiantes grupo 1 .............................................. 99 Tabla 6.10 Escenario 1: Puntuación obtenida - Estudiantes Grupo1 ................................. 100 Tabla 6.11 Escenario 2: Puntuación obtenida - Estudiantes Grupo2 ................................. 100 Tabla 6.12 Escenario 3: Puntuación obtenida - Profesores ................................................ 101 Tabla 6. 13 Escenario 4: Puntuación obtenida - Empresarios ............................................ 101 Tabla 6.14 Resultados de las explicaciones textuales ........................................................ 102 Tabla 6.15 Escenario 5: Puntuación obtenida - Estudiantes Grupo1 ................................. 103 Tabla 6.16 Escenario 6: Puntuación obtenida - Estudiantes Grupo2 ................................. 103 Tabla 6.17 Escenario 7: Puntuación obtenida - Profesores ................................................ 104 Tabla 6.18 Escenario 8: Puntuación obtenida - Empresarios ............................................. 104 Tabla 6.19 Resultados de las explicaciones mediante mapas conceptuales ....................... 105 Tabla 6.20 Escenario 9: Puntuación obtenida - Estudiantes Grupo1 ................................. 106 Tabla 6.21Escenario 10: Puntuación obtenida - Estudiantes Grupo2 ................................ 106 Tabla 6.22 Escenario 11: Puntuación obtenida - Profesores .............................................. 107 Tabla 6.23 Escenario 12: Puntuación obtenida - Empresarios ........................................... 107 Tabla 6.24 Resultados de las explicaciones mediante mapas conceptuales ....................... 108 Tabla 6.25Resultados por tipo de interfaz explicativa ....................................................... 109 Tabla 6.26 Texto: Comparación entre los 2 grupos de estudiantes .................................... 110 Tabla 6.27 Mapa Mental: Comparación entre los 2 grupos de estudiantes ........................ 110 Tabla 6.28 Mapa Conceptual: Comparación entre los 2 grupos de estudiantes ................. 110
  10. 10. ix Tabla 6.29 Concentrado de resultados de las explicaciones textuales ............................... 111 Tabla 6.30 Concentrado de resultados de las explicaciones gráficas de mapas mentales .. 111 Tabla 6.31 Concentrado de resultados de las explicaciones gráficas mediante mapas conceptuales........................................................................................................................ 111 Tabla 6.32 Resultados generales por tipo de interfaz explicativa ...................................... 112 Tabla 6.33 Comparación entre grupos de estudiantes por interfaz..................................... 112 Tabla B.1 Distribución de Ítems para G1 ........................................................................... 138 Tabla B.2 Distribución de ítems para G2 ........................................................................... 138 Tabla B.3 Distribución ítems para Profesores .................................................................... 138 Tabla B.4 Distribución ítems para de Empresarios ............................................................ 138 Tabla B.5 Preguntas de evaluación .................................................................................... 139 Tabla B.6 Escenario 1: Interfaz Textual – Estudiantes Grupo1 ......................................... 144 Tabla B.7 Escenario 2: Interfaz Textual – Estudiantes Grupo 2 ........................................ 144 Tabla B.8 Escenario3: Interfaz Textual – Profesores/investigadores ................................. 145 Tabla B.9 Escenario 4: Interfaz Textual – Empresarios/otros ............................................ 145 Tabla B.10 Interfaz gráfica mapa mental – Estudiantes Grupo1 ........................................ 146 Tabla B.11 Interfaz gráfica mapa mental – Estudiantes Grupo 2 ....................................... 146 Tabla B.12 Interfaz gráfica mapa mental – Profesores/investigadores .............................. 147 Tabla B.13 Escenario 8: Interfaz gráfica mapa mental – Empresarios/otros ..................... 147 Tabla B.14 Escenario 9: Interfaz gráfica mapa conceptual – Estudiantes Grupo1 ............ 148 Tabla B.15 Escenario 10: Interfaz gráfica mapa conceptual – Estudiantes Grupo 2 ......... 148 Tabla B.16 Escenario 7: Interfaz gráfica mapa conceptual – Profesores/investigadores ... 149 Tabla B.17 Escenario 8: Interfaz gráfica mapa conceptual – Empresarios/otros ............... 149
  11. 11. CAPÍTULO I Introducción 1. Introducción
  12. 12. Capítulo I. Introducción 2 1.1 Introducción Hoy en día el uso de los sistemas de recomendación (SR) se ha extendido a diferentes dominios que abarcan más allá del comercio electrónico; gracias a la habilidad que poseen para proporcionar sugerencias utilizando la información del perfil del usuario y la información del lugar donde se desenvuelve el mismo; es decir, su contexto (Sadeh, 2006). Un Sistema de Recomendación Sensible al Contexto (SRSC), es un sistema de cómputo que explota el perfil del usuario y es capaz de reaccionar de manera autónoma a cambios en su contexto, utilizando diferentes tecnologías como sensores o sistemas de información. Debido a esta tendencia tecnológica, los SRSC han tomado gran importancia en las áreas de investigación y desarrollo de aplicaciones, buscando mejoras en la definición de los ítems, la captura y manipulación de la información contextual del usuario, la precisión y rendimiento de los algoritmos de recomendación, así como en el desarrollo e implementación de explicaciones de las recomendaciones dadas al usuario; aumentando la confianza del usuario en el proceso de toma de decisiones, entre otros aspectos. De igual forma surgen las métricas de evaluación centradas en el usuario, donde se presta especial atención a la utilidad de las recomendaciones y cómo el usuario las utiliza dentro de su proceso de toma de decisiones. Además se ha reconocido que el funcionamiento de los SR se basa en un modelo de la caja negra, lo que no permite al usuario, tener una visión clara acerca del funcionamiento del proceso de recomendación y tampoco obtener información adicional que acompañe a las recomendaciones más allá de sí mismas. Las explicaciones en los SR son información adicional que expone el razonamiento y la información utilizada en la emisión de una recomendación, por lo tanto, pueden lograr diferentes objetivos como: mejorar la confianza del usuario, incrementar la satisfacción, hacer más fácil y rápido la búsqueda de ítems relevantes o convencer a los usuarios de probar o comprar determinado ítem, entre otros. En este trabajo de investigación se presenta una metodología para la generación de explicaciones en los sistemas de recomendación sensibles al contexto, la cual define una serie de actividades que permiten crear plantillas de texto con campos variables, cuya finalidad es explicar cada ítem recomendado por el sistema. El entorno multidimensional que tomamos como escenario para el desarrollo del presente trabajo de tesis es la plataforma T-Guia (González, 2012), que en la versión actual de esta plataforma no se cuenta con ningún tipo de servicio de explicación implementado. 1.2 Antecedentes En el grupo de Sistemas de Recomendación Sensibles al Contexto (por sus siglas en inglés, CARS) de CENIDET, se ha realizado una serie de trabajos de investigación en el marco del proyecto T-Guía, que consiste en el desarrollo de un sistema de recomendación
  13. 13. Capítulo I. Introducción 3 semántico sensible al contexto (SRSSC) diseñado para realizar recomendaciones de personas, objetos de conocimiento, lugares, eventos, actividades, recursos tecnológicos y servicios a los miembros o visitantes de una organización, con especial énfasis en Instituciones de Educación Superior (IES). En (Arjona, 2009), se describe la primera versión del proyecto TGuide. Originalmente, TGuide que consistía de un sistema de guiado automático; es decir, en base a la posición inicial del usuario y una tarea determinada (reunión, clase, préstamo de libros, etc.) se muestra mediante un mapa tipo croquis la ubicación del usuario en tiempo real y la ubicación final donde se lleva a cabo la tarea. Entre las características de este sistema se encuentran: desarrollo para teléfonos móviles con sistema operativo Android y utilización de tecnologías de localización heterogéneas: RFID, QRCodes y GSM. En la Fig. 1.1, se puede observar el proceso de guiado realizado utilizando T-Guía en su primera versión. Fig. 1.1 Guiado del sistema T-Guía, primera versión Después de las pruebas de concepto logradas con la primera versión del sistema T-Guía, haciendo uso de las tecnologías de la web semántica y de los dispositivos móviles de última generación, se inicia el desarrollo de la segunda versión. Esta nueva etapa del sistema T-Guía se enfoca en los distintos elementos susceptibles de recomendación dentro de los distintos tipos de organizaciones. Se busca obtener un sistema de recomendación semántico sensible al contexto que incorpore un repositorio de información (base de hechos) implementado en una red de ontologías capaz de soportar inferencias, un algoritmo de localización en interiores aprovechando los distintos sensores de los dispositivos móviles, mapas interactivos basados en los datos contenidos en el repositorio de información y una nueva interfaz interactiva mediante el uso de técnicas de realidad aumentada.
  14. 14. Capítulo I. Introducción 4 En (Vargas, 2011) se inicia el modelado de la base de hechos, especificando aspectos funcionales de una organización y sus competencias. El objetivo de este modelo consiste en encontrar grupos de trabajo sinérgicos de distintas organizaciones tomando como base las características de un proyecto. Posteriormente, en (González, 2012) se presenta una extensión al modelo añadiendo dimensiones adicionales; es decir, se añaden: modelos que describen dimensiones contextuales como localización y tiempo, modelos que describen factores genéricos de la organización como publicidad, actividad económica, infraestructura, objetos de conocimiento y comercio, modelos que complementan la descripción de las competencias organizacionales como la ocupación, educación y habilidad de una persona, y modelos que describen las características de los dispositivos e interfaces utilizadas para la explotación del sistema. En la Fig. 1.3, se muestra el modelo resultante y la información utilizada de cada elemento. De igual forma, en (González, 2012) se presenta una nueva arquitectura modular para el sistema T-Guía, y adquiere el nombre de Sistema de Recomendación Semántico Sensible al Contexto (SRSSC) Organizacional T-Guía. En la Fig. 1.2, se muestra la nueva arquitectura del SRSSC Organizacional T-Guía. Fig. 1.2 Arquitectura del SRSSC T-Guía, segunda versión
  15. 15. Capítulo I. Introducción 5 Fig. 1.3 Modelado multidimensional de la base de hechos
  16. 16. Capítulo I. Introducción 6 El presente trabajo de investigación se deriva de la tesis doctoral de doctoral de (Alejandres, 2012), que consiste en el desarrollo de una metodología de evaluación centrada al usuario de SRSCC, cuyo objetivo es desarrollar un modelo de evaluación de sistemas de recomendación semánticos sensibles al contexto mediante la utilización de métricas que permitan obtener una valoración de los aspectos subjetivos de la experiencia del usuario, con base en las características de usabilidad de efectividad, confianza y satisfacción, analizando escenarios con esquemas de explicación e interfaces multimodales interactivas. Además se desarrolló a la par y en colaboración con las tesis tituladas “Framework Adaptativo de Algoritmos de Recomendación para Sistemas de Recomendación Semánticos Sensibles al Contexto” de (Lozano, 2013) y “Metodología para la Implementación de Interfaces sobre Dispositivos Multisensoriales Aplicada a Sistemas de Recomendación Sensibles al Contexto” de (Rodriguez, 2013), en esta última se desarrolla una nueva versión del T-Guia denominada FindIt!, en la que se integraron todas las características de realidad aumentada, mapas SVG, diversos algoritmos de recomendación y las explicaciones. 1.3 Planteamiento del problema Gran parte de la investigación existente en el área de los SR se ha centrado en el estudio de las técnicas de recomendación, siendo éstas dependientes para algún dominio de aplicación particular; también de los factores de éxito de cada técnica; así como de las métricas para la evaluación de los sistemas. La medición de la precisión y exhaustividad de los SR, la satisfacción del usuario y sus derivados tales como la causalidad, la diversidad y la confianza entre otros, son aspectos cruciales para la aceptación de los sistemas y la construcción de la confianza del usuario sobre el mismo, en la inclusión de las recomendaciones en el proceso de toma de decisiones (Tintarev, y otros, 2007). El estudio de las explicaciones en los SR ha cobrado gran fuerza, ya que juegan un papel importante en la mejora de la experiencia del usuario ayudándolo en el proceso de toma de decisiones, por ejemplo: cuando un usuario recibe una explicación, él puede aceptar una recomendación fácilmente debido a que el sistema aporta transparencia a su recomendación (Papadimitriou, y otros, 2011). No obstante, no existe un consenso para la generación de explicaciones en los sistemas de recomendación y deben considerarse múltiples factores que influyen en su desarrollo. Tradicionalmente la generación de recomendaciones y por ende de explicaciones, se orienta hacia un dominio de aplicación particular y por lo tanto se reduce a trabajar con un solo tipo de ítem a recomendar. Dentro de este contexto, la problemática asociada a este trabajo se centra en el desarrollo de una metodología para la generación de explicaciones en los sistemas de recomendación, considerando diferentes técnicas de recomendación, estilos explicativos,
  17. 17. Capítulo I. Introducción 7 información contextual, estructuración del texto y aspectos como la personalización y la presentación; que a su vez son aplicados a un conjunto heterogéneo de ítems los cuales son recomendados a diferentes tipos de usuario. 1.4 Objetivo Desarrollar una metodología adaptable y extensible para la generación de explicaciones textuales mediante plantillas, en los sistemas de recomendación, aplicada a sistemas de recomendación sensibles al contexto”. Objetivos Específicos • Analizar los sistemas de recomendación • Analizar los estilos de explicación en los sistemas de recomendación. • Analizar los objetivos de las explicaciones en los sistemas de recomendación. • Definir la estructura sintáctica de las explicaciones. • Personalizar las explicaciones. • Definir la presentación de las explicaciones. • Evaluar el impacto de las explicaciones sobre la confianza del usuario. 1.5 Justificación Proveer de explicaciones a un sistema de recomendación es un aspecto de suma importancia ya que proporcionan información adicional al usuario ayudándolo a comprender la salida del sistema. Con la creación de las explicaciones para el sistema FindIt! se busca aumentar la confianza del usuario hacia el sistema, y brindar elementos claros y comprensibles que le ayuden en el proceso de recomendación, exponiendo la información utilizada para la emisión de una recomendación. Además la metodología desarrollada servirá como guía marcando las pautas para la generación de explicaciones en los sistemas de recomendación. Así, el usuario puede decidir si existe suficiente evidencia para tomarla como válida. Además de proporcionar otros objetivos implícitos como la satisfacción, la escrutabiliad y la efectividad Cuando las recomendaciones son emitidas por el SR, si el usuario tiene dudas sobre el origen de una recomendación se preguntará: ¿por qué recibo esta recomendación?, por lo que el SR debe estar capacitado para explicar el razonamiento detrás de la recomendación emitida. De esta forma, el usuario puede analizar la lógica detrás de la recomendación y decidir si existe suficiente evidencia para tomarla como válida. Al considerar la implementación de servicios de explicación en los sistemas de recomendación, se obtienen los siguientes beneficios:
  18. 18. Capítulo I. Introducción 8 • Facilitan al usuario la selección de ítems de una recomendación dada de acuerdo a sus necesidades presentes. • Ayudan al usuario a entender el razonamiento detrás de la recomendación y de esta forma puede decidir qué tanta confianza dar a un recomendación. • Optimizan el proceso de toma de decisiones al proporcionarle información adicional para poder realizar una decisión asertiva. • Se instruye al usuario sobre el proceso usado para generar la recomendación y permite un mejor entendimiento de la fortaleza y limitaciones del sistema. • Aceptación, se brinda mayor aceptación al SR como ayuda para la toma de decisiones. Dichos beneficios están estrechamente relacionados con los objetivos de las explicaciones (Tintarev, y otros, 2007), los cuales son: • Transparencia: Explica cómo trabaja el SR. • Escrutabilidad: Permite a los usuarios manejar posibles errores del SR. • Confianza: Incrementa la confianza del usuario en el SR. • Efectividad: Ayuda al usuario a tomar decisiones correctas. • Persuasión: Convence al usuario de probar o comprar determinado ítem. • Eficiencia: Ayuda a los usuarios a tomar decisiones rápidamente. • Satisfacción: Incrementa la facilidad de uso del SR. 1.6 Estructura del documento El presente documento se encuentra organizado en siete capítulos, los cuales describen el trabajo de investigación en sus diversas etapas como se indica a continuación: En el capítulo II: Fundamento Teórico, se abordan los temas relevantes para la presente investigación. En el capítulo III: Estado del Arte, se presenta la información obtenida de la investigación sobre los enfoques actuales en el desarrollo de explicaciones en los Sistemas de Recomendación. En el capítulo IV: Metodología para la generación de explicaciones, se define detalladamente la metodología propuesta para la creación de plantillas explicativas textuales en los sistemas de recomendación. En el capítulo V: Implementación de la Metodología para la generación de explicaciones en los SR, se describe el proceso de creación de las plantillas explicativas, tomando como base las fases presentados en el capítulo anterior. En el capítulo VI: Pruebas y Resultados, se muestran las pruebas realizadas y los resultados obtenidos. Con la finalidad de brindar resultados confiables, se realizaron pruebas a la metodología definida y a las plantillas generadas. Finalmente en el capítulo VII, se presentan las conclusiones, se identifican las contribuciones realizadas y los trabajos futuros de la presente investigación.
  19. 19. CAPÍTULO II Fundamento teórico 2. Fundamento teórico
  20. 20. Esta tesis se enfoca en los estilos de explicación para los Sistemas de Recomendación Sensibles al Contexto (SRSC). Por este motivo en esta sección, se detallan los temas y conceptos específicos relacionados con áreas relevantes para este trabajo. Se abordan los conceptos de ontologías; SRSSC, los tipos de técnicas utilizadas en el proceso de recomendación; las explicaciones en los sistemas de recomendación; el concepto de heurística y sistemas basados en reglas de inferencia; una introducción a la teoría de la estructura retorica para el análisis de textos y el análisis de los mapas mentales y conceptuales. 2.1 Web Semántica La Web Semántica es una extensión de la Web actual, en la cual se dota de significado a la información contenida en las páginas Web creando un ambiente donde los agentes de software pueden realizar tareas sofisticadas (Berners-Lee, y otros, 2001). La Web Semántica trata de agregar semántica formal (metadatos) al contenido Web con el propósito de contar con acceso y manejo más eficiente de la información. Como su importancia radica en la presencia de una gran masa de metadatos, el mayor reto de la comunidad de la Web Semántica es la adquisición de estos metadatos. Dicha adquisición puede realizarse con dos enfoques: la adición manual o automática de semántica explícita. Sin embargo, la adición manual se considera como un enfoque no factible (K. Atanas, 2003) por el enorme esfuerzo de creación manual de metadatos para el enorme volumen de información contenido en la Web. Ontologías En (Hepp, y otros, 2007) se describe cómo los filósofos griegos Sócrates y Aristóteles fueron los primeros en desarrollar los fundamentos de la ontología. Sócrates introdujo la noción de las ideas abstractas, una jerarquía entre ellos y las relaciones de instancia de clase. Aristóteles añadió las asociaciones lógicas, dando como resultado un modelo bien estructurado, que es capaz de describir el mundo real. Sin embargo, no es trivial para incluir todas las relaciones amplias y complejas de nuestro entorno. En la actualidad existen diferentes definiciones para dicho término y una de las definiciones declarativas más consolidadas es la propuesta por (Gruber, 1995) y ampliada por (Studer, 1998) que la describe como “una especificación explicita y formal de una conceptualización compartida.” Es decir, se trata de un modelo abstracto que define conceptos y relaciones de algún dominio (entendiendo por dominio una porción determinada de un área de conocimiento), de una forma compartida y consensuada, sus componentes más relevantes son conceptos, relaciones, funciones, instancias, restricciones y axiomas que pueden ser entendidos por una computadora esto, es el aspecto formal (Uschold, y otros, 1996).
  21. 21. Capítulo II. Fundamento teórico 11 El principal objetivo de las ontologías puede verse como la compartición y reutilización del conocimiento en un dominio o área de conocimiento, de tal forma que se proporcione una comprensión comúnmente aceptada, clara y precisa para su reutilización. Las ontologías se utilizan como una técnica de modelado y los elementos que la componen servirán para representar el conocimiento de algún dominio en específico los cuales son: • Conceptos: son las ideas básicas que se intentan formalizar. Aunque muchos autores los denominan también clases. Los conceptos pueden ser por ejemplo: clases de objetos, métodos, planes, estrategias, procesos de razonamiento. • Relaciones: representan la interacción y enlace entre los conceptos de un dominio. Suelen formar la taxonomía del dominio. Por ejemplo: subclase-de, parte-de, parte-exhaustiva-de, conectado-a. • Funciones: son un tipo concreto de relación donde se identifica un elemento mediante el cálculo de una función que considera varios elementos de la ontología. Por ejemplo, pueden aparecer funciones como: asignar-fecha, categorizar-clase. • Instancias: se utilizan para representar determinados objetos de un concepto. • Reglas de restricción o axiomas: son teoremas que se declaran sobre relaciones que deben cumplir los elementos de la ontología. Los axiomas, junto con la herencia de conceptos, permiten inferir conocimiento que no esté indicado explícitamente en la taxonomía de conceptos. Una ontología se expresa en un lenguaje basado en sistemas lógicos (lenguaje ontológico) que sirve para almacenar el conocimiento sobre el dominio de interés. Existe una gran cantidad de lenguajes ontológicos, haciendo una revisión general se pueden clasificar como (Lendinez, 2009): Lenguajes para representaciones gráficas (Grafical Notations): Estos lenguajes no se basan en lenguajes lógicos, sólo en la sintaxis de las ontologías, es decir, en las clases, las instancias y las propiedades que las relacionan entre sí. Son la base para representar ontologías gráficamente. Dentro de este grupo encontramos: redes Semánticas, mapas de conceptos, RDF (Resource Description Framework). Lenguajes basados en lógica. Se pueden definir como lenguajes formales para representar la información, de tal forma que pueden realizar inferencias sobre los datos. Conllevan una sintaxis, que define el tipo de sentencias que pueden darse en el lenguaje, y una semántica, que define el significado de dichas sentencias. Estos lenguajes se considerarán como leguajes ontológicos, ya que incluyen en su sintaxis definiciones lógicas que permiten utilizar razonadores lógicos para inferir resultados. Como lo son los basados en Lógica Descriptiva (DL Description Logics) OIL, DAML+OIL, OWL; basados en lógica de primer orden (FOL First Order Logic) KIF; basados en reglas como RuleML, LP/Prolog, SWRL; los basados en lógicas orden superior, como LBase; Lógicas no clásicas (F-logic, Non-Monotonic) y los basados en lógicas probabilísticas o difusas (Fuzzy logics) que suelen ser utilizados por sistemas de redes neuronales.
  22. 22. Capítulo II. Fundamento teórico 12 Una de las ontologías utilizadas en el modelo ontológico multidimensional que se presenta en el trabajo de (González, 2012), es la ontología llamada “Time ontology”: en esta ontología, se modela información temporal, tal como: unidades temporales, entidades temporales, instantes, intervalos, etc. En el modelo semántico propuesto, esta ontología permite asociar elementos temporales a las actividades y eventos desarrollados en una organización. En Fig. 2.1. Se muestra el diagrama de la ontología de tiempo, donde se modela un espacio temporal, el cual puede ser un evento, instante o intervalo, a su vez el evento puede ocurrir en un intervalo (intervalo del evento) de tiempo o en un instante (instante del evento), y el intervalo del espacio temporal tiene propiedades que a su vez tienen propiedades que se pueden modelar mediante la entidad calendarclockInterval la cual puede contener: hora, minuto, día, mes, etc. 2.2 Sistemas de recomendación sensibles al contexto, tipos y técnicas Los sistemas de recomendación (SR) son herramientas de software que proveen un mecanismo útil para sugerir ítems que son de interés para el usuario (Burke, 2007) (Mahmood, y otros, 2009) (Resnik, y otros, 1997). Estas recomendaciones se relacionan con varios procesos para la toma de decisiones como: ¿qué ítems comprar?, ¿qué música escuchar? o ¿qué noticias leer? Ítem, es el termino general utilizado para nombrar los elementos que el sistema recomienda al usuario. Generalmente, un SR se enfoca a un determinado tipo de ítem (música, películas, noticias) y, de acuerdo al diseño del mismo, la interfaz de usuario y la técnica de recomendación utilizada para la emisión de recomendaciones se personalizan para ofrecer recomendaciones útiles y efectivas para cada tipo de ítem. 2.2.1 SR sensibles al contexto Los sistemas de recomendación semánticos basan su proceso de recomendación sobre una base de hechos, normalmente definida a través de un esquema de conceptos Fig. 2.1 Ontología de Tiempo, utilizada en (González, 2012)
  23. 23. Capítulo II. Fundamento teórico 13 (como una taxonomía o un tesauro) o una ontología, y además, para ser considerados como adaptables al contexto, este tipo de sistemas deben tomar en consideración diferentes factores (temporales, de lugar, nivel de experiencia del usuario, dispositivo que se está utilizando en el momento de recibir la recomendación, etc.) para inferir el contexto en que se encuentra el usuario y adaptar las recomendaciones a esas circunstancias, facilitando el acceso de los usuarios a la información que necesitan (Peis, y otros, 2008). Para realizar este proceso de inferencia, las técnicas utilizadas por los SRSCC usan lo que en (Burke, 2002) se considera conocimiento funcional, es decir, se tiene conocimiento acerca de cómo un elemento en particular responde a una necesidad particular del usuario, y por lo tanto, se puede razonar sobre la relación entre una necesidad y una posible recomendación. En un sistema de recomendación, el contexto del usuario puede tomar diversas acepciones como la localización del usuario, identidad de las personas y objetos alrededor del usuario (Theimer, y otros, 1994), fecha, estación del año, temperatura (Brown, y otros, 1997), información que puede caracterizar la interacción entre un usuario y una aplicación (Dey, y otros, 2001) o bien el nivel de experiencia del usuario, dispositivos utilizados y sus características (Peis, y otros, 2008). En un sistema de recomendación la información que puede obtenerse de las acciones del usuario puede ser explícita o implícita. La información explicita hace referencia a la información que el usuario proporciona de forma directa como votar o contestar una pregunta y la información implícita es aquella que se obtiene del usuario de forma indirecta a través de la interacción del usuario con un objeto (Ferran, y otros, 2005), por ejemplo, cuando el usuario visita una página el SR puede obtener información sobre qué ítems o enlaces ha visitado y cuáles no, durante cuánto tiempo, además de que puede comparar esa información con el resto de la información obtenida de los diferentes usuarios. Por otra parte, considerando la información contextual se puede obtener información adicional como la disponibilidad de algún ítem con respecto al horario, los ítems a recomendar dependiendo al tipo de usuario, etc. La inclusión del contexto permite mejorar la calidad de las recomendaciones entregadas al usuario (Adomavicius, y otros, 2011) ya que se realiza una ponderación del contexto específico en el cual, se encuentra inmerso el usuario y a partir de la información contextual es posible descubrir información implícita no contenida en un perfil de usuario. 2.2.2 Técnicas de recomendación contextuales Un SR puede ofrecer al usuario dos respuestas ante un elemento en específico. Si se requiere obtener una opinión del usuario anticipada para un ítem no valorado, hablamos de una predicción o Individual Scoring. Normalmente, se trata de valores numéricos que representan la posible valoración que un usuario puede otorgar a un ítem que aún no ha analizado. Las predicciones pueden realizarse por la ponderación de valores entre distintos ítems de un mismo usuario (item-based) o bien entre valores del mismo ítem entre distintos usuarios (user-based). Por otro lado, si se requiere un conjunto ordenado de elementos que
  24. 24. Capítulo II. Fundamento teórico 14 satisfaga ciertas características de interés para el usuario, hablamos de una recomendación. Una recomendación se define como una lista de N ítems que se corresponden con las preferencias del usuario y se conoce como Top-N Recommendation o Rank Scoring. El inicio del desarrollo de los SR da origen las técnicas de recomendación: • Colaborativos: Al usuario se le recomiendan ítems que han sido del agrado de usuarios con preferencias similares. • Basados en contenido: Al usuario se le recomiendan ítems basados en lo que le ha gustado. • Híbridos: estos sistemas combinan el enfoque basado en contenidos con el enfoque colaborativo. • Basados en conocimiento: El conocimiento que proporciona el usuario sobre sus necesidades y el conocimiento que tiene el sistema sobre las entidades para realizar recomendaciones de los productos que mejor cubren las necesidades de los usuarios. 2.2.3 SR en ambientes organizacionales En el ámbito organizacional, la implementación de los SR no ha tenido el mismo auge que en el comercio electrónico, ya que las organizaciones han centrado su atención en la recuperación de información. En este sentido los SR representan una alternativa proactiva a los sistemas de recuperación de información y pueden ser utilizados para la explotación de la información corporativa. Esto incluye la obtención de información implícita como habilidades, competencias y redes de personas así como información de infraestructura, eventos, etc. Las recomendaciones sobre este tipo de información pueden ser de tres tipos: 1) sugerencias, presentación al usuario de ítems que pueden serle de utilidad, 2) predicciones, suposiciones de lo que el usuario puede hacer con el ítem y 3) evaluaciones, presentación de las opiniones de los usuarios sobre un ítem. Estas recomendaciones se realizan sobre el capital intelectual de la organización, el cual comprende tres vertientes principales: capital humano, capital estructural y capital relacional (De Castro, y otros, 2010). El capital humano comprende el conocimiento incorporado a las personas incluyendo experiencia, capacidades y habilidades. El capital estructural comprende el conocimiento de la organización incluyendo rutinas, estrategias, manuales, procedimientos, entre otros. Por último, el capital relacional se constituye de las relaciones de la empresa con distintos actores del entorno (clientes, proveedores y competidores). Es así como el enfoque de los SR en este dominio presenta cambios con respecto a los SR clásicos: se parte de compartir recomendaciones a compartir conocimiento y de construir comunidades a soportar comunidades (Glance, y otros, 1999). Haciendo uso de los SR, una organización es capaz de explotar de manera eficiente su capital intelectual y, de esta forma, obtener un beneficio. Entre los elementos que pueden ser de interés para un usuario, y por ende susceptibles de ser recomendados, en un entorno organizacional podemos encontrar personas expertas en determinada área, documentos sobre temas específicos, eventos dentro
  25. 25. Capítulo II. Fundamento teórico 15 y fuera de la organización, servicios propios y organizaciones externas. Bajo la premisa de la división del capital intelectual de la organización, podemos agrupar estos elementos bajo tres rubros: • Recomendación de personas expertas: la experiencia de una persona en determinada área es un recurso muy valioso en un entorno organizacional. Esta experiencia es difícil de representar de forma explícita y para su obtención es necesario realizar análisis del contenido de los repositorios que contienen este tipo de información. En esta área, los SR se pueden utilizar para recomendar personas expertas con conocimiento en resolución de problemas específicos dentro de la organización. • Recomendación de documentos: dentro de las organizaciones es necesario emplear esquemas de colaboración con base en grupos de trabajo. Estos grupos producen una gran cantidad de documentos que contienen conocimiento implícito que resulta valioso como parte del capital intelectual. Existe una gran cantidad de trabajos enfocados en administración del conocimiento (knowledge management); es decir, al almacenamiento y extracción de información de este tipo de documentos, sin embargo carecen de la pro actividad de los SR. Debido a esto, se han presentado trabajos que se enfocan en la recuperación de este conocimiento mediante la implementación de SR. • Recomendación de recursos: se centran en recomendaciones de eventos, servicios y organizaciones externas que puedan fungir como socios potenciales. Una característica de este tipo de trabajos es la utilización de información contextual de los usuarios para mejorar el proceso de emisión de recomendaciones. 2.3 Explicación y Argumentación De acuerdo a la Real Academia de la Lengua Española una explicación se define como “Una declaración o exposición de cualquier materia, doctrina o texto con palabras claras o ejemplos, para que se haga más perceptible.” Desde el punto de vista de la ciencia moderna, la formulación de leyes y teorías científicas es lo más adecuado a la hora de prever eventos naturales y controlarlos. De esta manera, la ciencia dispone de métodos sistemáticos, muy sofisticados, describir los diversos aspectos de los fenómenos naturales para poder explicarlos (Chirinos, 2006). Una manera de comprender estos métodos utilizados por la ciencia, ha sido concebirlos como modos de dar respuestas a cierta clase de preguntas sobre los fenómenos. En la incesante búsqueda de respuestas, se trata de responder a la pregunta del por qué esos fenómenos son lo que son y por qué se dan o pueden darse ciertos sucesos. El término explicación desde la perspectiva científica clásica está restringido, a la explicación del “por qué” de los hechos; considerándose sólo como explicación científica aquella que busca su marco y conceptos de referencia únicamente en las relaciones causales, es decir, “Por qué, dada ciertas condiciones antecedentes, se podría haber esperado que ocurriese el acontecimiento a explicar” Lambert y Britan 1975.
  26. 26. Capítulo II. Fundamento teórico 16 Por otra parte argumentación proviene del latín “argumentum” que significa prueba o razón para justificar algo como verdad o como acción razonable. La teoría de la argumentación parte de los trabajos publicados por Oswald Ducrot y Jean-Claude Anscombre en los años setenta. En la formulación de Ducrot, argumentar tiene el valor de “hacer admitir” un razonamiento (sea lógico o no) para poder llegar a una conclusión que sea aceptable por el destinatario de la enunciación. Un aspecto fundamental en la teoría de la argumentación es la defensa de la idea de que es el propio discurso el que propicia la interpretación argumentativa. No son los hechos extralingüísticos los que imponen una lectura argumentativa en una dirección determinada, sino la propia lengua. Es la orientación argumentativa interna de los enunciados (y no el contenido informativo) la que favorece que se espere la continuación de un discurso en un sentido determinado en virtud de una serie de inferencias (Pons, 2003). En resumen, una argumentación y una explicación pueden tener formas lingüísticas similares, así como términos comunes de razones, motivos o causas, pero su distinción se puede apreciar en que la argumentación posee la existencia de una cuestión debatida y de unos compromisos con posiciones o proposiciones enfrentadas al respecto, pero en la explicación existe la ausencia o la irrelevancia de estos aspectos dialécticos e intencionales. Explicaciones en los sistemas de recomendación Las explicaciones tienen sus orígenes en el área de sistemas expertos, estos sistemas utilizan un módulo de explicación, mediante el cual pueden proporcionar una explicación al usuario de por qué está haciendo una pregunta y cómo ha llegado a una conclusión. Este módulo proporciona beneficios tanto al diseñador del sistema como al usuario. El diseñador puede usarlo para detectar errores y el usuario se beneficia de la transparencia del sistema. Actualmente existen varios tipos de explicaciones e implementaciones en los sistemas que modelan el mundo real. Las explicaciones en los sistemas de recomendación son información acerca de las recomendaciones, apoyan los objetivos definidos por el diseñador del sistema de recomendación (Friedrich, y otros, 2011); cuando un usuario recibe una explicación, puede aceptar una recomendación fácilmente porque el sistema proporciona la transparencia de su recomendación (Papadimitriou, y otros, 2011); además de proporcionar diversos objetivos como se plantean en (Tintarev, 2009). En (Zanker, y otros, 2010) de definen a las explicaciones de los sistemas de recomendación como una secuencia de argumentos e= (a, a2,…, an) donde cada argumento a ∈ e puede ser una frase textual y es un texto en lenguaje natural. Los estilos explicativos proporcionan un nivel de transparencia a las técnicas de recomendación (sección 2.2.2), exponiendo los detalles del proceso de razonamiento y la
  27. 27. Capítulo II. Fundamento teórico 17 información utilizada para la emisión de una recomendación. Las explicaciones tienen distintos objetivos como: mejorar la confianza del usuario, incrementar la satisfacción de los resultados obtenidos, hacer más fácil y rápida la búsqueda de ítems relevantes e influir en la decisión del usuario para seleccionar determinado ítem. Ante las recomendaciones emitidas por el SR, si el usuario tiene dudas sobre el origen de una de ellas se preguntará: ¿por qué recibí esta recomendación?, para responder esta pregunta el SR debe ser capaz de explicar por qué ha realizado su sugerencia. De esta forma, el usuario puede analizar la lógica detrás de la recomendación y decidir si existe suficiente evidencia para tomarla como válida. Para generar explicaciones convincentes, se deben considerar varios atributos que contribuyen para la aceptación de una recomendación y su utilización en la toma de decisiones. Entre estos atributos se destacan: transparencia, confianza, efectividad, persuasión, eficiencia, satisfacción, etc. 2.4 Teoría de la estructura retórica La Teoría de la Estructura Retórica (RST) se originó en los estudios sobre la generación automática de textos. En 1983 Bill Mann, Sandy Thompson y Christian Matthiessen observaron que existía una carencia de alguna teoría de la estructura o la función del discurso que soportara la programación de un generador automático de textos. Por lo que la RST se concibió a partir de estudios de textos editados o preparados, procedentes de una amplia variedad de fuentes. En la actualidad, la teoría tiene validez y consideración dentro de la lingüística independientemente de sus usos computacionales. La función de la RST es ofrecer una explicación de la coherencia del texto. Una formulación de la coherencia propone que es la ausencia de secuencias ilógicas y de lagunas, es decir, un texto coherente tiene una función (una razón verosímil o aceptable para su existencia) evidente a los lectores y además, produce la impresión de que “no le falta nada”. La RST enfatiza la primera parte, la idea de que cada parte tiene un papel evidente en el texto. La RST Propone una serie de posibles estructuras, las cuales son diferentes tipos de unidades fundamentales observables en un texto y que pertenecen a dos niveles diferentes. El primer nivel comprende las relaciones de coherencia lingüística que son la "nuclearidad" y las "relaciones". El segundo nivel de unidades comprende a los esquemas. Es importante señalar la importancia entre el texto y el discurso. Tomando como definición de texto a un “enunciado o conjunto coherente de enunciados orales o escritos”, Álvarez (Alvarez, 1996) concibe al texto como una configuración lingüística, como un conjunto de elementos (palabras, oraciones, etc.) organizados según reglas estrictas de construcción; y el discurso como la emisión concreta de un texto, por un enunciador determinado, en una situación de comunicación determinada. El texto funciona como discurso en una situación determinada. Para que una secuencia de oraciones sea aceptada como un texto coherente en una interacción determinada, tiene que cumplir ciertas normas de buena formación textual.
  28. 28. Capítulo II. Fundamento teórico 18 Generalmente las exigencias de la buena formación textual se engloban bajo los términos de cohesión y coherencia”. La cohesión se refiere a la forma en que las unidades textuales son enlazadas y la coherencia alude a las relaciones de significados entre dos unidades. La RST se centra en la descripción del texto y se basa en un conjunto de relaciones discursivas que pueden darse entre dos porciones de texto: un núcleo y un satélite, dentro de un discurso; dichas relaciones son llamadas relaciones retóricas o relaciones de coherencia. El núcleo es la unidad que es más central y se puede interpretar de forma independiente; el satélite es menos central, generalmente sólo se interpreta en relación con el núcleo, por lo tanto las relaciones definen el agarre entre estos dos intervalos no traslapados de texto. En (Mann, y otros, 1987) exponen 22 relaciones entre las cuales se encuentran las de justificación y causa. En las relaciones de la RST podemos identificar los marcadores lingüísticos o marcadores del discurso. Los cuales son “unidades lingüísticas invariables, no ejercen una función sintáctica en el marco de la predicación oracional - son pues, elementos marginales - y poseen un cometido coincidente en el discurso: el de guiar, de acuerdo con sus propiedades, las inferencias que se realizan en la comunicación” (Martín Zorraquino, y otros, 1999). En concreto estos marcadores lingüísticos son un conjunto de términos que establecen relaciones entre intervalos textuales. Por ejemplo, la relación Causa-Efecto: Con la indicación de la causa formulada en el primer segmento del discurso (S1) el enunciado que contiene el marcador (S2) introduce la consecuencia, resultado o efecto. En vista de esto/eso/ello, a/por causa de esto/eso/ello, así pues. En resumen la RTS proporciona una base funcional para el estudio de las formas específicas del texto que tienen relevancia en el discurso: los marcadores del discurso y otros marcadores formales de la estructura del discurso. Si la RST encuentra estructura dentro de una oración, se establece la base para estudiar las funciones de diferentes métodos de unión de cláusulas y las relaciones entre estas formas de estructura discursiva, así como la cohesión. 2.5 Mapas Mentales y Conceptuales 2.5.1 Mapas conceptuales Los mapas conceptuales, fueron desarrollados por Novak en los años 70, se usan como un medio para la descripción y comunicación de conceptos dentro de la teoría de asimilación, una teoría del aprendizaje que ha tenido una enorme influencia en la educación. La teoría está basada en un modelo constructivista de los procesos cognitivos humanos, es decir describe cómo el estudiante adquiere conceptos, y cómo se organizan en su estructura cognitiva (Cañas, y otros, 2000). Los mapas conceptuales expresan explícitamente las relaciones jerárquicas más relevantes entre un conjunto de conceptos para captar lo más significativo de un tema; esta relación se describe por medio de palabras
  29. 29. Capítulo II. Fundamento teórico 19 de enlaces formando proposiciones. La forma más simple de un mapa conceptual constaría de dos conceptos unidos por una palabra de enlace para formar una proposición. Una característica muy importante de los mapas conceptuales, es que tienen una jerarquía gráfica, es decir los conceptos más generales se explicitan en la parte superior y descienden por el mapa, encontrando los conceptos de jerarquía intermedia y luego los más específicos (Ciliberti, y otros, 1999), por ejemplo en la Fig. 2.2, se muestra un mapa conceptual sobre plantas. En un mapa mental también es posible expresar la jerarquía de los conceptos mediante nodos, haciendo gráficos de los diferentes niveles de inclusión, desde los más generales, hasta los más específicos, además se pueden relacionar distintas ramas jerárquicas entre sí, mediante enlaces cruzados, estableciendo conexiones o nexos (Costamanga, 2001). En general para construir un mapa conceptual es necesario identificar los conceptos, ordenarlos del más general al más específico, enlazar los conceptos y añadir algunos ejemplos. Es importante señalar que las relaciones subordinadas entre conceptos pueden cambiar en diferentes segmentos, es decir que cualquier concepto puede elevarse a una posición superior y seguir manteniendo una relación proposicional significativa con otros conceptos del mapa. Por otra parte las redes semánticas son grafos que proporcionan una representación del conocimiento mediante objetos, propiedades y relaciones, sin ninguna estructura jerárquica vertical, por lo tanto las conexiones entre nodos se representan por medio de flechas para guiar el sentido de la lectura. Los nodos de una red semántica están unidos por arcos, los cuales indican la relación que existe entre ellos, los arcos representan las relaciones conceptuales. Fueron propuestas por Quillian y Collins en 1968. Su concepción se basa en la asociación de conocimientos que realiza la mente humana y no requieren jerarquía grafica vertical. Fig. 2.2 Conceptual sobre las plantas (Cañas, 2000)
  30. 30. Capítulo II. Fundamento teórico 20 2.5.2 Mapas Mentales El término mapa mental se le atribuye al psicólogo británico Tony Buzan, el cual lo define como “Un método de análisis que permite organizar con facilidad los pensamientos y utilizar al máximo las capacidades mentales" (Buzan, 2002), además los mapas mentales poseen una estructura común compuesta por ramas que irradian de una imagen central y el uso de colores, símbolos, dibujos y palabras que se enlazan de manera sencilla y lógica. Buzan argumenta que los diagramas tradicionales requieren que el lector asimile la información de izquierda a derecha y de arriba abajo; mientras que lo natural para el cerebro es explorar toda la página sin un patrón lineal definido; él se basa también en los hemisferios cerebrales para proponer los mapas mentales como la herramienta válida a la hora de expresar ideas de forma visual, de tal forma que cada dato se puede representar como una esfera de la cual pueden irradiar miles de ramificaciones y cada ramificación representa una asociación que a su vez cuenta con una red infinita de conexiones; y los mapas mentales son una forma de representar dicho concepto llamado pensamiento radial. Nancy Branger afirma que los mapas mentales son una técnica que nos permite entrar a los dominios de nuestra mente de una forma más creativa e inmediatamente ayudan a organizar proyectos en pocos minutos, estimula la creatividad, supera los obstáculos de la expresión escrita y ofrece un método eficaz para la producción e intercambio de ideas. El mapa mental toma en cuenta la manera como el cerebro recolecta, procesa y almacena información. Su estructura registra una imagen visual que facilita extraer información. También, como se mencionan en (Rodriguez Piña, y otros, 2008) según el sociólogo mexicano Antonio Emmanuel Berthier, un mapa mental es una herramienta que permite la organización y representación de la información con el propósito de facilitar los procesos de aprendizaje, administración, planeación organizacional, así como el proceso de toma de decisiones. Berthier afirma que al utilizar un mapa mental se produce un enlazamiento electro-químico entre los hemisferios cerebrales, haciendo que nuestras capacidades cognitivas se concentran sobre un mismo objeto y trabajan armónicamente con un mismo propósito, “esto ocurre gracias a que la actividad lógica y racional controlada por nuestro hemisferio izquierdo se ve complementada por la capacidad creativa y la disposición emocional hacia los objetos, reguladas por el hemisferio derecho”. Además explica que el proceso de creación del mapa reproduce el proceso natural sobre el que opera la inteligencia, donde toda la actividad cerebral se realiza mediante conexiones electroquímicas denominadas sinápticas; mediante estas conexiones, las neuronas se comunican entre ellas para formar una red de almacenamiento y procesamiento de la información, así cada vez que incorporamos datos nuevos por la vía perceptual o reflexiva, las conexiones sinápticas forman "circuitos de enlace" por los que fluye la nueva información y se conecta con la información existente para poder comprenderla. Al igual que en el cerebro, el Mapa Mental procede mediante la asociación de ideas: una vez ubicada la idea central se desprenden de ella por asociación “ramas” hacia todas las ideas relacionadas con ella, mostrando las diferentes dimensiones o aspectos de un mismo tema.
  31. 31. Capítulo II. Fundamento teórico 21 En conclusión, tomando en consideración que es más fácil asimilar la información cuando se representa por medio de imágenes, como se demuestra en diferentes estudios como (Perales, y otros, 2005), los mapas mentales permiten conectar, relacionar, expandir y familiarizarnos con la información de una manera sencilla y eficaz, partiendo de una idea central de la cual se derivan distintas ramificaciones. Por otra parte, los mapas conceptuales permiten una representación de relaciones entre conceptos de manera jerárquica que van de lo general a lo particular, además de que se pueden establecer relaciones entre distintas ramas jerárquicas.
  32. 32. CAPÍTULO III Estado del arte 3. Estado del Arte
  33. 33. Capítulo III. Estado del arte 23 El contenido de este capítulo abarca el análisis de diferentes estilos y técnicas para la generación de explicaciones en los sistemas de recomendación. Los trabajos son presentados de la siguiente manera: como primera instancia muestran trabajos relacionados con las taxonomías existentes para los estilos de explicación, posteriormente trabajos que implementan estilos de explicación particulares basados en las técnicas de recomendación de colaboración, contenido, basados en conocimiento e híbridos, así como la utilización de descriptores de características para la creación de explicaciones basadas en plantillas de texto y explicaciones basadas en información contextual, por último, se presenta una aproximación sobre la teoría de la estructura retórica para analizar e identificar las relaciones y marcadores causales en los textos. 3.1 Taxonomía para la generación de explicaciones en los SR En este artículo realizado en la Universidad Alpen-Adria en Klagenfurt Austria (Friedrich, y otros, 2011) proponen una taxonomía para clasificar y revisar la investigación en el área de las explicaciones. Definen a las explicaciones en los SR mediante dos propiedades. Primero, son información acerca de las recomendaciones. Una recomendación es típicamente una lista ponderada de ítems. Segundo, las explicaciones apoyan a los objetivos definidos por el diseñador del SR. A partir de esto, se categorizan las diferentes aproximaciones para la explicación de recomendaciones basados en los principales principios de diseño. Las tres dimensiones de la taxonomía se conforman por el modelo de razonamiento, el paradigma de recomendación y las categorías de información explotadas, como se muestra en la Fig. 3.1. Para la clasificación del modelo de razonamiento se considera el modelo de caja blanca, donde las explicaciones revelan, al menos parcialmente, el modelo de razonamiento empleado para generar las recomendaciones y el modelo de caja negra que calcula las justificaciones que argumentan por qué una recomendación es verosímil o debe ser de interés al usuario, a pesar de que el modelo de razonamiento no tomó en cuenta esas suposiciones. Los paradigmas de recomendación de filtrado colaborativo y basado en contenido, así como las recomendaciones basadas en conocimiento, constituyen los tres paradigmas Fig. 3.1 Dimensiones para categorizar los estilos explicativos (Friedrich, 2011)
  34. 34. Capítulo III. Estado del arte 24 básicos de recomendación. Las explicaciones de modelos de colaboración revelan relaciones de similitud entre instancias de conceptos. Las explicaciones de caja blanca basadas en contenido explican las similitudes entre los ítems revelando sus relaciones de propiedad. En los sistemas basados en conocimiento las explicaciones revelan las asignaciones de variables (o propiedades y relaciones de requerimientos) y las relaciones de restricción entre ellos para explicar una recomendación. Una visión unificada es que la generación de explicaciones explotan las relaciones entre usuarios, ítems y propiedades. Las categorías de información que pueden ser explotadas para la generación de explicaciones se caracteriza por tres diferentes aspectos de entrada: El modelo de usuario, donde las explicaciones son hechas en función de las creencias del sistema acerca de un usuario específico. El Ítem Recomendado, en la cual una explicación hace declaraciones acerca de características específicas del ítem recomendado y por último, las alternativas donde las explicaciones argumentan a favor o en contra de las alternativas para el ítem recomendado. También se presenta un ejemplo de cómo diferentes enfoques de explicaciones para sistemas de recomendación existentes pueden clasificarse según la taxonomía propuesta, para analizar fácilmente su proceso de funcionamiento. Estas tres dimensiones no capturan exhaustivamente todos los factores que determinan la generación de explicaciones para RS. Por ejemplo, las explicaciones pueden ser analizadas y clasificadas por su presentación u objetivos, además de que el texto, video o imágenes pueden ser utilizados para explicar la salida de un sistema, el nivel de confianza que puede generar además de otras consideraciones. Sin embargo, esta taxonomía se restringe a las dimensiones más comunes que existen actualmente en la literatura y proporciona una taxonomía útil para el análisis de la generación de explicaciones en los sistemas de recomendación. 3.2 Una taxonomía generalizada de estilos de explicaciones para sistemas de recomendaciones tradicionales y sociales En la universidad Aristotle en Grecia, Alexis Papadimitriou, Panagiotis Symeonidis y Yannis Manolopoulo proponen una taxonomía para los estilos de explicación (Papadimitriou, y otros, 2011) que busca separar la dependencia entre el estilo de explicación y la técnica de recomendación empleada. Ya que este tipo de correspondencia uno-a-uno puede considerarse como no generalizable y muy simplista. En la taxonomía propuesta ver Fig. 3.2, se consideran tres recursos fundamentales que pueden ser utilizados en una explicación: los usuarios, ítems, características, y cualquier combinación de ellos. Se define (i) el estilo de explicación humana, (ii) el estilo de explicación ítem y (iii) el estilo de explicación característica y mediante el uso de cualquier combinación de los estilos antes mencionados, también se define el estilo de explicación híbrido.
  35. 35. Capítulo III. Estado del arte 25 Las explicaciones que adoptan el estilo de explicación humana utilizan a otros usuarios y sus preferencias para justificar sus recomendaciones. Usualmente son de la forma “Los usuarios quienes compraron/calificaron el ítem X también compraron/calificaron los ítems Y, Z,…”. EL estilo humano se basa en la premisa de que tanto el usuario objetivo y los usuarios analizados tienen intereses similares. Los sistemas de recomendación que incorporan el estilo ítem proporcionan recomendaciones basados en las calificaciones que los usuarios han proporcionado al sistema. Generalmente las explicaciones son de la forma “El ítem Y se recomendó porque usted valoró/compró el ítem X”. El mismo principio se aplica a la recomendación de actividades. En este caso las explicaciones son de la forma “La actividad Y se recomendó porque usted se interesó en la actividad X”. Existen muchos tipos de ítems como libros o sitios web, con contenido textual que puede ser explotado por sus características. Ciertas aproximaciones usan palabras como características en la explicación, denominadas “basadas en características”. Las explicaciones que usan el contenido del ítem enfrentan varios desafíos. Una limitación es que las palabras clave extraídas del contenido representan datos en lugar de metadatos, y por lo tanto pueden ser de muy bajo nivel. Los enfoques actuales del estilo característica sólo requieren que el ítem cuente un conjunto de palabras y las frecuencias correspondientes. En los años recientes han surgido nuevos sistemas de recomendación que combinan los estilos de explicación. La combinación de (i) datos de contenido con calificaciones, (ii) datos de contenido/calificaciones con datos sociales y (iii) datos sociales con datos geográficos, se está convirtiendo en una forma de diferenciar cuándo solamente un tipo de dato es tomado en consideración. La idea de un enfoque hibrido sugiere que mediante el uso de ambos datos (es decir social y calificaciones) es posible superar los defectos de cada Fig. 3.2 Posibles combinaciones de estilos de explicación, (Papadimitriou, y otros, 2011)
  36. 36. Capítulo III. Estado del arte 26 uno y hacer el resultado de la recomendación más precisa, esta misma idea se encuentra para las explicaciones. Como se muestra en la Fig. 3.2, estilo de explicación de un sistema de recomendación en el primer nivel (Explicaciones 1-D) únicamente puede depender de un usuario (Human), de una característica del ítem (Feature) o de un ítem (Item). Esto es porque la información principal que se almacena en el núcleo de una base de datos del sistema de recomendación hace referencia a usuarios, características de los ítems o ítems. Por lo tanto, es lógico que produzca explicaciones basadas en sus recursos. El segundo nivel representa los estilos de explicación los cuales adoptan cualquier combinación de dos de los estilos anteriores (Explicaciones hibridas 2-D). El tercer nivel comprende los estilos de explicaciones los cuales adoptan todos los tres estilos de explicación (Explicaciones hibridas 3-D). Hay que tomar en cuenta que el modelo se puede ampliar fácilmente para expresar dimensiones de orden superior mediante la incorporación de otros recursos tales como la dimensión tiempo. Generalmente los estudios orientados al usuario han sido diseñados para mostrar diferentes conclusiones y es orientado hacia estilos de explicación específicos. En este estudio se generalizan los resultados mediante una integración de los resultados de tres diferentes estudios y con base a los resultados encontrados, el estilo Hibrido es el estilo de explicación más eficaz y el estilo de explicación favorito del usuario. Teniendo en cuenta que las conclusiones no pueden ser extraídas fácilmente se toma a cada estilo de explicación por separado. 3.3 Diseño y evaluación de explicaciones para sistemas de recomendación En el capítulo 15 del libro titulado “Recommender Systems Handbook” (Tintarev, y otros, 2011) desarrollado en la Universidad de Aberdeen en Reino Unido, se realizó una investigación sobre las explicaciones en los SR, esta investigación se realizó desde un punto de vista evaluativo, enfocada en qué es lo que hace a una explicación “buena” y propone las pautas para evaluarlas. La idea principal del trabajo se basa en que las explicaciones desempeñan siete diversos objetivos en un SR los cuales son: transparencia, escrutabilidad, confianza, efectividad, persuasión, eficiencia y satisfacción. Estos objetivos son muy distintos entre si, aunqe pueden interactuar entre ellos el cumplimiento de los mismos resulta en un problema de trade-off, es decir, en una situación en la cual se debe perder cierta cualidad a cambio de otra, lo que implica una decisión en la cual se comprende totalmente las ventajas y desventajas de cada elección, de esta manera difícilmente una explicación puede ajustarse bien a todos los criterios. El tipo de explicación que se le proporciona a un usuario muy probablemente es dependiente de los criterios del diseñador de un SR. Por ejemplo, cuando se construye un sistema que vende libros uno puede decidir que la confianza del usuario es el aspecto más importante, ya que conduce a la lealtad del usuario y aumenta las ventas. Para seleccionar tv-shows, la satisfacción del usuario puede ser más importante que la eficacia, es decir, es
  37. 37. Capítulo III. Estado del arte 27 más importante que un usuario disfrute el servicio, a que se presenten los mejores espectáculos disponibles. Algunos atributos de las explicaciones pueden contribuir hacia el logro de objetivos múltiples. Por ejemplo, se puede medir que tan comprensible es una explicación, que puede contribuir, por ejemplo a la confianza de los usuarios, así como la satisfacción. Por otra parte el algoritmo subyacente de un motor de recomendación influye en cierto grado en los tipos de explicaciones que pueden ser generadas. Las explicaciones pueden seguir el estilo de un algoritmo particular subyacente o diferentes estilos de explicación. No obstante, el estilo de explicación puede, o no, reflejar el algoritmo subyacente por el que las recomendaciones se calculan, es decir las explicaciones, pueden seguir el estilo de un algoritmo determinado, independientemente de si es así, o no como las recomendaciones han sido calculadas. Por consiguiente este tipo de explicaciones no sería compatible con el objetivo de transparencia pero puede apoyar otros objetivos explicativos. Se describen diferentes estilos de explicación (basada en colaboración, basada en el contenido, basada en casos, basada en conocimiento y utilidad y el estilo de explicación demográfica) sus entradas asumidas, procesos y explicaciones generadas. Además se presentan ejemplos de estilos de explicación generados mediante los algoritmos más comunes basados en la clasificación de (Burke, 2002), para cada ejemplo se menciona el modelo de interacción que se eligió y para los sistemas comerciales donde esta información no es pública, se ofrecen conjeturas de que algoritmo utilizado. El este trabajo se ofrecen algunas directrices para los diseñadores de explicaciones en los SR. El diseñador debe considerar que beneficio ofrecen las explicaciones y por lo tanto los criterios que estas siguen (transparencia, escrutabilidad, confianza, efectividad, …); la relación entre en algoritmo subyacente y el tipo de explicaciones que se desea generar teniendo en cuenta que es posible que las explicaciones generadas no reflejen el algoritmo subyacente; la forma en que las explicaciones son presentadas; así como la manera en que los usuarios interactúan con las explicaciones. 3.4 Framework para la generación de Explicaciones Inteligentes En el trabajo desarrollado por (Zanker, y otros, 2010) en la universidad de Klagenfurt en Austria, se propone un framework para la generación de explicaciones, denominadas por los autores explicaciones inteligentes (knowledgeable explanations), las cuales explotan el dominio de conocimiento para argumentar de forma transparente porqué un ítem recomendado se ajusta a las preferencias del usuario. Además el trabajo busca separar el mecanismo de razonamiento utilizado para las recomendaciones de la manera en que las explicaciones son generadas y pueden ser integradas con sistemas de recomendación arbitrarios. Los autores afirman que en los sistemas de recomendación que explotan el dominio de conocimiento explícito, como por ejemplo los sistemas representados por un “Problema de Satisfacción de Restricciones”, los pasos de inferencia empleados para la recomendación
  38. 38. Capítulo III. Estado del arte 28 de un ítem pueden ser usados como una explicación y la elaboración de reglas transparentes que satisfacen un ítem recomendado ayuda a los usuarios a entender mejor como trabaja el sistema e incrementa su usabilidad percibida. Presentan un modelo de explicaciones denominado PBExpModel representado por un grafo acíclico por capas con un nodo de inicio y un nodo de fin, las transiciones que representan las limitaciones de la formulación de restricciones de un conjunto finito de variables son dirigidas y conectan 2 nodos, los nodos representan los argumentos que pueden convertirse en parte de una explicación y la secuencia de los argumentos a lo largo de una ruta a través del grafo constituye una explicación. Una explicación se define como una secuencia de argumentos e = ‹a0, a1, a2,…, an› donde cada argumento puede ser una frase textual y e es un texto en lenguaje natural. El modelo de explicaciones basado en predicados es definido por una 5-tupla (X=XI U XU, D, C, Q, E) representado por un conjunto de variables X que modelan las características de los ítems XI ⊆ X, las características del usuario y sesión XU ⊆ X, además también pueden incorporarse parámetros contextuales dependiendo del contexto de la aplicación; el dominio de las variables D definido como una función dom(x) que regresa un numero finito de asignaciones de variables válidas para cada x ∈ X ; un conjunto Q de argumentos; un conjunto E de transiciones y un conjunto C = {c1,…, cn} de restricciones de limitación que representa una base de conocimiento que define cuales combinaciones de valores se pueden asignar simultáneamente a las variables, cada restricción c ∈ C puede ser evaluada como verdadera o falsa y es parte de una transición a1.c.a2 ∈ E que conecta argumentos a1 con a2, con una restricción c. Se analizó el impacto de las explicaciones inteligentes en un caso de estudio del mundo real donde los usuarios son asignados arbitrariamente a un SR con y sin explicaciones. La implementación del sistema se realizó sobre un framework de recomendación genérico denominado ISeller y se instanció en un escenario de explicaciones de recomendaciones de “thermal spa resorts” en una plataforma del mundo real. Se planteó la hipótesis de que las explicaciones hacen una diferencia significativa en la percepción de los usuarios de un sistema de recomendación y el principal resultado de este trabajo es que las explicaciones inteligentes incrementan significativamente la utilidad percibida de los sistemas de recomendación y por consiguiente ayudan a incrementar la experiencia de interacción del usuario y su intención para usar varias veces el sistema así como su compromiso para recomendar el sistema a otras personas. 3.5 Explicando recomendaciones de filtrado colaborativo En la universidad de Minnesota en Minneapolis EU, (Herlocker, y otros, 2000) realizaron un estudio sobre las interfaces de explicaciones para sistemas automatizados de filtrado colaborativo ACF. El filtrado de decisiones en ACF tiene la habilidad de filtrar cualquier tipo de contenido por ejemplo Word art, videos, música, imágenes, entre otros ya que se basa en decisiones de humanos y no en el análisis de contenido de una máquina. Estos sistemas permiten a cada usuario calificar ítems que ha experimentado con el fin de
  39. 39. Capítulo III. Estado del arte 29 establecer un perfil de intereses, de este modo el sistema ajusta al usuario con las personas de gustos o intereses similares y las calificaciones de las personas se usan para generar recomendaciones para el usuario. En el trabajo se aborda la problemática de cómo deben ser implementadas y porque deben ser implementadas. Para explorar el cómo, se presenta un modelo para las explicaciones basado en el modelo conceptual del proceso de recomendación del usuario. Para abordar por qué se presenta evidencia experimental que muestra que proporcionar explicaciones puede mejorar la aceptación de los sistemas ACF. Los modelos conceptuales que se discuten son el modelo de caja negra, caja blanca y se aborda brevemente sobre los problemas de los modelos conceptuales mal informados. En el modelo de caja blanca los usuarios de un sistema ACF se proporcionan mediante las tres siguientes etapas: 1) El usuario introduce el perfil de puntuaciones, 2) los sistemas ACF localizan personas con perfiles similares (vecinos) y 3) las puntuaciones de los vecinos se combinan para formar recomendaciones. La última etapa consiste en explicar los datos, el proceso de toma de puntuaciones de los vecinos y su agregación en una predicción final. Cuando no hay oportunidad o posiblemente no existe el deseo de transmitir el modelo conceptual del sistema al usuario, el sistema de ACF se convierte en un sistema de recomendación de caja negra. En estas situaciones, se tiene recurrir a formas de justificar la recomendación de tal forma que sean independientes de los mecánicos que se producen en el recomendador de caja negra. Una técnica es utilizar los resultados anteriores del recomendador como justificación y otra técnica podría ser proporcionar las pruebas correspondientes que no hayan sido utilizados durante el cálculo de la recomendación. Cualquier caja blanca se puede ver como una caja negra, centrándose únicamente en las entradas y salidas. Debido a esto, las formas de explicación para recomendadores de caja negra deben también ser útiles para proporcionar explicaciones para recomendadores de caja blanca. Los usuarios con modelos conceptuales conflictivos rápidamente se dan cuenta de que las explicaciones no coinciden con sus expectativas y a través del proceso de examinar la explicación, aprenden el modelo conceptual apropiado. Un problema relacionado se produce cuando al usuario se le hace creer intencionalmente en un modelo conceptual incorrecto. Lo que ocurre si se cree que el modelo computacional es demasiado complejo como para explicarlo, así que los usuarios son conducidos a creer que un proceso simple más comprensible se está utilizando. De esta forma los modelos descritos actúan como una guía que puede indicar posibles áreas clave de la explicación. Sin embargo, hay una enorme cantidad de información que puede ser explicada de una predicción. Para poder responder a la pregunta ¿Qué modelos y técnicas son eficaces en el apoyo a la explicación en un sistema de ACF? Se realizó un experimento con 21 interfaces de explicaciones para medir cómo los usuarios de un sistema de ACF responden a diferentes tipos de explicación, cada una derivada de los diferentes componentes de los modelos de explicación descritos anteriormente Tabla 3.1. Los histogramas de
  40. 40. Capítulo III. Estado del arte 30 puntuaciones resultaron ser las formas más convincentes para explicar los datos detrás de una predicción. Además, mostrar resultados anteriores; las comparaciones de ítems similares puntuados, y características de contenido del dominio específico, tales como los actores y actrices de la película son también formas convincentes para justificar una recomendación. Para saber si las explicaciones pueden mejorar la aceptación de los sistemas ACF, se realizó otro experimento, donde se mostró que la mayoría de los usuarios (86%) ven a las explicaciones como un componente valioso y les gustaría verlo añadido a su sistema ACF. Y por último no fue posible probar o refutar la hipótesis de que “las explicaciones aumentan el rendimiento de filtrado de los usuarios del sistema ACF” debido a diversos factores como una cantidad considerablemente grande de la varianza no controlada entre los usuarios y la falta de buenos datos. Sin duda un estudio más controlado revelaría el verdadero efecto de las explicaciones sobre el rendimiento en la decisión. 3.6 Explicando recomendaciones: Satisfacción vs. Promoción Mustafa Bilgic y Raymond Mooney de la universidad de Maryland en Washington y la universidad de Texas respectivamente, presentan dos nuevos métodos para la explicación de recomendaciones de sistemas basados en contenido y/o colaborativos los cuales son influence style explanation (ISE) y keyword style explanation (KSE) (Bilgic, y Tabla 3.1 La media de respuesta de los usuarios de cada interfaz de explicación, se basada en una escala del uno a siete. Las explicaciones 11 y 12 representan el caso base de ninguna información adicional. Las filas sombreadas indican las explicaciones con una r respuesta significativamente diferente de los casos base (Herlocker, y otros, 2000)

×