• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
Sistemas De Recomendación
 

Sistemas De Recomendación

on

  • 5,933 views

 

Statistics

Views

Total Views
5,933
Views on SlideShare
5,624
Embed Views
309

Actions

Likes
10
Downloads
0
Comments
0

5 Embeds 309

http://rapososin.wordpress.com 251
http://sdceniblog.blogspot.com 35
http://www.slideshare.net 18
http://www.sdceniblog.blogspot.com 4
http://sdceniblog.blogspot.com.es 1

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

Sistemas De Recomendación Sistemas De Recomendación Presentation Transcript

  • Sistemas de Recomendación Ponce Medellín Ismael Rafael Enero 30, 2009 Tesis: Búsquedas contextuales de servicios basados en localización en un entorno de Web social Directores de Tesis: Dr. Juan Gabriel González Serna Dr. Rodolfo A. Pazos Rangel
  • Agenda Introducción Futuro Problemas Tipos de acercamientos Evaluación Sistemas de Recomendación
  • Introducción - Los usuarios no pueden dedicar todo su tiempo a navegar todo lo que está disponible . Constante crecimiento de Internet - Disminuye la habilidad del usuario de identificar cuál podría ser más útil para cada una de sus necesidades . Sobrecarga de la información - Su influencia, presencia e importancia ha crecido con el tiempo, ante el problema de filtrar contenido interminable . Sistemas de recomendación
  • Introducción Tapestry GroupLens GroupLens en Usenet Sistemas de recomendación Primer sistema de filtrado (Goldberg et al, 1992). Primer artículo al respecto (Resnick et al, 1994). Primera comunidad virtual de recomendadores (Konstan et al, 1997). Éxito inicial reflejado en los sitios de e-comercio.
  • Introducción Impacto de los sistemas de recomendación Datos de (Celma & Lamere, 2007) 38% de los clicks Aprovecha los hábitos de música 35% de las ventas 2/3 de películas rentadas Last.fm Netflix Amazon Google News
  • Introducción Sistemas de Recomendación Objetivo Filtrar contenido para proporcionar sugerencias relevantes y útiles para cada usuario del sistema (Lathia, 2009) .
  • Introducción Persona a la que se le van a proporcionar recomendaciones . Usuario Recomendadores Rating Perfil Componentes Usuarios que contribuyen a la recomendación . Modelado de los usuarios de acuerdo a una variedad de información, como el conjunto de ratings que han proporcionado al sistema . Calificación que se le da a un ítem.
  • Introducción
    • Explícito
    • Retroalimentación
    • Calificación directa
    • Implícito
    • Conducta del usuario
    Captura de los gustos al medir cómo interactúan los usuarios con el contenido para predecir que tanto le gustará o la calificación exacta que un usuario le dará a un ítem Predicción del rating
  • Agenda Introducción Futuro Problemas Tipos de acercamientos Evaluación Sistemas de Recomendación
  • Tipos de acercamiento Tipo de filtrado Basado en contenido Colaborativo Híbrido
  • Acercamiento basado en contenido Filtrado basado en contenido Recomienda un ítem
    • A partir de la descripción del ítem y el perfil de los intereses del usuario (Pazzani & Billsus, 2007).
    • Selecciona los que tienen un alto grado de proximidad a las preferencias de un usuario
    Clave
    • Separar el contenido del sistema en un número de atributos .
      • Pueden ser características extraídas (frecuencia de palabras en los artículos, o etiquetas de los usuarios)
  • Acercamiento basado en contenido Construcción
    • Implícita, a partir de sus acciones pasadas.
    • Explícita, cuestionarios sobre sus preferencias.
    Representación Contenido
    • Como un vector con pesos sobre las descripciones de los ítems.
    • Un modelo de los ítems que son de interés para ese usuario.
    • Perfil de usuario
  • Acercamiento basado en contenido Entrada Modelo de usuario Salida La apreciación del usuario sobre un ítem. Aprendido de manera implícita por medio de un método de aprendizaje supervisado. La descripción de los ítems.
  • Acercamiento basado en contenido Ventaja A diferencia de los sistemas colaborativos, puede proporcionar recomendaciones de nuevos ítems aún cuando no haya ratings disponibles.
  • Acercamiento basado en contenido Necesita descripciones completas de los ítems, así como perfiles de usuario bien construidos. Requiere contenido que favorezca el análisis, descrito en términos de un número de atributos, lo que no siempre es el caso. Cuando se recomiendan ítems con un contenido similar a los ya considerados, con una gran falta de originalidad (Zhang et al. 2002). La apreciación de un usuario sobre un ítem se basa en más información de la que puede ser almacenada en la descripción de un ítem. Eficiencia Contenido Sobre-especia-lización Limitada
    • Desventajas
  • Tipos de acercamiento Tipo de filtrado Basado en contenido Colaborativo Híbrido
  • Acercamiento colaborativo Características
    • Algoritmo dominante en los sistemas de recomendación.
    • Deja de lado los atributos, en pro del juicio humano .
    • Genera recomendaciones basadas en las opiniones que han sido expresadas por la comunidad de usuarios.
    • Poder de filtrado basado en cualidades .
  • Acercamiento colaborativo Vecindario de usuarios Los usuarios son comparados por sus apreciaciones comunes sobre los ítems. Predicción del rating de un ítem para un usuario en base a: Vecindario del ítem Los ítems son comparados por la apreciación compartida de los usuarios .
  • Acercamiento colaborativo Predecir el rating p ai del usuario a sobre un item i . Basado en usuarios activos. Cold start . El sistema carece de datos para producir recomendaciones. Sistema colaborativo Usuario Objetivo Desventaja
  • Acercamiento colaborativo U un conjunto de N usuarios I un conjunto de M ítems R un conjunto de ratings r ui de usuarios u ∈ U sobre el ítem i ∈ I
    • S u ⊆ I conjunto de ítems que el usuario u ha calificado.
    • Usuario activo , S a ≠ Ø
    • Ítem a ser predicho es desconocido para el usuario, i ∉ S a
    • Formalización
  • Acercamiento colaborativo Basado en modelo Basado en memoria * En Usuario En ítem Colaborativo (Lathia, 2009)
  • Acercamiento basado en memoria Generados y ordenados los ratings predichos para los ítems, el top-n es mostrado al usuario final. Retroalimenta y reinicia el ciclo. Formación de vecindario Recomendación Agregar opiniones Encontrar un subconjunto único de la comunidad para cada usuario, identificando otros con intereses similares que actúen como recomendadores . Se obtiene un conjunto de pesos de los recomendadores para predecir el rating de contenido sin calificar. Los vecinos más similares tendrán mayor influencia en la predicción. Formación de vecindario Recomendación Agregar opiniones Etapas
  • Acercamiento basado en usuario Ejemplo de una matriz de calificaciones de usuarios Característica Maneja un vector que contiene los ratings de los ítems
  • Acercamiento basado en usuario Bases para la predicción de un rating del usuario Ítem Ratings Vecinos más cercanos Es necesario definir una medida de similitud entre las necesidades de los usuarios, antes de seleccionar el conjunto de vecinos más cercanos.
  • Acercamiento basado en usuario similitud sim(a,u) entre el usuario a y u Número de vecinos K que maximizan su similitud con el usuario a T a conjunto de vecinos de un usuario a
  • Acercamiento basado en ítem El rating predicho se obtiene usando los ratings del usuario en los vecinos del ítem seleccionado . Maneja un vector que contiene los ratings de los usuarios . Necesita definir vecindarios de ítems .
  • Tamaño de vecindario K 1.Sumatoria de valores con rating 2. Sumatoria de las desviaciones de la media - Más efectivo, según (Candillier et al. 2007). Esquema de predicción Parámetros a elegir para implementar un acercamiento basado en usuario o basado en ítem Title in here Medida de similitud Title in here Computar predicciones
  • Similitud Similitud es modelar la relación potencial entre los usuarios con un valor numérico. Pearson (Resnick et al., 1994), Coseno simple, similitud de Manhatan Similitud de Jaccard
        • Combinaciones usando Jaccard
        • wPearson
        • wCosine
        • wManhattan
  • Acercamiento basado en modelo Muchas aplicaciones reales necesitan poder realizar predicciones de manera rápida. Busca un modelo de los datos fuera de línea ( offline ) para predecir ratings online . Entrenan un modelo separado para cada usuario en el sistema, siendo caracterizados por una fuerte visión subjetiva de los usuarios finales. Aprendizaje máquina Predicción rápida Modelo offline Caracterización subjetiva
  • Acercamiento basado en modelo Agrupan a los usuarios en clusters para predecir el rating de un usuario sobre un ítem usando sólo los ratings de los usuarios que pertenecen al mismo clúster. Diferentes números de clusters son probados y el que deje el menor error en la validación cruzada es conservado . Solución atractiva, pues una vez entrenado puede predecir ratings eficientemente. Los ítems que un usuario ha calificado se consideran un conjunto de instancias de entrenamiento.
  • Tipos de acercamiento Tipo de filtrado Basado en contenido Colaborativo Híbrido
  • Filtrado híbrido Aprovecha el filtrado colaborativo y el basado en contenido combinando sus predicciones. U sa tanto las apreciaciones de los ítems como las descripciones de las preferencias de los usuarios. D os usuarios son similares no sólo si califican los mismos ítems, sino si además pertenecen al mismo segmento demográfico.
  • Agenda Introducción Futuro Problemas Tipos de acercamientos Evaluación Sistemas de Recomendación
  • Evaluación El conjunto de datos se divide en un conjunto de entrenamiento y en un conjunto de prueba Evalúan que tan bien el sistema hace predicciones. Se pide al algoritmo que haga una predicción sobre los elementos del conjunto de prueba usando el conjunto de entrenamiento. Las predicciones se comparan con el valor actual , con lo que se pueden calcular medidas de exactitud. [ Métricas de exactitud ] MAE Mean Absolute Error Precisión RMSE Root Mean Squared Error
  • Evaluación Experiencia Percepción ¿Evaluación? Una interfaz de usuario eficiente para dicha interacción. Determina la habilidad del sistema para presentar las recomendaciones de una manera clara y transparente. Las métricas de exactitud persisten debido a la necesidad de evaluación empírica que permita comparar el desempeño relativo de diferentes técnicas. Afecta la respuesta que el usuario da a la recomendación recibida. Una interacción divertida y duradera es tan esencial como el hacer buenas recomendaciones. McNee et al (2006) argumenta que los esfuerzos de la exactitud son perjudiciales para la investigación de los sistemas de recomendación. Diseño Rol vital Interfaz de usuario Subjetiva
  • Agenda Introducción Futuro Problemas Tipos de acercamientos Evaluación Sistemas de Recomendación
  • Problemas Datos perdidos Puede no haber traslape entre dos perfiles . Cold start Ítems no votados que nunca van a recomendarse. Actualización Ataques Sybil Usuarios maliciosos crean perfiles falsos para influir en el algoritmo (Mobaster et al, 2007). Algoritmo Vulnera-bilidad Usuarios
  • Agenda Introducción Futuro Problemas Tipos de acercamientos Evaluación Sistemas de Recomendación
  • Áreas a futuro
    • Lathia (2009):
    • La investigación de las características temporales de los sistemas de recomendación.
    • Recomendaciones en contextos cruzados .
      • Si el perfil musical de un usuario se ha definido, ¿se le podrían recomendar eventos musicales en vivo o conciertos de su interés?
    • Portar los perfiles de un lugar a otro y usarlos exitosamente en recomendaciones contextuales cruzadas.
  • Conclusiones El filtrado de contenido ofrece ítems según su proximidad con los atributos de otros; buen desempeño posiblemente por la similitud codificada entre sus atributos * . Los sistemas de recomendación surgen en respuesta a la sobrecarga de información del contenido en línea. Es útil considerar otros factores aparte de la exactitud para capturar calidad y utilidad (ej. escalabilidad, novedad, confianza y satisfacción del usuario) + . El filtrado colaborativo usa información que no se encuentra en los datos de los ítems; alinea los gustos con otros incluso si los ítems no tienen atributos en común * . *(Candiller et al, 2009) + (Herlocker et al, 2004)
  • ¡¡Gracias!! Vive como si fueras a morir mañana. Aprende como si fueras a vivir para siempre. –  Mahatma Gandhi
  • Bibliografía
    • Candillier L., Jack K., Fessant F., Meyer F. (2009). State-of-the-Art Recommender Systems. Collaborative and Social Information Retrieval and Access Techniques for Improved User Modeling (pp. 1-22). IGI Global.
    • Celma O., & Lamere, P. (2007, September). Music Recommendation Tutorial. Presented at the 8th International Conference on Music Information Retrieval, Vienna, Austria.
    • Goldberg, D., Nichols, D., Oki, B. M., & Terry, D. (1992). Using Collaborative Filtering to Weave an Information Tapestry. Communications of the ACM, 35, 61-70. ACM Press.
    • Herlocker, J., Konstan, J., Terveen, L., & Riedl, J. (2004). Evaluating collaborative filtering recommender systems. In ACM Transactions on Information Systems, 22(1), (pp. 5–53).
    • Konstan, J., Miller, B., Maltz, D., Herlocker, J. Gordon, L., & Riedl, J. (1997) GroupLens: Applying Collaborative Filtering to Usenet News Communications of the ACM, 40, 77-87. ACM Press.
    • Lathia N. (2009). Computing Recommendations with Collaborative Filtering. Collaborative and Social Information Retrieval and Access Techniques for Improved User Modeling (pp. 23-38). IGI Global.
    • McNee, S., Riedl, J., & Konstan, J. (2006). Being accurate is not enough: How accuracy metrics have hurt recommender systems. In Extended Abstracts of the 2006 ACM Conference on Human Factors in Computing Systems.
    • Mobasher, B., Burke, R., Bhaumik, R., & Williams, C. (2007). Towards Trustworthy Recommender Systems: An Analysis of Attack Models and Algorithm Robustness. Transactions on Internet Technology (TOIT).
    • Pazzani, M., & Billsus, D. (2007). Content-Based Recommendation Systems. In The Adaptive Web (pp. 325-341).
    • Resnick, P., Iacovou, N., Suchak, M., Bergstrom, P., & Riedl, J. (1994). Grouplens: An open architecture for collaborative filtering of netnews. In Conference on Computer Supported Cooperative Work (pp. 175–186). ACM.
    • Zhang, Y., Callan, J., & Minka, T. (2002). Novelty and redundancy detection in adaptive filtering. In ACM SIGIR’02.