Aprendizaje de Reglas para un        SR contextual                          Blanca A. Vargas Govea                     bla...
Contenido                          Surfeous  1     Antecedentes                          Evaluación  2     Metodología par...
Surfeous: prototipo de SR       usuario              enfoque contextual   [1]   buscando restaurante   enfoque social     ...
Surfeous: modelos de contexto        formalidad                        latitud     dirección        ciudad  transportación...
Evaluación: metodología         Básica                          Popularidad ítem                          Usuarios con más...
Evaluación: resultados     0.4original                social                         0.335                                ...
¿Por qué es bajo? ¿Qué ocurre con las reglas? ¿Sobreajuste?      Si         es roja, redonda, de 5cm de          diámetro ...
Ejemplo de reglas                    8
¿Entonces? Se necesita un conjunto de reglas que describa los datos sin sobre-ajuste ni extrema generalización            ...
Metodología                                 modelo del usuario         Selección de                                 modelo...
Selección de atributos                         11
¿Para qué sirve?                                           [2]                   Mejorar el desempeño                   pr...
Selección de atributos: proceso                          forward/backward                          búsqueda: hill-climbing...
Las Vegas Filter: criterio de inconsistencia                                               [3]               Conteo de inc...
Ejemplo          área   costo   franquicia   fumar   Rating A Rating B     1       i   bajo        n          s        0  ...
Ejemplo Sub-conjunto A                         Sub-conjunto B Instancias iguales: 1,2,3,4            Instancias iguales: 1...
Descripción de los datos: Surfeous                              1,160         130                            ratings     r...
¿Cómo se hizo? Selección de atributos para:                           [4]     Modelo del usuario     Modelo del servicio  ...
Preparación de datos                       user­cuisine       user­payment  usuariouser­profile Clase                  use...
Preparación de datos          Para el modelo de servicio se efectuó          un proceso similar.                          ...
Cada archivo es la entrada a WEKA                                    21
WEKA       22
WEKA       23
Resultados  usuario                                   ítem  interés   edad                            tipo-de-pago      ho...
Preparación de datos                       25
Preparación de datos para el aprendizaje Objetivos Obtener los elementos necesarios para el aprendizaje automático: reglas...
Preparación de datos para el aprendizaje                           <regla nombre="fumatrue1">                             ...
Preparación de datos para el aprendizaje   Ya se tiene   Plataforma para prueba de reglas   Predicados correspondientes a ...
Lo que sigue                                 modelo del usuario         Selección de                                 model...
Referencias [1] R. Ponce-Medellín, Búsquedas contextuales de servicios basados en localización en un entorno de web social...
Graciasblanca.vargas@cenidet.edu.mx        @blancavg                               31
Upcoming SlideShare
Loading in …5
×

Aprendizaje de reglas para un sistema de recomendación contextual

1,011 views

Published on

Published in: Education
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
1,011
On SlideShare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
9
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide
  • The algorithm considers that two instances are inconsistent if their attributes have the same values except for their class labels. For the matching in- stances, regardless of the class labels, the inconsistency count IC (Eq. 1 ) of an instance A 2 S is the number of instances in S equal to A minus the number of instances of the most frequent class ( k ) with the same attributes of S . The inconsistency rate IR of S (Eq. 2 ) is the sum of the in- consistency counts divided by the total number of instances.
  • The algorithm considers that two instances are inconsistent if their attributes have the same values except for their class labels. For the matching in- stances, regardless of the class labels, the inconsistency count IC (Eq. 1 ) of an instance A 2 S is the number of instances in S equal to A minus the number of instances of the most frequent class ( k ) with the same attributes of S . The inconsistency rate IR of S (Eq. 2 ) is the sum of the in- consistency counts divided by the total number of instances.
  • The algorithm considers that two instances are inconsistent if their attributes have the same values except for their class labels. For the matching in- stances, regardless of the class labels, the inconsistency count IC (Eq. 1 ) of an instance A 2 S is the number of instances in S equal to A minus the number of instances of the most frequent class ( k ) with the same attributes of S . The inconsistency rate IR of S (Eq. 2 ) is the sum of the in- consistency counts divided by the total number of instances.
  • The algorithm considers that two instances are inconsistent if their attributes have the same values except for their class labels. For the matching in- stances, regardless of the class labels, the inconsistency count IC (Eq. 1 ) of an instance A 2 S is the number of instances in S equal to A minus the number of instances of the most frequent class ( k ) with the same attributes of S . The inconsistency rate IR of S (Eq. 2 ) is the sum of the in- consistency counts divided by the total number of instances.
  • The algorithm considers that two instances are inconsistent if their attributes have the same values except for their class labels. For the matching in- stances, regardless of the class labels, the inconsistency count IC (Eq. 1 ) of an instance A 2 S is the number of instances in S equal to A minus the number of instances of the most frequent class ( k ) with the same attributes of S . The inconsistency rate IR of S (Eq. 2 ) is the sum of the in- consistency counts divided by the total number of instances.
  • The algorithm considers that two instances are inconsistent if their attributes have the same values except for their class labels. For the matching in- stances, regardless of the class labels, the inconsistency count IC (Eq. 1 ) of an instance A 2 S is the number of instances in S equal to A minus the number of instances of the most frequent class ( k ) with the same attributes of S . The inconsistency rate IR of S (Eq. 2 ) is the sum of the in- consistency counts divided by the total number of instances.
  • The algorithm considers that two instances are inconsistent if their attributes have the same values except for their class labels. For the matching in- stances, regardless of the class labels, the inconsistency count IC (Eq. 1 ) of an instance A 2 S is the number of instances in S equal to A minus the number of instances of the most frequent class ( k ) with the same attributes of S . The inconsistency rate IR of S (Eq. 2 ) is the sum of the in- consistency counts divided by the total number of instances.
  • The algorithm considers that two instances are inconsistent if their attributes have the same values except for their class labels. For the matching in- stances, regardless of the class labels, the inconsistency count IC (Eq. 1 ) of an instance A 2 S is the number of instances in S equal to A minus the number of instances of the most frequent class ( k ) with the same attributes of S . The inconsistency rate IR of S (Eq. 2 ) is the sum of the in- consistency counts divided by the total number of instances.
  • Aprendizaje de reglas para un sistema de recomendación contextual

    1. 1. Aprendizaje de Reglas para un SR contextual Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Grupo de Sistemas de Recomendación cenidet Feb 16, 2012
    2. 2. Contenido Surfeous 1 Antecedentes Evaluación 2 Metodología para el aprendizaje de reglas 3 Selección de atributos 4 Preparación de datos 2
    3. 3. Surfeous: prototipo de SR usuario enfoque contextual [1] buscando restaurante enfoque social opiniones 3 ratings y tags
    4. 4. Surfeous: modelos de contexto formalidad latitud dirección ciudad transportación presupuesto país fax alcoholfumador alcohol cocina cocina zona-fumar ambiente interés ZIP latitud servicios edad usuario pago costo item hijos teléfono estatura peso ambiente horaslongitud estado tipo-de-pagopersonalidad estado-civil religión días estacionamiento accesibilidad ocupación accesibilidad franquicia color-favorito formalidad 4
    5. 5. Evaluación: metodología Básica Popularidad ítem Usuarios con más ratings Por grupos Usuarios con menos ratings Distribución usuario-ítem Selección de atributos 5
    6. 6. Evaluación: resultados 0.4original social 0.335 fusión 0.278 contexto 0.133atributos-sel 0.335 0.327 0.133 0.35 La evaluación 0.3 más baja se 0.25 obtiene en el social enfoque 0.2 fusión contextual 0.15 contexto 0.1 0.05 0 original atributos-sel 6
    7. 7. ¿Por qué es bajo? ¿Qué ocurre con las reglas? ¿Sobreajuste? Si    es roja, redonda, de 5cm de     diámetro    y es jaspeada en el 20% de su     superficie  entonces     es una manzana ¿Demasiado generales? Si    es roja entonces     es una manzana 7
    8. 8. Ejemplo de reglas 8
    9. 9. ¿Entonces? Se necesita un conjunto de reglas que describa los datos sin sobre-ajuste ni extrema generalización Aprendizaje de Reglas 9
    10. 10. Metodología modelo del usuario Selección de modelo del ítem atributos con ambos modelos Preparación de datos para el aprendizaje Análisis del estado actual de las reglas Aprendizaje automático usando ILP Prueba de reglas aprendidas 10
    11. 11. Selección de atributos 11
    12. 12. ¿Para qué sirve? [2] Mejorar el desempeño predictivo Construir modelos más Selección de eficientes atributos Mejorar el entendimiento de los modelos 12
    13. 13. Selección de atributos: proceso forward/backward búsqueda: hill-climbing, best-first,... Generación de sub-conjuntos sub-conjunto chi-cuadrada, ganan- cia de información, Métrica clasificador, consisten- Evaluación de cia sub-conjuntos filtro/wrapper no si Criterio Validación de de paro resultados Umbral No. de atributos seleccionados 13 Que no mejore la evaluación
    14. 14. Las Vegas Filter: criterio de inconsistencia [3] Conteo de inconsistencia IC s ( A)=S ( A)−max S k ( A) k Valor de inconsistencia ∑ A∈S IC S ( A) IR( S )= ∣S∣ 14
    15. 15. Ejemplo área costo franquicia fumar Rating A Rating B 1 i bajo n s 0 0 2 i bajo n s 1 0 3 i bajo n s 2 0 4 i bajo n s 1 1 5 i alto n n 0 1 6 i alto n n 1 1 7 i alto n n 2 1 8 e alto s n 1 1 9 e bajo n n 1 1 10 e bajo n s 2 2 15
    16. 16. Ejemplo Sub-conjunto A Sub-conjunto B Instancias iguales: 1,2,3,4 Instancias iguales: 1,2,3,4 n=4, clases=0,1,2,1 n=4, clases=0,0,0,1 clase frecuente=1 (2 instancias) clase frecuente=0 (3 instancias) Conteo de inconsistencia (IC): 4-2=2 Conteo de inconsistencia (IC): 4-3=1 Instancias iguales: 5,6,7 Instancias iguales: 5,6,7 N=3, clases= 0,1,2 N=3, clases= 1,1,1 clase frecuente=1 (1 instancia) clase frecuente=1 (3 instancias) Conteo de inconsistencia (IC): 3-1=2 Conteo de inconsistencia (IC): 3-3=0 Valor de Inconsistencia: Valor de Inconsistencia: (2+2)/10 = 4/10 = 0.4 (1+0)/10 = 1/10 = 0.1 16
    17. 17. Descripción de los datos: Surfeous 1,160 130 ratings restaurantes 138 usuarios 0,1,2 valores de rating 8.41 115 ratings/usuario restaurantes con 1 rating 17
    18. 18. ¿Cómo se hizo? Selección de atributos para: [4] Modelo del usuario Modelo del servicio Modelo del usuario + Modelo del servicio 18 http://www.cs.waikato.ac.nz/ml/weka/
    19. 19. Preparación de datos user­cuisine user­payment usuariouser­profile Clase user­attributes 19
    20. 20. Preparación de datos Para el modelo de servicio se efectuó un proceso similar. Selección de usuario atributos Selección de ítem atributos usuario Selección de + atributos ítem 20
    21. 21. Cada archivo es la entrada a WEKA 21
    22. 22. WEKA 22
    23. 23. WEKA 23
    24. 24. Resultados usuario ítem interés edad tipo-de-pago horas cocina color-favorito días 80.95% 86.96% usuario + ítem edad religión alcohol zona-fumar horas color-favorito interés alcohol cocina formalidad cocina 75.00% 24
    25. 25. Preparación de datos 25
    26. 26. Preparación de datos para el aprendizaje Objetivos Obtener los elementos necesarios para el aprendizaje automático: reglas prototipo, conocimiento del dominio e instancias aterrizadas. Preparar una plataforma de prueba de reglas. 26
    27. 27. Preparación de datos para el aprendizaje <regla nombre="fumatrue1"> <antecedente>Restaurant(?r) ^  Reglas IDPlace(?r,?id)  ^....</antecedente> Formato RDF <consecuente> sqwrl:selectDistinct(?id)</consecuente> <tipo>2</tipo> </regla> usuariofuma(Restaurant,User):­ Predicados atom_chars(Msg,"Regla1n"), Prolog write(Msg), permiteFumar(Restaurant,"section"), esFumador(User,true). permiteFumar(Item,Algo) Extracción de tieneFormalidad(Item,Algo) literales (condiciones) ofreceServicio(Item,Algo) sirveAlimento(Item,Algo) esFranquicia(Item,Algo) Instanciar las esFumador("AAAM",false). esFumador("aguilar",false). condiciones con los esFumador("agusperez",false). 27 valores de atributos
    28. 28. Preparación de datos para el aprendizaje Ya se tiene Plataforma para prueba de reglas Predicados correspondientes a atributos (condiciones) En proceso Análisis de las reglas originales Reglas muy generales, producen varios resultados por tipo de regla (fumador, estudiante, …) 28
    29. 29. Lo que sigue modelo del usuario Selección de modelo del ítem atributos con ambos modelos Preparación de datos para el aprendizaje Análisis del estado actual de las reglas Aprendizaje automático usando ILP Prueba de reglas aprendidas 29
    30. 30. Referencias [1] R. Ponce-Medellín, Búsquedas contextuales de servicios basados en localización en un entorno de web social. 2010. [2] I. Guyon and A. Elisseeff, “An introduction to variable and feature selection,” Journal of Machine Learning Research, vol. 3, pp. 1157–1182, Mar. 2003. [3] H. Liu and R. Setiono, “A probabilistic approach to feature selection - A filter solution,” in 13th International Conference on Machine Learning, 1996, pp. 319–327. [4] M. Hall, E. Frank, G. Holmes, B. Pfahringer, P. Reutemann, and I. H. Witten, “The WEKA data mining software: an update,” SIGKDD Explorations Newsletter, vol. 11, no. 1, pp. 10–18, Nov. 2009. 30
    31. 31. Graciasblanca.vargas@cenidet.edu.mx @blancavg 31

    ×