Upcoming SlideShare
×

# Aprendizaje de reglas para un sistema de recomendación contextual

746

Published on

Published in: Education
0 Likes
Statistics
Notes
• Full Name
Comment goes here.

Are you sure you want to Yes No
• Be the first to comment

• Be the first to like this

Views
Total Views
746
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
9
0
Likes
0
Embeds 0
No embeds

No notes for slide
• The algorithm considers that two instances are inconsistent if their attributes have the same values except for their class labels. For the matching in- stances, regardless of the class labels, the inconsistency count IC (Eq. 1 ) of an instance A 2 S is the number of instances in S equal to A minus the number of instances of the most frequent class ( k ) with the same attributes of S . The inconsistency rate IR of S (Eq. 2 ) is the sum of the in- consistency counts divided by the total number of instances.
• The algorithm considers that two instances are inconsistent if their attributes have the same values except for their class labels. For the matching in- stances, regardless of the class labels, the inconsistency count IC (Eq. 1 ) of an instance A 2 S is the number of instances in S equal to A minus the number of instances of the most frequent class ( k ) with the same attributes of S . The inconsistency rate IR of S (Eq. 2 ) is the sum of the in- consistency counts divided by the total number of instances.
• The algorithm considers that two instances are inconsistent if their attributes have the same values except for their class labels. For the matching in- stances, regardless of the class labels, the inconsistency count IC (Eq. 1 ) of an instance A 2 S is the number of instances in S equal to A minus the number of instances of the most frequent class ( k ) with the same attributes of S . The inconsistency rate IR of S (Eq. 2 ) is the sum of the in- consistency counts divided by the total number of instances.
• The algorithm considers that two instances are inconsistent if their attributes have the same values except for their class labels. For the matching in- stances, regardless of the class labels, the inconsistency count IC (Eq. 1 ) of an instance A 2 S is the number of instances in S equal to A minus the number of instances of the most frequent class ( k ) with the same attributes of S . The inconsistency rate IR of S (Eq. 2 ) is the sum of the in- consistency counts divided by the total number of instances.
• The algorithm considers that two instances are inconsistent if their attributes have the same values except for their class labels. For the matching in- stances, regardless of the class labels, the inconsistency count IC (Eq. 1 ) of an instance A 2 S is the number of instances in S equal to A minus the number of instances of the most frequent class ( k ) with the same attributes of S . The inconsistency rate IR of S (Eq. 2 ) is the sum of the in- consistency counts divided by the total number of instances.
• The algorithm considers that two instances are inconsistent if their attributes have the same values except for their class labels. For the matching in- stances, regardless of the class labels, the inconsistency count IC (Eq. 1 ) of an instance A 2 S is the number of instances in S equal to A minus the number of instances of the most frequent class ( k ) with the same attributes of S . The inconsistency rate IR of S (Eq. 2 ) is the sum of the in- consistency counts divided by the total number of instances.
• The algorithm considers that two instances are inconsistent if their attributes have the same values except for their class labels. For the matching in- stances, regardless of the class labels, the inconsistency count IC (Eq. 1 ) of an instance A 2 S is the number of instances in S equal to A minus the number of instances of the most frequent class ( k ) with the same attributes of S . The inconsistency rate IR of S (Eq. 2 ) is the sum of the in- consistency counts divided by the total number of instances.
• The algorithm considers that two instances are inconsistent if their attributes have the same values except for their class labels. For the matching in- stances, regardless of the class labels, the inconsistency count IC (Eq. 1 ) of an instance A 2 S is the number of instances in S equal to A minus the number of instances of the most frequent class ( k ) with the same attributes of S . The inconsistency rate IR of S (Eq. 2 ) is the sum of the in- consistency counts divided by the total number of instances.
• ### Aprendizaje de reglas para un sistema de recomendación contextual

1. 1. Aprendizaje de Reglas para un SR contextual Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Grupo de Sistemas de Recomendación cenidet Feb 16, 2012
2. 2. Contenido Surfeous 1 Antecedentes Evaluación 2 Metodología para el aprendizaje de reglas 3 Selección de atributos 4 Preparación de datos 2
3. 3. Surfeous: prototipo de SR usuario enfoque contextual [1] buscando restaurante enfoque social opiniones 3 ratings y tags
5. 5. Evaluación: metodología Básica Popularidad ítem Usuarios con más ratings Por grupos Usuarios con menos ratings Distribución usuario-ítem Selección de atributos 5
6. 6. Evaluación: resultados 0.4original social 0.335 fusión 0.278 contexto 0.133atributos-sel 0.335 0.327 0.133 0.35 La evaluación 0.3 más baja se 0.25 obtiene en el social enfoque 0.2 fusión contextual 0.15 contexto 0.1 0.05 0 original atributos-sel 6
7. 7. ¿Por qué es bajo? ¿Qué ocurre con las reglas? ¿Sobreajuste? Si    es roja, redonda, de 5cm de     diámetro    y es jaspeada en el 20% de su     superficie  entonces     es una manzana ¿Demasiado generales? Si    es roja entonces     es una manzana 7
8. 8. Ejemplo de reglas 8
9. 9. ¿Entonces? Se necesita un conjunto de reglas que describa los datos sin sobre-ajuste ni extrema generalización Aprendizaje de Reglas 9
10. 10. Metodología modelo del usuario Selección de modelo del ítem atributos con ambos modelos Preparación de datos para el aprendizaje Análisis del estado actual de las reglas Aprendizaje automático usando ILP Prueba de reglas aprendidas 10
11. 11. Selección de atributos 11
12. 12. ¿Para qué sirve? [2] Mejorar el desempeño predictivo Construir modelos más Selección de eficientes atributos Mejorar el entendimiento de los modelos 12
13. 13. Selección de atributos: proceso forward/backward búsqueda: hill-climbing, best-first,... Generación de sub-conjuntos sub-conjunto chi-cuadrada, ganan- cia de información, Métrica clasificador, consisten- Evaluación de cia sub-conjuntos filtro/wrapper no si Criterio Validación de de paro resultados Umbral No. de atributos seleccionados 13 Que no mejore la evaluación
14. 14. Las Vegas Filter: criterio de inconsistencia [3] Conteo de inconsistencia IC s ( A)=S ( A)−max S k ( A) k Valor de inconsistencia ∑ A∈S IC S ( A) IR( S )= ∣S∣ 14
15. 15. Ejemplo área costo franquicia fumar Rating A Rating B 1 i bajo n s 0 0 2 i bajo n s 1 0 3 i bajo n s 2 0 4 i bajo n s 1 1 5 i alto n n 0 1 6 i alto n n 1 1 7 i alto n n 2 1 8 e alto s n 1 1 9 e bajo n n 1 1 10 e bajo n s 2 2 15
16. 16. Ejemplo Sub-conjunto A Sub-conjunto B Instancias iguales: 1,2,3,4 Instancias iguales: 1,2,3,4 n=4, clases=0,1,2,1 n=4, clases=0,0,0,1 clase frecuente=1 (2 instancias) clase frecuente=0 (3 instancias) Conteo de inconsistencia (IC): 4-2=2 Conteo de inconsistencia (IC): 4-3=1 Instancias iguales: 5,6,7 Instancias iguales: 5,6,7 N=3, clases= 0,1,2 N=3, clases= 1,1,1 clase frecuente=1 (1 instancia) clase frecuente=1 (3 instancias) Conteo de inconsistencia (IC): 3-1=2 Conteo de inconsistencia (IC): 3-3=0 Valor de Inconsistencia: Valor de Inconsistencia: (2+2)/10 = 4/10 = 0.4 (1+0)/10 = 1/10 = 0.1 16
17. 17. Descripción de los datos: Surfeous 1,160 130 ratings restaurantes 138 usuarios 0,1,2 valores de rating 8.41 115 ratings/usuario restaurantes con 1 rating 17
18. 18. ¿Cómo se hizo? Selección de atributos para: [4] Modelo del usuario Modelo del servicio Modelo del usuario + Modelo del servicio 18 http://www.cs.waikato.ac.nz/ml/weka/
19. 19. Preparación de datos user­cuisine user­payment usuariouser­profile Clase user­attributes 19
20. 20. Preparación de datos Para el modelo de servicio se efectuó un proceso similar. Selección de usuario atributos Selección de ítem atributos usuario Selección de + atributos ítem 20