Università degli studi di Catania
Laurea specialistica in Ingegneria Gestionale

          Corso di Sistemi Informativi
  ...
USER BASED PREDICTION MODEL
  JESTER        PREDIZIONE DEI GIUDIZI NON ESPRESSI DAGLI
                  UTENTI SULL’INSIEM...
USER BASED PREDICTION MODEL
 JESTER       PREDIZIONE DEI GIUDIZI NON ESPRESSI DAGLI
                UTENTI SULL’INSIEME DI...
USER BASED PREDICTION MODEL
COSTRUZIONE DI UN MODELLO PER LA PREDIZIONE
  ESTRAZIONE DI UN           ESTRAZIONE DELLA SOTT...
USER BASED PREDICTION MODEL
      PROCEDURA IPCA PER LA SOSTITUZIONE DEI DATI
                      MANCANTI

 CENTRAMENTO...
USER BASED PREDICTION MODEL
ALGORITMO PER LA COSTRUZIONE DEL MODELLO



                        Matrice Xmod


        Sos...
USER BASED PREDICTION MODEL
ALGORITMO PER LA COSTRUZIONE DEL MODELLO



                        Matrice Xmod


        Sos...
USER BASED PREDICTION MODEL
ALGORITMO PER LA COSTRUZIONE DEL MODELLO

                Matrice Xmod

                      ...
USER BASED PREDICTION MODEL
            CALCOLO DELL’ERRORE DI PREDIZIONE
      ESTRAZIONE DI UN
    DATASET DA UTILIZZARE...
USER BASED PREDICTION MODEL
  PROCEDURA IPCA PER LA SOSTITUZIONE DEI DATI
MANCANTI NEL GENERICO USER DELLA MATRICE DI TEST...
USER BASED PREDICTION MODEL
 VALORE DELL’ERRORE DI PREDIZIONE AL VARIARE DI m
USER BASED PREDICTION MODEL
  ALGORITMO PER LA PREDIZIONE DELL’ERRORE

                                                   ...
USER BASED PREDICTION MODEL
                  CONCLUSIONI
     È richiesto un grosso sforzo computazionale
     nella fase...
Upcoming SlideShare
Loading in …5
×

User Based Prediction Model

743 views

Published on

Published in: Technology, Education
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
743
On SlideShare
0
From Embeds
0
Number of Embeds
10
Actions
Shares
0
Downloads
0
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

User Based Prediction Model

  1. 1. Università degli studi di Catania Laurea specialistica in Ingegneria Gestionale Corso di Sistemi Informativi Prof.ssa D. Giordano Progetto di Datamining USER BASED PREDICTION MODEL Gabriele Manno Ing. F. MAIORANA Ivan Santini Nazareno Lo Iacono
  2. 2. USER BASED PREDICTION MODEL JESTER PREDIZIONE DEI GIUDIZI NON ESPRESSI DAGLI UTENTI SULL’INSIEME DI ITEM VOTABILI DATASET ESTRAZIONE DI UN DATASET DI DATI STORICI COSTRUZIONE DI UN MANIPOLAZIONE DEI DATI PER OTTENERE UNA MODELLO PER MATRICE PIENA LA PREDIZIONE CLUSTERIZZAZIONE DELLA MATRICE OTTENUTA
  3. 3. USER BASED PREDICTION MODEL JESTER PREDIZIONE DEI GIUDIZI NON ESPRESSI DAGLI UTENTI SULL’INSIEME DI ITEM VOTABILI DATASET ESTRAZIONE DI UN DATASET DI DATI SU CUI EFFETTUARE LA PREDIZIONE CALCOLO DELL’ERRORE DI SI EFFETTUA LA PREDIZIONE DI UN PREDIZIONE SOTTOINSIEME DEGLI ITEM VOTATI CALCOLO ERRORE DI PREDIZIONE
  4. 4. USER BASED PREDICTION MODEL COSTRUZIONE DI UN MODELLO PER LA PREDIZIONE ESTRAZIONE DI UN ESTRAZIONE DELLA SOTTOMATRICE DATASET DI DATI STORICI Xmod DALLA MATRICE DEI DATI SOSTITUZIONE DEI DATI MANCANTI CON LA MEDIA DELLE MEDIE DI RIGA E COLONNA MANIPOLAZIONE DEI DATI PER OTTENERE UNA MATRICE PIENA APPLICAZIONE DELLA PROCEDURA IPCA PER LA SOSTITUZIONE DEFINITIVA DEI DATI MANCANTI CLUSTERIZZAZIONE APPLICAZIONE DELL’ALGORITMO DELLA MATRICE X NON GERARCHICO DEL K-MEANS OTTENUTA
  5. 5. USER BASED PREDICTION MODEL PROCEDURA IPCA PER LA SOSTITUZIONE DEI DATI MANCANTI CENTRAMENTO DELLA MATRICE RICAVATA AL PASSO PRECEDENTE DECOMPOSIZIONE AI VALORI SINGOLARI RISPETTO ALLE MEDIE DI DELLA MATRICE RETTANGOLARE DEI DATI COLONNA SCELTA DELLA NUMEROSITA’ DEI VALORI ANALISI ALLE COMPONENTI PRINCIPALI SINGOLARI DELLA MATRICE CENTRATA RIDUZIONE DEL RANGO DELLA MATRICE SDECENTRAMENTO DELLA CENTRATA MATRICE RIDOTTA SOSTITUZIONE DEI DATI MANCANTI CON I RELATIVI VALORI PROCEDURA DELLA MATRICE RICAVATA AL PASSO PRECEDENTE ITERATIVA
  6. 6. USER BASED PREDICTION MODEL ALGORITMO PER LA COSTRUZIONE DEL MODELLO Matrice Xmod Sostituzione media delle medie ai dati mancanti Calcolo di X attraverso IPCA Clusterizzazione della matrice X
  7. 7. USER BASED PREDICTION MODEL ALGORITMO PER LA COSTRUZIONE DEL MODELLO Matrice Xmod Sostituzione media delle medie ai dati mancanti Calcolo di X attraverso IPCA Clusterizzazione della matrice X
  8. 8. USER BASED PREDICTION MODEL ALGORITMO PER LA COSTRUZIONE DEL MODELLO Matrice Xmod Calcolo di A (matrice centrata) Sostituzione media delle medie ai dati mancanti Calcolo di X attraverso IPCA Calcolo di Ak matrice di rango ridotto Clusterizzazione della matrice X Calcolo di A’ (matrice sdecentrata) Sostituzione dei dati mancanti (aggiornamento X) Uscita?
  9. 9. USER BASED PREDICTION MODEL CALCOLO DELL’ERRORE DI PREDIZIONE ESTRAZIONE DI UN DATASET DA UTILIZZARE ESTRAZIONE DELLA SOTTOMATRICE COME MATRICE DI TEST Xtest DALLA MATRICE DEI DATI SCELTA DEGLI ITEM VOTATI DEI QUALI EFFETTUARE LA PREDIZIONE APPLICAZIONE DEL METODO IPCA PER LA ASSOCIAZIONE DEL GENERICO USER AD SOSTITUZIONE DEI DATI MANCANTI DEL UN GRUPPO DEFINITO IN FASE DI GENERICO USER DELLA MATRICE DI TEST MODELLIZZAZIONE CALCOLO DISTANZA TRA IL GENERICO USER E I CENTROIDI DEI GRUPPI INDIVIDUATI NELLA FASE DI MODELLIZZAZIONE PREDIZIONE DEI VALORI DEGLI ITEM ATTRAVERSO L’ASSOCIAZIONE CON IL VALORE RELATIVO AL CENTROIDE PIU’ CALCOLO DELL’ERRORE SIMILE
  10. 10. USER BASED PREDICTION MODEL PROCEDURA IPCA PER LA SOSTITUZIONE DEI DATI MANCANTI NEL GENERICO USER DELLA MATRICE DI TEST VENGONO SCELTE m ULTIME RIGHE DELLA MATRICE X MATRICE DI m+1 RIGHE RICAVATA IN FASE DI MODELLIZAZIONE VETTORE DEL GENERICO SOSTITUZIONE DEI DATI MANCANTI CON LA USER MEDIA DELLE MEDIE DI RIGA E COLONNA E’ NECESSARIO CALCOLARE L’ERRORE PER DIVERSI VALORI PROCEDURA IPCA PER DI m PER LA SCELTA DEL VALORE OTTIMO DEL LA SOSTITUZIONE DEI PARAMENTRO DATI MANCANTI
  11. 11. USER BASED PREDICTION MODEL VALORE DELL’ERRORE DI PREDIZIONE AL VARIARE DI m
  12. 12. USER BASED PREDICTION MODEL ALGORITMO PER LA PREDIZIONE DELL’ERRORE Percentuale h di Item votati vengono Matrice Xtest scelti per la predizione in modo casuale Creazione Xtest1 Composta da una sottomatrice dei dati storici e il vettore utente Ciclo per ogni utente Creazione matrice B Sostituzione dei dati mancanti all’utente  vettore b Creazione BB tramite IPCA ed estrazione di b Associazione dell’elemento al gruppo più simile Calcolo dell’Errore associato ad un unico utente Ciclo per diversi m Calcolo dell’Errore totale
  13. 13. USER BASED PREDICTION MODEL CONCLUSIONI È richiesto un grosso sforzo computazionale nella fase di modellizzazione quando si è in presenza di matrici di grandi dimensioni. L’algoritmo si presenta comunque rapido nei confronti della predizione poiché si utilizzano solo m delle righe totali della matrice-modello. Futuri sviluppi possono consistere nello sviluppare una procedura di aggiornamento del modello quando un nuovo user entra nel sistema.

×