Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Sakilla Datawarehouse and Datamining

1,214 views

Published on

Presentazione della tesina sviluppata per conseguire l'esame di Sistemi Informativi Aziendali Presso l'università "La Sapienza di Roma".

Published in: Technology
  • Be the first to like this

Sakilla Datawarehouse and Datamining

  1. 1. Università degli studi “La Sapienza” di Roma Tesina di Sistemi Informativi Aziendali Umberto Griffo e Claudio Papa
  2. 2. Sakilla è un’azienda “giocattolo” che ha in gestione 2 videostore situati nella stessa città. Si vogliono utilizzare lemetodologie e le tecnologie del datawarehouse e deldatamining per monitorare ed ottimizzare il processo dinoleggio di DVD al fine di migliorare l’attività commerciale. 2
  3. 3.  Scoprire quale sia lo store più redditizio Scoprire quale sia il genere di DVD più noleggiato Scoprire quali sono i DVD più noleggiati Soddisfare i clienti, in termini di reperibilità dei DVD Caratterizzare i comportamenti dei clienti 3
  4. 4. cliente ! interessa Visita scaffale Scelta di Preleva altro DVD dello store un DVD Un DVD interessa !altro DVD Vai alla cassacambia !disponibile Registra Verifica Consulta assenza in DVD disponibilità inventario stock disponibile !cambia Effettua Registra Registra pagamento pagamento noleggio 4
  5. 5. Verifica statoDVD DVD Danneggiato o mancante si no Applica Confronta la data di penale restituzione con quella di noleggio !moroso moroso Effettua pagamento Registra Calcola restituzione mora Registra pagamento Pagamento mora Registra pagamento 5
  6. 6. Sigla Nome Metric Definizione Tipologia aNRTOT Num. Di noleggi ℕ COUNT(Fact_rental) Efficienza totaliNR Num. Di noleggi ℕ AGGREGATE Efficienza (Returned=Yes, NRTOT) restituitiNNR Num. Di noleggi ℕ AGGREGATE Efficienza (Returned=No, NRTOT) non restituitiPNR Percertuale noleggi % NR / NRTOT Efficienza restituitiPNNR Percentuale % NNR / NRTOT Efficienza noleggi non restituitiFATT Fatturato € SUM(Fact_rental.amount) EfficienzaPGR Percentuale % [ FATT – Efficienza SUM(Fact_rental.RentalRate) ]/ guadagno da FATT clienti ritardatari 6
  7. 7. Sigla Nome Metrica Definizione TipologiaTMR Tempo medio di ℕ AVG Qualità riconsegna (Fact_rental.rental_ effective_duration) /NRTOTTMDF Tempo medio ℕ AVG(Data_disponib Servizio disponibilità film ilità – Data_richiesta)NDANN Num. DVD ℕ COUNT(Inventory.d Qualità danneggiati amaged=true)NDS Num. DVD in stock ℕ COUNT(Inventory) Qualità – NNR 7
  8. 8. • NRTOT Efficienza • NR • NNR • PNR • FATT • PGR Input: Richieste noleggio Output: Noleggio DVD• TMR Risorse:• NDANN DVD,• NDNIS Personale • TMDF Qualità Servizio 8
  9. 9. Month City Ten DaysCountry Address Indirizzo Rental Date Last Name Week First Name Customer E-mail Rentals Return Date • Amount • Rental Duration Title • Rental Rate Lenght Rental Time • Replacement Cost Film • Rental Effective Special features Duration Hours • Rental Effective Rental Rate Duration Days Release year Minute • Total Rental Count Replacement cost Category Hour Return Time Language Store Staff Address Last Name Country E-mail City Manager Id First Name 9
  10. 10.  Migrazione del Database Normalizzazione del Database Aggiunta delle dimensioni temporali 10
  11. 11. SQL Server Migration Assistant 11
  12. 12. Database di partenza 12
  13. 13. Category Language Actor Country City Film Store Address Inventory Staff Rental Customer 13
  14. 14. Category FilmCategory Store Film Inventory Staff Customer Rental 14
  15. 15. Address Store FilmCategory Store Staff Customer Rental 15
  16. 16. Country Country City CityLanguage Address Store Address FilmCategory Store Staff Customer Rental 16
  17. 17. What: Film Where: Store Who: Staff Who: Customer Film Store Store Customer Country Staff CountryCategory City City Address AddressLanguage Rental 17
  18. 18. What: Film Where: Store Who: Staff Who: Customer RentalWhen: Rental When: Rental When: Return When: Return Date Time Date Time 18
  19. 19. 19
  20. 20. 20
  21. 21. Realizzazione delle aggregazione e dei calcoli necessari allarealizzazione dei KPI 21
  22. 22. 22
  23. 23. 23
  24. 24.  La videoteca vuole aumentare il numero noleggi analizzando le abitudini di noleggio dei clienti Si vogliono trovare delle associazioni sulle categorie di film noleggiati. Tale processo che prende il nome di market basket analysis è utile per ladozione di strategie di marketing ad hoc. Nel caso specifico la strategia è quella di disporre vicino, negli scaffali, le categorie di film che vengono più frequentemente noleggiate insieme 24
  25. 25.  Per poter effettuare la market basket analysis dobbiamo creare un Association model . Questo lo costruiamo su un dataset che contiene i DVD che possono essere noleggiati. Ogni DVD sarà rappresentato da una variabile booleana che starà ad indicare se è stato noleggiato o meno, ogni noleggio quindi sarà rappresentato da un vettore di booleani. È ora possibile scoprire pattern sotto forma di regole di associazione A=>B Un insieme di oggetti noleggiati è detto itemset. 25
  26. 26.  A corredo di ogni regola di associazione si utilizzano misure quali il supporto e la confidenza, regole che avranno tali indici inferiori rispetto a una predeterminata soglia (minimo supporto e minima confidenza) saranno scartate in quanto non interessanti, viceversa saranno dette regole forti. Il supporto è definito da supporto(A => B) = Prob(A U B) la confidenza è definita da confidenza(A => B) = Prob(B | A) 26
  27. 27.  Per poter costruire l’association model abbiamo preparato una tabella, chiamata customer_transaction, contenente tutti i noleggi effettuati(o transazioni) dai clienti. Questa è stata collegata come nested table alla tabella dim_customer. Su di esse abbiamo costruito il modello impostando come colonna da predirre l’attributo category della tabella customer_transaction 27
  28. 28. 28
  29. 29. 29

×