Politecnico di Milano<br />Polo regionale di Como<br />TECNICHE PER LA PREVISIONE DELLE VISIONI DI NUOVI CONTENUTI NELLA T...
Sommario<br />Contesto<br />Obiettivo<br />Soluzione proposta<br />Applicazione a un caso di studio<br />Principali risult...
Contesto<br />TV BROADCAST<br />TV INTERATTIVA<br />Palinsesto<br />Triple play<br />Unidirezionale<br />VOD (Video On Dem...
Obiettivo<br />Fornire agli operatori di TV interattiva uno strumento per prevedere la popolarità di un nuovo contenuto a ...
22/07/2008<br />Soluzione Proposta<br />5<br />
Soluzione proposta<br />22/07/2008<br />Catalogo Film<br /><ul><li> “Un’estate al mare”
 Greggio, Proietti, Banfi..
 Vanzina
 Commedia</li></ul>Metadati<br /><ul><li> Titolo
 Attore/i
 Regista/i
Genere/i</li></ul>Problema 1: Come determinare le classi di visioni?<br />Problema 2: Come trattare i metadati in input?<b...
Determinare le classi di visioni<br />22/07/2008<br />Input Preprocessing<br />       L’output del sistema consiste di N c...
Input Preprocessing: Riduzione complessità<br />22/07/2008<br />Input Preprocessing<br />Classi di visioni<br />Rete Neura...
Input preprocessing: Categorizzazione<br />22/07/2008<br />Input Preprocessing<br />Classi di visioni<br />Rete Neurale<br...
Input preprocessing: Categorizzazione<br />22/07/2008<br />Input Preprocessing<br />Esempio: Metadato “Attore”<br />Classi...
Topologia della rete neurale<br />22/07/2008<br />Input Preprocessing<br />Feed-forward Multi Layer Perceptron.<br />Class...
Categoria Regista
Genere
Mpaa
ReleaseMonth
Categoria Production company</li></ul>HL<br />HL<br /><ul><li> 2 Hidden Layer, con rispettivamente 4 e 3 percettroni.
 Funzione d’attivazione: Tangente Iperbolica.</li></ul>11<br />
Applicazione a un caso di studio<br />Dataset Netflix<br /><ul><li> Titolo
 Attore/i
 Regista/i
 Genere/i
 47.798 Utenti
Upcoming SlideShare
Loading in...5
×

Presentazione Tesi - Cusini Andrea

1,921

Published on

TECNICHE PER LA PREVISIONE DELLE VISIONI DI NUOVI CONTENUTI NELLA TELEVISIONE INTERATTIVA

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
1,921
On Slideshare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
0
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Presentazione Tesi - Cusini Andrea

  1. 1. Politecnico di Milano<br />Polo regionale di Como<br />TECNICHE PER LA PREVISIONE DELLE VISIONI DI NUOVI CONTENUTI NELLA TELEVISIONE INTERATTIVA<br />Relatore<br />Prof. Francesco Fabio Violante<br />Candidato:<br />Andrea Cusini<br />Correlatore<br />Ing. Stefano Visconti<br />Como, 22 Luglio 2008<br />
  2. 2. Sommario<br />Contesto<br />Obiettivo<br />Soluzione proposta<br />Applicazione a un caso di studio<br />Principali risultati ottenuti<br />Conclusioni e Sviluppi futuri<br />2<br />22/07/2008<br />
  3. 3. Contesto<br />TV BROADCAST<br />TV INTERATTIVA<br />Palinsesto<br />Triple play<br />Unidirezionale<br />VOD (Video On Demand)<br />PVR (Personal Video Recorder)<br />Servizi Avanzati<br />L’operatore può conoscere in ogni istante<br />cosa fanno e cosa guardano gli utenti.<br />L’operatore ha come unico feedback<br />l’ auditel.<br />3<br />22/07/2008<br />
  4. 4. Obiettivo<br />Fornire agli operatori di TV interattiva uno strumento per prevedere la popolarità di un nuovo contenuto a partire dai suoi metadati.<br />Metadati<br />Film<br />4<br />22/07/2008<br />
  5. 5. 22/07/2008<br />Soluzione Proposta<br />5<br />
  6. 6. Soluzione proposta<br />22/07/2008<br />Catalogo Film<br /><ul><li> “Un’estate al mare”
  7. 7. Greggio, Proietti, Banfi..
  8. 8. Vanzina
  9. 9. Commedia</li></ul>Metadati<br /><ul><li> Titolo
  10. 10. Attore/i
  11. 11. Regista/i
  12. 12. Genere/i</li></ul>Problema 1: Come determinare le classi di visioni?<br />Problema 2: Come trattare i metadati in input?<br />Rete Neurale<br />Input Preprocessing<br />6<br />
  13. 13. Determinare le classi di visioni<br />22/07/2008<br />Input Preprocessing<br /> L’output del sistema consiste di N classi di visione con ampiezza definita mantenendo una quantità di film (item) costante in ogni classe.<br />Classi di visioni<br />Rete Neurale<br /># Item<br />Distribuzione cumulativa Film/Visioni<br />250<br />125<br />43<br />1000<br />75<br />5000<br />10000<br />Views<br />Esempio: suddivisione in 5 classi di visioni.<br />1<br />2<br />3<br />4<br />5<br />7<br />
  14. 14. Input Preprocessing: Riduzione complessità<br />22/07/2008<br />Input Preprocessing<br />Classi di visioni<br />Rete Neurale<br />Splitting: Brando#Al pacino#Caan#Castellano#Duvall<br />Eliminazione MD non necessari<br />8<br />
  15. 15. Input preprocessing: Categorizzazione<br />22/07/2008<br />Input Preprocessing<br />Classi di visioni<br />Rete Neurale<br />Necessità della rete neurale:<br />Ricevere in input valori numerici<br />Numero di input limitato<br />1<br />2<br />Metadato Testuale<br />Valore numerico<br />Categoria<br />Rete Neurale<br />9<br />
  16. 16. Input preprocessing: Categorizzazione<br />22/07/2008<br />Input Preprocessing<br />Esempio: Metadato “Attore”<br />Classi di visioni<br />Rete Neurale<br />Tom Cruise<br />Determinazione peso<br />13709<br />10<br />
  17. 17. Topologia della rete neurale<br />22/07/2008<br />Input Preprocessing<br />Feed-forward Multi Layer Perceptron.<br />Classi di visioni<br />Input Layer<br />Rete Neurale<br /><ul><li>Categoria Attore
  18. 18. Categoria Regista
  19. 19. Genere
  20. 20. Mpaa
  21. 21. ReleaseMonth
  22. 22. Categoria Production company</li></ul>HL<br />HL<br /><ul><li> 2 Hidden Layer, con rispettivamente 4 e 3 percettroni.
  23. 23. Funzione d’attivazione: Tangente Iperbolica.</li></ul>11<br />
  24. 24. Applicazione a un caso di studio<br />Dataset Netflix<br /><ul><li> Titolo
  25. 25. Attore/i
  26. 26. Regista/i
  27. 27. Genere/i
  28. 28. 47.798 Utenti
  29. 29. 17.770 Contenuti
  30. 30. 10.000.450 Visioni
  31. 31. Mpaa Rating
  32. 32. Mese di rilascio
  33. 33. Casa di produzione</li></ul>IMDB<br />(Internet Movie Database)<br />12<br />22/07/2008<br />
  34. 34. Principali risultati ottenuti<br />Training della rete: 2000 campioni (Film). 400 x 5 classi.<br />Testing della rete: 50 campioni.<br />Confronto Visioni reali – Visioni predette<br />Reale<br />Predetto<br />Entro l’intervallo di una classe, la predizione può dirsi corretta.<br />13<br />22/07/2008<br />
  35. 35. Risultati per ogni classe di visione<br />22/07/2008<br />Valutazione performance: <br />%Bingo Rate: Percentuale di correttezza di una previsione. Si considera corretta la previsione se corrisponde alla classe reale.<br />%W1C (Within 1 Class) Rate: Si considera corretta anche la previsione che cade in una classe adiacente (precedente o successiva) alla classe reale.<br />La previsione entro una classe di correttezza è superiore al 70% in tutte le classi di visione.<br />14<br />
  36. 36. Conclusioni e Sviluppi futuri<br /><ul><li> Primo tentativo di ideazione di un modello per la predizione di Visioni dei film su </li></ul> televisione interattiva<br /><ul><li> Il preprocessing si è rivelato cruciale
  37. 37. Risultati migliori di quelli proposti in letteratura su domini affini</li></ul>CONCLUSIONI<br /><ul><li> Estendere l’analisi ad ulteriori metadati.
  38. 38. Arricchire il preprocessing (ad esempio utilizzo di Association Rules).
  39. 39. Raffinamento dell’implementazione prototipale.</li></ul>SVILUPPI FUTURI<br />15<br />22/07/2008<br />
  40. 40. Grazie per l’attenzione!<br />16<br />22/07/2008<br />
  41. 41. 22/07/2008<br />17<br />
  42. 42. Media digitali e TV interattiva<br />Film (Contenuto)<br />Televisione interattiva<br />Difficile determinare se raccomandare agli utenti un nuovo contenuto<br />Problema!<br />Informazioni Utenti<br /><ul><li> Quale utente ha visto </li></ul> quale film<br /><ul><li> Visioni di un film </li></ul> (fruizioni)<br />18<br />22/07/2008<br />
  43. 43. Problema Metadati<br />22/07/2008<br />Metadati<br />19<br />
  44. 44. Determinazione Classi di Output<br />22/07/2008<br />20<br />Algoritmo Lloyd-Max per la suddivisione di una pdf.<br />Procedura iterativa per disegnare un generico quantizzatore ottimo per una pdf data.<br />Views<br />Utilizzo di uno script Matlab.<br />Input: Numero di classi desiderate e pdf.<br />Output: Intervalli ottimi.<br />
  45. 45. Classificazione: Visione logaritmica<br />22/07/2008<br />Log10(Views)<br />1<br />2<br />3<br />4<br />5<br />Classi Output<br />21<br />
  46. 46. Parametri per i metadati<br />22/07/2008<br />Modello<br />Classi di visioni<br />Input Preprocessing<br />Rete Neurale<br />Parametri per i metadati<br />Modalità di utilizzo dei metadati<br />Metadati da utilizzare<br />Esempio: Utilizzare solo Attore, Genere e Regista<br />Numero di categorie per ogni metedato testuale<br />Esempio: Attore, 3 categorie (Star, Medio, Flop)<br />22<br />
  47. 47. Determinare Peso Metadato<br />22/07/2008<br />Input Preprocessing<br />Metadato Testuale<br />Es. “Tom Cruise”<br />Classi di visioni<br />Valore numerico<br />Es. “13709”<br />Categoria<br />Es. “1”<br />Rete Neurale<br />Rete Neurale<br />Peso di un Metadato testuale<br />75-percentile delle visioni dei film in cui è presente<br />Con P=75, N=num. Film<br />23<br />
  48. 48. Rete Neurale - Procedimento<br />22/07/2008<br />Input Preprocessing<br />Classi di visioni<br />Rete Neurale<br />Procedimento Sperimentale<br />Test della rete variando il numero di input per un metadato multiplo<br />Risultati<br />Migliori dei precedenti?<br />No<br />Configurazione ottimale<br />Sì<br />24<br />
  49. 49. Training e Testing della rete<br />22/07/2008<br />25<br />Training<br />Rete Neurale<br />Testing<br />
  50. 50. Esempio Algoritmo FPM<br />Funzionamento dell’algoritmo Relim (RecursiveElimination).<br />Definire un oridine per gli item (Ad esempio la frequenza nelle transazioni)<br />Riordinare gli item nelle transazioni in base alla loro frequenza<br />Ricorsivamente si creano delle liste dette “Prefix” a partire dall’Item con frequenza più elevata.<br />
  51. 51. Input preprocessing: Validazione<br />22/07/2008<br />Input Preprocessing<br />Classi di visioni<br />Algoritmi di Frequent Pattern Mining per la determinazione di Regole di Associazione. <br />Rete Neurale<br />Esempio regola:<br />Permettono di validare i risultati della categorizzazione dei metadati testuali.<br />27<br />
  52. 52. FPM anziché Rete Neurale<br />Pattern Frequenti<br />Algoritmi Frequent Pattern Mining<br />Input Preprocessing<br />Nuovo Contenuto<br />Esempio Pattern<br />“Actor:Tom Cruise”, “Actor:Brad Pitt”, “Genere: Drama”<br />RULE: “ViewClass=5”<br />“Actor:Tom Cruise”, “Actor:Brad Pitt”, “Genere: Drama”<br />P=f(MD1;MD2;MD3)<br />P=ViewClass=5<br />

×